Chiplet APU AMD: Ikhtisar Strix Halo

(chipsandcheese.com)

1 poin oleh GN⁺ 2025-10-20 | 1 komentar | Bagikan ke WhatsApp

Strix Halo adalah APU chiplet untuk klien berskala terbesar yang dirilis AMD, dirancang agar mampu menangani pekerjaan CPU dan GPU berkinerja tinggi secara terintegrasi
Dilengkapi dengan 16-core Zen 5 dan 40 unit komputasi iGPU RDNA 3.5, menawarkan performa yang mendekati CPU kelas desktop dan GPU eksternal menengah
Menerapkan bus memori LPDDR5X-8000 dan 32MB Infinity Cache untuk menghadirkan bandwidth tinggi dan latensi rendah
Performa iGPU mengungguli APU seluler sebelumnya, dan di beberapa lingkungan dapat bersaing dengan GPU eksternal menengah
Performa ML (machine learning) menunggu dukungan ROCm, sehingga potensi skalabilitas dan pengembangan di masa depan sangat diharapkan

Pengenalan dan Ikhtisar Produk

Strix Halo adalah APU chiplet untuk konsumen pertama yang diumumkan AMD di CES 2025
Meskipun prosesornya mobile, ia mengejar performa tinggi setara desktop, mendukung rentang TDP 55W~120W, dan tetap memberi performa tinggi tanpa grafis eksternal terpisah
Arsitektur Zen 5 16-core (dua CCD 8-core) dengan pemanfaatan FPU 512b yang sama seperti produk desktop
Mendukung frekuensi boost maksimum 5.1GHz (sekitar 600MHz lebih rendah dari desktop Ryzen 9 9950X)
RDNA 3.5 iGPU sebagai GPU utama: 40 unit komputasi, 32MB Infinity Cache, frekuensi boost 2.9GHz → performa komputasi setara RX 7600 XT~RX 7700
Bus memori LPDDR5X-8000 256b (hingga 256GB/s, berbagi untuk semua komponen; sedikit di bawah RX 7600 XT 288GB/s, tetapi jauh lebih baik dibanding APU sebelumnya) diterapkan

Lingkungan Pengujian dan Perangkat

Melakukan pengukuran performa praktis menggunakan Asus ROG Flow Z13 (2025) dan HP ZBook Ultra G1a 14”
ROG Flow Z13 digunakan untuk pengujian berfokus pada gaming, sementara ZBook Ultra G1a digunakan untuk microbenchmarking

Subsystem Memori dari Sudut Pandang CPU

Latensi memori: Strix Point(~128ns) dibandingkan Strix Halo(~123ns) hampir tidak berbeda
CPU tidak dapat mengakses langsung 32MB Infinity Cache di dalam die IO, hal ini dikonfirmasi secara resmi melalui wawancara
CPU desktop (9950X) berada di kisaran 75~80ns, jauh lebih rendah dibandingkan perangkat mobile
Bandwidth memori: 16-core mencapai lebih dari 175GB/s pada operasi read-modify-add murni, dan pembacaan bisa mencapai 124GB/s
- Bandwidth single CCD adalah 64GB/s (baca) dan 43GB/s (tulis), sehingga total praktis sekitar 103GB/s
- Seperti desktop, link CCD dan die IO berjalan pada 2000MHz dengan 32 byte per siklus

Performa CPU

CPU Strix Halo mencapai performa integer yang sama dengan flagship desktop generasi sebelumnya (7950X), meski kecepatannya turun 11.7%
Performa floating point sangat dekat dengan flagship saat ini (9950X), dengan beberapa subtes yang menunjukkan kebalikan hasil
Pada SPEC CPU 2017 Integer/FP subtest, Strix Halo setara atau melampaui 9950X pada beberapa item, namun selisih tipis terjadi akibat latensi bus LPDDR5X yang lebih tinggi

Arsitektur Memori dari Sudut Pandang GPU

Bandwidth memori GPU Strix Halo adalah yang paling tinggi di antara semua mobile SoC
Namun dibandingkan RTX 5070 Mobile, bandwidth memorinya 50% lebih rendah
Performa Infinity Cache (MALL) 40% lebih tinggi dari L2 5070M dan kapasitasnya 33% lebih besar. Cache L2 4MB menyediakan bandwidth 2.5TB/s
Latensi cache L2 Strix Halo lebih rendah daripada L2 5070M, sementara latensi MALL 32MB-nya serupa dengan L2 5070M
Latensi memori keseluruhan 35% lebih rendah dibandingkan 5070M

Throughput Operasi GPU

Throughput operasi floating point: sekitar 2,5x Strix Point, dan setara atau unggul dari 5070M
- Pada hasil FP16, hanya 5070M yang melebihi harapan (kemungkinan anomali pada benchmark)
Throughput operasi integer: 5070M lebih tinggi daripada Radeon 8060S

Performa GPU dan Gaming

Sebagai iGPU, Strix Halo sangat unggul dibanding iGPU Intel/AMD yang ada dan juga kompetitif mendekati GPU eksternal
Pada pengujian game dengan delta besar (Cyberpunk 2077):
- Di lingkungan baterai: Radeon 8060S unggul 7.5% dengan performa 1080p dibanding 5070M pada kondisi yang sama
- Pada kondisi daya AC: di 1080p, Radeon 8060S unggul 2.5%, di 1440p, 5070M unggul 8.3%
- Tergantung detail pengaturan dan kondisi daya, keduanya menunjukkan daya saing; iGPU terbukti dapat menyaingi performa GPU eksternal secara praktis
Pada Fluid X3D dan beban kerja komputasi, Radeon 8060S melampaui iGPU Intel/AMD sebelumnya secara total

Kesimpulan

Strix Halo menargetkan SoC terintegrasi CPU-GPU berkinerja tinggi dan menunjukkan performa unggul di berbagai skenario penggunaan
Mampu bersaing dengan CPU desktop Zen 5 dan GPU eksternal menengah, serta relevan untuk lingkungan mobile dan desktop
Menjaga efisiensi dan integrasi (keunggulan iGPU) sambil tetap menawarkan performa tinggi
Tidak melampaui GPU eksternal premium khusus performa tinggi, tetapi menawarkan fleksibilitas dan performa terbaik untuk perangkat kompak dan sistem terintegrasi
Performa ML perlu dianalisis lebih lanjut karena penundaan dukungan ROCm. Ada pula kemungkinan desain bus memori skala besar untuk perluasan di masa depan (seperti Apple Max/Ultra)
Strategi desain Strix Halo yang sukses diperkirakan akan menjadi dasar bagi perluasan lini APU performa tinggi AMD berikutnya

1 komentar

GN⁺ 2025-10-20

Komentar Hacker News

Saya benar-benar ingin mencoba mini PC dengan produk ini, tetapi di Eropa harganya sangat mahal atau bahkan sama sekali tidak bisa dibeli, dan membeli langsung dari Tiongkok juga terasa berisiko karena masalah layanan purna jual, ROCm 7 sudah berjalan di sebagian besar distro Linux, jadi ini tampaknya akan sangat bagus dipakai sebagai workstation atau server inferensi rumahan untuk LLM atau Ollama dan layanan lain di rumah
- Saya menemukan produk yang dikirim dari Jerman dan harganya relatif terjangkau, mungkin bisa jadi referensi: BOSGAME M5 AI Mini Desktop
- Apakah Anda sudah melihat Corsair AI Workstation 300 Desktop PC? Tergantung model yang dipilih, harganya 2000~2700 euro, dan jika memperhitungkan PPN, rasanya mirip dengan harga dalam dolar AS (1700~2300 USD) Corsair AI Workstations
- Saya memesan framework desktop 395 versi 128GB dengan harga sedikit di bawah 1900 euro, dan dengan konfigurasi tambahan plus ongkos kirim totalnya sedikit di atas 2000 euro, tetapi saya tidak merasa harganya terlalu mahal
- Saya memahami bahwa penyebab utama mahalnya harga adalah memori high-bandwidth (meski jika dibandingkan dengan GPU performa tinggi sungguhan, bandwidth memorinya juga tidak bisa dibilang sangat tinggi)
- ROCm memang berkembang pesat, tetapi saya juga sempat mengalami beberapa masalah di desktop RX9070XT, jadi untuk pekerjaan AI saat ini saya masih merekomendasikan solusi Nvidia atau Apple, meski saya rasa AMD akan segera menyusul, sistem AI dengan value terbaik masih tetap desktop rakitan sendiri dengan dua RTX 3090 (tentu perlu motherboard yang mendukung kartu ganda), lalu tinggal dijalankan saja di lemari
Jika dibandingkan dengan mobile dGPU, dan produk DGX Spark yang akhirnya benar-benar jadi kenyataan, pasar ini masih terasa seperti segmen yang belum matang dan masih punya potensi, saya tidak tahu kenapa DGX Spark tertunda begitu lama, tetapi itu memberi AMD kesempatan untuk lebih dulu merebut pangsa pasar, keunggulan discrete GPU (termasuk mobile) adalah bandwidth memori, sementara kelemahannya adalah konsumsi daya tinggi dan kapasitas memori, saya akan mengesampingkan CUDA di sini, meski tentu itu faktor yang sangat besar, jika menambahkan desktop kecil DGX Spark, Anda bisa memakai RDMA ke beberapa perangkat lewat port jaringan 200Gb, sehingga utilisasinya mungkin lebih tinggi daripada jumlah Strix Halo 395 yang sama, tetapi untuk pekerjaan sungguhan saya rasa saya akan tetap memilih server GPU atau workstation Threadripper GPU daripada empat DGX Spark, dan fakta bahwa DGX Spark tidak bisa masuk ke laptop juga menjadi poin keunggulan bagi Strix Halo, pada akhirnya saya melihat ini sebagai ceruk pasar baru, dan saya menantikan bagaimana bentuk akhirnya dalam beberapa generasi ke depan
- Generasi berikutnya AMD kabarnya akan menghadirkan Medusa Halo dengan bus LPDDR6 384-bit, dan dalam kasus itu mungkin saja bisa mencapai memori 2x lebih besar dan bandwidth 1,7x dibanding Strix Halo, Strix Halo tampaknya sedang sukses sebagai platform inferensi sehingga segmen pasar ini sepertinya akan terus tumbuh
- Sebagai koreksi, bukan dual 200Gb melainkan single 200Gb atau dual 100Gb
- “dGPU” biasanya berarti discrete GPU, jadi saya penasaran apakah yang dimaksud sebenarnya “iGPU” (grafis terintegrasi), produk Strix Halo memang dipasarkan juga untuk gaming, tetapi performa nyatanya terasa agak tidak seimbang, CPU-nya terlalu cepat sementara performa iGPU-nya relatif kurang, tetapi untuk performa matmul tampaknya memang akan sangat kuat
- Tujuan utama DGX Spark tampaknya adalah pengembangan dan pengujian model AI lokal, Strix Halo adalah iGPU berbasis amd64 sehingga tetap bisa dipakai untuk pekerjaan PC tradisional sekaligus cukup layak sebagai perangkat target AI lokal, menurut saya Strix Halo adalah titik awal yang menandai berakhirnya era discrete GPU di laptop, Nvidia tampaknya juga menyadari hal ini dan sedang mencoba membuat solusi iGPU bersama Intel
Yang mengecewakan, meski sudah setengah tahun sejak rilis, laptop yang benar-benar bisa dipakai masih hanya dua, dan dari keduanya hanya Z13 yang benar-benar model performa tinggi, memang ada produk Framework juga, tetapi di banyak negara produk itu tidak tersedia dan target penggunanya pun cukup terbatas, saya sangat menyukai Z13, tetapi produk ini juga jelas sangat niche, saya tidak tahu apakah ada masalah pada produksi chip, atau apakah Apple menyerap semua kapasitas produksi
- Harga HP ZBook Ultra di AS sangat tinggi, tetapi di Eropa terasa masuk akal karena mirip laptop biasa, penyesalan saya adalah saya memesan pada hari pertama sehingga tidak bisa menunggu versi 128GB, tetapi dari sisi baterai maupun performa, sampai sekarang saya belum melihat pesaing yang bisa menyamai untuk beban kerja berat apa pun yang pernah saya tangani, dan selain laptop, perusahaan seperti Beelink juga membuat NUC dengan harga yang masuk akal, saya setuju bahwa keterbatasan pasokan membuat sulit menilai seberapa besar peluangnya
- HP ZBook Ultra G1a adalah opsi bagus karena bisa dikonfigurasi hingga RAM 128GB
- Beelink, GMKtec, Minisforum, Corsair, merek-merek ini juga sedang merilis produk
- Di sebagian besar wilayah Eropa, Z13 tidak bisa dibeli dengan RAM di atas 32GB, dan garansi 2~3 tahun juga umumnya tidak tersedia, akibatnya saya frustrasi karena bisa saja akhirnya membeli Framework 13 yang RAM/CPU/GPU-nya lebih lemah
High Yield mengunggah video yang membedah chip 395 secara mendalam di level silikon, jadi layak ditonton High Yield - 395 Chip Deep Dive
Saya penasaran apakah di framework desktop TDP (batas daya) bisa diatur lebih tinggi, desktop ini tampaknya punya pendinginan yang jauh lebih baik daripada laptop dengan chip yang sama, jadi mungkin ada perbedaan performa nyata
- Bisa diatur sampai 140W berkelanjutan, 160W burst (sekitar 10 detik)
- Saya belum mengukur konsumsi dayanya, tetapi saya memakai motherboard Framework di casing ITX yang lebih besar untuk meningkatkan pendinginan, PC utama saya 7950X3D dan unit Strix punya jumlah core/thread yang sama, dan pada pengukuran performa nyaris tidak ada perbedaan, jadi sangat mengejutkan bahwa performa komputasi kelas desktop bisa didapat dari laptop
Saya pernah membaca di suatu tempat bahwa salah satu alasan utama APU ini tidak seefisien produk Apple dalam konsumsi energi adalah karena keputusan desain untuk berbagi dengan arsitektur Epyc, dan akibatnya ada trade-off yang membuat efisiensinya menurun pada daya rendah, saya penasaran apakah ada yang bisa memverifikasi ini
- Dalam ulasan Hardware Canucks ada hasil pengujian M4 Pro (3nm generasi kedua) dan 395+ (4nm) pada 50W, dan performanya cukup mirip, jadi ini bisa dijelaskan oleh perbedaan proses 3nm vs 4nm Ulasan YouTube
- APU ini juga bagus, tetapi dalam hal bandwidth memori jelas tidak akan bisa menyamai m3 ultra, meski harganya jauh lebih murah, saya sedang mempertimbangkan untuk mengganti desktop lama, dan bagi saya penting agar bisa sesekali meminjam GPU eksternal (A6000 dan sejenisnya) dari kantor tanpa perlu waktu lama untuk setup
Saya membeli framework desktop dan sedang mengujinya, ukurannya kecil tetapi benar-benar mesin yang mengesankan, saya berharap ke depan produk seperti ini bisa menarik lebih banyak minat dan partisipasi dari komunitas engineer, ekosistem dengan dukungan baik untuk vulkan maupun rocm akan menguntungkan semua orang
Saya punya pertanyaan terkait: jika merakit CPU Zen 5 desktop + RX 7600 XT + memori, apakah mungkin membuat sistem murah yang berbagi bandwidth memori antara memori sistem dan GPU seperti Strix Halo atau Apple Silicon, dan apakah itu bisa menjalankan LLM besar secara lokal dengan harga masuk akal, selain itu saya kurang paham, tetapi setahu saya hanya APU yang bisa berbagi memori sementara discrete GPU tidak, apakah benar
- Pada GPU yang memorinya terpisah secara fisik, memorinya bukan "unified", dalam kasus seperti itu akses dilakukan lewat bus PCIe, dan bottleneck bandwidth-nya cukup besar, PCIe 5.0 x16 maksimal 64GB/s, dan tidak semua GPU pun mendukung itu
Saya penasaran apakah performa grafisnya bisa bersaing dengan 5070M, jika harga dan konsumsi dayanya masuk akal maka ini terlihat sangat menarik
- Konsumsi dayanya sekitar 75W, bisa dinaikkan secara manual, tetapi dalam kondisi apa pun tetap di bawah 100W (ini info yang saya dapat saat meneliti Z13), chip ini sendiri bisa menangani daya yang lebih tinggi, dan ASUS biasanya memberi laptop lebih dari 130W, jadi angka 75W ini agak mengejutkan
Saya penasaran bagaimana performa GPU-nya jika dibandingkan dengan GPU pada Mac seri m

Chiplet APU AMD: Ikhtisar Strix Halo

Pengenalan dan Ikhtisar Produk

Lingkungan Pengujian dan Perangkat

Subsystem Memori dari Sudut Pandang CPU

Performa CPU

Arsitektur Memori dari Sudut Pandang GPU

Throughput Operasi GPU

Performa GPU dan Gaming

Kesimpulan

Bacaan terkait

1 komentar

Komentar Hacker News