3 poin oleh GN⁺ 2024-10-13 | 1 komentar | Bagikan ke WhatsApp

Turin dari AMD: Peluncuran EPYC Generasi ke-5

  • CPU server 5 GHz
    • Artikel ini memperkenalkan EPYC 9575F, CPU server baru dari AMD, dan ditulis berdasarkan pengalaman hands-on langsung, berbeda dari Granite Rapids sebelumnya.
    • Karena perbedaan antara versi mobile dan desktop dari core Zen 5 sudah pernah dibahas, artikel ini berfokus pada perubahan subsistem memori di Turin.

Bandwidth memori

  • 9575F mencatat bandwidth baca memori sekitar 52GB/s, bandwidth tulis 48GB/s, dan bandwidth read-modify-write 95GB/s.
  • Jika melihat pemakaian bandwidth memori pada satu CCD, satu core tunggal dapat menggunakan kurang dari setengah total bandwidth baca memori CCD, sekitar 55% bandwidth tulis, dan lebih dari 2/3 bandwidth read-modify-write.
  • 9575F memiliki bandwidth ke CCD yang jauh lebih tinggi dibandingkan komponen desktop Zen 5, karena menyediakan 2 link GMI ke IO die melalui GMI3-W.
  • Turin mendukung hingga DDR5-6400MT/s, tetapi hanya didukung sebagai 1 DIMM per channel pada sistem tertentu. Sebagian besar sistem mendukung 6000MT/s, dan jika dikonfigurasi sebagai 2 DIMM per channel akan turun menjadi 4400 MT/s.

Latensi memori

  • Latensi memori tanpa beban pada Turin mirip dengan Genoa.
  • Hasil pengukuran latensi memori dalam kondisi beban menunjukkan bahwa saat satu CCD dibebani, latensi meningkat sekitar 39 nanodetik dibandingkan kondisi tanpa beban, dan saat seluruh sistem dibebani, meningkat sekitar 31 nanodetik.
  • Latensi di dalam CCD sekitar 45ns, latensi antar-CCD sekitar 150ns, dan latensi antarsocket sekitar 260ns, yang menunjukkan peningkatan latensi dibandingkan Genoa.

Kecepatan clock

  • Semua 64 core pada 9575F dapat mencapai hingga 5GHz dalam pengujian single-thread, dan pada pengujian bandwidth memori, 8 core berjalan pada 5GHz.
  • Saat 128 thread berjalan di Cinebench 2024, 9575F mempertahankan sekitar 4.3GHz, dan pada workload transaksi web server/TLS mencatat sekitar 4.9GHz.

Kesimpulan

  • Turin dari AMD merupakan pembaruan generasi yang dapat diperkirakan, dengan menawarkan SKU berjumlah core tinggi dan SKU frekuensi tinggi berjumlah core rendah untuk memenuhi kebutuhan berbagai pasar.
  • Turin lebih dekat ke evolusi dari Milan ke Genoa daripada perubahan revolusioner dari Naples ke Rome, mencakup peningkatan bandwidth memori, peningkatan jumlah core, dan pembaruan core.
  • Generasi ini menawarkan banyak nilai dalam ekosistem yang kompetitif, dan akan menarik bagi banyak orang.

Ringkasan GN⁺

  • Turin dari AMD menghadirkan kemajuan penting di pasar CPU server, khususnya peningkatan pada bandwidth memori dan performa core yang patut diperhatikan.
  • Artikel ini bermanfaat bagi mereka yang ingin memahami teknologi terbaru AMD, dan dapat membantu engineer yang tertarik pada optimasi performa server.
  • Produk dengan fungsi serupa Turin mencakup seri Xeon dari Intel, dan perbandingan dengan AMD dapat membantu memahami kelebihan dan kekurangan masing-masing produk.

1 komentar

 
GN⁺ 2024-10-13
Komentar Hacker News
  • AMD EPYC 9175F adalah produk yang tidak biasa dengan 16 core dan cache L3 512MB. Ini tampaknya ditujukan bagi pelanggan yang ingin meminimalkan biaya lisensi "per core". Saya penasaran apakah Oracle masih menggunakan model lisensi seperti ini

    • Untuk tujuan tertentu seperti HFT, seluruh algoritme juga bisa dimasukkan ke L3 demi mengejar latensi minimum
    • Namun kemungkinan besar ini terutama terkait masalah lisensi perangkat lunak
  • Phoronix mengulas perbandingan antara Turin Dense 196 core dan AmpereOne 192 core

    • MSRP Ampere adalah $5.5K, sedangkan EPYC $15K
    • Turin 196 memiliki performa 1,6 kali lebih baik
    • Ampere 1,2 kali lebih efisien dalam konsumsi energi
    • Dari sisi $/performa nyata, Ampere 192 core 1,7 kali lebih baik daripada Turin Dense 196 core
  • Dengan $5.5K, Anda bisa membeli CPU AmpereOne 192 core (274w) atau CPU Turin Dense 48 core (300w)

    • Ampere berencana merilis produk 256 core, 3nm, dengan 12 channel memori tahun depan, yang berpotensi menjadi penantang lebih baik dalam persaingan performa melawan Turin Dense dan Sierra Forest
    • Untuk saat ini, $/performa adalah proposisi nilai mereka
  • Sangat tertarik pada performa chip server Qualcomm berbasis Nuvia

    • Jika peningkatan core klien ARM bisa menjadi indikator, saya sangat penasaran bagaimana chip buatan sendiri seperti AWS Graviton, Google Axion, Microsoft Cobalt, Nvidia Grace, dan Alibaba Yitian akan bersaing dengan core Neoverse yang lebih baik
    • Persaingan Nuvia vs ARM vs AmpereOne sangat dinantikan
  • Mungkin sekarang adalah masa keemasan CPU server

    • 7 tahun lalu hanya ada Intel Xeon
    • Sekarang ada beragam pilihan
  • Menantikan Hetzner menghadirkan server bare metal AMD Turin

    • Generasi sebelumnya pun sudah menawarkan nilai yang sangat bagus, tetapi kali ini tampaknya naik satu tingkat lagi
  • 20 tahun lalu, per CPU hanya ada 1-2 core, dan memiliki 4 core di server dual-socket sudah termasuk beruntung

    • Sekarang satu server bisa memiliki hampir 400 core
    • Core ARM mungkin bisa lebih banyak, tetapi untuk saat ini performanya belum sebagus ini
  • Bagi orang yang tidak menyukai perpindahan ke Substack, ada situs alternatif

  • Sedang menjalankan Dell PowerEdge berusia 12 tahun dengan dual Xeon

    • Menantikan saat server Epyc generasi pertama mulai murah di eBay
  • ChipsAndCheese adalah salah satu publikasi teknologi baru yang memiliki pengetahuan luar biasa, terutama dalam benchmark mendalam

    • Di saat situs teknologi lama seperti Anandtech, TechReport, HardCOP, dan lainnya telah menghilang, syukurlah ada penerbit baru yang bisa mempertahankan gaya seperti ini
  • Dirilis pada waktu yang tepat untuk Factorio 2.0

  • Ingin melihat 9965 dalam penggunaan nyata

    • Komponen-komponen ini sungguh mengagumkan
    • Berencana membeli mesin dari generasi ini
  • Di menit 1:11 pada video ada grafik TDP

    • Berjalan sangat panas di kisaran 125-500W