1 poin oleh GN⁺ 2025-12-12 | 1 komentar | Bagikan ke WhatsApp
  • Eksperimen memodifikasi server Nvidia Grace-Hopper GH200 menjadi desktop AI pribadi, dengan performa yang cukup untuk menjalankan model berparameter 235B secara lokal
  • Membeli sistem GH200 bekas seharga 7.500 euro dari Reddit, lalu merakit ulang server berpendingin cair untuk pusat data menjadi desktop berpendingin udara
  • Melakukan banyak troubleshooting perangkat keras termasuk masalah pendinginan, daya, dan error sensor seperti tampilan suhu GPU 16,77 juta°C, kerusakan rangkaian kipas, hingga pemulihan lewat penyolderan manual
  • Pada akhirnya menyelesaikan sistem yang stabil dengan menggabungkan 4 pendingin cair, adaptor hasil pemesinan CNC, dan komponen cetak 3D
  • Dengan total biaya sekitar 9.000 euro, berhasil membangun workstation AI berperforma sangat tinggi yang lebih murah daripada harga satu GPU H100

Pembelian server Grace-Hopper dan spesifikasinya

  • Menemukan listing server GH200 seharga 10.000 euro di forum Reddit r/LocalLLaMA, lalu setelah negosiasi membelinya seharga 7.500 euro
    • Konfigurasi: 2× Grace-Hopper Superchip, 2× CPU Grace 72-core, 2× GPU H100, 480GB LPDDR5X, 96GB HBM3, total 1.152GB memori berkecepatan tinggi
    • Bandwidth NVLink-C2C 900GB/s, daya 1.000~2.000W, termasuk PSU 3.000W
  • Penjualnya adalah GPTshop.ai, perusahaan yang menjual server Nvidia yang dimodifikasi menjadi desktop
    • Sistem ini awalnya berbentuk 'frankensystem' yang mengubah server berpendingin cair menjadi pendinginan udara
    • Penampilannya kasar, tidak bisa dipasang ke rak, dan dilengkapi catu daya 48V

Pembongkaran dan pembersihan server

  • Server berada dalam kondisi sangat berdebu, dan 8 kipas bertenaga tinggi menghasilkan kebisingan setingkat penyedot debu
    • Terlalu bising untuk digunakan di rumah, sehingga dibongkar lalu dibersihkan dan dirakit ulang
  • Mencuci seluruh motherboard menggunakan beberapa liter isopropanol, lalu dikeringkan di atas lantai pemanas selama seminggu
  • Membongkar modul Grace-Hopper untuk memeriksa kondisi internal dan menelusuri struktur di dalamnya
Iklan

Rekonfigurasi sistem pendingin cair

  • Karena risiko kebocoran, digunakan 4 pendingin AIO Arctic Liquid Freezer III 420 alih-alih blok kustom
    • Setelah mengukur dimensi die GPU dan CPU, blok adaptor dirancang dengan Fusion 360
    • Prototipe dibuat dengan printer 3D Bambu X1, lalu komponen akhir diselesaikan lewat pemesinan CNC
  • Setelah pemesinan, sisa oli dibersihkan dan pemasangan selesai, sehingga performa pendinginan tercapai

Perakitan desktop

  • Frame dibuat dari profil aluminium ProfilAlu, dengan desain menggunakan Fusion 360
    • Puluhan komponen dudukan PCB dan filter dibuat lewat pencetakan 3D
    • Menggunakan beberapa kilogram filamen untuk menstabilkan struktur

Masalah utama yang muncul

  • Saat menyambungkan daya kipas, terdengar bunyi 'pop' dan muncul asap', dan sebagian rangkaian header kipas rusak
    • Diduga MOSFET rusak akibat perhitungan arus yang keliru
    • Daya kipas kemudian diganti memakai adaptor 12V-5A terpisah
  • Error kipas membuat BMC (Baseboard Management Controller) memblokir proses boot
    • Pemeriksaan kipas dilewati dengan menonaktifkan phosphor-sensor-monitor.service
    Iklan

Error suhu GPU dan perbaikan rangkaian

  • Saat boot, suhu GPU ditampilkan sebagai 16.777.214°C, lalu sistem mati otomatis
    • Ini adalah nilai maksimum bilangan bulat 24-bit (2²⁴-2) yang menandakan error sinyal sensor
  • Hasil pemeriksaan dengan mikroskop menunjukkan kerusakan pada kapasitor 100nF dan resistor 4.7kΩ
    • Rangkaian dipulihkan dengan penyolderan presisi, lalu dikunci memakai masker UV
    • Setelah dirakit ulang, sistem berhasil boot normal

Konfigurasi akhir dan performa

  • Komponen tambahan yang dibuat:
    • Dudukan SSD E1.S 8TB, panel belakang PSU 3kW, mesh pelindung radiator
    Iklan
  • Masalah inisialisasi GPU diselesaikan dengan menonaktifkan NVLink
    • Menambahkan NVreg_NvLinkDisable=1 ke /etc/modprobe.d/nvidia-disable-nvlink.conf

Hasil benchmark

  • Build Llama.cpp dengan 144 core memerlukan 90 detik, dengan hasil uji model besar berikut:
    • gpt-oss-120b-Q4_K_M: prompt 2974.79, token 195.84
    • GLM-4.5-Air-Q4_K_M: prompt 1936.65, token 100.71
    • Qwen3-235B-A22B-Instruct: prompt 1022.79, token 65.90
  • Konsumsi sekitar 300W per GPU, masih jauh di bawah maksimum (900W)

Rincian biaya

  • Server Grace-Hopper €7.500, SSD €250, adaptor CNC €700, pendingin cair €180
  • Frame €200, panel kaca €40, bahan cetak 3D €40, komponen lain €50
  • Isopropanol untuk pembersihan €20, catu daya 12V €10, lampu LED €10
  • Total biaya sekitar €9.000, lebih murah daripada satu GPU H100

Kesimpulan

  • Berhasil menyelesaikan desktop yang dapat menjalankan model 235B parameter secara lokal
  • Dalam proses mengubah perangkat keras kelas pusat data menjadi perangkat pribadi, berhasil mengatasi berbagai kendala seperti error sensor, kerusakan rangkaian, dan masalah pendinginan
  • Hasilnya adalah contoh pembangunan workstation riset AI berperforma tinggi dengan biaya rendah

1 komentar

 
GN⁺ 2025-12-12
Komentar Hacker News
  • Saya membeli perangkat keras AI kelas data center, memodifikasinya dari pendingin cair → pendingin udara → kembali ke pendingin cair, mengalami banyak krisis termasuk suhu GPU yang sempat terbaca 16 juta derajat, dan akhirnya berhasil merakit desktop yang bisa menjalankan model 235B parameter di rumah
    Ini adalah kisah tentang keputusan nekat, pemecahan masalah yang kreatif, dan upaya mengubah peralatan data center menjadi perangkat harian

    • Saya menemukan bahwa jika driver diperintahkan untuk sepenuhnya mengabaikan NVLINK, GPU akan diinisialisasi secara independen melalui PCIe
      Butuh seminggu untuk menemukan ini, dan saya berhasil berkat Reddit. Saya jadi penasaran apakah masalah seperti ini juga bisa terjadi di semua data center
    • Saya juga sempat melihat postingan yang sama di Reddit dan mempertimbangkan untuk membelinya, tapi saya tinggal di AS jadi saya urung. Syukurlah ternyata bukan penipuan
    • Dia bilang membayar 7.500 euro tunai, jadi saya penasaran apakah semuanya ditarik dalam bentuk uang kertas. Saya ingin tahu bagaimana bank bisa menyiapkan jumlah sebesar itu
    • Mengesankan bahwa komponen solder dikunci dengan epoksi. Sepertinya harus sangat percaya diri dengan kemampuan menyolder. Saya jadi penasaran apakah dia tidak punya glue gun
  • Saya juga punya pengalaman serupa. Selama 3 tahun saya ingin membuat server game berbentuk rack untuk dipakai bersama anak saya, tapi rumah sempit dan istri tidak mengizinkan, jadi saya memanfaatkan pembangkit listrik PV (90kWp) di rumah orang tua dan server rack di sana
    Dua bulan lalu saya membeli Supermicro SYS-7049GP-TRT di eBay seharga 1.400 euro, dan setelah dibuka ternyata di dalamnya ada Nvidia V100S 32GB. Saya menjualnya seharga 1.600 euro lalu mengganti dengan dua CPU Xeon 6254. Setelah itu saya membeli dua Blackwell RTX 4000 Pro, sehingga sekarang bisa dipakai untuk bermain game bersama anak saya sekaligus bereksperimen dengan LLM
    Casing ini bisa menampung 4 GPU ganda, jadi suatu hari mungkin bisa di-upgrade menjadi empat RTX 6000 (total 384GB VRAM). Peralatan enterprise bekas sangat kokoh dan rasio harga terhadap nilainya bagus, jadi ini benar-benar hobi yang menyenangkan

  • Lucu juga melihat server 20kg seharga 7,5k euro ditaruh di atas meja IKEA LACK seharga 5 euro. LACK punya beban maksimum 25kg, jadi kelihatannya berbahaya

    • Sebenarnya casing aslinya memang 20kg, tapi sekarang sudah ditambah rangka aluminium dan panel kaca jadi sekitar 40kg. Kalau dipikir-pikir lagi, memang sepertinya tidak boleh ditaruh di atas LACK
    • Tapi meja LACK ternyata cukup kuat. Banyak dipakai untuk server atau peralatan jaringan, dan di wiki LackRack juga ada banyak contohnya. Saya sendiri pernah menaruh lebih dari 100kg di atasnya
    • Tapi setidaknya masih ada margin keamanan 25%, begitu candanya
  • Kalimat “saya menyetir dua jam untuk mengambilnya langsung” itu lucu. Benar-benar Your mileage may vary secara harfiah

  • Karena proses menghidupkan GPU itu menyakitkan, saya terkesan dia meninggalkan perintah instalasi untuk para penjelajah berikutnya
    Dia harus memasang driver NVIDIA-Linux-aarch64, dan setiap kali melihat perintah-perintah yang sulit dipahami seperti ini, saya langsung merasa, “ya, saya juga pernah ada di posisi itu”

  • Kalau bertanya serius, saya penasaran apakah perangkat seperti ini juga benar-benar bagus untuk performa gaming. Karena dioptimalkan untuk AI/ML, jangan-jangan justru game biasa tidak jalan dengan baik
    Dan pada bagian “pergi ke rumah pertanian di tengah hutan”, saya juga sempat bertanya-tanya apakah situasinya berbahaya

    • Saat penjual berkata “servernya ada di belakang van putih” sambil menunjukkan bagian belakang mobil, itu memang agak menakutkan. Untungnya setelah melihat bengkelnya, saya jadi tenang
    • GPU seperti ini tidak punya output HDMI atau DisplayPort, jadi kalau mau main game harus dijalankan melalui VM
    • Untuk gaming, kombinasi terbaik adalah RTX PRO 6000 Blackwell + AMD 9800X3D + RAM latensi rendah + NVMe. Di atas itu, efisiensi terhadap hasilnya menurun. CPU server berbasis ARM juga menimbulkan masalah DRM
    • Di video LTT juga pernah diuji GPU AI serupa, dan performa gaming-nya sangat buruk. Kartu konsumen kelas menengah dengan harga 1/10 justru memberi hasil lebih baik
  • Tulisan seperti ini benar-benar keren. Kisah keberhasilan DIY seperti inilah daya tarik Hacker News

    • Betul. Memicu rasa iri tapi sekaligus memberi inspirasi bahwa “saya juga mungkin bisa melakukannya”
  • Tentu saja ini tetap transaksi yang bagus, tapi membandingkannya dengan harga baru H100 agak berlebihan. Sekarang RTX 6000 Pro bisa dibeli di kisaran 7–8 ribu dolar, dan performanya juga mirip. Selain itu, kartu itu juga bisa dipasang di workstation biasa. Depresiasi peralatan enterprise bekas memang sangat besar

    • Meski begitu, ini tetap transaksi yang luar biasa. Alasannya adalah perbedaan halus pada RAM/VRAM
      Blackwell memang dua kali lebih cepat dari H100 dalam FP8, tetapi perbandingan ini memakai FP4 jadi realitasnya berbeda. Bandwidth VRAM berbasis HBM3 juga 4,9TB/s, sekitar 2,5 kali lebih cepat daripada 1,8TB/s milik RTX 6000 Pro
      NVLink-C2C memberikan 900GB/s antar-kartu, sekitar 5 kali PCIe5, sehingga pada LLM besar hal ini mengurangi bottleneck
      Misalnya pada benchmark GPT-OSS-120B, RTX 6000 Pro menghasilkan 145 token per detik, sedangkan GH200 menghasilkan 195 token per detik
    • Lagi pula dia punya dua H100. Untuk membeli dua RTX 6000 Pro dibutuhkan 15–16 ribu dolar, dan RAM yang sudah termasuk saja nilainya lebih dari 7 ribu dolar
  • Rasanya seperti benar-benar menjalani mimpi cyberpunk di dunia nyata. Keberanian untuk mencoba hal seperti ini luar biasa

  • Saya minta rekomendasi toko untuk membeli peralatan enterprise bekas. Kebanyakan tampaknya ada di California, jadi saya penasaran apakah ada juga di wilayah NY/NJ

    • Cari penjual di eBay yang memasang banyak produk serupa lalu telusuri mereka. Ada cukup banyak seller seperti itu di seluruh negeri