1 poin oleh GN⁺ 2024-09-14 | 1 komentar | Bagikan ke WhatsApp

71 TiB ZFS NAS tanpa kegagalan drive selama 10 tahun

  • Perangkat keras

    • NAS ZFS 71 TiB yang terdiri dari 24 drive 4 TB
    • Tidak pernah mengalami kegagalan drive sekalipun selama 10 tahun
    • Saat ini menggunakan motherboard dan catu daya yang kedua
  • Manajemen drive

    • Drive HGST 4 TB telah digunakan sekitar 6000 jam selama 10 tahun
    • Mematikan server saat tidak digunakan membantu memperpanjang umur drive
    • Menggunakan skrip untuk menyalakan dan mematikan server dari jarak jauh
    • Server dibiarkan mati secara default demi penghematan energi dan memperpanjang umur drive
  • Penggantian motherboard

    • Diganti beberapa tahun lalu karena motherboard rusak
    • Muncul masalah seperti tidak bisa masuk BIOS dan gagal boot
    • Masalah diselesaikan dengan membeli motherboard yang sama di Ebay
  • ZFS

    • ZFS berjalan tanpa masalah di berbagai sistem operasi
    • zpool scrub dijalankan beberapa kali, tetapi tidak ada kesalahan checksum
    • ZFS sangat efektif dalam mencegah kehilangan data
  • Manajemen kebisingan

    • Kecepatan kipas bawaan sangat tinggi sehingga sangat berisik
    • Menulis skrip yang mengatur kecepatan kipas berdasarkan suhu
    • Menggunakan kontroler PID untuk mengatur kecepatan kipas dan kebisingan
  • Jaringan

    • Awalnya menggunakan pengendali jaringan gigabit
    • Setelah beralih ke kartu Infiniband, mencapai kecepatan transfer 700 MB/s
    • Saat ini menggunakan kartu Ethernet 10Gbit
  • Catu daya

    • Saat boot, semua drive berputar bersamaan sehingga mengonsumsi daya 600W
    • Catu daya kadang memutus listrik saat proses boot
  • Menghentikan penggunaan UPS

    • UPS dihentikan pemakaiannya karena mengonsumsi daya tambahan
    • Menerima risiko kehilangan sistem akibat masalah daya
  • Cadangan

    • Data penting dicadangkan tiga kali
    • Data yang tidak penting tidak dicadangkan
    • Kehilangan data dicegah melalui penggantian perangkat keras dan ZFS
  • Rencana ke depan

    • Saat ini belum ada rencana menambah penyimpanan
    • Memiliki motherboard, CPU, memori, dan kartu HBA cadangan
    • Ada kemungkinan beralih ke form factor yang lebih kecil karena kapasitas drive yang makin besar
    • Jika sistem ini rusak, ada kemungkinan juga akan berhenti menjadikan penyimpanan sebagai hobi

Ringkasan GN⁺

  • Tulisan ini membagikan pengalaman mengoperasikan ZFS NAS 71 TiB selama 10 tahun tanpa kegagalan drive
  • Mematikan server saat tidak digunakan sangat membantu memperpanjang umur drive
  • ZFS sangat efektif untuk mencegah kehilangan data, dan kebisingan dapat dikurangi dengan pengaturan kecepatan kipas
  • Berbagai kartu jaringan digunakan untuk meningkatkan kecepatan transfer jaringan
  • Pengalaman terkait strategi pencadangan dan pengelolaan catu daya juga dibagikan

1 komentar

 
GN⁺ 2024-09-14
Komentar Hacker News
  • Diskusi utamanya berkisar pada ZFS dan BTRFS, tetapi penasaran apakah ada yang pernah menggunakan bcachefs

    • bcachefs sudah termasuk dalam kernel Linux dan memiliki fitur checksum menyeluruh
    • Ada penulis yang memandang tanggung jawab sistem berkas dengan sangat serius
  • Ada pertanyaan apakah ada jadwal rotasi drive

    • Sedang menggunakan 24 drive dengan model yang sama, dan tampaknya berasal dari batch yang sama
    • Karena tingkat keausannya mirip, kemungkinan besar bisa rusak secara bersamaan
    • Penyimpanan yang andal itu rumit
  • Pernah mendengar pendapat sebaliknya bahwa membiarkan drive tetap menyala bisa mengurangi keausan dibandingkan mematikan daya secara berkala

    • Lebih suka membiarkan ZFS NAS terus menyala agar dapat memeriksa data secara rutin
    • Selama 10 tahun menjalankan sistem dengan 4 drive, 2 drive rusak, tetapi itu bukan drive kelas enterprise (WD Green)
  • Kipas besar dapat memindahkan banyak udara bahkan pada RPM rendah, dan lebih efisien dalam penggunaan energi

    • Oxide Computer menekankan bahwa mereka menggunakan kipas 80mm yang senyap dan hemat daya
    • Pada server lain, konsumsi daya kipas bisa mencapai 25% dari total daya, sedangkan milik mereka hanya sekitar 1%
  • Ingin mendengar lebih banyak tentang koleksi film

    • Tertarik pada bagaimana memilih item awal dan item apa saja yang tetap ada dalam koleksi selama lebih dari 10 tahun
  • Mengambil risiko kehilangan sistem karena masalah listrik

    • UPS mencegah kerusakan langka akibat ketidakseimbangan daya
    • Lonjakan listrik dapat terjadi karena pekerjaan konstruksi atau petir
    • UPS melindungi server dengan rusak lebih dulu sebelum server ikut terdampak
  • 24 drive bisa memberi keuntungan performa, tetapi menggunakan NAS 6-bay dan disk 18TB memberi banyak keuntungan dalam hal penggunaan daya, kebisingan, ruang, biaya, dan keandalan

  • Lingkungan tempat drive beroperasi sangat memengaruhi umur pakainya

    • Lingkungan rumah tinggal lebih bervariasi dibanding pusat data atau ruang kantor
    • Fluktuasi suhu dan kelembapan, serta pengaruh debu, sangat besar
    • Dalam lingkungan yang bersih dan stabil, kerusakan drive berkurang secara signifikan
  • Rahasianya bukan mematikan drive, melainkan sekadar beruntung

    • Menggunakan drive 4TB HGST 24/7 selama lebih dari 10 tahun tanpa kerusakan
    • Orang lain mengalami RMA berkali-kali dengan drive yang sama
  • Ada drive yang justru berisiko jika pola siklus dayanya diubah

    • Tidak selalu baik untuk semua orang
    • Beberapa SSD memang memerlukan daya secara berkala
    • Duty cycle NAS kemungkinan besar memenuhi kebutuhan ini
    • Biaya listrik menjadi lebih murah
    • Penasaran apakah Backblaze memodelkan statistik umur drive berdasarkan jumlah siklus nyala/mati