1 poin oleh GN⁺ 2025-12-24 | 1 komentar | Bagikan ke WhatsApp
  • Fasilitas waktu NIST di Boulder, Colorado, AS berhenti beroperasi selama beberapa hari akibat pemadaman listrik, dan karena generator cadangan rusak, terjadi selisih hingga 5μs terhadap waktu acuan UTC
  • Fasilitas ini mengoperasikan 6 server NTP dan meski generator gagal, tetap mempertahankan deviasi waktu di bawah 5μs, sehingga hampir tidak berdampak bagi pengguna umum
  • Dampak mungkin terasa bagi lembaga riset ilmiah dan perusahaan dirgantara yang bergantung pada timing presisi, sehingga NIST sedang bekerja sama langsung dengan mereka
  • Sistem GPS dan WWV-Ft. Collins berfungsi normal sebagai cadangan, membuktikan redundansi infrastruktur waktu nasional AS
  • Kasus ini menunjukkan risiko ketergantungan pada GPS dan rapuhnya infrastruktur timing, sekaligus menyoroti perlunya pengembangan sistem PNT alternatif

Pemadaman listrik dan munculnya galat waktu

  • Kampus NIST di Boulder, Colorado terkena angin kencang lebih dari 160 km/jam (100mph), sehingga perusahaan listrik memutus pasokan daya untuk mencegah risiko kebakaran
    • Seluruh kampus ditutup sehingga staf tidak bisa masuk, yang menyebabkan pemulihan tertunda
  • Salah satu generator cadangan rusak dua hari kemudian, sehingga daya untuk clock ensemble utama server NTP terputus
  • Jeff Sherman, kepala Time Realization and Distribution Group, bahkan mempertimbangkan mematikan server untuk mencegah penyiaran waktu yang tidak akurat
  • Untungnya, sistem jam di gedung lain dapat mengirimkan sinyal waktu, dan beberapa staf tetap berada di lokasi untuk memulihkan layanan lewat pengalihan daya darurat
  • Cadangan baterai (UPS) menjaga waktu hingga generator diganti, dan hasil akhirnya deviasi terhadap UTC tercatat di bawah 5μs
Iklan

Operasi server NTP dan cakupan dampak

  • NIST menyediakan layanan waktu internet melalui 6 server NTP utama
  • Dari hasil perintah sntp time-a-b.nist.gov, galat akibat latensi jaringan bagi pengguna umum sekitar 35 milidetik (35.000μs), sehingga galat 5μs bisa diabaikan
  • Karena itu server tidak dihentikan, dan meski akurasi sekitar 5.000 kali lebih rendah dari biasanya, sebagian besar pengguna tidak terdampak
  • Universitas, sektor dirgantara, dan lembaga riset ilmiah sensitif terhadap galat kecil, sehingga NIST bekerja langsung dengan mereka untuk koreksi
  • Sistem GPS AS otomatis beralih ke kampus WWV-Ft. Collins, sehingga layanan tetap berjalan tanpa gangguan total

Kerapuhan infrastruktur waktu dan teknologi alternatif

  • Penulis mengoperasikan server NTP sendiri dengan dua jam GPS berbasis Raspberry Pi, dan menyoroti risiko ketergantungan pada GPS
  • CISA sebelumnya sudah memperingatkan risiko ketergantungan berlebihan AS pada GPS, dan pemerintah sedang mendorong pengembangan teknologi PNT (Position, Navigation, Timing) alternatif
  • Broadcast Positioning System (BPS) sedang dibahas sebagai salah satu kandidat pengganti GPS
  • Penulis menggunakan jam atom rubidium dan GPSDO untuk mempertahankan akurasi hingga tingkat beberapa nanodetik, dan tetap bisa menjaga waktu selama berbulan-bulan meski sinyal GPS terganggu
  • Namun bidang sains, RF, media, dan keuangan memerlukan presisi tingkat nanodetik, dan sebagian besar merujuk ke waktu acuan NIST

Pelajaran dan keandalan sistem

  • Insiden ini membuktikan bahwa sistem respons bencana NIST benar-benar bekerja, memperlihatkan bahwa layanan tetap berjalan “dalam operasi normal meski ada galat kecil”
  • Kombinasi redundansi daya, banyak sistem jam, dan cadangan GPS menjaga stabilitas infrastruktur waktu nasional
  • Penulis menekankan bahwa “infrastruktur timing sangat rapuh, dan banyak lapisan cadangan itu wajib
  • Dalam situasi krisis tingkat mikrodetik pun tim NIST berhasil menyelesaikan masalah, dan pemulihan selesai sampai-sampai sebagian besar pengguna tidak menyadarinya

1 komentar

 
GN⁺ 2025-12-24
Komentar Hacker News
  • Program Time Over Fiber (TOF) milik NIST terasa paling menarik
    Layanan ini menyediakan distribusi waktu presisi tinggi melalui serat optik, dan disebutkan bahwa beberapa link yang terhubung langsung ikut terdampak
    Baru pertama kali mendengar layanan seperti ini, tetapi mungkin bisa dipakai untuk sektor finansial (HFT, terkait FINRA Rule 4590), sinkronisasi 5G, atau database global seperti Google Spanner
    Tautan terkait: pengumuman NIST, penjelasan program TOF, FINRA Rule 4590, artikel tentang sinkronisasi 5G

    • Di HFT, tingkat presisi seperti ini tidak dibutuhkan
      Dalam sistem trading real-time, GPS sudah cukup, dan yang lebih penting daripada akurasi mikrodetik adalah latensi
      Persyaratan regulasinya juga mengizinkan error 1 detik, jadi presisi setingkat TOF tidak diwajibkan
    • Kemungkinan lebih untuk eksperimen ilmiah
      Misalnya saat perlu menyinkronkan data dari wilayah luas secara presisi, seperti ketika mengamati gelombang gravitasi dan ledakan sinar gamma secara bersamaan
    • Belum tentu konsumennya adalah pihak komersial
      Misalnya tempat seperti Schriever Space Force Base adalah titik kendali utama GPS
    • Kemungkinan prioritasnya adalah penggunaan riset ilmiah seperti White Rabbit Project
      Selain itu, ini juga penting sebagai jaringan waktu berbasis darat untuk berjaga-jaga ketika sinyal GNSS terputus
      Artikel terkait: sistem timing darat presisi tinggi milik China
    • Bisa juga dipakai sebagai jam referensi untuk perhitungan TDOA (Time Difference of Arrival) yang sangat presisi di jaringan SIGINT
  • Sebenarnya yang mengalami masalah sinkronisasi hanya server Boulder
    Penyebutan “seluruh NIST offline” itu berlebihan
    Menurut halaman status server, hanya 5 dari 16 server NTP IPv4 yang terdampak, sisanya tetap berfungsi normal
    Sebagian besar pengguna juga seharusnya memang tidak memakai server stratum atas secara langsung, jadi dampaknya hampir tidak ada
    Secara pribadi, saya merekomendasikan memakai pool.ntp.org

    • Saya penasaran siapa yang benar-benar memakai server stratum atas secara langsung
      Apakah ada kemungkinan error menyebar? Saya juga penasaran apakah pool.ntp.org didistribusikan sedemikian rupa untuk menghindari kegagalan atau korelasi error
    • time.nist.gov memakai DNS round-robin, jadi sebagian pengguna mungkin memang terhubung ke server Boulder dan mengalami error 5μs
  • Koreksi kecil: UTC adalah singkatan dari “Coordinated Universal Time”
    Urutan hurufnya diatur agar tidak memihak bahasa Inggris maupun Prancis

    • Ada juga yang menyebutnya “Universal Time, Coordinated”
    • Menurut Wikipedia, ini adalah hasil kesepakatan organisasi internasional untuk memakai singkatan yang sama di semua bahasa
      Konsistensi dengan sistem singkatan yang sudah ada seperti UT0, UT1, UT2 juga ikut dipertimbangkan
    • Sebagai tambahan, waktu standar Islandia juga sama dengan UTC
    • Latar belakang penamaan seperti ini cukup menarik
    • Dalam bahasa Prancis disebut “Universel Temps Coordonné
  • Sedikit di luar topik, tetapi saya ingin memuji chrony
    Di berbagai lingkungan hardware, ini jauh lebih stabil daripada klien NTP bawaan OS lama

    • Memang, di distro seperti RHEL dan SLES, chrony sudah menjadi default
      Itu menunjukkan performa dan stabilitasnya memang sudah terbukti
  • Thread ini terlalu menarik sampai saya terus membacanya
    Mungkin karena hari ini saya minum Adderall terlalu banyak

  • Katanya beberapa trader HFT yang saya kenal menghasilkan ratusan ribu dolar dari kejadian ini

    • Saya penasaran bagaimana itu bisa terjadi
      Ingin tahu apakah mereka sengaja memanfaatkan sistem, atau hanya glitch yang kebetulan menguntungkan
  • Dulu ada ungkapan “mengirim waktu yang salah lebih buruk daripada tidak mengirim sama sekali”, jadi saya tidak begitu paham kenapa kali ini waktu yang meleset tetap dikirim

    • Error 5μs pada dasarnya tidak berarti bagi pengguna NTP
      Menurut mailing list NIST, transmisi lewat internet biasanya punya ketidakpastian sekitar 1ms, jadi ini berada di skala yang benar-benar berbeda dari presisi ilmiah
    • Pertanyaan yang bagus
      Saat itu, listrik dan akses administratif sama-sama terputus, jadi tidak ada cara untuk mengetahui seberapa jauh jamnya meleset
      Jika waktu yang salah langsung tersebar begitu daya pulih, sistem di seluruh dunia bisa mengalami error sinkronisasi
      Karena itu, lebih aman untuk memutus secara aman (scram)
      Cerita pendek terkait: The Time Rift of 2100
    • Terkadang prinsipnya memang lebih baik tidak ada jawaban daripada jawaban yang salah
      Misalnya alarm kebakaran yang salah melaporkan “tidak ada masalah” lebih berbahaya daripada tidak memberi respons sama sekali
  • Saya tidak paham judul video yang bilang “jam NIST nyaris menyebabkan bencana”
    Bukankah cukup melakukan koreksi waktu dari kampus lain?

    • Ada yang menjawab bercanda, “alasannya akan mengejutkan Anda”
    • Secara praktis, itu memang terdengar seperti judul clickbait
      Jika memang ada kasus yang benar-benar memerlukan presisi seperti itu, penjelasan dari ahli akan dibutuhkan
  • Saya penasaran apa contoh paling penting ketika orang benar-benar membutuhkan waktu yang akurat

    • Saya bekerja di akselerator partikel
      Kami memakai White Rabbit untuk menyinkronkan sistem daya RF dan perangkat akuisisi data hingga tingkat nanodetik
    • Google Spanner adalah contoh yang representatif
      Dengan TrueTime, ia menjamin konsistensi transaksi global
    • Ini juga sangat penting untuk menghitung state vector wahana antariksa
    • Sistem seperti jaringan teleskop radio aperture sintetis juga perlu mencocokkan jam antarwilayah dengan presisi tinggi
    • Sebagai gambaran, error 5μs setara dengan jarak rambat gelombang radio sekitar 1500m
      Jika satelit GPS meleset sebesar itu, akurasi posisinya akan turun ke level Loran-C
  • Cerita ini bermula dari artikel NPR
    tautan asli