NIST tertinggal 5 mikrodetik dari UTC setelah pemadaman listrik pekan lalu
(jeffgeerling.com)- Fasilitas waktu NIST di Boulder, Colorado, AS berhenti beroperasi selama beberapa hari akibat pemadaman listrik, dan karena generator cadangan rusak, terjadi selisih hingga 5μs terhadap waktu acuan UTC
- Fasilitas ini mengoperasikan 6 server NTP dan meski generator gagal, tetap mempertahankan deviasi waktu di bawah 5μs, sehingga hampir tidak berdampak bagi pengguna umum
- Dampak mungkin terasa bagi lembaga riset ilmiah dan perusahaan dirgantara yang bergantung pada timing presisi, sehingga NIST sedang bekerja sama langsung dengan mereka
- Sistem GPS dan WWV-Ft. Collins berfungsi normal sebagai cadangan, membuktikan redundansi infrastruktur waktu nasional AS
- Kasus ini menunjukkan risiko ketergantungan pada GPS dan rapuhnya infrastruktur timing, sekaligus menyoroti perlunya pengembangan sistem PNT alternatif
Pemadaman listrik dan munculnya galat waktu
- Kampus NIST di Boulder, Colorado terkena angin kencang lebih dari 160 km/jam (100mph), sehingga perusahaan listrik memutus pasokan daya untuk mencegah risiko kebakaran
- Seluruh kampus ditutup sehingga staf tidak bisa masuk, yang menyebabkan pemulihan tertunda
- Salah satu generator cadangan rusak dua hari kemudian, sehingga daya untuk clock ensemble utama server NTP terputus
- Jeff Sherman, kepala Time Realization and Distribution Group, bahkan mempertimbangkan mematikan server untuk mencegah penyiaran waktu yang tidak akurat
- Untungnya, sistem jam di gedung lain dapat mengirimkan sinyal waktu, dan beberapa staf tetap berada di lokasi untuk memulihkan layanan lewat pengalihan daya darurat
- Cadangan baterai (UPS) menjaga waktu hingga generator diganti, dan hasil akhirnya deviasi terhadap UTC tercatat di bawah 5μs
Operasi server NTP dan cakupan dampak
- NIST menyediakan layanan waktu internet melalui 6 server NTP utama
- Dari hasil perintah
sntp time-a-b.nist.gov, galat akibat latensi jaringan bagi pengguna umum sekitar 35 milidetik (35.000μs), sehingga galat 5μs bisa diabaikan - Karena itu server tidak dihentikan, dan meski akurasi sekitar 5.000 kali lebih rendah dari biasanya, sebagian besar pengguna tidak terdampak
- Universitas, sektor dirgantara, dan lembaga riset ilmiah sensitif terhadap galat kecil, sehingga NIST bekerja langsung dengan mereka untuk koreksi
- Sistem GPS AS otomatis beralih ke kampus WWV-Ft. Collins, sehingga layanan tetap berjalan tanpa gangguan total
Kerapuhan infrastruktur waktu dan teknologi alternatif
- Penulis mengoperasikan server NTP sendiri dengan dua jam GPS berbasis Raspberry Pi, dan menyoroti risiko ketergantungan pada GPS
- CISA sebelumnya sudah memperingatkan risiko ketergantungan berlebihan AS pada GPS, dan pemerintah sedang mendorong pengembangan teknologi PNT (Position, Navigation, Timing) alternatif
- Broadcast Positioning System (BPS) sedang dibahas sebagai salah satu kandidat pengganti GPS
- Penulis menggunakan jam atom rubidium dan GPSDO untuk mempertahankan akurasi hingga tingkat beberapa nanodetik, dan tetap bisa menjaga waktu selama berbulan-bulan meski sinyal GPS terganggu
- Namun bidang sains, RF, media, dan keuangan memerlukan presisi tingkat nanodetik, dan sebagian besar merujuk ke waktu acuan NIST
Pelajaran dan keandalan sistem
- Insiden ini membuktikan bahwa sistem respons bencana NIST benar-benar bekerja, memperlihatkan bahwa layanan tetap berjalan “dalam operasi normal meski ada galat kecil”
- Kombinasi redundansi daya, banyak sistem jam, dan cadangan GPS menjaga stabilitas infrastruktur waktu nasional
- Penulis menekankan bahwa “infrastruktur timing sangat rapuh, dan banyak lapisan cadangan itu wajib”
- Dalam situasi krisis tingkat mikrodetik pun tim NIST berhasil menyelesaikan masalah, dan pemulihan selesai sampai-sampai sebagian besar pengguna tidak menyadarinya
1 komentar
Komentar Hacker News
Program Time Over Fiber (TOF) milik NIST terasa paling menarik
Layanan ini menyediakan distribusi waktu presisi tinggi melalui serat optik, dan disebutkan bahwa beberapa link yang terhubung langsung ikut terdampak
Baru pertama kali mendengar layanan seperti ini, tetapi mungkin bisa dipakai untuk sektor finansial (HFT, terkait FINRA Rule 4590), sinkronisasi 5G, atau database global seperti Google Spanner
Tautan terkait: pengumuman NIST, penjelasan program TOF, FINRA Rule 4590, artikel tentang sinkronisasi 5G
Dalam sistem trading real-time, GPS sudah cukup, dan yang lebih penting daripada akurasi mikrodetik adalah latensi
Persyaratan regulasinya juga mengizinkan error 1 detik, jadi presisi setingkat TOF tidak diwajibkan
Misalnya saat perlu menyinkronkan data dari wilayah luas secara presisi, seperti ketika mengamati gelombang gravitasi dan ledakan sinar gamma secara bersamaan
Misalnya tempat seperti Schriever Space Force Base adalah titik kendali utama GPS
Selain itu, ini juga penting sebagai jaringan waktu berbasis darat untuk berjaga-jaga ketika sinyal GNSS terputus
Artikel terkait: sistem timing darat presisi tinggi milik China
Sebenarnya yang mengalami masalah sinkronisasi hanya server Boulder
Penyebutan “seluruh NIST offline” itu berlebihan
Menurut halaman status server, hanya 5 dari 16 server NTP IPv4 yang terdampak, sisanya tetap berfungsi normal
Sebagian besar pengguna juga seharusnya memang tidak memakai server stratum atas secara langsung, jadi dampaknya hampir tidak ada
Secara pribadi, saya merekomendasikan memakai pool.ntp.org
Apakah ada kemungkinan error menyebar? Saya juga penasaran apakah pool.ntp.org didistribusikan sedemikian rupa untuk menghindari kegagalan atau korelasi error
Koreksi kecil: UTC adalah singkatan dari “Coordinated Universal Time”
Urutan hurufnya diatur agar tidak memihak bahasa Inggris maupun Prancis
Konsistensi dengan sistem singkatan yang sudah ada seperti UT0, UT1, UT2 juga ikut dipertimbangkan
Sedikit di luar topik, tetapi saya ingin memuji chrony
Di berbagai lingkungan hardware, ini jauh lebih stabil daripada klien NTP bawaan OS lama
Itu menunjukkan performa dan stabilitasnya memang sudah terbukti
Thread ini terlalu menarik sampai saya terus membacanya
Mungkin karena hari ini saya minum Adderall terlalu banyak
Katanya beberapa trader HFT yang saya kenal menghasilkan ratusan ribu dolar dari kejadian ini
Ingin tahu apakah mereka sengaja memanfaatkan sistem, atau hanya glitch yang kebetulan menguntungkan
Dulu ada ungkapan “mengirim waktu yang salah lebih buruk daripada tidak mengirim sama sekali”, jadi saya tidak begitu paham kenapa kali ini waktu yang meleset tetap dikirim
Menurut mailing list NIST, transmisi lewat internet biasanya punya ketidakpastian sekitar 1ms, jadi ini berada di skala yang benar-benar berbeda dari presisi ilmiah
Saat itu, listrik dan akses administratif sama-sama terputus, jadi tidak ada cara untuk mengetahui seberapa jauh jamnya meleset
Jika waktu yang salah langsung tersebar begitu daya pulih, sistem di seluruh dunia bisa mengalami error sinkronisasi
Karena itu, lebih aman untuk memutus secara aman (scram)
Cerita pendek terkait: The Time Rift of 2100
Misalnya alarm kebakaran yang salah melaporkan “tidak ada masalah” lebih berbahaya daripada tidak memberi respons sama sekali
Saya tidak paham judul video yang bilang “jam NIST nyaris menyebabkan bencana”
Bukankah cukup melakukan koreksi waktu dari kampus lain?
Jika memang ada kasus yang benar-benar memerlukan presisi seperti itu, penjelasan dari ahli akan dibutuhkan
Saya penasaran apa contoh paling penting ketika orang benar-benar membutuhkan waktu yang akurat
Kami memakai White Rabbit untuk menyinkronkan sistem daya RF dan perangkat akuisisi data hingga tingkat nanodetik
Dengan TrueTime, ia menjamin konsistensi transaksi global
Jika satelit GPS meleset sebesar itu, akurasi posisinya akan turun ke level Loran-C
Cerita ini bermula dari artikel NPR
tautan asli