Tentang gangguan layanan Tailscale.com pada 7 Maret 2024
- Pada 7 Maret 2024, Tailscale.com tidak dapat diakses selama sekitar 90 menit karena sertifikat TLS kedaluwarsa.
- Masalah ini dengan cepat diidentifikasi dan diperbaiki, dan terutama berdampak pada materi pemasaran serta dokumentasi.
- Gangguan layanan yang tidak terduga adalah masalah, dan mereka ingin menjelaskan penyebab, dampak, serta langkah-langkah untuk mencegah kejadian serupa.
Apa yang terjadi
- Pada Desember 2023, dilakukan perombakan besar situs web, termasuk migrasi ke penyedia hosting baru.
- Karena penyedia hosting tidak mendukung IPv6 secara default, mereka mengoperasikan proxy terpisah untuk menangani permintaan IPv6.
- Konfigurasi ini dianggap sebagai 'konfigurasi yang salah' oleh penyedia hosting, dan meskipun telah menerima peringatan, mereka tidak menyadari bahwa hal itu akan mengganggu perpanjangan sertifikat otomatis.
- Ada prover yang memeriksa kedaluwarsa sertifikat, tetapi karena hanya memeriksa melalui IPv6, ia hanya memverifikasi sertifikat yang valid yang dikelola proxy dan gagal mendeteksi kedaluwarsa yang akan segera terjadi.
Dampak
- Sebagian besar operasi Tailscale tidak perlu mengakses situs web utama, sehingga banyak pengguna tidak mengalami gangguan pada penggunaan normal.
- Dokumentasi, blog, dan materi referensi lainnya tidak dapat diakses; konsol admin dan halaman pengaturan tidak terdampak, tetapi pengguna yang tidak mengetahui cara mengaksesnya secara langsung bisa salah mengira layanan sedang offline.
- Skrip instalasi cepat tidak dapat diakses, sehingga menghambat beberapa instalasi, termasuk instalasi otomatis.
- Domain yang menyediakan paket Tailscale tetap dapat diakses, dan dampak pada mekanisme
go get milik Go diminimalkan berkat caching.
Langkah penanganan
- Setelah masalah dipahami, mereka sementara menghapus record AAAA 'tambahan' dan memperbarui sertifikat tersebut secara manual.
- Record kemudian dipulihkan untuk mempertahankan aksesibilitas situs dan layanan melalui IPv6.
- Dalam jangka pendek, mereka berencana menyiapkan beberapa pengingat kalender yang redundan dan waktu khusus untuk perpanjangan manual.
- Infrastruktur prover akan diperbarui agar memeriksa endpoint IPv4 dan IPv6 secara terpisah.
- Mereka berharap dapat mendukung IPv6 secara lebih langsung di infrastruktur situs web sehingga proxy tidak lagi diperlukan.
- Berkat desain Tailscale, sebagian besar pengguna tidak terdampak oleh gangguan ini untuk sebagian besar penggunaan.
Pendapat GN⁺
- Kasus gangguan layanan Tailscale menekankan pentingnya pengelolaan infrastruktur TI. Secara khusus, ini menunjukkan betapa pentingnya tugas pemeliharaan dasar seperti perpanjangan sertifikat.
- Insiden ini juga menunjukkan pentingnya dukungan IPv6 sekaligus perlunya pendekatan kreatif untuk menyelesaikan masalah kompatibilitas dengan infrastruktur yang ada.
- Layanan lain dengan fungsi serupa antara lain Cloudflare dan Let's Encrypt, yang menyediakan fitur perpanjangan sertifikat otomatis untuk mencegah masalah serupa.
- Saat mengadopsi teknologi, perlu mempertimbangkan kompatibilitas infrastruktur, kemungkinan otomatisasi, dan kemudahan pemeliharaan. Insiden seperti ini menunjukkan mengapa kelebihan dan kekurangan harus dievaluasi dengan cermat saat memilih teknologi.
- Artikel ini dapat membantu meningkatkan kewaspadaan pengguna dan administrator terhadap tugas pengelolaan sistem dasar seperti kedaluwarsa sertifikat.
1 komentar
Komentar Hacker News
Masalah sertifikat yang kedaluwarsa
Masalah akibat kedaluwarsanya sertifikat
Masalah keterhubungan antara situs pemasaran dan aplikasi
Keluhan tentang kebijakan harga
Pertanyaan tentang penyedia situs web
Pujian terhadap budaya engineering
Pertanyaan tentang alasan perlunya terminasi TLS
Sindiran tentang pengingat kalender
Kekhawatiran tentang keamanan
Usulan tentang monitoring infrastruktur dan pembaruan otomatis