- Jaringan global Cloudflare mengalami penurunan performa layanan internal sehingga beberapa layanan terdampak secara intermiten
- Layanan utama seperti Access, Bot Management, CDN/Cache, Dashboard, Firewall, Network, WARP, Workers sempat mengalami gangguan sementara
- Tim engineering mengidentifikasi masalah dan melakukan perbaikan, sementara layanan WARP dan Access dipulihkan lebih dulu
- Setelah itu, tingkat error dan latensi di seluruh dunia berangsur pulih ke level normal, dan layanan dashboard juga dipulihkan
- Saat ini semua layanan beroperasi normal, dan insiden telah sepenuhnya diselesaikan
Ringkasan insiden
- Cloudflare mengalami penurunan performa layanan internal (Internal Service Degradation) yang menyebabkan sebagian layanan terhenti secara intermiten
- Layanan yang terdampak mencakup Access, Bot Management, CDN/Cache, Dashboard, Firewall, Network, WARP, Workers dan lainnya
- Perusahaan segera memulai pemulihan dan terus memperbarui perkembangan penanganan masalah
Identifikasi masalah dan respons awal
- Cloudflare mengonfirmasi penurunan layanan internal pada tahap Investigating
- Sebagian pelanggan mengalami error dan latensi secara intermiten
- Tim engineering menjalankan analisis penyebab dan pemulihan secara paralel
- Setelah itu, penyebab masalah diidentifikasi (Identified) dan perbaikan mulai dilakukan
- Selama proses perbaikan, akses WARP di wilayah London sempat dinonaktifkan sementara, sehingga pengguna di wilayah tersebut mengalami kegagalan koneksi internet
Progres pemulihan layanan
- Setelah perbaikan, layanan Access dan WARP dipulihkan lebih dulu sehingga tingkat error kembali ke level sebelum insiden
- Akses WARP di wilayah London diaktifkan kembali
- Setelah itu, pekerjaan pemulihan layanan untuk pelanggan Application Services dilanjutkan
- Perubahan untuk memulihkan layanan dashboard telah diterapkan
- Sebagian pelanggan masih mengalami masalah saat login atau menggunakan dashboard, tetapi hal ini diselesaikan dengan perbaikan tambahan
Stabilisasi di seluruh jaringan
- Secara global, tingkat error dan latensi (latency) berangsur menurun dan pulih ke level normal
- Perhitungan skor Bot Management (bot scores) sempat terdampak sementara, tetapi kembali normal selama proses pemulihan
- Tim engineering menghilangkan error yang tersisa dan mempercepat pemulihan seluruh jaringan
- Setelah itu, semua layanan kembali beroperasi normal, dan tingkat error serta latensi sepenuhnya kembali normal
Penutupan insiden dan tindak lanjut
- Cloudflare mengonfirmasi bahwa semua layanan beroperasi normal dan menutup insiden ini
- Saat ini tidak ada perubahan konfigurasi tambahan, dan platform sedang dipantau secara ketat
- Investigasi pascainsiden (post-incident investigation) terhadap penyebab gangguan sedang berlangsung, dan hasilnya akan dipublikasikan kemudian
- Gangguan kali ini dicatat sebagai insiden yang berdampak pada seluruh jaringan global
Belum ada komentar.