Memahami bagaimana Facebook menghilang pada 4/10
(blog.cloudflare.com)-
Tulisan analisis dari luar oleh CloudFlare tentang alasan layanan terkait Facebook tidak bisa diakses pada 4/10
-
Kegagalan terjadi mulai dari DNS lookup, dan koneksi IP ke seluruh infrastruktur terkait Facebook sempat terputus
-
Pernyataan resmi Facebook adalah
→ "Masalah terjadi saat mengubah konfigurasi router backbone yang mengatur lalu lintas jaringan antar pusat data. Ini secara berantai memengaruhi konektivitas antar pusat data sehingga layanan terhenti"
→ Server DNS biasanya mengumumkan keberadaannya melalui BGP, tetapi server DNS Facebook dikonfigurasi untuk menonaktifkan BGP jika tidak terhubung ke pusat data Facebook
→ Ketika backbone pusat data terputus, permintaan BGP ditolak dan akses ke server DNS menjadi tidak mungkin
→ Karena itu, seluruh server Facebook menjadi tidak bisa diakses
→ Akses ke pusat data itu sendiri juga benar-benar sulit, sehingga para engineer harus datang langsung ke lokasi untuk menyelesaikan masalah
-
Masalahnya terjadi seolah-olah seseorang mencabut kabel internet di pusat data Facebook
-
Ini bukan masalah DNS, tetapi error DNS adalah gejala pertama dari gangguan berskala besar tersebut
-
BGP(Border Gateway Protocol)
→ Mekanisme bagi AS(Autonomous Systems) di internet untuk saling bertukar informasi routing
→ Router besar terus membagikan informasi routing agar pengelolaan dapat mencapai informasi akhir
→ Jika Facebook tidak mengumumkan keberadaannya sendiri ke jaringan (advertising), maka ia menjadi tidak bisa diakses
→ Setiap jaringan memiliki ASN(Number), dan memberi tahu prefix IP yang mereka kelola
- Mulai 4/10 15:40 UTC, Facebook berhenti mengumumkan DNS Prefix mereka
→ Seperti isu yang disebut Facebook di atas, akses menjadi tidak mungkin karena tidak mengirim BGP Ad
→ Karena ini, routing berubah dan pembaruan BGP terjadi dalam skala besar
→ Semua server DNS mulai mengembalikan SERVFAIL untuk URL Facebook
→ Kueri DNS mulai meningkat 30x
→ Kueri DNS untuk Twitter, Signal, Telegram, dan lainnya juga meningkat
- Pada 21:00 UTC, BGP diperbarui lagi dan keadaan kembali normal
2 komentar
Facebook mengalami gangguan selama 5 jam... ini memang kejadian yang sangat besar.
Apakah BGP aman? https://id.news.hada.io/topic?id=1932
Analisis insiden down internet CenturyLink/Level(3) pada 30 Agustus https://id.news.hada.io/topic?id=2746