1 poin oleh GN⁺ 2024-11-27 | 1 komentar | Bagikan ke WhatsApp
  • Situs ini adalah halaman yang menyediakan pembaruan insiden global. Kerusakan perangkat keras sehari-hari atau insiden infrastruktur yang terbatas tidak disertakan.
  • Untuk melihat semua insiden yang dapat memengaruhi aplikasi yang dipersonalisasi, Anda dapat memeriksa halaman status yang dipersonalisasi di dasbor Fly Organization.

Insiden Terdahulu

27 November 2024

  • Tidak ada laporan insiden

26 November 2024

  • Latensi API dan kesalahan timeout: Selesai. Performa Machines API dan GraphQL API telah kembali normal.
  • Penurunan konektivitas: Machine milik sebagian pelanggan dibatasi karena peluncuran penuh kuota CPU. Hal ini menyebabkan masalah jaringan, dan perubahan tersebut untuk sementara dibatalkan guna menyelesaikannya.
  • Penurunan performa API: Selesai. Sistem telah diskalakan dan perbaikan pada API telah diterapkan sehingga kini beroperasi normal.

25 November 2024

  • Penurunan performa API: Masalah telah diidentifikasi dan sedang diperbaiki. Performa Machines API dan proxy menurun.
  • Pemulihan klaster Corrosion: Proses pemulihan dan reseed sedang dijalankan, dan pada beberapa host pekerjaan masih berlangsung.

24 November 2024

  • Tidak ada laporan insiden

23 November 2024

  • Tidak ada laporan insiden

22 November 2024

  • Pencarian log tidak tersedia: Selesai. Mempengaruhi panel pencarian log Fly Metrics dan log aplikasi historis.

21 November 2024

  • Pemeliharaan jaringan darurat: Selesai. Penyedia jaringan melakukan penggantian switch.

20 November 2024

  • Tidak ada laporan insiden

19 November 2024

  • Pencarian log tidak tersedia: Selesai. Mempengaruhi panel pencarian log Fly Metrics dan log aplikasi historis.

18 November 2024

  • Tidak ada laporan insiden

17 November 2024

  • Tidak ada laporan insiden

16 November 2024

  • Tidak ada laporan insiden

15 November 2024

  • Tidak ada laporan insiden

14 November 2024

  • Penurunan konektivitas IPv6 di IAD: Selesai. Masalah diselesaikan dengan bekerja sama dengan penyedia upstream.

1 komentar

 
GN⁺ 2024-11-27
Opini Hacker News
  • Seorang pengguna menyebut situs web yang dihosting di fly.io sempat down selama 5 menit, tetapi setelah itu berjalan stabil. Ia menggunakan layanan pemantauan gratis untuk memeriksa setiap 5 menit.

  • fly.io merilis postmortem dan menjelaskan bahwa pada 2016 mereka menggunakan server TLS terpusat bernama Consul, tetapi pada 2020 menggantinya dengan Corrosion. Pada Oktober 2024, kunci penandatanganan root key Consul kedaluwarsa sehingga koneksi terputus, lalu layanan dipulihkan dengan mendistribusikan sertifikat SSL baru.

  • Mereka juga menemukan bahwa akibat masalah infrastruktur fly.io, kunci TLS layanan lain ikut kedaluwarsa, dan alat logging melakukan serangan DDoS ke penyedia jaringan. Banyak upaya diperlukan untuk menyelesaikan berbagai masalah tersebut.

  • Ada yang mempertanyakan keandalan fly.io dan menyebut bahwa jika platform cloud tidak bisa memberikan reliabilitas, mungkin lebih baik menyewa virtual server.

  • API Fly.io masih tidak bisa diakses, dan pengguna mengatakan mereka tidak dapat mengakses deployment maupun database. Pembaruan yang akurat bisa dilihat melalui halaman komunitas.

  • Secara pribadi, setelah membandingkan Fly.io dan Railway.com, ada yang merasa Railway lebih baik dan dukungannya juga lebih unggul. Fly.io disebut tidak merespons pertanyaan terkait penghapusan data.

  • Ada yang menekankan bahwa mereka telah beberapa kali mengalami outage besar di Fly.io, dan stabilitas layanan harus menjadi prioritas utama.

  • Turso juga mengalami masalah yang terkait dengan outage Fly.io, dan CEO-nya mengonfirmasi hal tersebut di Discord.

  • Ada yang mempertanyakan harga Fly.io yang rendah, dan menyebut dokumentasi teknis menjelaskan bahwa instance terikat pada satu server fisik sehingga jika server down harus dipulihkan dari backup.

  • Disebutkan bahwa outage cenderung terjadi pada pekan libur besar, dan MS 365/Teams/Exchange juga terdampak. Ada usulan agar perubahan dihentikan selama hari libur besar.

  • Disebutkan juga bahwa rangkaian outage pada awal 2023 pun mengalami masalah yang berkaitan dengan Corrosion.