4 poin oleh GN⁺ 28 hari lalu | 5 komentar | Bagikan ke WhatsApp
  • Gangguan layanan GitHub yang sering terjadi belakangan ini terus berlanjut, sehingga bukan hanya standar industri '5 nines (99,999%)' yang sulit dicapai, bahkan '3 nines (99,9%)' pun tampak sulit diraih
  • Pada 9 Februari, fitur-fitur utama seperti Actions, Pull Request, notifikasi, dan Copilot mengalami gangguan secara bersamaan, dan sebagian layanan mengalami penundaan selama beberapa jam
  • Akibat masalah propagasi kebijakan Copilot, sebagian pengguna mengalami kesalahan tampilan model hingga pagi 10 Februari
  • Setelah GitHub mengubah struktur halaman status, pelacakan ketersediaan selama 90 hari terakhir menjadi lebih sulit, dan data tidak resmi juga menunjukkan ada saat ketika ketersediaan turun di bawah 90%
  • Meski SLA Enterprise Cloud mencantumkan uptime 99,9%, hal itu pada praktiknya tidak dijamin untuk semua pengguna, sehingga kebutuhan akan strategi operasional yang mempertimbangkan downtime makin besar

Penurunan ketersediaan GitHub dan gangguan layanan yang sering terjadi

  • Di tengah gangguan layanan cloud yang kian sering menjadi hal biasa, GitHub juga mengalami masalah stabilitas
    • Muncul ungkapan seperti “jarang ada hari tanpa gangguan”, dan disebutkan bahwa bukan hanya '5 nines (99,999%)' yang sulit, bahkan '1 nine (90%)' pun sukar dicapai
  • Pada 9 Februari (berdasarkan UTC), fitur utama GitHub seperti Actions, Pull Request, notifikasi, dan Copilot semuanya mengalami gangguan
    • GitHub mengumumkan sekitar pukul 15:54 bahwa “sebagian layanan mengalami masalah”, dan menyatakan keterlambatan notifikasi mencapai sekitar 50 menit
    • Pada pukul 17:57, keterlambatan berkurang menjadi sekitar 30 menit, lalu pada 19:29 diumumkan telah pulih normal
  • Gangguan terkait Copilot berlangsung lebih lama
    • Sejak 9 Februari pukul 16:29 hingga 10 Februari pukul 9:57, sebagian pengguna mengalami masalah propagasi kebijakan Copilot
    • Akibatnya, dilaporkan terjadi kondisi di mana model yang baru diaktifkan tidak ditampilkan kepada pengguna
  • GitHub mengubah struktur halaman status, sehingga pelacakan ketersediaan selama 90 hari terakhir menjadi lebih sulit
    • Detail tetap disediakan, tetapi bentuknya berubah sehingga tren uptime secara keseluruhan sulit dipahami secara visual
    • Dari data pada halaman pemulihan tidak resmi (mrshu.github.io/github-statuses/), terlihat ada saat pada 2025 ketika ketersediaan turun di bawah 90%
  • SLA Enterprise Cloud GitHub mencantumkan uptime 99,9%, tetapi tidak menjaminnya bagi semua pengguna
    • Di industri, '5 nines' dianggap sebagai standar ideal, tetapi sebagian vendor dinilai bahkan sulit mempertahankan 90%
    • Situasi ini mengindikasikan bahwa pelanggan perlu menyiapkan rencana operasional dengan asumsi adanya downtime

Konteks dan contoh terkait

  • GitHub belakangan juga menghadapi berbagai kontroversi terkait fitur AI dan perubahan kebijakan
    • Meninjau 'kill switch' AI untuk memblokir kode pada Pull Request
    • Membatalkan rencana paket harga self-hosted runner

      • Ada kasus proyek bahasa Zig meninggalkan GitHub dengan alasan kebijakan Microsoft yang berfokus pada AI
      • Bersamaan dengan kejadian-kejadian ini, penurunan stabilitas layanan turut menjadi faktor yang memperbesar ketidakpuasan komunitas pengembang

Kesimpulan

  • Gangguan GitHub belakangan ini menyoroti masalah ketersediaan yang membuat bahkan 'tiga angka 9' (99,9%) pun sulit dicapai
  • Seiring berlanjutnya ketidakstabilan fitur inti seperti Copilot, menjamin keandalan platform pengembangan berbasis cloud menjadi tantangan penting
  • Kebutuhan untuk menyusun strategi menghadapi downtime kembali ditekankan

5 komentar

 
elbanic 27 hari lalu

GitHub itu layanan gratis, jadi mengharapkan ketersediaan tinggi dari sana saja sudah...

 
cosine20 25 hari lalu

Kalau KakaoTalk juga mengalami gangguan, apakah Anda akan mengatakan hal yang sama...

 
malkeu 26 hari lalu

Sepertinya cukup jalankan git reset --hard.

 
master6559 27 hari lalu

Kalau GitHub saja tidak gangguan, kondisi sekarang sudah bagus.

 
GN⁺ 28 hari lalu
Opini di Hacker News
  • Masalah uptime Github jelas serius, tetapi menurut saya berlebihan jika mengatakan “seluruh Github down” hanya karena semua fitur tidak berhenti secara bersamaan
    Saya hampir tidak pernah memakai Copilot, jadi saya tidak terlalu peduli meski layanan itu sering mati
    Yang benar-benar penting adalah stabilitas fitur inti seperti Git, situs web, API, dan Actions

    • Setuju. Namun dalam 90 hari terakhir, tidak ada satu pun layanan individual yang mencapai uptime 3x9 (99.9%)
      Menurut Enterprise SLA GitHub, tiap layanan harus menjamin minimal 99.9%, dan angka aktualnya bisa dilihat di sini
    • Ungkapan “Github down” memang berlebihan, tetapi kenyataannya bahkan API hanya 99.69%, yakni cuma dua angka 9
      Copilot berada di level satu angka 9, dan layanan inti seperti Git dan Actions juga sama
    • Perusahaan ini berada dalam portofolio perusahaan global bernilai 1 triliun dolar
      Tidak ada alasan bagi perusahaan dengan sumber daya sebesar itu untuk menelantarkan pelanggan
    • Istilah “5 nines” yang sering dibicarakan perusahaan besar belakangan ini hampir semata ilusi
      Dalam praktiknya, bahkan respons error tetap dihitung sebagai “berfungsi normal”
      Kasus yang benar-benar mencapai 99.999% seperti di industri jaringan itu jarang, dan kebanyakan hanya menjaga status page tetap hijau dengan trik pengirisan data
  • Saya sudah waswas sejak CTO GitHub pada 2025 mengumumkan akan “bermigrasi penuh ke Azure” demi meningkatkan keandalan
    Dulu komunitas berteriak agar fitur baru ditambahkan lebih cepat, tetapi sekarang yang jauh lebih mendesak adalah stabilitas dan keandalan

    • Meski begitu, GitHub tetap lambat juga dalam menambahkan fitur baru
    • Kalau tidak harus memakai platform besar, ada juga alternatif yang kecil dan stabil sampai terasa membosankan
    • Saya bergabung pada masa itu, dan rasanya menakjubkan hanya karena saya bisa membagikan repo saya secara publik
    • Secara umum keandalan industri memang membaik, tetapi sekarang ada begitu banyak dependensi yang saling terkait sehingga satu masalah saja bisa mengguncang semuanya
    • Saya malah berharap saat beralih total ke Azure mereka lupa menyediakan akses IPv6
  • GitHub sekarang sedang menghadapi tiga masalah sekaligus: migrasi ke Azure, perubahan infrastruktur berbasis AI, dan lonjakan trafik AI
    Pada proyek populer, hanya beberapa menit setelah issue dibuat, akan datang puluhan PR buatan AI
    Sulit menahan beban seperti ini, dan “N 9s” sebelum era AI dengan “N 9s” sesudahnya adalah tingkat kesulitan yang sama sekali berbeda

    • Betul. GitHub sejak awal memang tidak dirancang dengan asumsi lingkungan serbuan agen AI seperti ini
  • Jika melihat status page GitHub, angkanya sebenarnya 90.21%, alias cuma setingkat satu angka 9
    Dalam arsip 2019, gangguan masih 1–4 kali per bulan, sekarang nyaris sekali sehari

    • Angka ini terlihat buruk bukan hanya karena downtime murni, tetapi juga karena mencakup degraded performance
    • Tapi tetap saja, sambil bercanda ada yang bilang ini masih lebih baik daripada status.claude.com milik Claude
  • Sementara GitHub terobsesi pada fitur AI, keamanan platformnya justru runtuh
    Baru-baru ini Aqua Security diserang dan beberapa repo terinfeksi; ini adalah contoh eksploitasi kerentanan mutable reference di GitHub Actions
    GitHub mengetahui masalah ini tetapi tidak memperbaikinya

    • Sebagai langkah sementara, sebaiknya versi Actions dipin dengan hash
      Contoh: uses: actions/checkout@11bd7190...
      Untuk alat otomatis, lihat mheap/pin-github-action
    • Saya rasa CI/CD sudah jadi terlalu kusut akibat kompleksitas berbasis YAML
      Dulu deployment ditangani Jenkins, test sederhana cukup dengan skrip, tetapi sekarang berubah menjadi neraka YAML yang terdistribusi
    • Keamanan GHA sudah separah sampai muncul ungkapan “lebih banyak lubangnya daripada keju Swiss”
    • Bahkan ada diskusi komunitas yang membiarkan masalah ini berlarut-larut selama bertahun-tahun
  • Uptime 90% adalah angka yang mencakup semua layanan, jadi pengalaman nyata pengguna bisa berbeda
    Namun bahkan 96.47% milik Copilot pun tetap hanya setingkat satu angka 9
    GitHub menganjurkan agar Anda memakai semua fiturnya bersama-sama, tetapi semakin begitu keandalannya justru anjlok tajam

    • Lagi pula, kasus “lambat tapi masih jalan” tidak masuk statistik
      Misalnya, hanya untuk membuka diff PR sederhana saja bisa butuh lebih dari 30 detik
    • Beberapa insiden bahkan dilaporkan terlambat secara resmi
      Ada juga kasus ketika CI/CD, git, dan fitur PR semuanya berhenti
    • Jika dibandingkan dengan data 2019, kondisinya sekarang memburuk lebih dari 10 kali lipat
    • 96% itu benar-benar angka yang mengerikan
  • Dari sudut pandang orang yang pernah mengelola GitHub Enterprise Server sendiri, masalah seperti ini tidak mengejutkan
    Fitur dasar high availability seperti tidak mendukung active-active, tidak bisa upgrade tanpa downtime, dan tidak bisa rollback bahkan tidak terpenuhi
    Kalau ada bug, selain memulihkan backup tidak ada jalan lain, dan dalam prosesnya terjadi kehilangan data
    Menjual produk seperti ini ke pelanggan mahal adalah bukti ketidakpedulian terhadap availability

    • Perusahaan kami juga akhirnya menyerah pada GHES dan bermigrasi ke GHEC
  • Microsoft memang punya bakat merusak produk bagus
    Skype adalah contoh utamanya, dan Windows, Notepad, serta Explorer juga tidak jauh berbeda
    Kebingungan branding dari Office → Office 365 → Microsoft 365 → Copilot 365 juga parah

    • Sepertinya hari lahirnya “GitHub for Business” juga sudah tidak lama lagi
  • Di perusahaan kami, setiap PR menjalankan pemindaian keamanan dengan GitHub Actions
    Saat GitHub berhenti, security gate juga berhenti, dan para developer melakukan merge tanpa verifikasi
    Dalam situasi seperti ini, kode rentan bisa ikut masuk, tetapi GitHub tetap mencurahkan tenaga kerja hanya ke Copilot

    • Ada juga yang bertanya apakah ada kasus publik terkait hal ini
  • Mengabaikan IPv6 melambangkan keteledoran teknis GitHub
    Masalah yang lebih besar adalah mengapa dalam kondisi seperti ini mereka masih bisa lolos audit keamanan
    Jika melihat dokumentasi keamanan GitHub, isinya terasa sangat formalitas

    • Kualitas auditnya juga seburuk tingkat arsitekturnya