1 poin oleh GN⁺ 20 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • Terjadi penurunan ketersediaan dan ketidaktersediaan pada beberapa layanan GitHub, termasuk Webhooks, Actions, dan Copilot
  • Awalnya investigasi difokuskan pada penurunan ketersediaan Copilot dan Webhooks, lalu cakupannya diperluas karena gangguan pada beberapa layanan
  • Actions mengalami penurunan performa secara terpisah, dan setelah akar masalah teridentifikasi, pekerjaan mitigasi dilakukan
  • Setelah penurunan pada Actions dan Copilot berhasil dimitigasi, pemantauan stabilitas dan proses verifikasi untuk layanan yang tersisa terus dilakukan, dan Webhooks juga dipulihkan ke operasi normal
  • Insiden ini pada akhirnya ditutup dengan status terselesaikan, dan root cause analysis yang lebih rinci akan dibagikan setelah siap

Perkembangan gangguan

  • Terjadi gangguan pada beberapa layanan GitHub, dengan cakupan dampak mencakup Webhooks, Actions, dan Copilot
  • Pada awalnya, investigasi dimulai terhadap penurunan ketersediaan pada Copilot dan Webhooks
  • Setelah itu, cakupan investigasi diperluas ketika beberapa layanan menunjukkan kondisi tidak tersedia
  • Actions secara terpisah mengalami penurunan performa, dan identifikasi penyebab terus berlangsung
  • Setelah akar masalah dikonfirmasi, pekerjaan mitigasi dilakukan
  • Penurunan yang memengaruhi Actions dan Copilot telah dimitigasi, dan pemantauan untuk menjaga stabilitas terus berlanjut
  • Setelah mitigasi diterapkan pada banyak layanan, proses verifikasi untuk layanan yang tersisa juga terus dilakukan
  • Webhooks juga telah dipulihkan ke operasi normal
  • Pada akhirnya, insiden ini ditutup dengan status terselesaikan, dan root cause analysis yang lebih rinci akan dibagikan setelah siap

Tautan referensi

1 komentar

 
GN⁺ 20 jam lalu
Komentar Hacker News
  • Saya sedang memindahkan berbagai hal ke self-hosting di rumah, dan kemarin akhirnya saya menyelesaikan instance Forgejo di rumah
    Linux dan Windows dijalankan lewat VM, macOS lewat Mac Mini, bahkan runner CI/CD juga sudah terpasang, jadi sekarang source code, Actions, dan infrastruktur nyata semuanya benar-benar ada di rumah
    Biasanya butuh satu atau dua bulan setelah pindah ke self-hosting sampai rasa puas itu datang, tetapi kali ini sejak hari setelah migrasi selesai saya langsung yakin keputusan ini benar, jadi rasanya cukup menyenangkan

    • Saya selalu tertarik dengan ide homelab, tetapi begitu benar-benar mulai membangunnya saya cepat lelah
      Setelah seharian memperbaiki sistem rusak di kantor, saya tidak ingin pulang lalu mengambil peran sebagai sysadmin pribadi saya sendiri
      Minisforum yang lumayan bagus dan bertenaga yang saya beli saat Natal juga masih ada di atas meja, tetapi bahkan belum pernah saya nyalakan
    • Begitu mulai self-hosting, Anda langsung merasakan betapa lambatnya web modern
      Saya menjalankan Forgejo di satu NUC bersama beberapa layanan di atas Proxmox, dan waktu muat halamannya sekitar 6ms
      Immich memang tidak secepat itu, tetapi tetap jauh lebih cepat daripada Google Photos
    • Sudah beberapa waktu saya menjalankan Forgejo pribadi dan menaruh semua side project privat saya di sana
      UI-nya secara umum mirip, tetapi jauh lebih nyaman daripada GitHub. Alasannya bahkan cukup hanya karena uptime-nya melewati 90%
      Belakangan saya terlalu sering mengalami masalah terkait GitHub, dan bahkan sekadar menjelajahi situsnya pun sering terasa lambat atau malah berhenti total
    • Saya juga baru-baru ini pindah seperti ini, dan yang paling mengejutkan adalah kecepatan Actions jauh lebih cepat daripada GitHub
      Linux dan macOS saya siapkan dengan Mac Mini dan file task Ansible yang dibuat Claude, tetapi konfigurasi Windows VM tampaknya cukup menyakitkan
      Saya penasaran apakah Anda menemukan cara untuk menyederhanakan proses deployment
    • Kemarin saya melihat pembahasan gitea di sini, mencari tahu sedikit, lalu saya juga langsung pindah ke self-hosting dan memigrasikan semua proyek pribadi saya ke Forgejo
      Namun, proyek publik sulit dipindahkan karena pasar kerja dan efek jaringan GitHub
      Sekarang rasanya seperti bermain jadi administrator sistem sambil menjalankan sekitar 20 layanan lokal demi hal-hal yang saya butuhkan, dan yang paling penting adalah karena sekarang tanggung jawab mencegah kehilangan data ada pada saya, saya harus punya backup rutin
  • Jika melihat https://mrshu.github.io/github-statuses/, uptime turun sampai 88.15%
    Bahkan jika dilihat per komponen, yang tertinggi hanya 99.78%, jadi nyaris cuma setara two nines

    • Skala pertumbuhan yang harus mereka tangani benar-benar tidak masuk akal
      Pada 2025 jumlahnya 1 miliar commit, sekarang 275 juta commit per minggu, dan bahkan jika diasumsikan pertumbuhan linear saja, laju tahun ini mencapai 14 miliar commit
      GitHub Actions juga naik dari 500 juta menit per minggu pada 2023 menjadi 1 miliar menit pada 2025, dan minggu ini sejauh ini sudah 2.1 miliar menit
      Sumbernya adalah posting COO GitHub tanggal 2026-04-03 https://x.com/kdaigle/status/2040164759836778878
    • Saya penasaran apakah ada korelasi dengan GitHub yang mulai memprioritaskan migrasi ke Azure
      https://thenewstack.io/github-will-prioritize-migrating-to-azure-over-feature-development/
    • AI yang didorong Microsoft ternyata benar-benar sangat membantu para self-hoster dan penggemar Linux
  • Saya penasaran apakah meski gangguan seperti ini terus berulang, GitHub benar-benar mengalami kerugian bisnis yang berarti
    Di industri ini sudah lama dikatakan bahwa keandalan dan nilai merek itu penting, tetapi sekarang tampaknya mereka hampir tidak memedulikannya
    Jika pemahaman saya keliru, saya dengan senang hati ingin dikoreksi

    • Baru 2~3 tahun lalu, hampir semua orang sepakat bahwa untuk merilis software secara stabil dan aman, repeatable builds, chain of custody yang tervalidasi, dan bill of materials yang bisa diaudit itu wajib
      Tetapi begitu LLM menjadi agak bagus, rasanya pembicaraan itu hilang begitu saja
    • GitHub sudah menjadi platform yang terlalu mengakar, jadi gangguan seperti ini seolah hanya dianggap sebagai biaya bisnis
      Perusahaan besar punya perlindungan sampai batas tertentu lewat instance internal, dan sisanya entah tidak terlalu terdampak, atau tidak punya sumber daya untuk membuat solusi sendiri maupun pindah
    • Pindah dari GitHub ke GitLab bisa jadi seperti keluar dari wajan lalu masuk ke api
      Akan bagus kalau ada alternatif yang benar-benar layak bagi orang yang memakainya dalam skala besar
  • Berdasarkan rolling window 90 hari, tampaknya dibutuhkan sekitar 16 jam gangguan tambahan lagi untuk turun ke bawah two nines

  • Entah harus dibilang tak perlu khawatir atau tidak, status page tetap mengatakan lampu hijau, 100% normal
    Padahal bahkan satu halaman statis saja tidak bisa diakses

  • Sekarang sudah sampai pada titik di mana seharusnya ada satu posting HN setiap kali muncul hari saat layanan GitHub tidak bermasalah
    Atau itu justru berarti kondisi normalnya memang seperti ini

  • Dulu di pihak Bitbucket pernah ada kejadian git history satu hari hilang di beberapa repo
    Itu lebih merupakan masalah data mereka daripada outage, dan berkat clone lokal sebagian besar bisa diselamatkan, tetapi issue dan PR pada rentang waktu itu hilang begitu saja
    Karena itu saya mulai membuat gitbacker sebagai side project
    Mem-backup repo itu sendiri mudah, tetapi bagian yang benar-benar menarik adalah backup metadata

  • Hari ini juga ada insiden yang sangat serius: https://www.githubstatus.com/incidents/zsg1lk7w13cf
    Karena regresi yang terjadi saat merge queue dipakai bersama squash merge atau rebase, beberapa PR dikatakan ter-merge secara salah antara 2026-04-23 16:05-20:43 UTC
    Di pihak kami, sekitar 8 commit dibatalkan seluruhnya dari branch default selama waktu itu
    Ini pertama kalinya saya melihat incident GitHub yang seserius ini

    • Downtime adalah satu masalah, tetapi diam-diam membatalkan commit di branch default adalah kegagalan di tingkat yang sama sekali berbeda
    • Kami juga mengalami hal serupa
      Ironis sekali bahwa alat yang seharusnya mencegah merge conflict justru menuliskan commit berantakan langsung ke branch mainline
    • Kami juga kehilangan beberapa commit di main, sementara status PR tetap tertulis merged
      Sangat membuat stres
    • Kami juga mengalami PR dibatalkan di beberapa repo
      Downtime memang masalah, tetapi membatalkan PR adalah kegagalan yang satu tingkat lebih serius
    • Kami juga menerima email dengan lampiran PDF berisi daftar commit yang terdampak dan cara pemulihannya
      Benar-benar kacau
  • Kebutuhan kami relatif sederhana, kira-kira hanya git repos + actions, dan downtime sesekali juga tidak terlalu fatal karena kami bukan tim yang terus melakukan commit dan deployment
    Meski begitu, sekarang kami mulai serius mencari alternatif
    Rupanya SourceHut juga sempat tumbang, mungkin karena banyak orang mencari alternatif pada saat yang sama. Saat tulisan itu dibuat sedang down, dan sekarang sudah hidup lagi
    https://sr.ht/

    • Saya jadi penasaran bagaimana dengan tangled.org
  • Hari ini saja sudah ada tiga incident, masing-masing hampir lebih dari 1 jam, tetapi status hariannya semuanya hijau dan tertulis tidak ada downtime yang tercatat
    Juga tidak terlihat berbeda secara mendasar dari incident lama yang dulu memunculkan batang merah, kecuali mungkin hanya karena durasinya bukan beberapa jam
    Jadi saya benar-benar tidak paham batang hijau itu sebenarnya berarti apa
    Saya curiga apakah perlu cukup banyak orang mengeluh dulu baru nanti diubah menjadi tidak hijau, atau incident di hari yang sama hanya muncul sebentar di tooltip lalu diam-diam dilupakan
    Jika melihat tanggal-tanggal hijau selama ini tidak menampilkan incident apa pun di tooltip, tetapi khusus hari ini malah muncul beberapa, apa pun penjelasannya rasanya ini tampilan yang sengaja menyesatkan