1 poin oleh p2c2kbf 2026-04-13 | Belum ada komentar. | Bagikan ke WhatsApp

AIWatch adalah proyek open source yang memantau secara real-time gangguan, uptime, dan waktu pemulihan layanan AI utama seperti Claude, OpenAI, dan Gemini.

Dasbor: https://ai-watch.dev
Landing page: https://ai-watch.dev/intro
GitHub: https://github.com/bentleypark/aiwatch

Saat terjadi gangguan, AI menganalisis penyebabnya, memprediksi waktu pemulihan, dan
mengirim notifikasi instan ke Discord/Slack.

Hari ini kami merilis laporan keandalan untuk 27 layanan (per Maret) berdasarkan data yang dikumpulkan selama 20–31 Maret (12 hari). Karena ini adalah laporan pertama, periodenya masih singkat, dan mulai April akan diterbitkan dengan data bulanan penuh.

3 temuan utama

1. Angka % uptime tidaklah lengkap
Claude API mencatat uptime 99%, tetapi terjadi 9 insiden dalam 12 hari.
Cohere memiliki uptime 100% dan nol insiden.
Jika hanya melihat angkanya, keduanya tampak mirip, tetapi keandalan nyata sangat berbeda.

2. Insiden singkat yang menumpuk menjadi masalah besar
Together AI mencatat insiden terbanyak, yaitu 20 kali dalam 12 hari,
namun waktu pemulihan rata-ratanya 25 menit sehingga total downtime adalah 8 jam 37 menit.
Sebaliknya, ChatGPT hanya mengalami 4 insiden, tetapi salah satunya berlangsung selama 19 jam 46 menit.

3. Risiko dependensi upstream
Gangguan Voice Agent Deepgram selama 74 jam bermula dari gangguan OpenAI.
Layanan yang membangun AI di atas AI lain akan mewarisi gangguan dari layanan hulu tersebut apa adanya.


5 teratas AIWatch Score (per Maret)

Layanan Score Peringkat Insiden
Cohere API 100 Excellent 0
Hugging Face 100 Excellent 0
OpenRouter 99 Excellent 0
Groq Cloud 93 Excellent 1
DeepSeek API 92 Excellent 1
OpenAI API 88 Excellent 1 (2h 56m)
Together AI 84 Good 20 (rata-rata 25m)
ChatGPT 73 Good 4 (terlama 19h 46m)
Claude API 59 Fair 9 (dikumpulkan per model)
ElevenLabs 47 Degrading 2 (terlama 4h 47m)

Rumus Score (berdasarkan laporan Maret): Uptime(50) + hari terdampak insiden(30) + waktu pemulihan(20) = maksimum 100 poin
Karena memakai dasar hari terdampak (affected_days), bukan jumlah insiden, perbandingan yang adil tetap dimungkinkan terlepas dari cara pelaporannya.
Metode perhitungan lengkap dipublikasikan di: https://ai-watch.dev/#about-score

ElevenLabs mencatat uptime 97,55% dan menjadi satu-satunya dari 27 layanan yang menerima peringkat Degrading.
Jika Anda menggunakan layanan suara/audio di production, perlu berhati-hati.


Catatan

  • Periode pemantauan adalah 20–31 Maret (12 hari), sehingga sebagai laporan pertama datanya masih parsial.
    Mulai April akan diterbitkan dengan data bulanan penuh.

Rekomendasi berdasarkan penggunaan (berdasarkan laporan Maret)

  • Production-critical: Cohere (100 poin, 0 insiden), OpenAI API (88 poin, 1 insiden/total downtime 2h 56m)
  • Latensi rendah / stabilitas: Groq Cloud (93 poin, uptime 100%), DeepSeek API (92 poin)
  • Alur kerja coding: Cursor, Windsurf (uptime tinggi)
  • Suara/audio: AssemblyAI direkomendasikan + fallback wajib (ElevenLabs·Deepgram mengalami beberapa gangguan)

Belum ada komentar.

Belum ada komentar.