- Membagikan hasil analisis per jam terhadap sekitar 27.000 data yang terakumulasi selama sekitar 2 minggu setelah menerapkan Priority PayGo di Vertex AI pada chatbot AI yang berjalan di lingkungan produksi
- Berdasarkan waktu respons median, ON_DEMAND(Standard) dan ON_DEMAND_PRIORITY sebagian besar berada dalam rentang 100~300ms, sehingga performanya pada dasarnya sama
- Satu-satunya jam ketika Priority secara signifikan lebih cepat adalah pukul 16.00 (-338ms); pada 23 jam lainnya hasilnya serupa atau justru Standard lebih cepat
- Rasio permintaan yang melebihi 10 detik adalah 3,4% untuk Standard dan 5,9% untuk Priority, sehingga Priority justru menunjukkan hasil yang 1,7 kali lebih tidak stabil
- Terutama pada malam hari (22.00~23.00), rasio lebih dari 10 detik pada Priority melampaui 12%, lebih dari 3 kali lebih tinggi dibanding Standard
- Jika mempertimbangkan bahwa harga per token 1,8 kali lebih mahal, pada saat ini dinilai tidak ada keunggulan cost-performance untuk Priority PayGo
- Karena ini adalah hasil di lingkungan gemini-3-flash-preview (model preview) + asia-northeast3 (region Seoul), hasilnya dapat berubah setelah rilis GA
Belum ada komentar.