1 poin oleh calmlake79 2026-02-25 | Belum ada komentar. | Bagikan ke WhatsApp
  • Membagikan hasil analisis per jam terhadap sekitar 27.000 data yang terakumulasi selama sekitar 2 minggu setelah menerapkan Priority PayGo di Vertex AI pada chatbot AI yang berjalan di lingkungan produksi
  • Berdasarkan waktu respons median, ON_DEMAND(Standard) dan ON_DEMAND_PRIORITY sebagian besar berada dalam rentang 100~300ms, sehingga performanya pada dasarnya sama
  • Satu-satunya jam ketika Priority secara signifikan lebih cepat adalah pukul 16.00 (-338ms); pada 23 jam lainnya hasilnya serupa atau justru Standard lebih cepat
  • Rasio permintaan yang melebihi 10 detik adalah 3,4% untuk Standard dan 5,9% untuk Priority, sehingga Priority justru menunjukkan hasil yang 1,7 kali lebih tidak stabil
  • Terutama pada malam hari (22.00~23.00), rasio lebih dari 10 detik pada Priority melampaui 12%, lebih dari 3 kali lebih tinggi dibanding Standard
  • Jika mempertimbangkan bahwa harga per token 1,8 kali lebih mahal, pada saat ini dinilai tidak ada keunggulan cost-performance untuk Priority PayGo
  • Karena ini adalah hasil di lingkungan gemini-3-flash-preview (model preview) + asia-northeast3 (region Seoul), hasilnya dapat berubah setelah rilis GA

Belum ada komentar.

Belum ada komentar.