Vertex AI Priority PayGo, diuji dengan 27.000 kasus layanan produksi, ternyata tidak berbeda dari Standard

calmlake79 · 2026-02-25T11:06:54+09:00

Membagikan hasil analisis per jam terhadap sekitar 27.000 data yang terakumulasi selama sekitar 2 minggu setelah menerapkan Priority PayGo di Vertex AI pada chatbot AI yang berjalan di lingkungan produksi Berdasarkan waktu respons median, ON_DEMAND(Standard) dan ON_DEMAND_PRIORITY sebagian besar berada dalam rentang 100~300ms, sehingga performanya pada dasarnya sama Satu-satunya jam ketika Priority secara signifikan lebih cepat adalah pukul 16.00 (-338ms); pada 23 jam lainnya hasilnya serupa atau justru Standard lebih cepat Rasio permintaan yang melebihi 10 detik adalah 3,4% untuk Standard dan 5,9% untuk Priority, sehingga Priority justru menunjukkan hasil yang 1,7 kali lebih tidak stabil Terutama pada malam hari (22.00~23.00), rasio lebih dari 10 detik pada Priority melampaui 12%, lebih dari 3 kali lebih tinggi dibanding Standard Jika mempertimbangkan bahwa harga per token 1,8 kali lebih mahal, pada saat ini dinilai tidak ada keunggulan cost-performance untuk Priority PayGo Karena ini adalah hasil di lingkungan gemini-3-flash-preview (model preview) + asia-northeast3 (region Seoul), hasilnya dapat berubah setelah rilis GA

(cloudturing.com)

1 poin oleh calmlake79 2026-02-25 | Belum ada komentar. | Bagikan ke WhatsApp

Membagikan hasil analisis per jam terhadap sekitar 27.000 data yang terakumulasi selama sekitar 2 minggu setelah menerapkan Priority PayGo di Vertex AI pada chatbot AI yang berjalan di lingkungan produksi
Berdasarkan waktu respons median, ON_DEMAND(Standard) dan ON_DEMAND_PRIORITY sebagian besar berada dalam rentang 100~300ms, sehingga performanya pada dasarnya sama
Satu-satunya jam ketika Priority secara signifikan lebih cepat adalah pukul 16.00 (-338ms); pada 23 jam lainnya hasilnya serupa atau justru Standard lebih cepat
Rasio permintaan yang melebihi 10 detik adalah 3,4% untuk Standard dan 5,9% untuk Priority, sehingga Priority justru menunjukkan hasil yang 1,7 kali lebih tidak stabil
Terutama pada malam hari (22.00~23.00), rasio lebih dari 10 detik pada Priority melampaui 12%, lebih dari 3 kali lebih tinggi dibanding Standard
Jika mempertimbangkan bahwa harga per token 1,8 kali lebih mahal, pada saat ini dinilai tidak ada keunggulan cost-performance untuk Priority PayGo
Karena ini adalah hasil di lingkungan gemini-3-flash-preview (model preview) + asia-northeast3 (region Seoul), hasilnya dapat berubah setelah rilis GA

Vertex AI Priority PayGo, diuji dengan 27.000 kasus layanan produksi, ternyata tidak berbeda dari Standard

Bacaan terkait

Belum ada komentar.