Gemini Flash
(deepmind.google)- Gemini Flash dicirikan oleh bobot yang ringan, kecepatan tinggi, dan efisiensi biaya, serta menyediakan penalaran multimodal dan jendela konteks panjang hingga satu juta token.
Performa
Dirancang untuk kecepatan
- Kecepatan: Pada sebagian besar kasus penggunaan developer dan perusahaan, latensi token pertama berada di bawah satu detik.
- Efisiensi biaya: Untuk sebagian besar tugas umum, 1.5 Flash menawarkan kualitas yang serupa dengan model yang lebih besar, tetapi dengan biaya yang jauh lebih rendah.
- Pemahaman konteks panjang: Dapat memproses video dan audio selama berjam-jam, serta menangani ratusan ribu kata atau baris kode.
Konteks yang lebih panjang
- Jendela konteks: Secara default menyediakan jendela konteks satu juta token, sehingga dapat menangani video 1 jam, audio 11 jam, codebase lebih dari 30.000 baris, atau lebih dari 700.000 kata.
Inovasi tanpa henti
- Tim riset: Mengeksplorasi ide-ide baru di garis depan AI dan mengembangkan produk inovatif yang menunjukkan kemajuan konsisten di berbagai benchmark.
- Model terbaru: Gemini 1.5 Flash.
Perbandingan performa
-
Umum: Menangani pertanyaan dari 57 mata pelajaran (sains, humaniora, dll.) pada benchmark MMLU.
- Gemini 1.0 Pro: 71.8%
- Gemini 1.0 Ultra: 83.7%
- Gemini 1.5 Pro (Februari 2024): 81.9%
- Gemini 1.5 Flash: 78.9%
-
Kode: Pembuatan kode Python, menggunakan dataset yang mirip dengan HumanEval.
- Gemini 1.0 Pro: 69.6%
- Gemini 1.0 Ultra: 74.9%
- Gemini 1.5 Pro (Februari 2024): 77.7%
- Gemini 1.5 Flash: 77.2%
-
Matematika: Soal matematika menantang (aljabar, geometri, kalkulus, dll.).
- Gemini 1.0 Pro: 32.6%
- Gemini 1.0 Ultra: 53.2%
- Gemini 1.5 Pro (Februari 2024): 58.5%
- Gemini 1.5 Flash: 54.9%
-
Penalaran: Dataset pertanyaan yang ditulis oleh para ahli biologi, fisika, dan kimia.
- Gemini 1.0 Pro: 27.9%
- Gemini 1.0 Ultra: 35.7%
- Gemini 1.5 Pro (Februari 2024): 41.5%
- Gemini 1.5 Flash: 39.5%
-
Multibahasa: Terjemahan bahasa WMT23.
- Gemini 1.0 Pro: 71.7
- Gemini 1.0 Ultra: 74.4
- Gemini 1.5 Pro (Februari 2024): 75.2
- Gemini 1.5 Flash: 74.1
-
Gambar: Soal penalaran multidisipliner tingkat universitas.
- Gemini 1.0 Pro: 47.9%
- Gemini 1.0 Ultra: 59.4%
- Gemini 1.5 Pro (Februari 2024): 58.5%
- Gemini 1.5 Flash: 56.1%
-
Audio: Pengenalan ucapan otomatis untuk 55 bahasa (berdasarkan word error rate, semakin rendah semakin baik).
- Gemini 1.0 Pro: 6.4
- Gemini 1.0 Ultra: 6.0
- Gemini 1.5 Pro (Februari 2024): 6.6
- Gemini 1.5 Flash: 9.8
-
Video: Tanya jawab video.
- Gemini 1.0 Pro: 55.7%
- Gemini 1.0 Ultra: 61.5%
- Gemini 1.5 Pro (Februari 2024): 63.2%
- Gemini 1.5 Flash: 63.5%
Panduan untuk developer
Membangun dengan Gemini
- Google AI Studio: Cara mudah untuk mengembangkan prompt model dan membangun dengan cepat menggunakan Gemini API.
- Vertex AI: Alat yang ditujukan khusus untuk data scientist dan engineer machine learning.
Opini GN⁺
- Jendela konteks panjang: Jendela konteks satu juta token pada Gemini Flash sangat berguna untuk pemrosesan data skala besar. Ini sangat membantu terutama untuk proyek yang menangani video, audio, dan codebase besar.
- Efisiensi biaya: Gemini Flash menawarkan kualitas yang serupa dengan model yang lebih besar, tetapi dengan biaya yang lebih rendah. Ini sangat menguntungkan untuk proyek atau startup dengan anggaran terbatas.
- Beragam benchmark: Performa Gemini Flash dapat dilihat di berbagai benchmark. Ini menunjukkan fleksibilitas model tersebut.
- Ramah developer: Mudah diintegrasikan melalui Google AI Studio dan Vertex AI, sehingga sangat nyaman bagi developer.
- Produk pesaing: Jika dibandingkan dengan model lain seperti GPT-4 dari OpenAI, Gemini Flash memiliki daya saing dari sisi kecepatan dan biaya.
Belum ada komentar.