2 poin oleh GN⁺ 2023-12-07 | 1 komentar | Bagikan ke WhatsApp

Era Gemini telah tiba

  • Gemini dibangun berdasarkan kemampuan multimodal yang mencakup teks, gambar, video, audio, dan kode.
  • Versi pertama Gemini diperkenalkan sebagai model AI paling mumpuni hingga saat ini.
  • Sebagai model pertama yang melampaui pakar manusia, Gemini menunjukkan performa tinggi pada MMLU, yang menguji pengetahuan dan kemampuan pemecahan masalah model AI.

Benchmark kemampuan teks

  • Gemini Ultra mencatat performa tinggi di berbagai benchmark seperti MMLU umum, Big-Bench Hard yang membutuhkan penalaran kompleks, dan DROP yang mengevaluasi pemahaman bacaan.
  • Gemini juga menunjukkan hasil unggul dalam penalaran akal sehat sehari-hari, pemecahan soal matematika, dan pembuatan kode Python.
  • Performa terhadap metodologi lain dapat dilihat lebih rinci dalam laporan teknis.

Benchmark kemampuan multimodal

  • Di bidang gambar, video, dan audio, Gemini juga melampaui performa terbaik yang ada sebelumnya.
  • Gemini Ultra menunjukkan performa tinggi dalam pemecahan berbagai soal akademik tingkat universitas, pemahaman gambar alami, dan pemahaman dokumen.
  • Di bidang audio, Gemini Pro unggul atas model-model pesaing dalam terjemahan suara otomatis dan pengenalan suara.

Pemanfaatan Gemini Pro di Bard

  • Dengan mencoba Gemini Pro di Bard, pengguna dapat menemukan cara baru untuk berkarya, merencanakan, dan melakukan brainstorming.

Pendapat GN⁺

  • Poin terpenting dari artikel ini adalah bahwa model AI Gemini memiliki kemampuan multimodal untuk memahami dan memproses berbagai bentuk data seperti teks, gambar, video, audio, dan kode, serta menunjukkan performa yang melampaui pakar manusia di berbagai benchmark.
  • Perkembangan ini menunjukkan kemajuan teknologi AI dan menarik bagi banyak orang karena diharapkan dapat sangat memperluas kemungkinan pemanfaatan AI di berbagai bidang seperti kreasi, perencanaan, dan pembelajaran di masa depan.

1 komentar

 
GN⁺ 2023-12-07
Opini Hacker News
  • Postingan blog terkait: menyediakan tautan ke postingan blog tentang teknologi AI baru Google, Gemini, serta tautan diskusi Hacker News. Gemini Ultra belum dirilis dan masih beberapa bulan lagi.
  • Bard w/ Gemini Pro tidak tersedia di Eropa dan bukan multimodal. Tidak ada statistik publik untuk Gemini Pro, tetapi ada informasi tersembunyi di dokumen teknis.
  • Ada pendapat bahwa ini adalah promosi yang dibesar-besarkan karena produk yang bersaing dengan GPT-4 tidak dirilis hari ini. Dinilai akan lebih baik jika mereka merilis produk yang tersedia di sebagian besar negara dan memiliki statistik seperti yang diiklankan.
  • Performa Gemini AI yang mengesankan: saat ditanya tentang fitur TypeScript yang mustahil, ia menjawab dengan tepat bahwa itu memang mustahil dan memberikan tautan isu GitHub terkait. GPT-4 biasanya tidak pandai membuat tautan saat tidak berada dalam mode penelusuran web. Selain itu, Gemini juga lebih cepat mengenali Pixi.js v8 yang masih versi beta dibanding GPT-4 dan menjelaskan fitur-fitur utamanya dengan akurat.
  • Penjelasan bagi orang yang bingung dengan versi Gemini: yang paling sering dibahas adalah Gemini Ultra, yang diklaim melampaui GPT-4. Yang tersedia melalui Bard adalah Gemini Pro.
  • Perbandingan performa benchmark antara Gemini Ultra, Gemini Pro, dan GPT-4 menurut laporan teknis. Disediakan perbandingan skor di berbagai dataset.
  • Menyediakan tautan ke video demo Gemini AI.
  • Pengamatan terhadap pernyataan utama Sundar Pichai di video: terkesan ingin menekankan bahwa Google sudah lama mengerjakan AI. Karena model terbaru yang saat ini dipublikasikan justru dibuat oleh OpenAI, penekanan itu terasa agak kurang tepat. Ada pendapat bahwa menunjukkan hasil nyata akan menjadi strategi yang lebih baik.
  • Informasi bahwa model Gemini dapat diintegrasikan ke aplikasi melalui Google AI Studio dan Google Cloud Vertex AI. Tampaknya akan tersedia mulai 13 Desember.
  • Kekhawatiran tentang sulitnya menentukan apakah data pengujian pada benchmark merupakan bagian dari data pelatihan. Diberikan contoh seperti GPT-4 yang membuat kesalahan pada soal matematika tetapi mendapat skor tinggi di GSM8k.
  • Beragam pendapat tentang hanya sedikit melampaui GPT-4. Ada harapan bahwa persaingan yang makin ketat akan menguntungkan semua pihak. Juga ada keluhan tentang pengumuman prarilis dan komentar bahwa kita perlu menunggu sampai benar-benar bisa digunakan.
  • Menyediakan tautan diskusi tentang model Gemini di Codeforces (platform pemrograman kompetitif). Ada keraguan terhadap klaim bahwa model tersebut menyelesaikan masalah rating 3200 tanpa kebocoran data.
  • Ekspektasi besar terhadap Gemini Nano. Di thread Pixel 8 sempat ada pendapat bahwa penggunaan web API hanyalah sementara dan nantinya bisa digantikan oleh model di perangkat; ini mungkin menjadi awalnya.