Pengumuman model Gemini 1.5 Flash
- Model multimodal baru yang sekuat Gemini 1.5 Pro, tetapi dioptimalkan untuk tugas yang sempit, sering, dan berlatensi rendah
- Lebih cocok untuk menghasilkan respons cepat
- Kemampuan terjemahan, penalaran, dan coding Gemini 1.5 juga ditingkatkan
- Context window Gemini 1.5 Pro (jumlah informasi yang dapat diserap) meningkat dua kali lipat dari 1 juta token menjadi 2 juta token
Project Astra: visi masa depan AI ala Star Trek dari Google
- Asisten AI multimodal yang ditujukan untuk melihat dan memahami melalui kamera perangkat, mengingat lokasi benda, dan melakukan tugas atas nama pengguna
- Diterapkan pada sebagian besar demo paling mengesankan di I/O tahun ini
- Tujuannya adalah menjadi AI agent sejati yang tidak hanya bercakap-cakap, tetapi benar-benar melakukan tugas untuk pengguna
Veo: pembuatan video bergaya Sora dari Google
- Model AI generatif baru dari Google untuk menyaingi Sora milik OpenAI, yang dapat menghasilkan video 1080p menggunakan prompt berbasis teks, gambar, dan video
- Dapat membuat video dalam berbagai gaya seperti aerial shot atau timelapse, dan bisa disesuaikan dengan prompt tambahan
- Sudah disediakan kepada beberapa kreator untuk digunakan dalam pembuatan video YouTube, dan diposisikan juga untuk produksi film
Integrasi Gemini dengan Workspace
- Gemini 1.5 Pro, model bahasa generasi berikutnya, diintegrasikan ke sidebar Docs, Sheets, Slides, Drive, dan Gmail
- Akan tersedia bulan depan untuk pelanggan berbayar, dan berperan sebagai asisten serbaguna di dalam Workspace
- Dapat mengambil informasi dari seluruh konten di Drive
- Dapat melakukan tugas seperti menulis email dengan menggabungkan informasi dari dokumen yang sedang dilihat, atau mengingatkan untuk membalas email yang sedang dibaca nanti
Perluasan kemampuan Google Lens
- Kini bisa melakukan pencarian tidak hanya dengan gambar tetapi juga dengan video
- Ditambahkan fitur yang memungkinkan pengguna merekam video sambil mengajukan pertanyaan, lalu AI Google mencari jawaban terkait di web
Pemanfaatan Google Photos oleh Gemini
- Melalui fitur "Ask Photos" yang akan dirilis musim panas ini, sistem akan menganalisis pustaka Google Photos pengguna dan menjawab pertanyaan
- Bukan sekadar menemukan foto anjing atau kucing, tetapi juga dapat menjawab pertanyaan yang lebih kompleks seperti menanyakan nomor plat kendaraan sendiri, seperti yang didemokan CEO Sundar Pichai
Gems: penambahan fitur pembuatan chatbot kustom di Gemini
- Mirip GPT dari OpenAI, lewat Gems pengguna dapat memberi instruksi kepada Gemini untuk menyesuaikan cara menjawab dan bidang keahliannya
- Misalnya, jika menginginkan pelatih lari yang positif dan gigih yang memberi motivasi harian dan rencana lari, itu akan segera dimungkinkan (untuk pelanggan Gemini Advanced)
Peningkatan kemampuan percakapan Gemini
- Fitur baru Gemini Live bertujuan membuat voice chat dengan Gemini terasa lebih alami
- Suara chatbot diberi lebih banyak karakter, dan pengguna dapat menyela di tengah atau meminta Gemini menerima informasi secara real-time melalui kamera smartphone
- Gemini terintegrasi dengan Google Calendar, Tasks, dan Keep untuk memperbarui atau mengambil informasi, serta memanfaatkan kemampuan multimodal seperti menambahkan detail dari selebaran ke kalender pribadi
Circle to Search mendukung penyelesaian soal matematika
- Kini di ponsel atau tablet Android, pengguna bisa melingkari soal matematika untuk mendapatkan bantuan menyelesaikannya
- AI Google tidak akan langsung mengerjakan soal agar tidak membantu siswa mencontek tugas, tetapi akan memecahnya langkah demi langkah agar lebih mudah diselesaikan
Perombakan AI pada Google Search
- "AI Overviews" (sebelumnya disebut "Search Generative Experience") akan diluncurkan di seluruh Amerika Serikat minggu ini
- Kini model Gemini yang "terspesialisasi" akan merancang halaman hasil pencarian dan mengisinya dengan jawaban ringkas dari web (mirip dengan yang terlihat di alat pencarian AI seperti Perplexity atau Arc Search)
Deteksi penipuan berbasis AI di Android
- Google mengatakan bahwa dengan AI Gemini Nano di perangkat, ponsel Android dapat membantu menghindari panggilan penipuan dengan mendeteksi tanda bahaya seperti pola percakapan umum penipu dan menampilkan peringatan secara real-time
- Detail lebih lanjut tentang fitur ini akan tersedia akhir tahun ini
Peningkatan kecerdasan AI pada perangkat Android
- Google mengatakan Gemini akan segera memungkinkan pengguna mengajukan pertanyaan tentang video yang ditampilkan di layar, dan akan menjawab berdasarkan subtitle otomatis
- Untuk pengguna Gemini Advanced berbayar, sistem juga dapat menyerap PDF dan memberikan informasi
- Pembaruan multimodal ini dan pembaruan lain untuk Gemini on Android akan tersedia dalam beberapa bulan ke depan
Penambahan asisten AI ke Google Chrome
- Google mengumumkan penambahan Gemini Nano, versi ringannya, ke Chrome di desktop
- Asisten bawaan akan menggunakan AI di perangkat untuk membantu pembuatan teks untuk posting media sosial, ulasan produk, dan lainnya langsung di Google Chrome
Upgrade watermarking AI SynthID
- Google mengatakan akan memperluas kemampuan SynthID
- Sistem akan menyisipkan watermark pada konten yang dibuat dengan generator video baru Veo, dan kini juga dapat mendeteksi video buatan AI
6 komentar
Chatbot cukup disediakan gratis saja, dan karena saya tidak memakai fitur terkait gambar, video, atau audio, saya senang itu diintegrasikan ke produk yang sudah ada.
Kemajuan AI Project Astra dan pembuatan video Google
Model Gemini dari Google telah digunakan secara luas oleh lebih dari 1,5 juta pengembang untuk debugging kode, memperoleh insight, dan membangun aplikasi AI. Project Astra memperkenalkan agen AI yang dapat memproses input video dan suara secara efisien, serta model video generatif canggih baru bernama Vo. Vo dapat membuat video 1080p berkualitas tinggi dari prompt teks, gambar, dan video, sehingga menghadirkan kontrol kreatif yang belum pernah ada sebelumnya. Teknologi yang dikembangkan oleh DeepMind milik Google ini bertujuan mewujudkan ide-ide yang sebelumnya mustahil direalisasikan.
TPU generasi keenam Google dan pembaruan AI yang inovatif
Google berencana merilis Trillium, TPU generasi keenam dengan peningkatan performa komputasi 4,7 kali per chip, pada akhir 2024 dan menyediakannya bagi pelanggan cloud. Selain itu, Google juga memperkenalkan CPU dan GPU baru, termasuk prosesor Axion dan GPU Envidia Blackwell, untuk mendukung beragam workload; yang terakhir dijadwalkan tersedia pada awal 2025. Google juga meluncurkan Gemini, pengalaman penelusuran baru berbasis AI yang sepenuhnya dirancang ulang dengan tingkat kepuasan pengguna yang lebih tinggi, dan akan dirilis lebih dulu di Amerika Serikat. Model penelusuran baru ini memungkinkan kueri yang lebih kompleks dan pencarian foto, serta menyajikan hasil yang terstruktur untuk pengalaman pengguna yang lebih baik.
Fitur AI baru Google dan inovasi mendatang
Google memperkenalkan halaman hasil penelusuran baru yang disusun oleh AI, dimulai dari makanan dan resep lalu diperluas ke kategori lain. AI dapat menggunakan faktor kontekstual seperti musim untuk memberikan ringkasan penyebab masalah dan langkah-langkah pemecahannya. AI Google, Gemini, juga akan segera menghadirkan pengalaman live berupa pakar pribadi kustom yang disebut "gems", dan akan terintegrasi dengan Project Astra untuk kemampuan memahami video.
Memperkenalkan Gemini, asisten AI baru untuk Android
Gemini adalah asisten AI baru untuk Android yang menghadirkan pengalaman AI on-device sambil memprioritaskan privasi data. Asisten ini dirancang untuk memberikan saran yang sesuai konteks, seperti membantu belajar di sekolah dan menyediakan panduan langkah demi langkah untuk masalah yang rumit. Selain itu, Gemini dapat membantu tugas seperti mencari gambar dan menjawab pertanyaan tertentu, sambil terintegrasi mulus ke dalam workflow pengguna.
Dampak Gemini Google pada penggunaan smartphone
Gemini dari Google menghadirkan kemampuan AI bagi pengguna smartphone, memudahkan akses ke informasi dalam dokumen dan memberikan jawaban yang jelas untuk pertanyaan tertentu. Model foundation on-device meningkatkan pengalaman smartphone dengan memberikan respons yang lebih cepat sambil memprioritaskan privasi pengguna. Model Gemini Nano yang akan segera hadir akan semakin memperluas kemungkinan dengan memungkinkan ponsel memahami dunia melalui teks, visual, suara, dan bahasa lisan.
Corely, inti konten YouTube dalam 10 detik! - https://corely.ai/content/google-io-2024-everything-revealed
Gemini Flash
Google DeepMind Veo
https://killedbygoogle.com
Saya penasaran kapan Gemini akan masuk ke daftar ini. Kalau tidak menghasilkan uang, Google memang punya kebiasaan menghentikannya tanpa ragu, jadi saya jadi kurang simpati.
Kalau tidak ada pengumuman GPT-4o, sebenarnya presentasinya cukup bagus, tetapi jadinya terasa sangat kurang greget. Dari sudut pandang Google, sepertinya mereka benar-benar kesal pada OpenAI.
Dulu OpenAI sudah merilis demo batu-gunting-kertas yang pernah diperagakan Google, tapi Google sendiri sampai sekarang masih jauh dari itu... Aku lihat pengumuman kali ini juga sambil mikir, ini bakal benar-benar terwujud entah kapan lagi wkwk