Semua yang diumumkan di Google I/O 2024

xguru · 2024-05-15T08:34:19+09:00

Pengumuman model Gemini 1.5 Flash Model multimodal baru yang sekuat Gemini 1.5 Pro, tetapi dioptimalkan untuk tugas yang sempit, sering, dan berlatensi rendah Lebih cocok untuk menghasilkan respons cepat Kemampuan terjemahan, penalaran, dan coding Gemini 1.5 juga ditingkatkan Context window Gemini 1.5 Pro (jumlah informasi yang dapat diserap) meningkat dua kali lipat dari 1 juta token menjadi 2 juta token Project Astra: visi masa depan AI ala Star Trek dari Google Asisten AI multimodal yang ditujukan untuk melihat dan memahami melalui kamera perangkat, mengingat lokasi benda, dan melakukan tugas atas nama pengguna Diterapkan pada sebagian besar demo paling mengesankan di I/O tahun ini Tujuannya adalah menjadi AI agent sejati yang tidak hanya bercakap-cakap, tetapi benar-benar melakukan tugas untuk pengguna Veo: pembuatan video bergaya Sora dari Google Model AI generatif baru dari Google untuk menyaingi Sora milik OpenAI, yang dapat menghasilkan video 1080p menggunakan prompt berbasis teks, gambar, dan video Dapat membuat video dalam berbagai gaya seperti aerial shot atau timelapse, dan bisa disesuaikan dengan prompt tambahan Sudah disediakan kepada beberapa kreator untuk digunakan dalam pembuatan video YouTube, dan diposisikan juga untuk produksi film Integrasi Gemini dengan Workspace Gemini 1.5 Pro, model bahasa generasi berikutnya, diintegrasikan ke sidebar Docs, Sheets, Slides, Drive, dan Gmail Akan tersedia bulan depan untuk pelanggan berbayar, dan berperan sebagai asisten serbaguna di dalam Workspace Dapat mengambil informasi dari seluruh konten di Drive Dapat melakukan tugas seperti menulis email dengan menggabungkan informasi dari dokumen yang sedang dilihat, atau mengingatkan untuk membalas email yang sedang dibaca nanti Perluasan kemampuan Google Lens Kini bisa melakukan pencarian tidak hanya dengan gambar tetapi juga dengan video Ditambahkan fitur yang memungkinkan pengguna merekam video sambil mengajukan pertanyaan, lalu AI Google mencari jawaban terkait di web Pemanfaatan Google Photos oleh Gemini Melalui fitur "Ask Photos" yang akan dirilis musim panas ini, sistem akan menganalisis pustaka Google Photos pengguna dan menjawab pertanyaan Bukan sekadar menemukan foto anjing atau kucing, tetapi juga dapat menjawab pertanyaan yang lebih kompleks seperti menanyakan nomor plat kendaraan sendiri, seperti yang didemokan CEO Sundar Pichai Gems: penambahan fitur pembuatan chatbot kustom di Gemini Mirip GPT dari OpenAI, lewat Gems pengguna dapat memberi instruksi kepada Gemini untuk menyesuaikan cara menjawab dan bidang keahliannya Misalnya, jika menginginkan pelatih lari yang positif dan gigih yang memberi motivasi harian dan rencana lari, itu akan segera dimungkinkan (untuk pelanggan Gemini Advanced) Peningkatan kemampuan percakapan Gemini Fitur baru Gemini Live bertujuan membuat voice chat dengan Gemini terasa lebih alami Suara chatbot diberi lebih banyak karakter, dan pengguna dapat menyela di tengah atau meminta Gemini menerima informasi secara real-time melalui kamera smartphone Gemini terintegrasi dengan Google Calendar, Tasks, dan Keep untuk memperbarui atau mengambil informasi, serta memanfaatkan kemampuan multimodal seperti menambahkan detail dari selebaran ke kalender pribadi Circle to Search mendukung penyelesaian soal matematika Kini di ponsel atau tablet Android, pengguna bisa melingkari soal matematika untuk mendapatkan bantuan menyelesaikannya AI Google tidak akan langsung mengerjakan soal agar tidak membantu siswa mencontek tugas, tetapi akan memecahnya langkah demi langkah agar lebih mudah diselesaikan Perombakan AI pada Google Search "AI Overviews" (sebelumnya disebut "Search Generative Experience") akan diluncurkan di seluruh Amerika Serikat minggu ini Kini model Gemini yang "terspesialisasi" akan merancang halaman hasil pencarian dan mengisinya dengan jawaban ringkas dari web (mirip dengan yang terlihat di alat pencarian AI seperti Perplexity atau Arc Search) Deteksi penipuan berbasis AI di Android Google mengatakan bahwa dengan AI Gemini Nano di perangkat, ponsel Android dapat membantu menghindari panggilan penipuan dengan mendeteksi tanda bahaya seperti pola percakapan umum penipu dan menampilkan peringatan secara real-time Detail lebih lanjut tentang fitur ini akan tersedia akhir tahun ini Peningkatan kecerdasan AI pada perangkat Android Google mengatakan Gemini akan segera memungkinkan pengguna mengajukan pertanyaan tentang video yang ditampilkan di layar, dan akan menjawab berdasarkan subtitle otomatis Untuk pengguna Gemini Advanced berbayar, sistem juga dapat menyerap PDF dan memberikan informasi Pembaruan multimodal ini dan pembaruan lain untuk Gemini on Android akan tersedia dalam beberapa bulan ke depan Penambahan asisten AI ke Google Chrome Google mengumumkan penambahan Gemini Nano, versi ringannya, ke Chrome di desktop Asisten bawaan akan menggunakan AI di perangkat untuk membantu pembuatan teks untuk posting media sosial, ulasan produk, dan lainnya langsung di Google Chrome Upgrade watermarking AI SynthID Google mengatakan akan memperluas kemampuan SynthID Sistem akan menyisipkan watermark pada konten yang dibuat dengan generator video baru Veo, dan kini juga dapat mendeteksi video buatan AI

(theverge.com)

19 poin oleh xguru 2024-05-15 | 6 komentar | Bagikan ke WhatsApp

Pengumuman model Gemini 1.5 Flash

Model multimodal baru yang sekuat Gemini 1.5 Pro, tetapi dioptimalkan untuk tugas yang sempit, sering, dan berlatensi rendah
Lebih cocok untuk menghasilkan respons cepat
Kemampuan terjemahan, penalaran, dan coding Gemini 1.5 juga ditingkatkan
Context window Gemini 1.5 Pro (jumlah informasi yang dapat diserap) meningkat dua kali lipat dari 1 juta token menjadi 2 juta token

Project Astra: visi masa depan AI ala Star Trek dari Google

Asisten AI multimodal yang ditujukan untuk melihat dan memahami melalui kamera perangkat, mengingat lokasi benda, dan melakukan tugas atas nama pengguna
Diterapkan pada sebagian besar demo paling mengesankan di I/O tahun ini
Tujuannya adalah menjadi AI agent sejati yang tidak hanya bercakap-cakap, tetapi benar-benar melakukan tugas untuk pengguna

Veo: pembuatan video bergaya Sora dari Google

Model AI generatif baru dari Google untuk menyaingi Sora milik OpenAI, yang dapat menghasilkan video 1080p menggunakan prompt berbasis teks, gambar, dan video
Dapat membuat video dalam berbagai gaya seperti aerial shot atau timelapse, dan bisa disesuaikan dengan prompt tambahan
Sudah disediakan kepada beberapa kreator untuk digunakan dalam pembuatan video YouTube, dan diposisikan juga untuk produksi film

Integrasi Gemini dengan Workspace

Gemini 1.5 Pro, model bahasa generasi berikutnya, diintegrasikan ke sidebar Docs, Sheets, Slides, Drive, dan Gmail
Akan tersedia bulan depan untuk pelanggan berbayar, dan berperan sebagai asisten serbaguna di dalam Workspace
Dapat mengambil informasi dari seluruh konten di Drive
Dapat melakukan tugas seperti menulis email dengan menggabungkan informasi dari dokumen yang sedang dilihat, atau mengingatkan untuk membalas email yang sedang dibaca nanti

Perluasan kemampuan Google Lens

Kini bisa melakukan pencarian tidak hanya dengan gambar tetapi juga dengan video
Ditambahkan fitur yang memungkinkan pengguna merekam video sambil mengajukan pertanyaan, lalu AI Google mencari jawaban terkait di web

Pemanfaatan Google Photos oleh Gemini

Melalui fitur "Ask Photos" yang akan dirilis musim panas ini, sistem akan menganalisis pustaka Google Photos pengguna dan menjawab pertanyaan
Bukan sekadar menemukan foto anjing atau kucing, tetapi juga dapat menjawab pertanyaan yang lebih kompleks seperti menanyakan nomor plat kendaraan sendiri, seperti yang didemokan CEO Sundar Pichai

Gems: penambahan fitur pembuatan chatbot kustom di Gemini

Mirip GPT dari OpenAI, lewat Gems pengguna dapat memberi instruksi kepada Gemini untuk menyesuaikan cara menjawab dan bidang keahliannya
Misalnya, jika menginginkan pelatih lari yang positif dan gigih yang memberi motivasi harian dan rencana lari, itu akan segera dimungkinkan (untuk pelanggan Gemini Advanced)

Peningkatan kemampuan percakapan Gemini

Fitur baru Gemini Live bertujuan membuat voice chat dengan Gemini terasa lebih alami
Suara chatbot diberi lebih banyak karakter, dan pengguna dapat menyela di tengah atau meminta Gemini menerima informasi secara real-time melalui kamera smartphone
Gemini terintegrasi dengan Google Calendar, Tasks, dan Keep untuk memperbarui atau mengambil informasi, serta memanfaatkan kemampuan multimodal seperti menambahkan detail dari selebaran ke kalender pribadi

Circle to Search mendukung penyelesaian soal matematika

Kini di ponsel atau tablet Android, pengguna bisa melingkari soal matematika untuk mendapatkan bantuan menyelesaikannya
AI Google tidak akan langsung mengerjakan soal agar tidak membantu siswa mencontek tugas, tetapi akan memecahnya langkah demi langkah agar lebih mudah diselesaikan

Perombakan AI pada Google Search

"AI Overviews" (sebelumnya disebut "Search Generative Experience") akan diluncurkan di seluruh Amerika Serikat minggu ini
Kini model Gemini yang "terspesialisasi" akan merancang halaman hasil pencarian dan mengisinya dengan jawaban ringkas dari web (mirip dengan yang terlihat di alat pencarian AI seperti Perplexity atau Arc Search)

Deteksi penipuan berbasis AI di Android

Google mengatakan bahwa dengan AI Gemini Nano di perangkat, ponsel Android dapat membantu menghindari panggilan penipuan dengan mendeteksi tanda bahaya seperti pola percakapan umum penipu dan menampilkan peringatan secara real-time
Detail lebih lanjut tentang fitur ini akan tersedia akhir tahun ini

Peningkatan kecerdasan AI pada perangkat Android

Google mengatakan Gemini akan segera memungkinkan pengguna mengajukan pertanyaan tentang video yang ditampilkan di layar, dan akan menjawab berdasarkan subtitle otomatis
Untuk pengguna Gemini Advanced berbayar, sistem juga dapat menyerap PDF dan memberikan informasi
Pembaruan multimodal ini dan pembaruan lain untuk Gemini on Android akan tersedia dalam beberapa bulan ke depan

Penambahan asisten AI ke Google Chrome

Google mengumumkan penambahan Gemini Nano, versi ringannya, ke Chrome di desktop
Asisten bawaan akan menggunakan AI di perangkat untuk membantu pembuatan teks untuk posting media sosial, ulasan produk, dan lainnya langsung di Google Chrome

Upgrade watermarking AI SynthID

Google mengatakan akan memperluas kemampuan SynthID
Sistem akan menyisipkan watermark pada konten yang dibuat dengan generator video baru Veo, dan kini juga dapat mendeteksi video buatan AI

6 komentar

pinks 2024-05-16

Chatbot cukup disediakan gratis saja, dan karena saya tidak memakai fitur terkait gambar, video, atau audio, saya senang itu diintegrasikan ke produk yang sudah ada.

corelyai 2024-05-15

Kemajuan AI Project Astra dan pembuatan video Google

Model Gemini dari Google telah digunakan secara luas oleh lebih dari 1,5 juta pengembang untuk debugging kode, memperoleh insight, dan membangun aplikasi AI. Project Astra memperkenalkan agen AI yang dapat memproses input video dan suara secara efisien, serta model video generatif canggih baru bernama Vo. Vo dapat membuat video 1080p berkualitas tinggi dari prompt teks, gambar, dan video, sehingga menghadirkan kontrol kreatif yang belum pernah ada sebelumnya. Teknologi yang dikembangkan oleh DeepMind milik Google ini bertujuan mewujudkan ide-ide yang sebelumnya mustahil direalisasikan.

TPU generasi keenam Google dan pembaruan AI yang inovatif

Google berencana merilis Trillium, TPU generasi keenam dengan peningkatan performa komputasi 4,7 kali per chip, pada akhir 2024 dan menyediakannya bagi pelanggan cloud. Selain itu, Google juga memperkenalkan CPU dan GPU baru, termasuk prosesor Axion dan GPU Envidia Blackwell, untuk mendukung beragam workload; yang terakhir dijadwalkan tersedia pada awal 2025. Google juga meluncurkan Gemini, pengalaman penelusuran baru berbasis AI yang sepenuhnya dirancang ulang dengan tingkat kepuasan pengguna yang lebih tinggi, dan akan dirilis lebih dulu di Amerika Serikat. Model penelusuran baru ini memungkinkan kueri yang lebih kompleks dan pencarian foto, serta menyajikan hasil yang terstruktur untuk pengalaman pengguna yang lebih baik.

Fitur AI baru Google dan inovasi mendatang

Google memperkenalkan halaman hasil penelusuran baru yang disusun oleh AI, dimulai dari makanan dan resep lalu diperluas ke kategori lain. AI dapat menggunakan faktor kontekstual seperti musim untuk memberikan ringkasan penyebab masalah dan langkah-langkah pemecahannya. AI Google, Gemini, juga akan segera menghadirkan pengalaman live berupa pakar pribadi kustom yang disebut "gems", dan akan terintegrasi dengan Project Astra untuk kemampuan memahami video.

Memperkenalkan Gemini, asisten AI baru untuk Android

Gemini adalah asisten AI baru untuk Android yang menghadirkan pengalaman AI on-device sambil memprioritaskan privasi data. Asisten ini dirancang untuk memberikan saran yang sesuai konteks, seperti membantu belajar di sekolah dan menyediakan panduan langkah demi langkah untuk masalah yang rumit. Selain itu, Gemini dapat membantu tugas seperti mencari gambar dan menjawab pertanyaan tertentu, sambil terintegrasi mulus ke dalam workflow pengguna.

Dampak Gemini Google pada penggunaan smartphone

Gemini dari Google menghadirkan kemampuan AI bagi pengguna smartphone, memudahkan akses ke informasi dalam dokumen dan memberikan jawaban yang jelas untuk pertanyaan tertentu. Model foundation on-device meningkatkan pengalaman smartphone dengan memberikan respons yang lebih cepat sambil memprioritaskan privasi pengguna. Model Gemini Nano yang akan segera hadir akan semakin memperluas kemungkinan dengan memungkinkan ponsel memahami dunia melalui teks, visual, suara, dan bahasa lisan.

Corely, inti konten YouTube dalam 10 detik! - https://corely.ai/content/google-io-2024-everything-revealed

xguru 2024-05-15

Gemini Flash
Google DeepMind Veo

savvykang 2024-05-15

https://killedbygoogle.com
Saya penasaran kapan Gemini akan masuk ke daftar ini. Kalau tidak menghasilkan uang, Google memang punya kebiasaan menghentikannya tanpa ragu, jadi saya jadi kurang simpati.