Project Genie: bereksperimen dengan dunia yang tak terbatas dan interaktif

(blog.google)

6 poin oleh GN⁺ 2026-01-30 | 1 komentar | Bagikan ke WhatsApp

Project Genie dari Google adalah prototipe riset eksperimental yang memungkinkan pengguna membuat, menjelajahi, dan me-remix dunia virtual interaktif dengan teks dan gambar
Dibangun di atas model Genie 3, dan menghasilkan jalur serta lingkungan secara real-time mengikuti pergerakan pengguna
Tersedia dalam bentuk web app, dengan integrasi model Nano Banana Pro dan Gemini untuk mendukung fitur sketsa dunia, penjelajahan, dan remix
Karena keterbatasan model, versi awal memiliki sejumlah batasan seperti ketidaksesuaian dengan hukum fisika, latensi kontrol karakter, dan batas 60 detik
Saat ini tersedia untuk pelanggan Google AI Ultra di AS (usia 18 tahun ke atas), dengan rencana ekspansi ke lebih banyak wilayah di masa depan

Gambaran umum Project Genie

Project Genie adalah prototipe riset eksperimental berbasis Genie 3 yang dikembangkan Google DeepMind, yang menyediakan lingkungan bagi pengguna untuk membuat, menjelajahi, dan me-remix dunia virtual secara langsung
- Tersedia bagi pelanggan Google AI Ultra di AS (usia 18 tahun ke atas)
- Pengguna dapat membuat dunia melalui prompt teks dan gambar, lalu menjelajahinya secara real-time
Proyek ini merupakan langkah awal untuk membuka teknologi pembuatan dunia yang imersif kepada pengguna umum, sekaligus perluasan dari riset world model

Perkembangan World Model

World model adalah sistem yang mensimulasikan perubahan dinamis pada lingkungan dan memprediksi dampak dari suatu tindakan
Google DeepMind menargetkan pengembangan sistem AGI yang dapat mengeksplorasi keragaman dunia nyata, melampaui riset agen untuk lingkungan spesifik seperti catur atau Go
Genie 3 menghasilkan jalur secara real-time sesuai perpindahan pengguna dan mensimulasikan interaksi fisik
- Mendukung pembuatan dunia yang dinamis, bukan sekadar snapshot 3D statis
- Dapat dimanfaatkan dalam berbagai skenario seperti robotika, animasi, fiksi, dan eksplorasi lokasi bersejarah

Cara kerja Project Genie

Sebagai prototipe berbasis web, selain Genie 3 juga terintegrasi dengan model Nano Banana Pro dan Gemini
Terdiri dari tiga fitur inti
1. World Sketching (Sketsa Dunia)
- Merancang lingkungan yang hidup dengan teks dan gambar (dibuat atau diunggah)
- Pengguna dapat mendefinisikan karakter dan cara menjelajah, dengan dukungan berjalan, terbang, mengemudi, dan bentuk mobilitas lain
- Integrasi Nano Banana Pro memungkinkan pratinjau dan penyesuaian detail dunia
- Dapat memilih sudut pandang orang pertama atau orang ketiga
2. World Exploration (Penjelajahan Dunia)
- Dunia yang dibuat menjadi lingkungan yang bisa dijelajahi, dengan jalur yang dihasilkan secara real-time mengikuti tindakan pengguna
- Sudut pandang kamera dapat diubah saat menjelajah
3. World Remixing (Remix Dunia)
- Berdasarkan prompt dunia yang sudah ada, pengguna dapat menyusun ulang dunia dengan interpretasi baru
- Melalui galeri atau fitur penjelajahan acak, pengguna dapat menjelajahi atau mengubah dunia buatan pengguna lain
- Dunia yang telah selesai dan proses penjelajahannya dapat diunduh sebagai video

Membangun AI yang bertanggung jawab

Project Genie adalah prototipe riset eksperimental yang dijalankan dalam Google Labs, dan dioperasikan sesuai prinsip pengembangan AI yang bertanggung jawab
Karena keterbatasan model saat ini, disebutkan sejumlah batasan berikut
- Dunia yang dihasilkan bisa berbeda dari kenyataan atau tidak konsisten dengan prompt maupun hukum fisika
- Dapat terjadi latensi kontrol karakter atau penurunan responsivitas
- Ada batas waktu pembuatan 60 detik
Fitur perubahan event berbasis prompt yang diumumkan pada Agustus 2025 belum disertakan
Pembaruan dan peningkatan berikutnya dapat dipantau di halaman resmi DeepMind

Rencana ke depan dan perluasan akses

Project Genie dikembangkan berdasarkan riset kolaboratif dengan para tester tepercaya
Peluncuran kali ini merupakan tahap untuk memahami bagaimana pengguna benar-benar memanfaatkan world model
Saat ini hanya tersedia untuk pelanggan Google AI Ultra di AS, dan akan diperluas ke lebih banyak wilayah di masa mendatang
Dalam jangka panjang, Google berencana membuka teknologi pembuatan dunia ini kepada lebih banyak pengguna

1 komentar

GN⁺ 2026-01-30

Komentar Hacker News

Akhir-akhir ini saya terus teringat pada Andy Clark, The Experience Machine
Teorinya adalah bahwa otak manusia tidak mengenali dunia secara langsung, melainkan mengalami realitas dengan mengoreksi simulasi yang dihasilkannya secara internal melalui indera
Dengan kata lain, kita hidup di dalam model generatif beresolusi tinggi, dan indera berperan menyesuaikan sinyal kesalahan pada model itu
Seperti Genie 3 yang memprediksi frame berikutnya di ruang laten, otak manusia juga berusaha meminimalkan perbedaan antara ekspektasi dan pengalaman nyata melalui ‘Active Inference’
Pada akhirnya, rasa realitas bukanlah rekaman langsung dunia luar, melainkan simulasi interaktif yang terus-menerus dikoreksi
- Secara neurologis, ini sudah merupakan konsep yang cukup mapan
  Misalnya, mimpi bisa dilihat sebagai kasus ketika model internal bekerja bebas saat masukan sensorik terputus
- Untuk video terkait, saya merekomendasikan kurzgesagt Why Your Brain Blinds You For 2 Hours Every Day dan kumpulan sumbernya
- Your Brain Hallucinates Your Conscious Reality dari Anil Seth juga berada dalam konteks yang sama
  Topik seperti ini sudah lama dibahas dalam filsafat dan agama, dan menarik bahwa kesadaran manusia membangun realitas sebagai proyeksi dirinya sendiri
- Pascapemrosesan pada foto smartphone juga bisa dilihat sebagai analogi serupa
  Muncul pertanyaan, pada titik mana itu berhenti menjadi foto dan berubah menjadi karya impresionis yang dihitung secara komputasional
- 『The Case Against Reality』 karya Donald Hoffman juga layak dibaca
Tampaknya banyak orang salah paham dan mengira Genie hanyalah produk untuk game atau film
Padahal tujuan sebenarnya adalah membuat model dunia untuk AI dan robot generasi berikutnya, semacam ‘mesin imajinasi’ yang membantu pengambilan keputusan dengan mensimulasikan hasil tindakan
- Saya juga setuju. Orang sering bilang LLM tidak punya model dunia, dan sekarang rasanya kita sedang melangkah ke tahap berikutnya
  Saya membayangkan struktur yang mengenkode video dunia nyata pada frame rate tertentu untuk menambatkan imajinasi model ke data nyata, lalu mencabangkan dan mengevaluasi skenario tindakan yang mungkin sebelum mengirim prediksi optimal ke motor
  Menyetel timing-nya tidak akan mudah, tapi gambaran besarnya sudah terlihat
- Saya agak berbeda pendapat. Kalau yang diinginkan adalah imajinasi sejati, menurut saya dekoding video tidak harus diperlukan
  Genie menghasilkan video sebagai antarmuka yang bisa dipahami dan di-debug manusia
  Jadi tujuannya berbeda, yaitu sebagai game eksperimen AI untuk peneliti
- Tapi struktur seperti ini terlalu mahal. Untuk robotika sepertinya dibutuhkan arsitektur yang sama sekali berbeda
- Instagram juga awalnya hanya aplikasi untuk berbagi foto dengan teman, tapi sekarang berubah menjadi platform yang membuat kecanduan
  Kalau Genie digabungkan dengan VR, bisa saja muncul titik balik distopia yang serupa
- Pemetaan lingkungan seperti ini dan pembuatan hasil alternatif oleh AI pada akhirnya adalah konsep holodeck
  Tapi saya tetap lebih suka risiko dan vitalitas dunia nyata
Senang sekali akhirnya Genie dirilis
Ada beberapa video menarik dari para pengguna awal:
menjelajahi kota, simulasi helikopter, stasiun luar angkasa dan Dunkin Donuts, simulasi laptop, berang-berang pilot
- Saya juga ikut sebagai early tester
  Saya mencoba membuat berbagai dunia, seperti berjalan di bulan, bertemu Holmes dan Watson di 221B Baker Street, atau menjelajah sebagai bubble tea raksasa di pasar malam Taipei
  Ada juga video demo
  Memang masih prototipe eksperimental, tapi terasa seperti petunjuk masa depan
- Secara teknis ini mengagumkan, tapi rasa imersinya kurang
  Bisa menghasilkan aset Unreal 5 hanya dengan beberapa kata memang keren, tapi saya sendiri tidak benar-benar ingin bermain seperti itu
  Lagi pula saya juga tidak ingin membayar biaya komputasi per detik
- Saya benar-benar ingin melihat versi yang merekonstruksi era dinosaurus
- Penasaran bagaimana pendapat orang tentang Project Genie
Terobosan nyata Genie adalah bahwa kita bisa menoleh ke belakang
Simulator dari lab lain tidak bisa menjaga konsistensi untuk hal-hal yang berada di luar bidang pandang, tapi Genie berhasil menyelesaikan itu
- Saya dengar lab Fei-Fei Li membuat dunia 3D sungguhan
  Hanya saja pendekatan itu tampaknya akan punya keterbatasan untuk ekspresi animasi
- Menarik bahwa para peneliti ML baru sekarang menyadari perlunya struktur cache eksplisit
- Kalau begitu, saya jadi penasaran apakah jika kembali ke tempat yang sama seminggu kemudian, pemandangannya akan tetap terjaga
Ada video wawancara dengan tim Project Genie
Tautan YouTube
Genie adalah prototipe riset yang dapat menghasilkan, dijelajahi, dan diinteraksikan secara real-time dalam dunia fotorealistis yang tak terbatas variasinya
Ini membahas peralihan dari pembuatan video pasif ke media interaktif, tantangan teknis konsistensi dunia dan pemeliharaan memori, serta perannya sebagai tempat pelatihan bagi agen AI
Semakin saya melihat teknologi seperti ini, justru semakin saya ingin menghabiskan waktu di dunia nyata
Saya ingin mematikan layar dan kembali melakukan hal-hal yang saya cintai
- Saya juga merasakan hal yang sama. Saat melihat seseorang mengetik di keyboard di dalam video itu, tiba-tiba muncul rasa pahit
  Dunia virtual yang dibangun dari adegan nyata justru menimbulkan kesedihan
- Saya mencintai AI, tapi justru berharap teknologi seperti ini bisa menyadarkan kita akan nilai pengalaman manusia yang nyata
- Saya sudah seumur hidup bekerja di industri teknologi, tapi sekarang rasanya ingin mematikan semuanya
- Ironisnya, kemajuan seperti ini malah membuat saya semakin percaya pada hipotesis simulasi
  Mungkin saja realitas memang sudah merupakan simulasi
- Langit sedang biru dan matahari bersinar bagus, tapi karena malas saya jadi berpikir mungkin lebih enak menjalankan saja simulasi jalan-jalan
Ini mengingatkan saya pada proyek pribadi yang dulu pernah muncul di HN, yang melatih model dunia dari video taman
Ada juga demo interaktif, dan Genie terasa seperti membawa ide itu satu langkah lebih jauh
Agak disayangkan bahwa blog atau demo indie seperti itu tidak dikutip
- Benar, konsepnya mirip, tapi skalanya sangat ekstrem berbeda
  Model taman itu punya 5 juta parameter, dilatih dengan video 15 menit, dan bisa berjalan di iPhone
  Sementara Genie 3 adalah model raksasa dengan miliaran parameter yang dilatih dengan jutaan jam video
  Model skala menengah juga mulai bermunculan, jadi dalam 1–2 tahun ke depan mungkin bisa dijalankan secara lokal di GPU gaming
  Contoh: LingBot-World, Waypoint 1
Semua ini mirip dengan tema film 『The Thirteenth Floor』
Tautan trailer
Saya berharap ada yang membuat satu dunia dari GIF ini
Saya sudah lama penasaran. Mengapa Meta(FB) tidak agresif terhadap model dunia
Justru ini seharusnya menjadi inti visi metaverse, tapi mereka malah melepas Yann LeCun
- LeCun menyebabkan keretakan internal lewat minimnya hasil dan arah riset yang keras kepala
  Ia tidak ikut dalam persaingan LLM dan hanya berkutat pada teori yang belum terbukti
  Akibatnya Meta tertinggal dari kelompok terdepan AI, dan LeCun pun pergi sambil tetap menjaga reputasinya
- Saya mengibaratkan perbedaan JEPA dan Genie seperti ini
  JEPA seperti novelis yang merangkum “seekor anjing berlari ke arah tukang pos”
  Genie seperti pelukis yang harus benar-benar melukis adegan berikutnya agar ceritanya ada
  Dengan kata lain, Genie adalah generasi tingkat frame, sedangkan JEPA adalah prediksi tingkat konsep
- Sepenuhnya setuju. Model dunia adalah kartu penyelamat investasi Reality Labs
  Jika ini tidak bisa diprodukkan, proyeknya sendiri harus ditutup
- Kasus kegagalan tidak dipublikasikan. Jadi sebenarnya tidak jelas Meta telah berinvestasi di mana saja
- Pada dasarnya orang memang tidak suka memakai headset VR
  Sebagus apa pun kontennya, ini tetap bertahan sebagai pasar niche

Project Genie: bereksperimen dengan dunia yang tak terbatas dan interaktif

Gambaran umum Project Genie

Perkembangan World Model

Cara kerja Project Genie

1. World Sketching (Sketsa Dunia)

2. World Exploration (Penjelajahan Dunia)

3. World Remixing (Remix Dunia)

Membangun AI yang bertanggung jawab

Rencana ke depan dan perluasan akses

Bacaan terkait

1 komentar

Komentar Hacker News