Revolusi AI Google: Perjuangan 2 Tahun untuk Menyusul OpenAI

(wired.com)

35 poin oleh GN⁺ 2025-03-28 | 4 komentar | Bagikan ke WhatsApp

Awal krisis Google yang tertinggal dalam revolusi chatbot

Pada Desember 2022, Sissie Hsiao diberi misi untuk mengembangkan produk pesaing ChatGPT milik Google dalam 100 hari
Hsiao adalah veteran yang telah bekerja lebih dari 16 tahun dan memimpin ribuan orang, tetapi ia belum pernah menghadapi situasi krisis separah ini
Setelah OpenAI merilis ChatGPT, jumlah pengguna dengan cepat melampaui 1 juta orang meskipun ada kesalahan fakta dan kekeliruan matematika
Sebagian orang mulai menganggap ChatGPT sebagai pengganti Google Search, dan ini menjadi ancaman bagi sumber pendapatan terbesar Google
Google memiliki model bahasanya sendiri, LaMDA, tetapi akses publik sangat dibatasi, dan bahkan demo yang ditampilkan hanya sebatas “cerita anak anjing”
Wall Street (pasar keuangan) merasa cemas; sebelumnya CEO Sundar Pichai telah menyatakan era “AI-first” dan mengatakan bahwa asisten cerdas akan menggantikan perangkat, tetapi kenyataannya tidak memenuhi harapan
Arsitektur Transformer juga diciptakan oleh delapan peneliti Google, tetapi mereka kemudian keluar dari perusahaan atau pergi tanpa hasil berarti
Google Assistant yang dikelola Hsiao hanya dipakai untuk hal-hal seperti menyetel timer atau memutar musik
Yang ada hanyalah chatbot belum rampung yang menyediakan saran memasak dan kuis sejarah untuk generasi Gen Z
Hingga akhir 2022, harga saham Alphabet turun 39% dibanding tahun sebelumnya, dan posisi Google sebagai pemimpin AI mulai goyah

Respons Google terhadap krisis AI dan perubahan strategi

Pada awal 2023, dewan direksi Google menuntut laporan real-time terkait AI
- Salah satu pendiri sekaligus pemegang saham utama, Sergey Brin, juga ikut langsung dalam tinjauan strategi
- Kepada karyawan disampaikan pesan untuk “bergerak seperti startup”
Sebelumnya, budaya di perusahaan adalah banyak karyawan boleh menentang sebuah produk, tetapi tidak memiliki wewenang untuk menyetujuinya
Kini Google sedang beralih ke budaya yang mengambil risiko lebih besar dan mengeksekusi lebih cepat
Saat memulai proyek 100 hari itu, Sissie Hsiao memberikan prinsip unik kepada tim:
“Quality over speed, but fast”
Eksekutif senior lain, James Manyika, berperan dalam mengubah strategi AI secara mendasar
- Ia adalah doktor robotika lulusan Oxford dan mantan penasihat McKinsey, lalu bergabung dengan Google pada 2022
- Ia mengusulkan kepada Pichai penggabungan DeepMind dan Google Brain
DeepMind (London, dipimpin Demis Hassabis) dan Google Brain (Mountain View, di bawah Jeff Dean) berjalan terpisah dan menghabiskan sumber daya secara tidak efisien
- Setelah peluncuran produk OpenAI, tiga pemimpin mengajukan rencana integrasi kepada dewan
- Hassabis mengusulkan nama proyek ‘Titan’, tetapi ditolak, dan nama usulan Jeff Dean, ‘Gemini’, akhirnya dipilih
Manyika kemudian menyebut bahwa Google telah membuat pilihan-pilihan yang berani dan bertanggung jawab
- Namun ia juga mengakui bahwa “kami tidak selalu membuat pilihan yang tepat”
- Di tengah situasi mendesak, keresahan bahkan menyebar di kalangan karyawan bahwa “Google bisa menjadi seperti Yahoo”
- Hsiao menggambarkan masa itu sebagai “seperti sprint penuh di dalam maraton”
Namun kini, dua tahun kemudian, saham Alphabet mencetak rekor tertinggi sepanjang masa
- Investor menunjukkan pandangan optimistis terhadap pemulihan daya saing AI Google
WIRED menilai periode ini sebagai masa paling kacau dan penuh perubahan budaya dalam sejarah Google
- Mereka mewawancarai lebih dari 50 karyawan lama dan sekarang, termasuk engineer, pemasaran, hukum, dan pakar keselamatan
- Artikel ini untuk pertama kalinya menyoroti secara rinci perubahan di Google melalui kesaksian para eksekutif senior

Pengembangan Bard: prioritas tingkat perusahaan dan pemusatan sumber daya

Untuk merespons ChatGPT, Google memulai proyek chatbot baru dengan nama sandi Bard
Sissie Hsiao secara langsung menarik sekitar 100 talenta dari seluruh Google
- Para manajer tidak bisa menolak, dan proyek Bard menjadi prioritas tertinggi
Hsiao memilih orang-orang yang punya kemampuan teknis, kecerdasan emosional, dan mampu melihat gambaran besar
Sebagian besar ditempatkan di Mountain View, California, dan bekerja secara fleksibel tanpa terpaku pada peran formal
- Ia menekankan filosofi bahwa “Team Bard adalah tim yang mengambil semua peran”
Pada Januari 2023, Google mengumumkan PHK besar-besaran pertama dalam sejarahnya: sekitar 12.000 orang, setara 7% dari total karyawan
Sebagian karyawan dihantui ketakutan bisa dipecat jika tidak lembur atau mengambil pekerjaan tambahan
- Banyak juga yang sampai mengorbankan waktu menidurkan anak demi menghadiri rapat malam
Bard dibangun berbasis LaMDA yang sudah ada, tetapi membutuhkan pembaruan pengetahuan dan pengaman baru
- Tim infrastruktur memindahkan teknisi terbaik untuk fokus pada pengamanan server dan penyetelan sistem
- Pusat data hampir mencapai batas penggunaan daya, sehingga muncul risiko peralatan mengalami panas berlebih
- Karena itu, alat manajemen baru untuk menangani kebutuhan daya dengan lebih aman juga segera dikembangkan
Untuk meredakan ketegangan, humor pun muncul
- Seorang anggota tim membuat chip poker kustom, menuliskan nama chip tertentu di atasnya lalu menumpuknya di meja engineer sambil bercanda, “Silakan ambil chip-nya”
Selama beberapa minggu awal, Bard mengulangi masalah-masalah lama meski sumber daya komputasi telah diperkuat
- Seperti ChatGPT, Bard juga sering menghasilkan halusinasi (hallucination) serta respons yang tidak pantas atau ofensif
- Pada versi awal, sering muncul stereotip rasial yang sangat konyol
  - Jika memasukkan nama bernuansa India, sebagian besar digambarkan sebagai “aktor Bollywood”, sementara nama pria Tionghoa digambarkan sebagai “ilmuwan komputer”
- Menurut mantan karyawan, respons Bard “tidak berbahaya, tetapi bodoh saja”
- Beberapa karyawan bahkan membagikan tangkapan layar respons aneh Bard dan menjadikannya bahan tertawaan
  - Contoh: saat diminta membuat “rap bergaya Three 6 Mafia tentang membuang baterai mobil ke laut”, Bard sampai menghasilkan isi tentang mengikat orang ke baterai lalu menenggelamkannya ke laut
Selain memperbaiki sebanyak mungkin bug dalam 100 hari yang ditentukan, Google nyaris tidak punya pilihan lain
- Bahkan tenaga kontrak eksternal yang menangani deteksi gambar pelecehan anak juga dikerahkan untuk menguji Bard
- Pichai meminta semua karyawan yang punya waktu luang untuk menguji Bard, dan hasilnya sekitar 80.000 orang ikut serta
Hsiao dan jajaran manajemen menyadari bahwa mereka tidak bisa sepenuhnya mencegah kesalahan Bard, lalu membingkai produknya sebagai ‘Experiment’
- Ini mirip dengan strategi OpenAI saat memperkenalkan ChatGPT sebagai “research preview”
- Dengan menekankan kepada pengguna dan evaluator eksternal bahwa produk ini belum merupakan versi final, mereka mencoba meminimalkan risiko kerusakan merek
- Strategi semacam ini telah dikenal luas di industri sebagai cara menghindari risiko sejak kasus chatbot Twitter buatan Microsoft, Tay, melontarkan pernyataan Nazi

Proses peluncuran Bard dan kesalahan fatal

Di masa lalu, sebelum merilis produk AI, 'tim inovasi bertanggung jawab' di Google meninjau bias dan cacat selama berbulan-bulan
- Untuk Bard, karena tekanan jadwal, proses peninjauan dipangkas besar-besaran
- Chief Legal Officer Kent Walker mendorong peluncuran yang cepat
- Model dan fitur baru muncul terlalu cepat sehingga tim review tidak mampu mengimbangi meski lembur dan bekerja di akhir pekan
Ada peringatan yang meminta penundaan peluncuran Bard, tetapi diabaikan atau dilemahkan
- Terkait hal ini, Google mengatakan kepada WIRED bahwa “tidak ada tim mana pun yang secara resmi merekomendasikan penolakan peluncuran”
  - Google menjelaskan bahwa banyak tim ikut serta dalam pengujian, dan tidak ada struktur di mana satu tim tertentu memikul tanggung jawab penuh
Pada sekitar dua pertiga perjalanan proyek 100 hari, pada Februari 2023, Google memperoleh informasi bahwa ChatGPT akan diintegrasikan ke pencarian Bing
Pangsa pasar pencarian masih sangat didominasi Google, tetapi ketiadaan fitur AI generatif merupakan ancaman jangka panjang
Untuk menghindari penurunan harga saham, sehari sebelum pengumuman Microsoft pada 6 Februari, Pichai secara mendadak mengumumkan pembukaan uji coba terbatas Bard
Dalam video pemasaran, Bard digambarkan sebagai asisten AI yang mewarisi misi Google untuk “mengorganisasi informasi”
Pertanyaan dalam video: “Dari penemuan baru Teleskop Luar Angkasa James Webb, mana yang bisa dijelaskan kepada anak 9 tahun?”
- Jawaban Bard: “JWST mengambil foto pertama planet di luar tata surya”
Tak lama kemudian, Reuters melaporkan kesalahan faktual: foto tersebut diambil bukan oleh teleskop luar angkasa, melainkan teleskop darat (VLT)
Saham Alphabet turun 9%, kapitalisasi pasar menyusut sekitar $100 miliar
Tim internal terguncang
- Staf pemasaran yang membuat pertanyaan itu menyalahkan dirinya sendiri, dan rekan-rekannya menghibur dengan mengatakan, “tim legal dan tim PR sama-sama sudah meninjau, tetapi tidak ada yang melihat kesalahan itu”
- Karena ChatGPT juga sering membuat kesalahan, mereka tidak memperkirakan kesalahpahaman kecil seperti ini akan berdampak besar pada harga saham
Xiao menyebutnya sebagai “kesalahan naif”
- Bard menyusun jawaban berdasarkan hasil pencarian Google, dan mungkin salah menafsirkan ungkapan “foto pertama” dalam blog NASA
- Pimpinan menegaskan, “tidak ada yang akan dipecat karena kejadian ini. Tetapi kita harus cepat belajar dari pelajaran ini”
Xiao: “Kita bukan startup, kita Google. Ini tidak bisa dianggap sekadar cacat teknis. Kita harus merespons dengan bertanggung jawab”
Ketidakpuasan dari luar tim Bard makin meningkat
- Di forum internal Memegen, muncul posting kritik bahwa “peluncuran Bard dan PHK dilakukan tergesa-gesa, berantakan, dan berpandangan pendek”
- Gambar logo Google yang terbakar di tempat sampah juga dibagikan
Namun, Google menyalurkan lebih banyak sumber daya ke Bard
- Ratusan orang tambahan ditempatkan, dan di dokumen tim ikon foto profil Pichai muncul setiap hari, menandakan keterlibatan langsungnya

Kemunculan GPT-4 dan kesenjangan teknologi

Pada pertengahan Maret 2023, peluncuran GPT-4 oleh OpenAI kembali mengguncang internal Google
- Seorang peneliti senior berkata: “Saya benar-benar tercengang, dan merasa sangat mendesak bahwa Google harus bergerak lebih cepat”
Seminggu kemudian, Bard resmi diluncurkan di Amerika Serikat dan Inggris
- Pengguna menilai Bard berguna untuk menulis email, membuat draf laporan, dan sebagainya
- Namun, ChatGPT juga melakukan hal yang sama dengan lebih baik, sehingga insentif untuk berpindah bagi pengguna lemah
Pichai di podcast Hard Fork menyindir diri sendiri dengan mengatakan Google “menurunkan Civic yang sudah di-tuning untuk melawan mobil sport yang bertenaga”
- Kesimpulannya: “Kita butuh mesin yang lebih baik”

Pengembangan Gemini: integrasi DeepMind dan Google Brain serta benturan budaya

Perbedaan dua organisasi riset AI
- DeepMind diklasifikasikan sebagai 'Other Bets' milik Alphabet, dan berfokus pada pemecahan masalah ilmiah dan matematika jangka panjang
- Google Brain terutama mengembangkan teknologi AI yang praktis secara komersial, seperti autocomplete Gmail dan penanganan kueri pencarian ambigu
Menurut seorang mantan insinyur senior:
- Google Brain berpusat pada otonomi, dan Jeff Dean memiliki gaya “membiarkan orang mengerjakan sendiri”
- Sebaliknya, DeepMind bergerak seperti militer yang sangat terkoordinasi, dan Demis Hassabis menjalankan “organisasi berdaya guna tinggi di bawah satu komandan”
Dean adalah veteran riset jaringan saraf, aktif sejak masa awal berdirinya Google
Hassabis adalah pemimpin yang berorientasi visi, memimpikan penyembuhan penyakit melalui AI dan sedang membayangkan “agen AI yang bisa melihat, mendengar, dan membantu”
Peluncuran Google DeepMind(GDM)
- Pada April 2023, Google menggabungkan dua organisasi tersebut dan meluncurkan Google DeepMind(GDM)
  - Hassabis ditunjuk sebagai CEO organisasi hasil merger
  - Suasana internal: “tujuan kembali hidup”, “main-main sudah selesai”
- Untuk membangun model Gemini dengan cepat, diperlukan kolaborasi lintas 8 zona waktu
- Ratusan ruang chat dibuat, dan budaya kerja semalaman pun mengakar
  - Hassabis: “Setiap hari terasa seperti seumur hidup”
- GDM pindah ke gedung aman bernama Gradient Canopy di Mountain View
  - Struktur berbentuk kubah, dikelilingi instalasi seni
  - Kantor CEO Pichai berada di lantai yang sama
- Sergey Brin (salah satu pendiri Google) sering datang memberi semangat
- Ada tuntutan untuk lebih sering masuk kantor, dan karyawan Google biasa tidak bisa masuk ke gedung ini
- Kode inti GDM juga tidak dapat diakses organisasi lain
Saat proyek Gemini menyerap sumber daya Google, para peneliti di bidang lain seperti kesehatan dan perubahan iklim mengalami kekurangan server
Pembatasan publikasi paper juga muncul, memicu ketidakpuasan karena paper merupakan aset karier utama para peneliti
- Google memperketat pembatasan karena khawatir informasi bocor ke OpenAI
- resep pelatihan Gemini adalah aset inti bagi kelangsungan hidup perusahaan
Gemini juga menghadapi masalah yang mirip dengan Bard
Wakil presiden machine learning dan cloud AI Google, Amin Vahdat:
- “Saat Anda memperbesar skala 10 kali lipat, semuanya rusak”
Menjelang peluncuran, Vahdat membentuk war room khusus, berfokus pada penyelesaian bug dan error sistem

Pemeriksaan terakhir sebelum peluncuran Gemini dan pertimbangan etis

Tim pengembangan bertanggung jawab Google DeepMind(GDM) mengerahkan seluruh upaya untuk review produk menjelang peluncuran Gemini
- Modelnya kuat, tetapi masih ada kasus menghasilkan respons yang aneh atau tidak pantas
Menurut laporan yang dipublikasikan:
- Perlu banyak perbaikan terutama pada saran medis dan respons terkait perundungan
- Saat menerima input gambar, muncul masalah berupa inferensi tanpa dasar untuk pertanyaan seperti “Apa tingkat pendidikan orang ini?”
Direktur inovasi bertanggung jawab Dawn Bloxwich menilai ini “tidak sampai pada tingkat yang harus menghentikan peluncuran”
- Namun, waktu untuk memprediksi cara penggunaan publik yang kreatif (atau aneh) masih kurang
Pada titik ini Google sebenarnya bisa memperlambat laju, tetapi tidak melakukannya
- OpenAI telah menjadi ‘Kleenex-nya AI’ dan sedang mendapat sorotan global
- ChatGPT menjadi simbol harapan teknologi sekaligus masalah sosial
- Para pekerja merasa pekerjaan mereka terancam, dan para kreator menuntut kompensasi atas eksploitasi data
- Para orang tua mulai menyadari bahwa chatbot dapat menyampaikan konten yang tidak pantas kepada anak-anak mereka
- Di kalangan peneliti AI, muncul diskusi tentang “p(doom)”—probabilitas bahwa teknologi akan mengancam umat manusia
Ilmuwan AI legendaris Google Geoffrey Hinton mundur pada Mei 2023 karena kekhawatiran etis
- Ia memperingatkan bahwa AI dapat mengancam umat manusia melalui disinformasi dan racun yang canggih
Hassabis juga merasa membutuhkan lebih banyak waktu, tetapi ia tetap melangkah menuju impiannya tentang asisten AI serbaguna dan penyembuhan penyakit

Pengungkapan Gemini dan keberhasilan awal

Desember 2023, Google secara resmi meluncurkan Gemini
- Harga saham naik setelah peluncuran
- Mengungguli ChatGPT dalam 30 dari 32 pengujian standar
- Analisis makalah dan video YouTube, memperkuat kemampuan menjawab pertanyaan matematika dan hukum
Hassabis mengadakan pesta perayaan kecil di kantor London
- Ia mengenang, “Saya bukan orang yang pandai merayakan. Saya selalu memikirkan hal berikutnya”
Pada bulan yang sama, Jeff Dean diundang ke ruang obrolan baru bernama 'Goldfish' dan mengetahui kemajuan teknologi berikutnya
- Namanya memang bercanda, tetapi isinya justru kebalikannya: pengembangan versi Gemini dengan memori panjang
Melalui pemrosesan terdistribusi pada jaringan chip berkecepatan tinggi, sistem ini bisa menganalisis ribuan halaman teks atau bahkan seluruh serial TV
- Teknologi ini disebut “long context”
Dean, Hassabis, dan Manica mencari cara untuk mengintegrasikan ini ke lini produk AI Google
Fitur yang paling pertama diinginkan Manica: fitur yang secara otomatis merangkum PDF dalam format podcast
- Ia mengatakan kepada WIRED, “Sulit mengikuti semua makalah yang membanjiri arXiv setiap minggu”

Stabilitas setelah transisi Gemini dan krisis baru

Setahun setelah code red, suasana di Google berbalik pulih
- Investor menjadi lebih tenang, dan Bard serta LaMDA disatukan di bawah satu merek, “Gemini”
Tim Sissie Hsiao memperkecil jarak dengan OpenAI lewat pengembangan fitur pembuatan teks-ke-gambar
Fitur baru bernama Gemini Live juga sedang dipersiapkan
- Fitur ini memungkinkan pengguna menjalin percakapan panjang layaknya dengan teman atau konselor
Berkat model Gemini yang semakin kuat, para eksekutif kembali percaya diri
Meski suasana mulai stabil, CEO Pichai memerintahkan restrukturisasi tambahan
- Pendapatan iklan naik, tetapi tidak memenuhi ekspektasi Wall Street
- Bahkan para penanggung jawab privasi dan kepatuhan ikut disingkirkan
  - Kepergian petinggi yang bertugas melindungi pengguna ini ditafsirkan sebagai pesan: “Kekhawatiran boleh disampaikan, tetapi jangan menghambat laju”
Generator gambar itu sendiri relatif mudah dibangun, tetapi proses peninjauannya menjadi kerja repetitif yang berat
- Tim harus menulis prompt penyaringan agar respons bermasalah tidak muncul
Karena tidak semua karyawan dapat mengakses pengujian, beban berlebihan terkonsentrasi pada segelintir orang
- Contoh: pada prompt “rapist”, gambar orang berkulit gelap lebih sering dihasilkan → memicu kekhawatiran bias rasial
- Karena itu, sempat ada permintaan internal agar gambar manusia tidak dibuat sama sekali, tetapi diabaikan
Seorang mantan peninjau mengenang bahwa “suasananya adalah apa pun yang terjadi, produk harus diluncurkan”
- Sebagian peninjau mengundurkan diri karena kekhawatiran mereka tidak ditanggapi
Pada Februari 2024, generator gambar itu resmi diluncurkan di dalam aplikasi Gemini
- Masalah gambar rasis dan seksis yang diperkirakan sebelumnya hampir tidak muncul, tetapi masalah lain justru timbul ke arah sebaliknya
Contoh: permintaan gambar “senator Amerika pada 1800-an” → menghasilkan gambar perempuan kulit hitam, pria keturunan Asia, dan perempuan pribumi
- Pria kulit putih sama sekali tidak dihasilkan
Contoh yang lebih mengejutkan: tentara Nazi Jerman dibuat sebagai orang berkulit berwarna
Atas hal ini, anggota Partai Republik AS dan Elon Musk mengecam keras “woke AI” milik Google
- Musk menyebut nama anggota tim terkait secara terbuka dan mengarahkannya menjadi sasaran serangan, sehingga karyawan tersebut menutup akun media sosial dan khawatir akan ancaman keselamatan
Google menghentikan total fitur pembuatan gambar manusia, dan saham Alphabet kembali turun
Tak lama setelah kontroversi itu, puluhan eksekutif Google memulai percakapan darurat
- Para wakil presiden dan direktur terbang ke London untuk bertemu langsung dengan Hassabis
Hasilnya:
- Tim Hassabis (model Gemini) dan tim Hsiao (aplikasi Gemini) sama-sama mendapat persetujuan untuk merekrut pakar keandalan dan keselamatan
- Dibuka total 15 posisi baru terkait ‘Trust & Safety’
Di kantor pusat Gradient Canopy, Sissie Hsiao memberi timnya cukup waktu untuk menyelesaikan masalah generator gambar
Bersama James Manica, ia juga menyusun ulang prinsip publik untuk Gemini
Prinsip-prinsip ini semuanya ditulis dengan ungkapan yang berpusat pada pengguna (“you”):
- Gemini “mengikuti instruksi Anda”
- “menyesuaikan diri dengan kebutuhan Anda”
- “melindungi pengalaman Anda”
Salah satu penekanan utamanya:
- “Respons Gemini mungkin tidak mencerminkan posisi atau keyakinan Google”
- “Hasil Gemini sebagian besar didasarkan pada apa yang Anda minta—Gemini adalah sesuatu yang Anda ciptakan”
Ini menjadi perangkat logis yang dapat meminimalkan tanggung jawab Google jika masalah serupa muncul di masa depan
Namun, Google tidak menjelaskan dengan jelas bagaimana perusahaan akan mempertanggungjawabkan dirinya sendiri berdasarkan prinsip-prinsip ini

Eksperimen podcast AI: Westminster Watch

Sekitar pukul 18.30 pada suatu malam di Maret 2024, sebuah eksperimen menarik diperlihatkan di Yellow Zone milik Gradient Canopy
Dua karyawan dari Google Labs memperlihatkan proyek baru kepada Josh Woodward
- Woodward adalah pimpinan Google Labs yang bertugas meluncurkan produk eksperimental Google dengan cepat
Isi proyeknya:
- Dengan memanfaatkan transkrip sidang parlemen Inggris dan Gemini yang dibekali fitur long context
- mereka membuat podcast ‘Westminster Watch’ yang dipandu oleh pembawa acara AI, Kath dan Simon
Dalam episode pertamanya, Simon membuka dengan kalimat:
- “Minggu ini juga ada drama yang padat, perdebatan, dan bahkan sedikit sejarah di House”
Woodward sangat terkesan dengan eksperimen itu, lalu membagikannya langsung kepada tokoh-tokoh penting termasuk Pichai

Ringkasan audio AI, inovasi pencarian, dan kontroversi lainnya

Fitur NotebookLM Audio Overviews, yang memungkinkan AI merangkum dokumen atau notulen rapat dalam format podcast,
resmi diperkenalkan pada Google I/O Mei 2024
Menurut Josh Woodward, tim inti menguji ribuan podcast AI siang dan malam selama pengembangan
Namun, di lokasi pengumuman, dua presentasi lain justru lebih banyak menyita perhatian:
- Astra: asisten AI generasi berikutnya yang mampu menganalisis video secara real-time (didemonstrasikan langsung oleh Brin)
- AI Overviews: fitur yang merangkum hasil pencarian dan menampilkannya di bagian atas halaman
AI Overviews, yang dikembangkan tim Project Magi, merangkum hasil pencarian dan menampilkannya dalam kotak ringkasan (Box)
Tim inovasi bertanggung jawab awalnya meminta pengawasan karena khawatir terhadap masalah bias, akurasi, dan dampak etis akibat penurunan traffic
- Namun, proyek ini menjadi sulit diawasi secara sistematis karena restrukturisasi tim dan pekerjaan yang tersebar
Setelah dirilis, muncul banyak contoh respons aneh:
- “Berapa batu yang harus saya makan per hari?” → “Menurut ahli geologi UC Berkeley, disarankan mengonsumsi 1 batu kecil per hari”
- “Keju tidak menempel di pizza” → “Tambahkan 1/8 cangkir lem non-toksik ke saus”
Respons-respons ini sebagian besar berasal dari meme internet seperti postingan lelucon di Reddit, tetapi
AI Overviews menyajikannya seolah fakta, sehingga memunculkan masalah kredibilitas
Google sementara mengurangi penayangan fitur tersebut dan melakukan penyesuaian ulang
Reaksi internal Google dan umpan balik pengguna
- Kepala ilmuwan Search Pandu Nayak:
  - “Kita tidak bisa mencegah semua masalah sebelumnya. Yang bisa kami janjikan hanyalah perbaikan berkelanjutan”
  - “Kalau berjalan baik, orang-orang diam saja; kalau aneh, mereka hanya mengeluh”
- Di internal, karyawan yang sebelumnya menyuarakan kekhawatiran soal akurasi merasa kecewa
  - Dari Bard→Gemini, generator gambar, hingga AI Overviews, semua dinilai sebagai “rentetan mesin penghasil halusinasi”
  - Muncul juga kekhawatiran bahwa misi Google untuk meningkatkan akses informasi sedang merosot menjadi “alat dikte omong kosong”
- Sebaliknya, tim Search berfokus pada kepuasan pengguna
  - AI Overviews tetap dipertahankan penuh tanpa opsi untuk mematikannya
  - Setelah itu, fitur ringkasan AI juga diterapkan ke Google Maps, aplikasi cuaca, dan lainnya
- Contoh di aplikasi cuaca untuk Pixel:
  - Meski beberapa engineer berpendapat grafik lama sudah cukup, hasil pengujian menunjukkan 90% memberi umpan balik “suka”
Tanda-tanda pemulihan dan talenta yang kembali
- Pada Desember 2024, dua tahun setelah dampak ChatGPT, Jeff Dean memberi wawancara kepada WIRED dengan suasana yang positif
  - Model Gemini berhasil meraih peringkat 1 di benchmark publik
  - Seorang eksekutif mengatakan bahwa ia berbicara dengan Gemini Live saat pergi dan pulang kerja, menggantikan percakapan dengan saudara perempuannya
- CEO NVIDIA Jensen Huang sangat merekomendasikan NotebookLM Audio Overviews
- Talenta-talenta yang dulu pergi karena tidak puas dengan budaya perusahaan yang terlalu hati-hati juga kembali
  - Noam Shazeer, salah satu pencipta Transformer, juga bergabung kembali
    - Dulu ia keluar karena kecewa pada kebijakan perusahaan yang tidak merilis LaMDA ke publik

Masa depan Gemini, tantangan, dan berlanjutnya perang AI

Suasana internal Google dan kepercayaan diri untuk tumbuh
- Dalam wawancara, Jeff Dean mengakui kesalahan penilaian di masa lalu dan menilai bahwa Google kini sedang melangkah lebih jauh, lepas dari sikap menghindari risiko
- Saat ini, tujuh layanan utama Google (Chrome, Gmail, YouTube, dll.) semuanya sedang mengadopsi fitur berbasis Gemini
- Dean, Noam Shazeer, dan pemimpin lain sedang menyelaraskan kebutuhan di seluruh perusahaan:
  - peningkatan terjemahan bahasa Jepang
  - penguatan kemampuan coding
  - peningkatan analisis video real-time untuk Astra dan lain-lain
- Dean dan Shazeer sering bertemu di microkitchen Gradient Canopy untuk berbagi ide
Perluasan strategi dengan fokus pada pembuatan konten AI
- Shazeer: “Mengorganisasi informasi adalah pasar 1 triliun dolar, tetapi hal yang keren sekarang adalah 1 kuadriliun dolar”
- Saham Alphabet telah naik hampir 2 kali lipat dibanding titik terendah saat debut ChatGPT
- Hassabis kini juga memimpin tim aplikasi Gemini milik Xiao, dan yakin bahwa masa depan ketika AI menyembuhkan penyakit tidak lagi jauh
  - Ia mengatakan kepada WIRED, “Kami memiliki fondasi riset yang paling luas dan dalam dibanding organisasi mana pun”
Masalah profitabilitas dan kembalinya model iklan
- Saat ini, sebagian besar pengguna tidak berniat membayar langsung untuk fitur AI
- Google sedang mempertimbangkan cara menyisipkan iklan ke dalam aplikasi Gemini
- Ini adalah strategi tradisional Silicon Valley:
  - “Berikan data, waktu, dan perhatian Anda, lalu gunakan gratis alat keren yang kami buat”
  - Selama Anda hanya mencentang persetujuan disclaimer, Google tidak bertanggung jawab
Persaingan pasar dan beban infrastruktur
- Data Sensor Tower:
  - Total unduhan aplikasi ChatGPT: sekitar 600 juta
  - Aplikasi Gemini: sekitar 140 juta
- Ada banyak pesaing AI:
  - Claude, Copilot, Grok, DeepSeek, Llama, Perplexity dan lain-lain
  - Banyak di antaranya adalah pesaing langsung Google atau target investasinya
- AI generatif membutuhkan investasi miliaran dolar dan konsumsi energi yang sangat besar
  - Sampai-sampai perlu memperpanjang umur pembangkit listrik batu bara lama atau reaktor nuklir
  - Seluruh industri masih belum menemukan cara monetisasi yang jelas
Risiko tambahan yang dihadapi Google
- Dalam beberapa tahun ke depan, hingga 25% pendapatan iklan pencarian berpotensi hilang akibat gugatan antimonopoli (analisis JP Morgan)
- Di internal pun kesadaran akan tekanan untuk menutup kebutuhan finansial makin tinggi
  - Sebagian anggota tim Xiao bekerja tanpa libur musim dingin selama tiga tahun berturut-turut
  - Salah satu pendiri, Brin, baru-baru ini mengatakan kepada karyawan bahwa “bekerja 60 jam per minggu adalah sweet spot paling efektif dalam persaingan AI”
- Karyawan yang diwawancarai WIRED: kecemasan terhadap PHK berkelanjutan, burnout, dan risiko hukum sangat dalam
Obsesi menuju AGI dan tantangan filosofis
- Hassabis masih teguh pada tujuan mengembangkan AGI (kecerdasan umum buatan)
  - Sambil membawa prototipe Astra dan berjalan di London, ia membayangkan masa depan yang mampu mengenali segala hal di dunia
- Namun AGI baru mungkin terwujud jika penalaran, perencanaan, dan kemampuan eksekusi semuanya meningkat
Persaingan 'AI agen' dengan OpenAI
- Pada Januari 2025, OpenAI meluncurkan layanan Operator
  - AI tipe agen yang mengklik dan mengetik di situs web nyata untuk menjalankan tugas atas nama pengguna
  - Dapat melakukan hal seperti memesan perjalanan dan mengisi formulir, tetapi lambat dan sering salah
  - Paket harga: US$200 per bulan
- Google juga memperluas fitur ke arah yang sama:
  - Saat ini Gemini bisa menyusun rencana makan, tetapi versi berikutnya ditargetkan bisa memasukkan bahan makanan ke keranjang belanja,
    dan tahap setelahnya bahkan memberi umpan balik real-time saat memotong bawang
Kesalahan akan terulang, tetapi laju tidak akan berhenti
- Pada Januari 2025, dalam iklan Super Bowl, Gemini membuat kesalahan konyol-miris dengan menjawab “lebih dari separuh konsumsi keju dunia adalah Gouda”
- Namun Google sedang mengembangkan Gemini bukan sekadar sebagai mesin informasi, melainkan bagian dari hidup, pelatih kehidupan, dan asisten serbabisa
- Pichai mengatakan: “Kami melangkah dengan hati-hati”
- Namun ia dan para eksekutifnya, begitu sudah mencapai puncak, tidak akan pernah ingin tertinggal lagi
Persaingan AI terus berlanjut

4 komentar

joone 2025-05-24

Lalu, bagaimana cerita seperti ini bisa dijadikan artikel? Rasanya seperti tulisan promosi untuk Google.
"Kami sedang bekerja keras"...

halfenif 2025-03-28

Rasanya seperti sedang menonton serial TV Amerika.

Tapi, Apple ke mana ya?

ide127 2025-03-28

Rasanya seperti masa ketika kita terkena Sputnik Shock.

GN⁺ 2025-03-28

Opini Hacker News

Awalnya saya skeptis, tetapi saya pikir Google bekerja dengan baik dalam persaingannya melawan OpenAI. Model Gemini 2.0 Pro dan Flash sangat bagus. Fitur riset mendalam diimplementasikan dengan baik. Context window masih yang terbaik di industri. Integrasinya dengan Search, Gmail, rangkaian Google Office, Google Meet, Android, dan lainnya sangat kuat
- Kini mereka memiliki model yang sudah cukup baik, sehingga tertanam dalam portofolio produk yang ada, infrastruktur cloud, dan kehidupan kerja modern
- Tidak seperti Apple, mereka memiliki lebih sedikit batasan dalam mengakses data pelatihan berkat kebijakan privasi yang kurang ketat
Masalah terbesar yang dihadapi Google adalah dorongan untuk menghadirkan model ringan bagi semua orang. Model yang digunakan di Search kemungkinan berada di level sekitar 8B, dan Flash 2.0 lumayan, tetapi tetap merupakan model ringan
- Orang-orang sekarang mulai mengaitkan Google AI/Gemini dengan hasil pencarian yang buruk dan jawaban yang jelek
- Di sisi lain, model terdepan mereka sangat kuat, dan Gemini 2.5 mungkin telah merebut takhta AI
OpenAI bukan perusahaan publik dan tidak menghasilkan laba. Google menghasilkan laba. Meski begitu, seperti halnya Google Meet/Zoom, kegagalan memproduksikan Transformer decoder adalah sebuah kesalahan. (Encoder seperti BERT digunakan secara luas)
Kepemimpinan Google mengambil pendekatan yang hati-hati, dan peluncuran produknya terlihat lebih matang. Terasa seperti transformasi memikat dari 0 ke 1 ala Apple di era 2000-an
Masalah utama Google adalah ada banyak kelompok yang membuat produk yang sama dan saling bersaing untuk merebut perhatian pengguna
- Ada berbagai produk seperti Google AI Studio, aplikasi Gemini, aplikasi Gemini untuk pengguna Gemini Advanced, Vertex AI, NotebookLM, dan lainnya
- Ini dibandingkan dengan ChatGPT.com
- Search Google. Search. Cukup tampilkan hasil pencarian di kolom kanan seperti sekarang bersama iklan, lalu tempatkan Gemini di kiri, sesederhana itu
Sebagai investor kecil: saya pikir Alphabet/Google bisa berkinerja lebih baik dengan CEO selain Sundar
- Juga: layak mempertimbangkan berinvestasi pada perusahaan yang menjalankan layanan berbasis langganan (misalnya Youtube Premium, dulu Netflix)
Masalah Google adalah orang-orang yang tidak akrab dengan teknologi mulai melihat AI sebagai sesuatu yang berbeda dari Google (Search) dan produk lainnya
- Mereka mencoba menggunakan AI (misalnya ChatGPT) alih-alih Search, dan Google sedang kalah dalam perang persepsi ini. Ini bukan masalah yang bisa diselesaikan dengan cepat
- Bagi publik umum, apa yang dilakukan Google di bidang AI dulu adalah Bard (ada yang masih ingat?), dan sekarang berubah menjadi Gemini
- Apa pembeda yang sebenarnya? Apakah Google menawarkan lebih banyak layanan gratis daripada pesaingnya? Orang biasa tidak peduli apakah model itu bisa menyelesaikan soal matematika
- Selama orang menganggap AI dan Search sebagai dua hal yang terpisah, Google akan menghadapi masalah
Apakah pernah bertemu Googler yang percaya diri dengan strategi AI Google? Orang-orang yang saya ajak bicara tampaknya semuanya punya kekhawatiran serius, tetapi ini mungkin hanya sampel kecil
Sepertinya Eric Schmidt pernah berkata sekitar 10 tahun lalu bahwa "semua orang akan membutuhkan asisten" (mungkin sekitar 2016). Saya tidak tahu mengapa mereka tidak melakukannya, padahal mereka bisa saja mewujudkan sesuatu seperti percakapan. Sebaliknya, mereka malah sibuk dengan hal-hal terkait mailbox dan semacamnya

Revolusi AI Google: Perjuangan 2 Tahun untuk Menyusul OpenAI

Awal krisis Google yang tertinggal dalam revolusi chatbot

Respons Google terhadap krisis AI dan perubahan strategi

Pengembangan Bard: prioritas tingkat perusahaan dan pemusatan sumber daya

Proses peluncuran Bard dan kesalahan fatal

Kemunculan GPT-4 dan kesenjangan teknologi

Pengembangan Gemini: integrasi DeepMind dan Google Brain serta benturan budaya

Peluncuran Google DeepMind(GDM)

Pemeriksaan terakhir sebelum peluncuran Gemini dan pertimbangan etis

Pengungkapan Gemini dan keberhasilan awal

Stabilitas setelah transisi Gemini dan krisis baru

Eksperimen podcast AI: Westminster Watch

Ringkasan audio AI, inovasi pencarian, dan kontroversi lainnya

Reaksi internal Google dan umpan balik pengguna

Tanda-tanda pemulihan dan talenta yang kembali

Masa depan Gemini, tantangan, dan berlanjutnya perang AI

Suasana internal Google dan kepercayaan diri untuk tumbuh

Perluasan strategi dengan fokus pada pembuatan konten AI

Masalah profitabilitas dan kembalinya model iklan

Persaingan pasar dan beban infrastruktur

Risiko tambahan yang dihadapi Google

Obsesi menuju AGI dan tantangan filosofis

Persaingan 'AI agen' dengan OpenAI

Kesalahan akan terulang, tetapi laju tidak akan berhenti

Bacaan terkait

4 komentar

Opini Hacker News