Awal krisis Google yang tertinggal dalam revolusi chatbot
- Pada Desember 2022, Sissie Hsiao diberi misi untuk mengembangkan produk pesaing ChatGPT milik Google dalam 100 hari
- Hsiao adalah veteran yang telah bekerja lebih dari 16 tahun dan memimpin ribuan orang, tetapi ia belum pernah menghadapi situasi krisis separah ini
- Setelah OpenAI merilis ChatGPT, jumlah pengguna dengan cepat melampaui 1 juta orang meskipun ada kesalahan fakta dan kekeliruan matematika
- Sebagian orang mulai menganggap ChatGPT sebagai pengganti Google Search, dan ini menjadi ancaman bagi sumber pendapatan terbesar Google
- Google memiliki model bahasanya sendiri, LaMDA, tetapi akses publik sangat dibatasi, dan bahkan demo yang ditampilkan hanya sebatas “cerita anak anjing”
- Wall Street (pasar keuangan) merasa cemas; sebelumnya CEO Sundar Pichai telah menyatakan era “AI-first” dan mengatakan bahwa asisten cerdas akan menggantikan perangkat, tetapi kenyataannya tidak memenuhi harapan
- Arsitektur Transformer juga diciptakan oleh delapan peneliti Google, tetapi mereka kemudian keluar dari perusahaan atau pergi tanpa hasil berarti
- Google Assistant yang dikelola Hsiao hanya dipakai untuk hal-hal seperti menyetel timer atau memutar musik
- Yang ada hanyalah chatbot belum rampung yang menyediakan saran memasak dan kuis sejarah untuk generasi Gen Z
- Hingga akhir 2022, harga saham Alphabet turun 39% dibanding tahun sebelumnya, dan posisi Google sebagai pemimpin AI mulai goyah
Respons Google terhadap krisis AI dan perubahan strategi
- Pada awal 2023, dewan direksi Google menuntut laporan real-time terkait AI
- Salah satu pendiri sekaligus pemegang saham utama, Sergey Brin, juga ikut langsung dalam tinjauan strategi
- Kepada karyawan disampaikan pesan untuk “bergerak seperti startup”
- Sebelumnya, budaya di perusahaan adalah banyak karyawan boleh menentang sebuah produk, tetapi tidak memiliki wewenang untuk menyetujuinya
- Kini Google sedang beralih ke budaya yang mengambil risiko lebih besar dan mengeksekusi lebih cepat
- Saat memulai proyek 100 hari itu, Sissie Hsiao memberikan prinsip unik kepada tim:
“Quality over speed, but fast”
- Eksekutif senior lain, James Manyika, berperan dalam mengubah strategi AI secara mendasar
- Ia adalah doktor robotika lulusan Oxford dan mantan penasihat McKinsey, lalu bergabung dengan Google pada 2022
- Ia mengusulkan kepada Pichai penggabungan DeepMind dan Google Brain
- DeepMind (London, dipimpin Demis Hassabis) dan Google Brain (Mountain View, di bawah Jeff Dean) berjalan terpisah dan menghabiskan sumber daya secara tidak efisien
- Setelah peluncuran produk OpenAI, tiga pemimpin mengajukan rencana integrasi kepada dewan
- Hassabis mengusulkan nama proyek ‘Titan’, tetapi ditolak, dan nama usulan Jeff Dean, ‘Gemini’, akhirnya dipilih
- Manyika kemudian menyebut bahwa Google telah membuat pilihan-pilihan yang berani dan bertanggung jawab
- Namun ia juga mengakui bahwa “kami tidak selalu membuat pilihan yang tepat”
- Di tengah situasi mendesak, keresahan bahkan menyebar di kalangan karyawan bahwa “Google bisa menjadi seperti Yahoo”
- Hsiao menggambarkan masa itu sebagai “seperti sprint penuh di dalam maraton”
- Namun kini, dua tahun kemudian, saham Alphabet mencetak rekor tertinggi sepanjang masa
- Investor menunjukkan pandangan optimistis terhadap pemulihan daya saing AI Google
- WIRED menilai periode ini sebagai masa paling kacau dan penuh perubahan budaya dalam sejarah Google
- Mereka mewawancarai lebih dari 50 karyawan lama dan sekarang, termasuk engineer, pemasaran, hukum, dan pakar keselamatan
- Artikel ini untuk pertama kalinya menyoroti secara rinci perubahan di Google melalui kesaksian para eksekutif senior
Pengembangan Bard: prioritas tingkat perusahaan dan pemusatan sumber daya
- Untuk merespons ChatGPT, Google memulai proyek chatbot baru dengan nama sandi Bard
- Sissie Hsiao secara langsung menarik sekitar 100 talenta dari seluruh Google
- Para manajer tidak bisa menolak, dan proyek Bard menjadi prioritas tertinggi
- Hsiao memilih orang-orang yang punya kemampuan teknis, kecerdasan emosional, dan mampu melihat gambaran besar
- Sebagian besar ditempatkan di Mountain View, California, dan bekerja secara fleksibel tanpa terpaku pada peran formal
- Ia menekankan filosofi bahwa “Team Bard adalah tim yang mengambil semua peran”
- Pada Januari 2023, Google mengumumkan PHK besar-besaran pertama dalam sejarahnya: sekitar 12.000 orang, setara 7% dari total karyawan
- Sebagian karyawan dihantui ketakutan bisa dipecat jika tidak lembur atau mengambil pekerjaan tambahan
- Banyak juga yang sampai mengorbankan waktu menidurkan anak demi menghadiri rapat malam
- Bard dibangun berbasis LaMDA yang sudah ada, tetapi membutuhkan pembaruan pengetahuan dan pengaman baru
- Tim infrastruktur memindahkan teknisi terbaik untuk fokus pada pengamanan server dan penyetelan sistem
- Pusat data hampir mencapai batas penggunaan daya, sehingga muncul risiko peralatan mengalami panas berlebih
- Karena itu, alat manajemen baru untuk menangani kebutuhan daya dengan lebih aman juga segera dikembangkan
- Untuk meredakan ketegangan, humor pun muncul
- Seorang anggota tim membuat chip poker kustom, menuliskan nama chip tertentu di atasnya lalu menumpuknya di meja engineer sambil bercanda, “Silakan ambil chip-nya”
- Selama beberapa minggu awal, Bard mengulangi masalah-masalah lama meski sumber daya komputasi telah diperkuat
- Seperti ChatGPT, Bard juga sering menghasilkan halusinasi (hallucination) serta respons yang tidak pantas atau ofensif
- Pada versi awal, sering muncul stereotip rasial yang sangat konyol
- Jika memasukkan nama bernuansa India, sebagian besar digambarkan sebagai “aktor Bollywood”, sementara nama pria Tionghoa digambarkan sebagai “ilmuwan komputer”
- Menurut mantan karyawan, respons Bard “tidak berbahaya, tetapi bodoh saja”
- Beberapa karyawan bahkan membagikan tangkapan layar respons aneh Bard dan menjadikannya bahan tertawaan
- Contoh: saat diminta membuat “rap bergaya Three 6 Mafia tentang membuang baterai mobil ke laut”, Bard sampai menghasilkan isi tentang mengikat orang ke baterai lalu menenggelamkannya ke laut
- Selain memperbaiki sebanyak mungkin bug dalam 100 hari yang ditentukan, Google nyaris tidak punya pilihan lain
- Bahkan tenaga kontrak eksternal yang menangani deteksi gambar pelecehan anak juga dikerahkan untuk menguji Bard
- Pichai meminta semua karyawan yang punya waktu luang untuk menguji Bard, dan hasilnya sekitar 80.000 orang ikut serta
- Hsiao dan jajaran manajemen menyadari bahwa mereka tidak bisa sepenuhnya mencegah kesalahan Bard, lalu membingkai produknya sebagai ‘Experiment’
- Ini mirip dengan strategi OpenAI saat memperkenalkan ChatGPT sebagai “research preview”
- Dengan menekankan kepada pengguna dan evaluator eksternal bahwa produk ini belum merupakan versi final, mereka mencoba meminimalkan risiko kerusakan merek
- Strategi semacam ini telah dikenal luas di industri sebagai cara menghindari risiko sejak kasus chatbot Twitter buatan Microsoft, Tay, melontarkan pernyataan Nazi
Proses peluncuran Bard dan kesalahan fatal
- Di masa lalu, sebelum merilis produk AI, 'tim inovasi bertanggung jawab' di Google meninjau bias dan cacat selama berbulan-bulan
- Untuk Bard, karena tekanan jadwal, proses peninjauan dipangkas besar-besaran
- Chief Legal Officer Kent Walker mendorong peluncuran yang cepat
- Model dan fitur baru muncul terlalu cepat sehingga tim review tidak mampu mengimbangi meski lembur dan bekerja di akhir pekan
- Ada peringatan yang meminta penundaan peluncuran Bard, tetapi diabaikan atau dilemahkan
- Terkait hal ini, Google mengatakan kepada WIRED bahwa “tidak ada tim mana pun yang secara resmi merekomendasikan penolakan peluncuran”
- Google menjelaskan bahwa banyak tim ikut serta dalam pengujian, dan tidak ada struktur di mana satu tim tertentu memikul tanggung jawab penuh
- Pada sekitar dua pertiga perjalanan proyek 100 hari, pada Februari 2023, Google memperoleh informasi bahwa ChatGPT akan diintegrasikan ke pencarian Bing
- Pangsa pasar pencarian masih sangat didominasi Google, tetapi ketiadaan fitur AI generatif merupakan ancaman jangka panjang
- Untuk menghindari penurunan harga saham, sehari sebelum pengumuman Microsoft pada 6 Februari, Pichai secara mendadak mengumumkan pembukaan uji coba terbatas Bard
- Dalam video pemasaran, Bard digambarkan sebagai asisten AI yang mewarisi misi Google untuk “mengorganisasi informasi”
- Pertanyaan dalam video: “Dari penemuan baru Teleskop Luar Angkasa James Webb, mana yang bisa dijelaskan kepada anak 9 tahun?”
- Jawaban Bard: “JWST mengambil foto pertama planet di luar tata surya”
- Tak lama kemudian, Reuters melaporkan kesalahan faktual: foto tersebut diambil bukan oleh teleskop luar angkasa, melainkan teleskop darat (VLT)
- Saham Alphabet turun 9%, kapitalisasi pasar menyusut sekitar $100 miliar
- Tim internal terguncang
- Staf pemasaran yang membuat pertanyaan itu menyalahkan dirinya sendiri, dan rekan-rekannya menghibur dengan mengatakan, “tim legal dan tim PR sama-sama sudah meninjau, tetapi tidak ada yang melihat kesalahan itu”
- Karena ChatGPT juga sering membuat kesalahan, mereka tidak memperkirakan kesalahpahaman kecil seperti ini akan berdampak besar pada harga saham
- Xiao menyebutnya sebagai “kesalahan naif”
- Bard menyusun jawaban berdasarkan hasil pencarian Google, dan mungkin salah menafsirkan ungkapan “foto pertama” dalam blog NASA
- Pimpinan menegaskan, “tidak ada yang akan dipecat karena kejadian ini. Tetapi kita harus cepat belajar dari pelajaran ini”
- Xiao: “Kita bukan startup, kita Google. Ini tidak bisa dianggap sekadar cacat teknis. Kita harus merespons dengan bertanggung jawab”
- Ketidakpuasan dari luar tim Bard makin meningkat
- Di forum internal Memegen, muncul posting kritik bahwa “peluncuran Bard dan PHK dilakukan tergesa-gesa, berantakan, dan berpandangan pendek”
- Gambar logo Google yang terbakar di tempat sampah juga dibagikan
- Namun, Google menyalurkan lebih banyak sumber daya ke Bard
- Ratusan orang tambahan ditempatkan, dan di dokumen tim ikon foto profil Pichai muncul setiap hari, menandakan keterlibatan langsungnya
Kemunculan GPT-4 dan kesenjangan teknologi
- Pada pertengahan Maret 2023, peluncuran GPT-4 oleh OpenAI kembali mengguncang internal Google
- Seorang peneliti senior berkata: “Saya benar-benar tercengang, dan merasa sangat mendesak bahwa Google harus bergerak lebih cepat”
- Seminggu kemudian, Bard resmi diluncurkan di Amerika Serikat dan Inggris
- Pengguna menilai Bard berguna untuk menulis email, membuat draf laporan, dan sebagainya
- Namun, ChatGPT juga melakukan hal yang sama dengan lebih baik, sehingga insentif untuk berpindah bagi pengguna lemah
- Pichai di podcast Hard Fork menyindir diri sendiri dengan mengatakan Google “menurunkan Civic yang sudah di-tuning untuk melawan mobil sport yang bertenaga”
- Kesimpulannya: “Kita butuh mesin yang lebih baik”
Pengembangan Gemini: integrasi DeepMind dan Google Brain serta benturan budaya
- Perbedaan dua organisasi riset AI
- DeepMind diklasifikasikan sebagai 'Other Bets' milik Alphabet, dan berfokus pada pemecahan masalah ilmiah dan matematika jangka panjang
- Google Brain terutama mengembangkan teknologi AI yang praktis secara komersial, seperti autocomplete Gmail dan penanganan kueri pencarian ambigu
- Menurut seorang mantan insinyur senior:
- Google Brain berpusat pada otonomi, dan Jeff Dean memiliki gaya “membiarkan orang mengerjakan sendiri”
- Sebaliknya, DeepMind bergerak seperti militer yang sangat terkoordinasi, dan Demis Hassabis menjalankan “organisasi berdaya guna tinggi di bawah satu komandan”
- Dean adalah veteran riset jaringan saraf, aktif sejak masa awal berdirinya Google
- Hassabis adalah pemimpin yang berorientasi visi, memimpikan penyembuhan penyakit melalui AI dan sedang membayangkan “agen AI yang bisa melihat, mendengar, dan membantu”
-
Peluncuran Google DeepMind(GDM)
- Pada April 2023, Google menggabungkan dua organisasi tersebut dan meluncurkan Google DeepMind(GDM)
- Hassabis ditunjuk sebagai CEO organisasi hasil merger
- Suasana internal: “tujuan kembali hidup”, “main-main sudah selesai”
- Untuk membangun model Gemini dengan cepat, diperlukan kolaborasi lintas 8 zona waktu
- Ratusan ruang chat dibuat, dan budaya kerja semalaman pun mengakar
- Hassabis: “Setiap hari terasa seperti seumur hidup”
- GDM pindah ke gedung aman bernama Gradient Canopy di Mountain View
- Struktur berbentuk kubah, dikelilingi instalasi seni
- Kantor CEO Pichai berada di lantai yang sama
- Sergey Brin (salah satu pendiri Google) sering datang memberi semangat
- Ada tuntutan untuk lebih sering masuk kantor, dan karyawan Google biasa tidak bisa masuk ke gedung ini
- Kode inti GDM juga tidak dapat diakses organisasi lain
- Saat proyek Gemini menyerap sumber daya Google, para peneliti di bidang lain seperti kesehatan dan perubahan iklim mengalami kekurangan server
- Pembatasan publikasi paper juga muncul, memicu ketidakpuasan karena paper merupakan aset karier utama para peneliti
- Google memperketat pembatasan karena khawatir informasi bocor ke OpenAI
- resep pelatihan Gemini adalah aset inti bagi kelangsungan hidup perusahaan
- Gemini juga menghadapi masalah yang mirip dengan Bard
- Wakil presiden machine learning dan cloud AI Google, Amin Vahdat:
- “Saat Anda memperbesar skala 10 kali lipat, semuanya rusak”
- Menjelang peluncuran, Vahdat membentuk war room khusus, berfokus pada penyelesaian bug dan error sistem
Pemeriksaan terakhir sebelum peluncuran Gemini dan pertimbangan etis
- Tim pengembangan bertanggung jawab Google DeepMind(GDM) mengerahkan seluruh upaya untuk review produk menjelang peluncuran Gemini
- Modelnya kuat, tetapi masih ada kasus menghasilkan respons yang aneh atau tidak pantas
- Menurut laporan yang dipublikasikan:
- Perlu banyak perbaikan terutama pada saran medis dan respons terkait perundungan
- Saat menerima input gambar, muncul masalah berupa inferensi tanpa dasar untuk pertanyaan seperti “Apa tingkat pendidikan orang ini?”
- Direktur inovasi bertanggung jawab Dawn Bloxwich menilai ini “tidak sampai pada tingkat yang harus menghentikan peluncuran”
- Namun, waktu untuk memprediksi cara penggunaan publik yang kreatif (atau aneh) masih kurang
- Pada titik ini Google sebenarnya bisa memperlambat laju, tetapi tidak melakukannya
- OpenAI telah menjadi ‘Kleenex-nya AI’ dan sedang mendapat sorotan global
- ChatGPT menjadi simbol harapan teknologi sekaligus masalah sosial
- Para pekerja merasa pekerjaan mereka terancam, dan para kreator menuntut kompensasi atas eksploitasi data
- Para orang tua mulai menyadari bahwa chatbot dapat menyampaikan konten yang tidak pantas kepada anak-anak mereka
- Di kalangan peneliti AI, muncul diskusi tentang “p(doom)”—probabilitas bahwa teknologi akan mengancam umat manusia
- Ilmuwan AI legendaris Google Geoffrey Hinton mundur pada Mei 2023 karena kekhawatiran etis
- Ia memperingatkan bahwa AI dapat mengancam umat manusia melalui disinformasi dan racun yang canggih
- Hassabis juga merasa membutuhkan lebih banyak waktu, tetapi ia tetap melangkah menuju impiannya tentang asisten AI serbaguna dan penyembuhan penyakit
Pengungkapan Gemini dan keberhasilan awal
- Desember 2023, Google secara resmi meluncurkan Gemini
- Harga saham naik setelah peluncuran
- Mengungguli ChatGPT dalam 30 dari 32 pengujian standar
- Analisis makalah dan video YouTube, memperkuat kemampuan menjawab pertanyaan matematika dan hukum
- Hassabis mengadakan pesta perayaan kecil di kantor London
- Ia mengenang, “Saya bukan orang yang pandai merayakan. Saya selalu memikirkan hal berikutnya”
- Pada bulan yang sama, Jeff Dean diundang ke ruang obrolan baru bernama 'Goldfish' dan mengetahui kemajuan teknologi berikutnya
- Namanya memang bercanda, tetapi isinya justru kebalikannya: pengembangan versi Gemini dengan memori panjang
- Melalui pemrosesan terdistribusi pada jaringan chip berkecepatan tinggi, sistem ini bisa menganalisis ribuan halaman teks atau bahkan seluruh serial TV
- Teknologi ini disebut “long context”
- Dean, Hassabis, dan Manica mencari cara untuk mengintegrasikan ini ke lini produk AI Google
- Fitur yang paling pertama diinginkan Manica: fitur yang secara otomatis merangkum PDF dalam format podcast
- Ia mengatakan kepada WIRED, “Sulit mengikuti semua makalah yang membanjiri arXiv setiap minggu”
Stabilitas setelah transisi Gemini dan krisis baru
- Setahun setelah code red, suasana di Google berbalik pulih
- Investor menjadi lebih tenang, dan Bard serta LaMDA disatukan di bawah satu merek, “Gemini”
- Tim Sissie Hsiao memperkecil jarak dengan OpenAI lewat pengembangan fitur pembuatan teks-ke-gambar
- Fitur baru bernama Gemini Live juga sedang dipersiapkan
- Fitur ini memungkinkan pengguna menjalin percakapan panjang layaknya dengan teman atau konselor
- Berkat model Gemini yang semakin kuat, para eksekutif kembali percaya diri
- Meski suasana mulai stabil, CEO Pichai memerintahkan restrukturisasi tambahan
- Pendapatan iklan naik, tetapi tidak memenuhi ekspektasi Wall Street
- Bahkan para penanggung jawab privasi dan kepatuhan ikut disingkirkan
- Kepergian petinggi yang bertugas melindungi pengguna ini ditafsirkan sebagai pesan: “Kekhawatiran boleh disampaikan, tetapi jangan menghambat laju”
- Generator gambar itu sendiri relatif mudah dibangun, tetapi proses peninjauannya menjadi kerja repetitif yang berat
- Tim harus menulis prompt penyaringan agar respons bermasalah tidak muncul
- Karena tidak semua karyawan dapat mengakses pengujian, beban berlebihan terkonsentrasi pada segelintir orang
- Contoh: pada prompt “rapist”, gambar orang berkulit gelap lebih sering dihasilkan → memicu kekhawatiran bias rasial
- Karena itu, sempat ada permintaan internal agar gambar manusia tidak dibuat sama sekali, tetapi diabaikan
- Seorang mantan peninjau mengenang bahwa “suasananya adalah apa pun yang terjadi, produk harus diluncurkan”
- Sebagian peninjau mengundurkan diri karena kekhawatiran mereka tidak ditanggapi
- Pada Februari 2024, generator gambar itu resmi diluncurkan di dalam aplikasi Gemini
- Masalah gambar rasis dan seksis yang diperkirakan sebelumnya hampir tidak muncul, tetapi masalah lain justru timbul ke arah sebaliknya
- Contoh: permintaan gambar “senator Amerika pada 1800-an” → menghasilkan gambar perempuan kulit hitam, pria keturunan Asia, dan perempuan pribumi
- Pria kulit putih sama sekali tidak dihasilkan
- Contoh yang lebih mengejutkan: tentara Nazi Jerman dibuat sebagai orang berkulit berwarna
- Atas hal ini, anggota Partai Republik AS dan Elon Musk mengecam keras “woke AI” milik Google
- Musk menyebut nama anggota tim terkait secara terbuka dan mengarahkannya menjadi sasaran serangan, sehingga karyawan tersebut menutup akun media sosial dan khawatir akan ancaman keselamatan
- Google menghentikan total fitur pembuatan gambar manusia, dan saham Alphabet kembali turun
- Tak lama setelah kontroversi itu, puluhan eksekutif Google memulai percakapan darurat
- Para wakil presiden dan direktur terbang ke London untuk bertemu langsung dengan Hassabis
- Hasilnya:
- Tim Hassabis (model Gemini) dan tim Hsiao (aplikasi Gemini) sama-sama mendapat persetujuan untuk merekrut pakar keandalan dan keselamatan
- Dibuka total 15 posisi baru terkait ‘Trust & Safety’
- Di kantor pusat Gradient Canopy, Sissie Hsiao memberi timnya cukup waktu untuk menyelesaikan masalah generator gambar
- Bersama James Manica, ia juga menyusun ulang prinsip publik untuk Gemini
- Prinsip-prinsip ini semuanya ditulis dengan ungkapan yang berpusat pada pengguna (“you”):
- Gemini “mengikuti instruksi Anda”
- “menyesuaikan diri dengan kebutuhan Anda”
- “melindungi pengalaman Anda”
- Salah satu penekanan utamanya:
- “Respons Gemini mungkin tidak mencerminkan posisi atau keyakinan Google”
- “Hasil Gemini sebagian besar didasarkan pada apa yang Anda minta—Gemini adalah sesuatu yang Anda ciptakan”
- Ini menjadi perangkat logis yang dapat meminimalkan tanggung jawab Google jika masalah serupa muncul di masa depan
- Namun, Google tidak menjelaskan dengan jelas bagaimana perusahaan akan mempertanggungjawabkan dirinya sendiri berdasarkan prinsip-prinsip ini
Eksperimen podcast AI: Westminster Watch
- Sekitar pukul 18.30 pada suatu malam di Maret 2024, sebuah eksperimen menarik diperlihatkan di Yellow Zone milik Gradient Canopy
- Dua karyawan dari Google Labs memperlihatkan proyek baru kepada Josh Woodward
- Woodward adalah pimpinan Google Labs yang bertugas meluncurkan produk eksperimental Google dengan cepat
- Isi proyeknya:
- Dengan memanfaatkan transkrip sidang parlemen Inggris dan Gemini yang dibekali fitur long context
- mereka membuat podcast ‘Westminster Watch’ yang dipandu oleh pembawa acara AI, Kath dan Simon
- Dalam episode pertamanya, Simon membuka dengan kalimat:
- “Minggu ini juga ada drama yang padat, perdebatan, dan bahkan sedikit sejarah di House”
- Woodward sangat terkesan dengan eksperimen itu, lalu membagikannya langsung kepada tokoh-tokoh penting termasuk Pichai
Ringkasan audio AI, inovasi pencarian, dan kontroversi lainnya
- Fitur NotebookLM Audio Overviews, yang memungkinkan AI merangkum dokumen atau notulen rapat dalam format podcast,
resmi diperkenalkan pada Google I/O Mei 2024
- Menurut Josh Woodward, tim inti menguji ribuan podcast AI siang dan malam selama pengembangan
- Namun, di lokasi pengumuman, dua presentasi lain justru lebih banyak menyita perhatian:
- Astra: asisten AI generasi berikutnya yang mampu menganalisis video secara real-time (didemonstrasikan langsung oleh Brin)
- AI Overviews: fitur yang merangkum hasil pencarian dan menampilkannya di bagian atas halaman
- AI Overviews, yang dikembangkan tim Project Magi, merangkum hasil pencarian dan menampilkannya dalam kotak ringkasan (Box)
- Tim inovasi bertanggung jawab awalnya meminta pengawasan karena khawatir terhadap masalah bias, akurasi, dan dampak etis akibat penurunan traffic
- Namun, proyek ini menjadi sulit diawasi secara sistematis karena restrukturisasi tim dan pekerjaan yang tersebar
- Setelah dirilis, muncul banyak contoh respons aneh:
- “Berapa batu yang harus saya makan per hari?” → “Menurut ahli geologi UC Berkeley, disarankan mengonsumsi 1 batu kecil per hari”
- “Keju tidak menempel di pizza” → “Tambahkan 1/8 cangkir lem non-toksik ke saus”
- Respons-respons ini sebagian besar berasal dari meme internet seperti postingan lelucon di Reddit, tetapi
AI Overviews menyajikannya seolah fakta, sehingga memunculkan masalah kredibilitas
- Google sementara mengurangi penayangan fitur tersebut dan melakukan penyesuaian ulang
-
Reaksi internal Google dan umpan balik pengguna
- Kepala ilmuwan Search Pandu Nayak:
- “Kita tidak bisa mencegah semua masalah sebelumnya. Yang bisa kami janjikan hanyalah perbaikan berkelanjutan”
- “Kalau berjalan baik, orang-orang diam saja; kalau aneh, mereka hanya mengeluh”
- Di internal, karyawan yang sebelumnya menyuarakan kekhawatiran soal akurasi merasa kecewa
- Dari Bard→Gemini, generator gambar, hingga AI Overviews, semua dinilai sebagai “rentetan mesin penghasil halusinasi”
- Muncul juga kekhawatiran bahwa misi Google untuk meningkatkan akses informasi sedang merosot menjadi “alat dikte omong kosong”
- Sebaliknya, tim Search berfokus pada kepuasan pengguna
- AI Overviews tetap dipertahankan penuh tanpa opsi untuk mematikannya
- Setelah itu, fitur ringkasan AI juga diterapkan ke Google Maps, aplikasi cuaca, dan lainnya
- Contoh di aplikasi cuaca untuk Pixel:
- Meski beberapa engineer berpendapat grafik lama sudah cukup, hasil pengujian menunjukkan 90% memberi umpan balik “suka”
-
Tanda-tanda pemulihan dan talenta yang kembali
- Pada Desember 2024, dua tahun setelah dampak ChatGPT, Jeff Dean memberi wawancara kepada WIRED dengan suasana yang positif
- Model Gemini berhasil meraih peringkat 1 di benchmark publik
- Seorang eksekutif mengatakan bahwa ia berbicara dengan Gemini Live saat pergi dan pulang kerja, menggantikan percakapan dengan saudara perempuannya
- CEO NVIDIA Jensen Huang sangat merekomendasikan NotebookLM Audio Overviews
- Talenta-talenta yang dulu pergi karena tidak puas dengan budaya perusahaan yang terlalu hati-hati juga kembali
- Noam Shazeer, salah satu pencipta Transformer, juga bergabung kembali
- Dulu ia keluar karena kecewa pada kebijakan perusahaan yang tidak merilis LaMDA ke publik
Masa depan Gemini, tantangan, dan berlanjutnya perang AI
-
Suasana internal Google dan kepercayaan diri untuk tumbuh
- Dalam wawancara, Jeff Dean mengakui kesalahan penilaian di masa lalu dan menilai bahwa Google kini sedang melangkah lebih jauh, lepas dari sikap menghindari risiko
- Saat ini, tujuh layanan utama Google (Chrome, Gmail, YouTube, dll.) semuanya sedang mengadopsi fitur berbasis Gemini
- Dean, Noam Shazeer, dan pemimpin lain sedang menyelaraskan kebutuhan di seluruh perusahaan:
- peningkatan terjemahan bahasa Jepang
- penguatan kemampuan coding
- peningkatan analisis video real-time untuk Astra dan lain-lain
- Dean dan Shazeer sering bertemu di microkitchen Gradient Canopy untuk berbagi ide
-
Perluasan strategi dengan fokus pada pembuatan konten AI
- Shazeer: “Mengorganisasi informasi adalah pasar 1 triliun dolar, tetapi hal yang keren sekarang adalah 1 kuadriliun dolar”
- Saham Alphabet telah naik hampir 2 kali lipat dibanding titik terendah saat debut ChatGPT
- Hassabis kini juga memimpin tim aplikasi Gemini milik Xiao, dan yakin bahwa masa depan ketika AI menyembuhkan penyakit tidak lagi jauh
- Ia mengatakan kepada WIRED, “Kami memiliki fondasi riset yang paling luas dan dalam dibanding organisasi mana pun”
-
Masalah profitabilitas dan kembalinya model iklan
- Saat ini, sebagian besar pengguna tidak berniat membayar langsung untuk fitur AI
- Google sedang mempertimbangkan cara menyisipkan iklan ke dalam aplikasi Gemini
- Ini adalah strategi tradisional Silicon Valley:
- “Berikan data, waktu, dan perhatian Anda, lalu gunakan gratis alat keren yang kami buat”
- Selama Anda hanya mencentang persetujuan disclaimer, Google tidak bertanggung jawab
-
Persaingan pasar dan beban infrastruktur
- Data Sensor Tower:
- Total unduhan aplikasi ChatGPT: sekitar 600 juta
- Aplikasi Gemini: sekitar 140 juta
- Ada banyak pesaing AI:
- Claude, Copilot, Grok, DeepSeek, Llama, Perplexity dan lain-lain
- Banyak di antaranya adalah pesaing langsung Google atau target investasinya
- AI generatif membutuhkan investasi miliaran dolar dan konsumsi energi yang sangat besar
- Sampai-sampai perlu memperpanjang umur pembangkit listrik batu bara lama atau reaktor nuklir
- Seluruh industri masih belum menemukan cara monetisasi yang jelas
-
Risiko tambahan yang dihadapi Google
- Dalam beberapa tahun ke depan, hingga 25% pendapatan iklan pencarian berpotensi hilang akibat gugatan antimonopoli (analisis JP Morgan)
- Di internal pun kesadaran akan tekanan untuk menutup kebutuhan finansial makin tinggi
- Sebagian anggota tim Xiao bekerja tanpa libur musim dingin selama tiga tahun berturut-turut
- Salah satu pendiri, Brin, baru-baru ini mengatakan kepada karyawan bahwa “bekerja 60 jam per minggu adalah sweet spot paling efektif dalam persaingan AI”
- Karyawan yang diwawancarai WIRED: kecemasan terhadap PHK berkelanjutan, burnout, dan risiko hukum sangat dalam
-
Obsesi menuju AGI dan tantangan filosofis
- Hassabis masih teguh pada tujuan mengembangkan AGI (kecerdasan umum buatan)
- Sambil membawa prototipe Astra dan berjalan di London, ia membayangkan masa depan yang mampu mengenali segala hal di dunia
- Namun AGI baru mungkin terwujud jika penalaran, perencanaan, dan kemampuan eksekusi semuanya meningkat
-
Persaingan 'AI agen' dengan OpenAI
- Pada Januari 2025, OpenAI meluncurkan layanan Operator
- AI tipe agen yang mengklik dan mengetik di situs web nyata untuk menjalankan tugas atas nama pengguna
- Dapat melakukan hal seperti memesan perjalanan dan mengisi formulir, tetapi lambat dan sering salah
- Paket harga: US$200 per bulan
- Google juga memperluas fitur ke arah yang sama:
- Saat ini Gemini bisa menyusun rencana makan, tetapi versi berikutnya ditargetkan bisa memasukkan bahan makanan ke keranjang belanja,
dan tahap setelahnya bahkan memberi umpan balik real-time saat memotong bawang
-
Kesalahan akan terulang, tetapi laju tidak akan berhenti
- Pada Januari 2025, dalam iklan Super Bowl, Gemini membuat kesalahan konyol-miris dengan menjawab “lebih dari separuh konsumsi keju dunia adalah Gouda”
- Namun Google sedang mengembangkan Gemini bukan sekadar sebagai mesin informasi, melainkan bagian dari hidup, pelatih kehidupan, dan asisten serbabisa
- Pichai mengatakan: “Kami melangkah dengan hati-hati”
- Namun ia dan para eksekutifnya, begitu sudah mencapai puncak, tidak akan pernah ingin tertinggal lagi
- Persaingan AI terus berlanjut
4 komentar
Lalu, bagaimana cerita seperti ini bisa dijadikan artikel? Rasanya seperti tulisan promosi untuk Google.
"Kami sedang bekerja keras"...
Rasanya seperti sedang menonton serial TV Amerika.
Tapi, Apple ke mana ya?
Rasanya seperti masa ketika kita terkena Sputnik Shock.
Opini Hacker News
Awalnya saya skeptis, tetapi saya pikir Google bekerja dengan baik dalam persaingannya melawan OpenAI. Model Gemini 2.0 Pro dan Flash sangat bagus. Fitur riset mendalam diimplementasikan dengan baik. Context window masih yang terbaik di industri. Integrasinya dengan Search, Gmail, rangkaian Google Office, Google Meet, Android, dan lainnya sangat kuat
Masalah terbesar yang dihadapi Google adalah dorongan untuk menghadirkan model ringan bagi semua orang. Model yang digunakan di Search kemungkinan berada di level sekitar 8B, dan Flash 2.0 lumayan, tetapi tetap merupakan model ringan
OpenAI bukan perusahaan publik dan tidak menghasilkan laba. Google menghasilkan laba. Meski begitu, seperti halnya Google Meet/Zoom, kegagalan memproduksikan Transformer decoder adalah sebuah kesalahan. (Encoder seperti BERT digunakan secara luas)
Kepemimpinan Google mengambil pendekatan yang hati-hati, dan peluncuran produknya terlihat lebih matang. Terasa seperti transformasi memikat dari 0 ke 1 ala Apple di era 2000-an
Masalah utama Google adalah ada banyak kelompok yang membuat produk yang sama dan saling bersaing untuk merebut perhatian pengguna
Sebagai investor kecil: saya pikir Alphabet/Google bisa berkinerja lebih baik dengan CEO selain Sundar
Masalah Google adalah orang-orang yang tidak akrab dengan teknologi mulai melihat AI sebagai sesuatu yang berbeda dari Google (Search) dan produk lainnya
Apakah pernah bertemu Googler yang percaya diri dengan strategi AI Google? Orang-orang yang saya ajak bicara tampaknya semuanya punya kekhawatiran serius, tetapi ini mungkin hanya sampel kecil
Sepertinya Eric Schmidt pernah berkata sekitar 10 tahun lalu bahwa "semua orang akan membutuhkan asisten" (mungkin sekitar 2016). Saya tidak tahu mengapa mereka tidak melakukannya, padahal mereka bisa saja mewujudkan sesuatu seperti percakapan. Sebaliknya, mereka malah sibuk dengan hal-hal terkait mailbox dan semacamnya