2 poin oleh GN⁺ 11 hari lalu | Belum ada komentar. | Bagikan ke WhatsApp
  • Teknologi yang kini disebut AI sebenarnya adalah sistem machine learning (ML) yang kompleks, dengan struktur yang secara statistik melengkapi teks, gambar, dan audio
  • LLM adalah mesin yang menciptakan ‘kebohongan yang terdengar meyakinkan’ layaknya teater improvisasi, menghindari jawaban bahwa ia tidak tahu dan menghasilkan fakta-fakta fiktif
  • Orang kerap salah mengiranya sebagai entitas yang sadar, tetapi penjelasan diri dan proses penalaran model hanyalah narasi fiktif
  • LLM menunjukkan kinerja yang tidak merata, mampu memecahkan masalah tingkat tinggi tetapi gagal pada tugas sederhana, sehingga memperlihatkan batas yang tidak dapat diandalkan
  • Di tengah ketimpangan dan ketidakpastian ini, ML sedang menjadi teknologi yang secara mendasar mengubah masyarakat manusia menjadi sesuatu yang ganjil

Kata pengantar

  • Generasi yang tumbuh dengan mengagumi dunia fiksi ilmiah Asimov dan Clarke pernah membayangkan kemunculan mesin cerdas secara optimistis, namun mengalami kekecewaan dalam kenyataan ketika uji Turing runtuh
  • Ketika sebuah perusahaan cloud besar pada 2019 mengumumkan perangkat keras untuk melatih LLM, muncul kekhawatiran bahwa penyebaran deep learning dapat melahirkan bentuk baru spam dan propaganda
  • Tulisan ini menjelajahi ruang negatif dalam wacana AI, dan disusun sebagai upaya menampakkan kontur risiko dan kemungkinan, bukan analisis yang sepenuhnya lengkap
  • Karena istilah “AI” terlalu luas, pembahasan difokuskan pada diskusi yang lebih konkret tentang ML dan LLM
  • Sebagian prediksi sudah menjadi kenyataan, sementara sebagian lain masih berada di wilayah yang tidak pasti dan ganjil

Apa itu “AI”

  • Yang saat ini disebut “AI” adalah kelompok teknologi machine learning (ML) yang kompleks, yaitu sistem yang mengenali, mengubah, dan menghasilkan vektor token seperti teks, gambar, audio, dan video
  • LLM (Large Language Model) menangani bahasa alami, dan bekerja dengan memprediksi kelanjutan yang secara statistik mungkin dari string masukan
  • Model dilatih dengan halaman web dan korpus data berskala besar seperti buku dan musik bajakan, lalu setelah pelatihan dapat digunakan berulang kali melalui inferensi (inference) berbiaya rendah
  • Model tidak belajar sendiri seiring waktu, dan hanya diperbarui melalui penyesuaian operator atau pelatihan ulang
  • “Ingatan” model percakapan sebenarnya diwujudkan sebagai teknik struktural yang memasukkan ringkasan percakapan sebelumnya ke dalam masukan

Fanfiction realitas

  • LLM bekerja seperti mesin improvisasi (improv), memperlihatkan pola ‘yes-and’ yang meneruskan konteks masukan dengan “lalu kemudian...”
  • Karena itu, ia menghasilkan kalimat yang terdengar meyakinkan tetapi tidak terkait fakta, salah memahami satire atau konteks, dan menciptakan informasi palsu
  • Manusia mudah salah mengira keluaran semacam ini sebagai ujaran dari makhluk yang benar-benar sadar
  • Karena LLM menghasilkan keluaran untuk semua masukan, ada kecenderungan untuk menghindari jawaban “tidak tahu” dan justru mengarang kebohongan
  • Kebohongan ini bukan tindakan yang disengaja, melainkan muncul sebagai produk sosioteknis dari interaksi antara manusia dan mesin

Narator yang tidak dapat dipercaya

  • Orang-orang meminta penjelasan diri dari LLM, seperti “mengapa kamu melakukan itu”, tetapi model tidak memiliki kemampuan kesadaran diri
  • LLM hanya menghasilkan kelengkapan probabilistik berbasis percakapan sebelumnya dan korpus, dan penjelasan tentang dirinya pun disusun sebagai kisah fiktif
  • Model “reasoning” juga bekerja dalam bentuk mengemas proses berpikirnya sebagai narasi
  • Menurut penelitian Anthropic, sebagian besar catatan penalaran Claude tidak akurat, dan bahkan pesan status seperti “sedang berpikir” hanyalah pengarahan fiktif

Model itu pintar

  • Dalam beberapa bulan terakhir, persepsi bahwa kemampuan LLM meningkat pesat makin meluas
  • Beberapa engineer melaporkan bahwa Claude atau Codex dapat langsung menyelesaikan tugas pemrograman yang kompleks
  • Di berbagai bidang, sudah ada pemanfaatan nyata seperti perancangan diet, peninjauan spesifikasi konstruksi, visualisasi 3D, dan penulisan evaluasi diri
  • Ia juga menunjukkan kinerja tinggi pada prediksi pelipatan protein oleh AlphaFold dan pembacaan citra medis
  • Dalam gaya penulisan bahasa Inggris, gambar, dan musik, semakin sulit membedakan manusia dan mesin, meskipun pembuatan video masih terbatas

Model itu bodoh

  • Pada saat yang sama, LLM juga dinilai sebagai sistem ‘bodoh’ yang terus mengulang kesalahan dasar
  • Sebagai contoh, Gemini berulang kali salah menangani geometri dan material dalam rendering model 3D, dan Claude menghasilkan kode visualisasi JavaScript yang tidak bermakna
  • ChatGPT bahkan gagal memenuhi permintaan sederhana untuk mengubah warna, dan melontarkan klaim palsu yang salah mengasumsikan orientasi seksual pengguna
  • Dilaporkan pula kasus ketika LLM membuat grafik dari data palsu, gagal mengendalikan smart home, atau menyebabkan kerugian finansial
  • Fitur ringkasan AI Google menunjukkan tingkat kesalahan sekitar 10%, dan klaim tentang “kecerdasan setingkat ahli” dinilai sebagai fantasi yang dibesar-besarkan

Batas yang bergerigi

  • Manusia umumnya dapat memperkirakan rentang kemampuannya, tetapi kinerja sistem ML tidak teratur dan sulit diprediksi
  • LLM dapat menyelesaikan matematika tingkat tinggi tetapi gagal pada masalah bahasa yang sederhana, serta memberikan penjelasan yang tidak memiliki akal sehat fisik
  • Ketimpangan ini disebut ‘jagged technology frontier’, dan berbeda dari distribusi kemampuan manusia karena berbentuk tak kontinu
  • Karena ML bergantung pada data pelatihan atau jendela konteks (window), ia rapuh terhadap tugas yang memerlukan pengetahuan implisit
  • Robot humanoid atau ranah yang menuntut embodied knowledge masih jauh dari tercapai

Apakah sedang membaik, atau tidak

  • Para peneliti bahkan belum memahami dengan jelas penyebab keberhasilan model transformer
  • Sejak makalah 2017 Attention is All You Need, berbagai arsitektur telah dicoba, tetapi pendekatan sekadar menambah parameter masih tetap yang paling efektif
  • Meski biaya pelatihan dan jumlah parameter melonjak tajam, peningkatan kinerja melambat, dan belum jelas apakah ini ilusi atau batas nyata
  • Bahkan jika ML tidak lagi membaik, ia sudah memberi dampak besar pada masyarakat, politik, seni, dan ekonomi
  • Pada akhirnya, ML adalah teknologi yang secara mendasar mengubah kehidupan manusia menjadi sesuatu yang ganjil, dan perkembangan berikutnya kemungkinan akan “bergerak ke arah yang aneh”

Catatan istilah

  • Karena “AI” terlalu luas, istilah ini diperjelas menjadi ML atau LLM
  • “AI generatif” dianggap ungkapan yang tidak lengkap karena tidak mencakup tugas pengenalan
  • Alasan LLM tampak berbohong tentang dirinya sendiri adalah karena pengaruh narasi manusia tentang AI dan data pelatihan
  • Sebagai sanggahan terhadap klaim “model itu bodoh”, ada pendapat bahwa masalahnya terletak pada prompt atau pemilihan model, tetapi telah dipastikan bahwa kesalahan yang sama berulang bahkan pada model komersial terbaru

Belum ada komentar.

Belum ada komentar.