5 poin oleh GN⁺ 2024-02-26 | 1 komentar | Bagikan ke WhatsApp

Batas Intrinsik Model Bahasa Skala Besar: Halusinasi Tidak Dapat Dihindari

  • Fenomena halusinasi pada model bahasa skala besar (LLM) adalah kelemahan serius yang sudah dikenal luas.
  • Banyak penelitian telah mencoba mengurangi tingkat halusinasi, tetapi sebagian besar hanya berupa metode empiris sehingga tidak menjawab pertanyaan mendasar apakah halusinasi bisa dihilangkan sepenuhnya.
  • Makalah ini memformalkan masalah tersebut dan menunjukkan bahwa menghilangkan halusinasi pada LLM adalah hal yang mustahil.

Definisi Halusinasi dalam Dunia Formal

  • Didefinisikan sebuah dunia formal yang mendeskripsikan halusinasi sebagai ketidaksesuaian antara LLM yang dapat dihitung dan fungsi kebenaran acuan yang dapat dihitung.
  • Dengan memanfaatkan hasil dari teori pembelajaran, ditunjukkan bahwa LLM tidak dapat mempelajari semua fungsi yang dapat dihitung, dan karena itu akan selalu mengalami halusinasi.

Keniscayaan Halusinasi di Dunia Nyata

  • Karena dunia formal hanyalah bagian dari dunia nyata yang jauh lebih kompleks, halusinasi juga tak terhindarkan pada LLM di dunia nyata.
  • Untuk LLM dunia nyata yang dibatasi oleh kompleksitas waktu yang dapat dibuktikan, makalah ini menjelaskan tugas-tugas yang rentan menimbulkan halusinasi dan memverifikasinya secara empiris.

Mekanisme Mitigasi Halusinasi dan Implikasi Praktis

  • Dengan menggunakan kerangka dunia formal, dibahas kemungkinan dan efektivitas mekanisme mitigasi halusinasi yang sudah ada.
  • Juga dibahas implikasi praktis bagi penerapan LLM yang aman.

Opini GN⁺

  • Penelitian ini memberikan pemahaman mendasar tentang fenomena 'halusinasi', salah satu masalah inti pada model bahasa skala besar.
  • Pembuktian teoretis bahwa halusinasi tidak dapat dihindari dapat menawarkan arah baru dalam perancangan dan perbaikan LLM.
  • Ini dapat memberi kontribusi penting pada diskusi untuk membangun sistem kecerdasan buatan yang aman dan andal, dan bisa menjadi tonggak penting dalam perkembangan teknologi.

1 komentar

 
GN⁺ 2024-02-26
Komentar Hacker News
  • Ringkasan komentar pertama:

    • Klaim inti makalah ini adalah bahwa karena P ≠ NP, LLM (model bahasa besar) akan menghasilkan jawaban fiktif untuk masalah NP-lengkap.
    • Ini menimbulkan pertanyaan filosofis yang menarik tentang matematika, ilmu komputer, dan bahasa, tetapi menggunakan konsep formal yang berbeda dari konsep umum tentang 'halusinasi LLM'.
    • Klaim bahwa dunia formal adalah himpunan bagian dari dunia bahasa alami juga menarik. Manusia tidak dapat menyelesaikan masalah NP-lengkap, tetapi menunjukkan kemahiran tinggi dalam bahasa alami.
  • Ringkasan komentar kedua:

    • Saya hanya membaca abstraknya, tetapi skeptis apakah pendekatan formal ini akan membantu pada masalah praktis untuk meningkatkan frekuensi LLM menjawab 'tidak tahu'.
    • Ini mirip dengan teorema ketidaklengkapan; LLM tidak perlu mengetahui segalanya, tetapi masalah dalam menjawab 'tidak tahu' itu penting.
  • Ringkasan komentar ketiga:

    • Kita harus mengajukan pertanyaan ke LLM dengan sangat hati-hati agar tidak membuatnya mengarang.
    • AI semacam ini seperti 'yes-man', yang mencoba menyenangkan Anda terlepas dari benar atau tidaknya.
    • Sangat sulit bekerja dengan orang seperti ini. Anda harus selalu memeriksa apakah mereka benar-benar akan mengerjakan proyek yang dijanjikan, dan apakah itu memungkinkan.
  • Ringkasan komentar keempat:

    • Menulis fiksi dan cerita adalah salah satu bentuk halusinasi.
    • AI mencapai dua kutub ekstrem: mesin logis dan penghasil halusinasi.
    • Tujuannya adalah membuat mesin yang dapat melakukan keduanya sekaligus dan dapat membedakannya.
    • Halusinasi itu penting, tetapi kuncinya adalah komputer sadar ketika sedang berhalusinasi.
  • Ringkasan komentar kelima:

    • Jika kreativitasnya bagus, itu disebut 'kreativitas'; jika buruk, itu disebut 'halusinasi'.
    • Ini bukan bug atau keterbatasan, melainkan sebuah fitur.
  • Ringkasan komentar keenam:

    • Istilah 'halusinasi' berarti memersepsikan hal-hal yang tidak ada di dunia nyata, sehingga ini adalah istilah yang kurang tepat untuk menggambarkan fenomena menghasilkan rangkaian kata yang tidak terpetakan dengan baik ke realitas.
  • Ringkasan komentar ketujuh:

    • Hype tentang AI kini mulai masuk ke 'tahap realistis'.
    • Akhir-akhir ini sudah tidak terlihat lagi post yang penuh semangat tentang masalah alignment.
  • Ringkasan komentar kedelapan:

    • LLM didefinisikan sebagai model probabilistik atas string, dan ini adalah definisi yang cukup luas hingga mencakup kecerdasan manusia.
    • Karena itu, temuan mereka bisa saja berlaku sama untuk manusia.
  • Ringkasan komentar kesembilan:

    • Halusinasi didefinisikan sebagai ketidaksesuaian antara LLM yang dapat dihitung dan fungsi kebenaran acuan yang dapat dihitung.
    • Ini pada dasarnya hanyalah ketidakakuratan atau fabrikasi.
    • Istilah halusinasi sesuai dengan gagasan bahwa program-program ini bersifat cerdas.
  • Ringkasan komentar kesepuluh:

    • Halusinasi didefinisikan sebagai ketidaksesuaian antara LLM yang dapat dihitung dan fungsi kebenaran acuan yang dapat dihitung.
    • Dengan menggunakan definisi ini, kalimat judul 'halusinasi tidak terhindarkan' dapat dengan mudah dibantah.
    • Tetapkan panjang konteks input menjadi satu byte, lalu latih LLM agar hanya menjawab 'ya' untuk 'A'.
    • Definisikan fungsi kebenaran acuan sehingga output yang benar untuk input 'A' adalah 'ya' dan untuk semua input lain adalah 'tidak'.
    • LLM ini tidak akan pernah berhalusinasi karena telah diverifikasi sepenuhnya bahwa outputnya cocok dengan fungsi kebenaran acuan untuk semua kemungkinan input.
    • Ukuran konteks input dan jumlah entri dalam tabel kebenaran acuan dapat ditingkatkan, dan pada tahap mana pun halusinasi tidak menjadi 'tak terhindarkan'.