7 poin oleh hankor 2024-08-05 | Belum ada komentar. | Bagikan ke WhatsApp
  1. Era ChatGPT telah tiba. Saat ini kita hidup di zaman ketika pengaruh model bahasa besar begitu besar hingga layak disebut sebagai revolusi industri ketiga. Bahkan ibu saya pun menggunakan ChatGPT ketika ada hal yang ingin beliau ketahui, sehingga cakupan pemanfaatannya makin meluas tanpa mengenal generasi.
  2. Jika dipikirkan, alasan cakupan pemanfaatannya bisa seluas ini mungkin karena sistem ini mampu mengambil dan menyampaikan informasi yang diinginkan pengguna dengan tepat. Bagi orang-orang yang lelah dengan banjir informasi, ia memilihkan dan membawakan informasi yang 'dibutuhkan'.
  3. Meski hingga sekarang telah terjadi perkembangan yang sangat pesat, banyak pula tantangan yang menyertainya. Salah satu contohnya adalah apa yang disebut 'halusinasi'. Informasi memang diberikan, tetapi yang dibawa adalah informasi yang tidak akurat. Fenomena ini memiliki berbagai penyebab. Salah satu penyebab paling representatif adalah ketika sistem salah memahami maksud pengguna lalu mengambil informasi yang tidak relevan. Cara untuk mengatasi penyebab ini sederhana: pahami maksud pengguna dengan 'baik' dan sampaikan informasi yang 'relevan'.
  4. Untuk memperbaiki hal ini, berbagai upaya sedang dilakukan. Secara umum, ini dapat diklasifikasikan menjadi 4 pendekatan: 1. membangun model bahasa besar dari awal, 2. mengambil model bahasa besar yang sudah terlatih dengan 'baik' lalu melatihnya lagi agar sesuai dengan domain yang diinginkan, 3. menggunakan model bahasa besar apa adanya tetapi menambahkan konteks tambahan pada kueri pengguna, 4. tetap menggunakan model bahasa besar, tetapi dalam proses menjawab pengguna, menambahkan konteks tentang 'informasi yang relevan' agar relevansinya semakin menonjol. Karena pendekatannya beragam, masing-masing juga memiliki kelebihan dan kekurangan.
  5. Pendekatan 1 memiliki kelebihan karena, karena dibangun dari awal, kita dapat menyajikan konteks data yang jelas kepada model bahasa besar sejak awal. Namun, kekurangannya adalah biaya pembangunannya tidak kecil.
    2 memiliki kelebihan berupa biaya yang relatif lebih murah dan tingkat akurasi yang sampai batas tertentu dapat dijamin, karena mengambil konteks dari model bahasa besar yang sudah terlatih dengan 'baik' lalu menerapkan secara selektif sejumlah kecil data yang terspesialisasi pada domain. Namun, kekurangannya adalah sulit menjaga agar konteks model bahasa besar tidak hilang sambil mempertahankan konteks khusus domain secara harmonis.
    3 memiliki kelebihan berupa biaya yang murah karena cukup mengolah kueri pengguna dan memberi konteks atas maksudnya dengan 'baik'. Namun, dalam proses pemberian konteks, subjektivitas dari pihak yang memberi konteks dapat ikut campur, sehingga objektivitas konteks bisa berkurang. Akibatnya, jika bias tercermin terlalu kuat, konteks justru dapat berdampak negatif.
    4 memiliki kelebihan karena dapat menjawab kueri pengguna dengan respons yang mencerminkan informasi yang relatif lebih mutakhir dan biaya implementasinya murah. Namun, karena kualitas pertanyaan sangat beragam tergantung dokumen terkaitnya, ada kekurangan berupa tingginya kompleksitas: bagaimana membedakan dan mengambil dokumen terkait dengan baik harus didekati secara strategis dengan memadukan berbagai elemen secara seimbang.
  6. Selain itu, perbandingan yang lebih rinci dari lima aspek—cost, accuracy, domain-specific terminology, up-to-date response, transparency and interpretability—telah dicatat dengan baik di https://deci.ai/blog/… , jadi saya merekomendasikan untuk melihatnya sekali.
  7. Sejauh ini kita telah membahas berbagai metodologi yang dicoba untuk mengatasi halusinasi, yaitu masalah yang muncul pada model bahasa besar. Dalam postingan ini, kita akan melihat RAG (Retrieval Augment Generation), yaitu teknologi pada pendekatan nomor 4 yang mengambil 'informasi yang relevan' dengan baik untuk memberikan konteks, lalu membahas keterbatasan RAG serta GraphRAG sebagai salah satu cara untuk melengkapi keterbatasan tersebut.

Belum ada komentar.

Belum ada komentar.