Apa itu rantai Markov
- Saat LLMs (large language models) pertama kali muncul, orang-orang menjelaskannya sebagai rantai Markov yang sangat cerdas
- Belakangan ini, orang lebih akrab dengan LLMs daripada rantai Markov
- Rantai Markov bisa disebut sebagai LLM yang sangat kecil, sangat sederhana, dan sangat naif
- Rantai Markov memprediksi kata berikutnya berdasarkan konteks saat ini, tetapi tidak mempertimbangkan semantik, dimensionalitas, atau matematika vektor kompleks lainnya
- Rantai Markov adalah model statistik yang primitif
- Fitur "saran kata berikutnya" pada keyboard ponsel umumnya menggunakan rantai Markov
- Rantai Markov murah untuk dijalankan dan mudah diperbarui agar sesuai dengan gaya teks pengguna
- Cara kerja LLMs dan rantai Markov bisa dijelaskan secara mendalam, tetapi di sini cukup pahami bahwa rantai Markov kurang mampu menyelesaikan tugas dibandingkan LLMs
Apa itu kelucuan
- Humor berkaitan dengan kejutan yang tidak serius
- Lelucon terbaik mengandung "snap" yang menyenangkan dan penting
- "Snap" berarti hentakan yang datang dari kejutan
- Semakin sedikit kejutan, semakin tidak lucu
- Inilah alasan lelucon menjadi kurang lucu ketika terlalu sering didengar
- Humor "random" tidak lucu karena ketidakpastiannya justru bisa diprediksi
- Menulis lelucon berkaitan dengan melanggar pola
- "Realisasi adegan" bisa memperkuat snap
- Jika menggunakan bahasa yang lebih orisinal atau deskriptif, adegan akan terlihat lebih nyata
- Lelucon sangat beragam dan humor itu subjektif
Prediktabilitas LLMs
- Untuk berhasil memprediksi kalimat, dibutuhkan banyak konteks
- LLMs memiliki banyak konteks
- LLMs mencari token berikutnya yang paling mungkin melalui banyak perhitungan matematis
- LLM yang "lebih baik" lebih dapat diprediksi
- LLMs tidak cocok untuk penulisan kreatif
- LLMs menghasilkan keluaran yang rata-rata
- Untuk menghasilkan lelucon, LLM perlu memberi kejutan
- LLM yang bagus tidak pandai melakukan itu
- LLMs tidak cocok untuk ekspresi artistik
- LLMs bisa melewatkan konsep yang menarik
- Melalui kerangka ini, mungkin bisa dibuat model bahasa baru
Mengapa ini menarik
- Ini menunjukkan sesuatu yang lebih dalam
- Ini bukan perdebatan jiwa versus mesin
- Ini menunjukkan cacat bawaan pada model
- Pesan ChatGPT terlihat seperti esai anak SMA
- Ini adalah reproduksi dari keluaran rata-rata
- Kepribadian dihilangkan dan digantikan dengan ketelitian akademis
- Nadanya hambar dan korporat
- Ulasan Amazon palsu bisa dengan mudah dikenali
- Model pendeteksi LLM sebentar lagi harus memeriksa kepribadian
Ringkasan GN⁺
- Artikel ini menjelaskan perbedaan antara rantai Markov dan LLMs, serta mengeksplorasi hakikat humor
- Rantai Markov adalah model statistik sederhana yang kemampuan prediksinya lebih rendah daripada LLMs
- Humor didasarkan pada kejutan yang tidak serius, dan menulis lelucon berkaitan dengan melanggar pola
- Karena sangat dapat diprediksi, LLMs tidak cocok untuk penulisan kreatif
- Artikel ini menunjukkan keterbatasan LLMs dan mengisyaratkan kemungkinan model bahasa baru
1 komentar
Komentar Hacker News
Beberapa tahun lalu saat mengerjakan proyek sampingan, saya sampai pada kesimpulan yang sama
Saya meminta Claude 3.5 Sonnet menulis 10 lelucon pendek dengan tema bahwa rantai Markov lebih lucu daripada LLM
Ini bukan berarti rantai Markov lebih baik
Saat kuliah, teman-teman saya menggunakan generator rantai Markov untuk bagian "laporan polisi" di koran kampus
Saya merasa tidak nyaman menggunakan Alkitab untuk eksperimen seperti ini
Sebagai bukti empiris, /r/subreddit simulator adalah parodi Reddit berbasis Markov
Saya pernah beberapa kali memposting "XYZ palsu yang ditulis AI" di Reddit
Sekitar 10 tahun lalu saat masih sekolah, saya membuat bot Twitter Markov
Evolusi blog AI weirdness mendukung ide ini
Saya punya dua bot di server Discord pribadi