LoPE: Menambahkan teks Latin acak di depan dapat meningkatkan penalaran LLM! (makalah arXiv)

(dev.to)

16 poin oleh taekim34 2026-05-12 | 13 komentar | Bagikan ke WhatsApp

LoPE adalah teknik yang menyisipkan Lorem ipsum dolor sit amet ... di depan prompt saat pelatihan RL. Teknik ini menyelesaikan masalah "zero-advantage" di mana sinyal pembelajaran menjadi 0 ketika semua sampel gagal pada masalah yang sulit.

Hasil utama:

Rata-rata benchmark matematika +4,62 poin pada Qwen3-4B
Peningkatan performa relatif 22% pada AMC 2023
Satu-satunya metode yang berhasil menembus 50 soal sulit yang gagal diselesaikan semua metode sebelumnya

Poin untuk dibaca

Menarik untuk melihat mengapa "teks yang tampak seperti bahasa tetapi tidak bermakna" berbasis Latin ini efektif, serta mekanisme bagaimana teks tersebut mengganggu lintasan penalaran dasar model untuk memperoleh keragaman eksplorasi.

13 komentar

gooksangom6394 2026-05-12

“Burung hantu nomor 158, bisa melakukannya?”
“… instruktur, ini terlalu…”
“Lorem ipsum! Bisa melakukannya?”
“Argh!!! Saya bisa!”

sonic0987 2026-05-12

Wkwkwkwkwkwkwkwk

epics 2026-05-12

wkwkwk

taekim34 2026-05-12

🤣🤣🤣🤣 Aku ngakak banget

mammal 2026-05-12

Menarik. Ini seperti menggunakan kalimat yang bisa diabaikan model sebagai semacam seed tambahan untuk memperluas ruang pencarian saat melakukan sampling.

taekim34 2026-05-12

Betul. Menarik dan juga memicu rasa ingin tahu karena ini menghadirkan perspektif baru yang tak terduga, sekaligus benar-benar meningkatkan performa.

ide127 2026-05-21

Mungkin ini juga bisa diartikan bahwa model saat ini mengalami pembelajaran yang terlalu overfit, dan karena itu masih ada ruang untuk lebih mengurangi kapasitas model.

happing94 2026-05-12

Ternyata bukan cuma perasaan kalau nulis prompt sambil typo parah malah bikin performanya meningkat

taekim34 2026-05-13

Wkwkwk, kenapa kalian semua lucu sekali

aliveornot 2026-05-12

Prinsipnya masuk akal, tapi tetap terasa menarik. Kenapa performanya tidak turun, malah naik?

taekim34 2026-05-12

Menurut saya, kalau diibaratkan pada manusia, ini mungkin mirip seperti saat menghadapi masalah yang sulit, lalu setelah 'menyegarkan pikiran' dan memikirkannya lagi dari awal, masalahnya jadi bisa terpecahkan. Ini cuma pendapat pribadi saya, hehe

somang04 2026-05-12

Yang saya penasaran, kalau itu dimanfaatkan apakah bisa menghasilkan hasil yang bermakna juga dalam pembelajaran secara umum?? Berdebar-debar..

taekim34 2026-05-12

Saya juga jadi ingin mencobanya. ^^
Dulu juga pernah ada hasil penelitian bahwa jika prompt yang sama dimasukkan 2 kali berulang (meski tidak bermakna), hasilnya bisa keluar lebih baik. Rasanya seperti menegur sekali lagi.. Seperti yang juga saya tulis sebagai balasan di komentar aliverornot, ini tampaknya berperan untuk menyegarkan pikiran. Agak mirip dengan ketika para matematikawan meletakkan pena sejenak lalu berjalan-jalan saat mereka mentok pada soal yang sulit.. haha

LoPE: Menambahkan teks Latin acak di depan dapat meningkatkan penalaran LLM! (makalah arXiv)

Poin untuk dibaca

Bacaan terkait

13 komentar