16 poin oleh taekim34 2026-05-12 | 13 komentar | Bagikan ke WhatsApp

LoPE adalah teknik yang menyisipkan Lorem ipsum dolor sit amet ... di depan prompt saat pelatihan RL. Teknik ini menyelesaikan masalah "zero-advantage" di mana sinyal pembelajaran menjadi 0 ketika semua sampel gagal pada masalah yang sulit.

Hasil utama:

  • Rata-rata benchmark matematika +4,62 poin pada Qwen3-4B
  • Peningkatan performa relatif 22% pada AMC 2023
  • Satu-satunya metode yang berhasil menembus 50 soal sulit yang gagal diselesaikan semua metode sebelumnya

Poin untuk dibaca

Menarik untuk melihat mengapa "teks yang tampak seperti bahasa tetapi tidak bermakna" berbasis Latin ini efektif, serta mekanisme bagaimana teks tersebut mengganggu lintasan penalaran dasar model untuk memperoleh keragaman eksplorasi.

13 komentar

 
gooksangom6394 2026-05-12

“Burung hantu nomor 158, bisa melakukannya?”
“… instruktur, ini terlalu…”
“Lorem ipsum! Bisa melakukannya?”
“Argh!!! Saya bisa!”

 
sonic0987 2026-05-12

Wkwkwkwkwkwkwkwk

 
epics 2026-05-12

wkwkwk

 
taekim34 2026-05-12

🤣🤣🤣🤣 Aku ngakak banget

 
mammal 2026-05-12

Menarik. Ini seperti menggunakan kalimat yang bisa diabaikan model sebagai semacam seed tambahan untuk memperluas ruang pencarian saat melakukan sampling.

 
taekim34 2026-05-12

Betul. Menarik dan juga memicu rasa ingin tahu karena ini menghadirkan perspektif baru yang tak terduga, sekaligus benar-benar meningkatkan performa.

 
ide127 2026-05-21

Mungkin ini juga bisa diartikan bahwa model saat ini mengalami pembelajaran yang terlalu overfit, dan karena itu masih ada ruang untuk lebih mengurangi kapasitas model.

 
happing94 2026-05-12

Ternyata bukan cuma perasaan kalau nulis prompt sambil typo parah malah bikin performanya meningkat

 
taekim34 2026-05-13

Wkwkwk, kenapa kalian semua lucu sekali

 
aliveornot 2026-05-12

Prinsipnya masuk akal, tapi tetap terasa menarik. Kenapa performanya tidak turun, malah naik?

 
taekim34 2026-05-12

Menurut saya, kalau diibaratkan pada manusia, ini mungkin mirip seperti saat menghadapi masalah yang sulit, lalu setelah 'menyegarkan pikiran' dan memikirkannya lagi dari awal, masalahnya jadi bisa terpecahkan. Ini cuma pendapat pribadi saya, hehe

 
somang04 2026-05-12

Yang saya penasaran, kalau itu dimanfaatkan apakah bisa menghasilkan hasil yang bermakna juga dalam pembelajaran secara umum?? Berdebar-debar..

 
taekim34 2026-05-12

Saya juga jadi ingin mencobanya. ^^
Dulu juga pernah ada hasil penelitian bahwa jika prompt yang sama dimasukkan 2 kali berulang (meski tidak bermakna), hasilnya bisa keluar lebih baik. Rasanya seperti menegur sekali lagi.. Seperti yang juga saya tulis sebagai balasan di komentar aliverornot, ini tampaknya berperan untuk menyegarkan pikiran. Agak mirip dengan ketika para matematikawan meletakkan pena sejenak lalu berjalan-jalan saat mereka mentok pada soal yang sulit.. haha