1 poin oleh GN⁺ 2025-04-30 | 1 komentar | Bagikan ke WhatsApp
  • CoRT adalah algoritme yang memungkinkan model AI meninjau ulang responsnya sendiri secara berulang, menghasilkan alternatif, lalu memilih jawaban terbaik
  • Saat diterapkan pada model Mistral 3.1 24B, performanya meningkat secara signifikan, terutama pada tugas pemrograman
  • AI menghasilkan respons awal, lalu memilih respons akhir dengan mengevaluasi alternatif melalui beberapa 'putaran berpikir'
  • Proses ini mencakup evaluasi diri, pembuatan alternatif yang kompetitif, peningkatan berulang, dan kedalaman berpikir dinamis
  • CoRT tersedia di bawah lisensi MIT, dan kontribusi untuk perbaikan sangat disambut

CoRT (Chain of Recursive Thoughts) 🧠🔄

Ringkasan

  • Memperkenalkan CoRT, sebuah algoritme yang membuat AI berdebat dengan dirinya sendiri untuk menemukan jawaban yang lebih baik
  • Model AI meninjau ulang respons secara berulang dan menghasilkan alternatif untuk memilih jawaban terbaik
  • Saat diterapkan pada model Mistral 3.1 24B, performanya meningkat secara signifikan, terutama pada tugas pemrograman

Cara Kerja CoRT

  • AI menghasilkan respons awal
  • AI menentukan jumlah 'putaran berpikir' yang diperlukan
  • Pada setiap putaran:
    • Menghasilkan 3 respons alternatif
    • Mengevaluasi semua respons
    • Memilih respons terbaik
  • Respons akhir menjadi penyintas dari battle royale AI ini

Bahan Rahasia

  • Evaluasi diri
  • Pembuatan alternatif yang kompetitif
  • Peningkatan berulang
  • Kedalaman berpikir dinamis

Kontribusi

  • Jika menemukan cara untuk meningkatkannya, PR sangat disambut

Lisensi

  • Bebas digunakan di bawah lisensi MIT

1 komentar

 
GN⁺ 2025-04-30
Pendapat Hacker News
  • Untuk suatu masalah, model chat AI diminta memberikan jawaban lalu menulis laporan yang menjelaskan mengapa jawaban itu benar

    • Model AI kedua kemudian menilai laporan tersebut, lalu menulis laporan yang menunjukkan informasi yang tidak diberikan model awal atau ketidakkonsistenan logis
    • Proses ini diulang sampai model AI kedua puas dengan penjelasan model AI pertama, atau sampai model AI pertama menerapkan semua perubahan yang diminta
    • Metode ini memang agak rumit, tetapi saat dicoba hasilnya cukup bagus
  • Ingin mencoba debat "senat" dalam mode selalu aktif pada skala yang lebih besar

    • Alih-alih merespons masalah satu per satu, memberikan daftar tugas dan membiarkan senat menyelesaikannya
    • Diperkirakan bisa menghasilkan keluaran yang mengesankan melalui beragam sudut pandang dan analisis kritis
    • Membutuhkan banyak token, tetapi biayanya per token terus menurun sehingga ada kemungkinan untuk diwujudkan
    • Ada juga kemungkinan menyiapkan server IRC khusus AI untuk membuat ruang diskusi bersama tempat siapa pun bisa menghubungkan model mereka sendiri
  • Strategi sederhana saat menutup pesan adalah meminta, "tolong pikirkan sekali dengan tag pemikiran, lakukan kritik diri sekali dengan tag kritik, lalu pikirkan sekali lagi dengan tag pemikiran sebelum menjawab"

    • Bekerja dengan baik
    • Meminta AI menemukan 5 masalah terbesar dari sebuah usulan juga efektif
  • Berbeda dari yang dibayangkan dari judulnya

    • Menetapkan peran pembantu, pemeriksa silang, dan hakim, lalu menjalankan tanya jawab sesuai masing-masing peran
    • Meminta ChatGPT, "jika XYZ benar, jelaskan" dan "jika XYZ tidak benar, jelaskan", lalu mencari sisi yang lebih meyakinkan
  • Sedang merancang editor graf bergaya blueprint Unreal Engine, dimulai dari input pengguna lalu beberapa agen menjalankan tugas

    • Model Mistral small 3.1 dan gemma 3 terasa seperti model semi-mampu pertama yang bisa dijalankan secara lokal
    • Jika eksekusi Python dicoba dalam loop dan diarahkan untuk menjelajahi dunia, model mulai mengunduh dan membaca berita, dan sebagainya
  • Bertanya-tanya apakah tim agen AI akan menjalankan tim scrum dan mengadakan rapat standup setiap beberapa jam

    • Bertanya-tanya apakah birokrasi pemerintah akan direplikasi dengan agen yang mendiskusikan topik sepanjang hari untuk menemukan pendapat terbaik
  • Salah satu cara membuat model ML menghasilkan ide baru adalah dengan mendekati secara diagonal ide-ide yang sudah pernah dicoba lalu dibuang, sambil mempertahankan batasan konsistensi tertentu

  • Jika semua GPU tidak segera dialihkan ke energi ramah lingkungan, bumi akan memanas sementara AI berdebat untuk menemukan solusi optimalnya sendiri

  • Ada contoh yang menggunakan CoRT dan contoh yang tidak menggunakannya, tetapi contoh yang tidak menggunakannya jauh lebih baik

    • Pemilihan contohnya aneh
  • Pendekatan ini mengingatkan pada kreator YT

    • Mereka membuat skrip permainan seperti lintasan balap agar bisa mencapai titik tujuan, lalu mengulanginya sampai menemukan solusi tercepat
    • Ini disebut pembelajaran mesin atau pembelajaran penguatan
    • Pemahaman yang naif tentang AI umumnya memang mirip seperti itu