Apa itu ARC-AGI?
- ARC-AGI adalah benchmark kecerdasan buatan yang diperkenalkan pada 2019, dirancang untuk menguji kemampuan sistem dalam menyimpulkan dan menggeneralisasi aturan abstrak dari contoh yang minimal.
- Dataset ini terdiri dari teka-teki mirip tes IQ, dan setiap teka-teki menyediakan beberapa gambar contoh yang menunjukkan aturan dasar serta gambar uji tempat aturan tersebut harus diterapkan.
- Tujuan dari menyelesaikan ARC-AGI adalah menyoroti tantangan saat ini yang menghambat kemajuan kecerdasan buatan.
Pendekatan solusi kami
- Kami mengusulkan bahwa kompresi informasi lossless dapat menjadi kerangka kerja yang efektif untuk menyelesaikan teka-teki ARC-AGI.
- Kompresi teka-teki yang lebih efisien berkorelasi dengan solusi yang lebih akurat.
- CompressARC menggunakan jaringan saraf sebagai decoder, dan algoritma encoding memperoleh representasi teka-teki yang paling terkompresi dengan mengoptimalkan parameter decoder dan distribusi input, bukan jaringan lain.
Pengamatan pembelajaran jaringan: mewarnai kotak
- Solusi manusia: menyadari bahwa input dibagi menjadi kotak-kotak, dan kotak-kotak itu dipertahankan serta diwarnai pada output.
- Solusi CompressARC: pada setiap tahap pembelajaran, jaringan secara bertahap memahami dan menerapkan aturan teka-teki.
Cara menurunkan pendekatan solusi kami
- Kompresi informasi lossless adalah cara merepresentasikan informasi dengan bit sesedikit mungkin sambil tetap memungkinkan informasi tersebut direkonstruksi dari representasi bitnya.
- Kami ingin mengetahui jawaban apa yang akan didekompresi oleh sistem yang paling baik mengompresi dataset ARC-AGI.
Bantuan jaringan saraf
- Alih-alih menelusuri ruang program, kami memilih program dan mendelegasikannya pada keragaman ruang input.
- Kami menulis program yang menjalankan forward pass jaringan saraf, lalu melakukan pencarian melalui ruang input.
Arsitektur
- Kami merancang arsitektur jaringan saraf untuk mendekode teka-teki ARC-AGI.
- Fitur yang paling penting adalah ekuivalensi, seperti mengikuti aturan simetri.
Hasil
- CompressARC mencatat hasil 34.75% pada set pelatihan dan 20% pada set evaluasi.
Teka-teki yang bisa dan tidak bisa diselesaikan
- CompressARC mencoba mencari tahu sebanyak mungkin dengan menggunakan kemampuan tertentu.
- Misalnya, ia dapat memperluas pola pada jarak pendek, tetapi tidak pada jarak panjang.
Mewarnai kotak: studi kasus
- Selama pelatihan, galat rekonstruksi menurun sangat cepat dan rata-rata tetap rendah.
- Untuk memahami bagaimana CompressARC menyelesaikan teka-teki, kami menganalisis representasi yang disimpan dalam z.
Cara meningkatkan pekerjaan kami
- Saat perilisan CompressARC, ada berbagai ide yang sudah dicoba maupun belum dicoba.
- Kami masih menganggap beberapa ide, seperti kompresi bersama melalui pembagian bobot antar-teka-teki, tetap valid.
Belum ada komentar.