FunSearch: memanfaatkan model bahasa skala besar untuk penemuan baru dalam matematika dan sains
- Model bahasa skala besar (LLM) memiliki kemampuan yang sangat baik dalam menggabungkan konsep, dan merupakan alat yang berguna untuk membantu pemecahan masalah melalui membaca, menulis, dan coding.
- Karena LLM terkadang cenderung "berhalusinasi" dengan menghasilkan informasi yang tidak faktual, melakukan penemuan yang akurat dan dapat diverifikasi menjadi tantangan.
- FunSearch adalah metode untuk mengeksplorasi solusi baru dalam matematika dan ilmu komputer dengan menggabungkan LLM pralatih yang memberikan solusi kreatif dan "evaluator" otomatis yang menyaring ide yang keliru.
Mendorong penemuan melalui evolusi dengan model bahasa
- FunSearch menggunakan metode evolusioner yang mengembangkan ide dengan skor tertinggi, dan ide-ide ini direpresentasikan sebagai program komputer yang dapat dijalankan dan dievaluasi secara otomatis.
- Pengguna menuliskan masalah dalam bentuk kode, yang terdiri dari prosedur untuk mengevaluasi program dan program seed untuk menginisialisasi kumpulan program awal.
- FunSearch adalah prosedur berulang, di mana pada setiap iterasi beberapa program dipilih dari kumpulan program saat ini dan diberikan ke LLM, lalu LLM menghasilkan program baru untuk dievaluasi.
Membuka jalan baru dalam matematika
- FunSearch menemukan solusi baru untuk masalah cap set yang telah membingungkan para matematikawan selama puluhan tahun.
- Masalah cap set adalah mencari himpunan titik terbesar pada grid berdimensi tinggi yang tidak memiliki tiga titik segaris, dan merupakan model penting dalam kombinatorika ekstremal.
- FunSearch menemukan cap set terbesar yang pernah ditemukan dalam 20 tahun terakhir pada beberapa pengaturan.
FunSearch lebih menyukai program yang ringkas dan dapat ditafsirkan manusia
- FunSearch tidak sekadar menghasilkan solusi untuk suatu masalah, tetapi juga menghasilkan program yang menjelaskan bagaimana solusi tersebut diturunkan.
- FunSearch lebih memilih menemukan solusi melalui program dengan kompleksitas Kolmogorov yang rendah, yaitu program yang sangat ringkas.
- Output program FunSearch mudah dipahami oleh para peneliti dan memberikan wawasan yang dapat ditindaklanjuti.
Menyelesaikan tantangan yang terkenal sangat sulit dalam komputasi
- Setelah berhasil pada masalah cap set yang bersifat teoretis, FunSearch diterapkan pada masalah "bin packing", tantangan praktis penting dalam ilmu komputer.
- FunSearch berhasil mengemas jumlah item yang sama dengan jumlah bin yang lebih sedikit dibandingkan heuristik yang ada.
Membuka jalan bagi penemuan yang dipimpin LLM untuk sains dan seterusnya
- Jika halusinasi LLM dapat dicegah, kekuatan model ini dapat dimanfaatkan bukan hanya untuk menghasilkan penemuan matematis baru, tetapi juga untuk mengungkap solusi berdampak bagi masalah dunia nyata yang penting.
- Diperkirakan bahwa penggunaan pendekatan yang dipimpin LLM untuk menghasilkan algoritme yang efektif dan disesuaikan akan menjadi praktik umum untuk banyak masalah sains dan industri.
Opini GN⁺
- FunSearch menunjukkan kemungkinan baru bagi kecerdasan buatan dalam pemecahan masalah matematika. Secara khusus, dengan menghadirkan solusi baru untuk masalah yang lama belum terpecahkan seperti masalah cap set, peran AI di bidang matematika diperkirakan akan menjadi semakin penting.
- Dengan diterapkannya teknologi ini pada masalah industri nyata, misalnya peningkatan efisiensi pusat data, hal ini menunjukkan bahwa AI juga dapat berkontribusi pada pemecahan masalah praktis.
- Program yang dihasilkan FunSearch dapat ditafsirkan oleh manusia, yang akan membantu para peneliti memperoleh wawasan lebih mendalam dan bekerja sama dengan AI untuk menyelesaikan masalah.
1 komentar
Komentar Hacker News
Pertanyaan tentang kebutuhan LLM:
Konteks penting tentang penemuan dalam kombinatorika:
Komentar terkait "self-play":
Pengalaman pribadi dalam penggunaan pencarian web:
Unggahan Twitter tentang penemuan DeepMind:
Ringkasan unggahan Twitter:
Ringkasan tentang pembuatan program:
Pendekatan terhadap masalah cap set:
Mengungkapkan rasa ingin tahu tentang kemungkinan integrasi antara LLM dan penalaran simbolik.
Terlepas dari apakah benar-benar menghasilkan pengetahuan baru, ini menarik sebagai studi kasus ketika mempertimbangkan pembatasan akses AI berdasarkan ukuran model AI atau langkah regulasi lainnya.
Terkait teorema aproksimasi universal, disebutkan bahwa fungsi dapat diaproksimasi secara tepat dengan jaringan saraf tiruan yang menggunakan ReLU.