Beyond A*: Perencanaan yang Lebih Baik dengan Memanfaatkan Transformer
- Model transformer telah mencapai kemajuan besar di berbagai bidang aplikasi, tetapi masih tertinggal dari metode perencanaan berbasis simbol tradisional dalam menyelesaikan tugas pengambilan keputusan yang kompleks.
- Para peneliti mengusulkan cara melatih transformer untuk menyelesaikan tugas perencanaan yang kompleks, dan mengembangkan model bernama Searchformer yang dapat menyelesaikan puzzle Sokoban yang belum pernah dilihat sebelumnya secara optimal dalam 93,7% waktu, sambil menggunakan hingga 26,8% lebih sedikit langkah pencarian dibandingkan pencarian A* konvensional.
- Searchformer adalah model transformer encoder-decoder yang dilatih untuk memprediksi perilaku pencarian A*, lalu disempurnakan melalui expert iteration sehingga dapat menghasilkan rencana optimal dengan lebih sedikit langkah pencarian daripada pencarian A*.
Metode Pelatihan dan Kinerja
- Dalam metode pelatihan, perilaku pencarian A* direpresentasikan sebagai urutan token yang menunjukkan kapan status ditambahkan ke dan dihapus dari pohon pencarian dalam perencanaan simbolik.
- Dalam studi ablasi untuk penelusuran labirin, Searchformer jauh melampaui model dasar yang secara langsung memprediksi rencana optimal, dengan ukuran model 5–10 kali lebih kecil dan dataset pelatihan 10 kali lebih kecil.
- Para peneliti menunjukkan bahwa Searchformer efektif untuk tugas pengambilan keputusan yang lebih besar dan lebih kompleks seperti Sokoban, baik dalam meningkatkan proporsi tugas yang berhasil diselesaikan maupun memperpendek perilaku pencarian.
Opini GN⁺
- Riset ini menunjukkan kemungkinan baru pemanfaatan model transformer di bidang kecerdasan buatan. Dengan menawarkan pendekatan yang lebih efisien daripada metode berbasis simbol yang ada untuk menyelesaikan tugas pengambilan keputusan yang kompleks, ini merupakan kemajuan penting yang memperluas cakupan penerapan AI.
- Model Searchformer menunjukkan kemampuan pemecahan masalah yang lebih cepat dan efisien dengan menggunakan sumber daya yang lebih sedikit. Ini dapat menjadi keunggulan besar khususnya saat menerapkan AI di lingkungan dengan sumber daya terbatas.
- Studi ini menunjukkan bahwa kemajuan teknologi AI tidak harus bergantung hanya pada lebih banyak data dan model yang lebih besar, tetapi juga dapat dicapai melalui metodologi yang lebih cerdas dan perbaikan algoritme. Ini adalah pendekatan yang sangat menarik dan bermanfaat dari sisi keberlanjutan serta efisiensi riset AI.
1 komentar
Komentar Hacker News