-
ACM A.M. Turing Award Honors Two Researchers Who Led the Development of Cornerstone AI Technology
-
Andrew Barto and Richard Sutton Recognized as Pioneers of Reinforcement Learning
- ACM memilih Andrew G. Barto dan Richard S. Sutton sebagai penerima ACM A.M. Turing Award 2024. Keduanya mengembangkan dasar konseptual dan algoritmik dari reinforcement learning.
- Barto adalah profesor emeritus Ilmu Informasi dan Komputer di University of Massachusetts Amherst, dan Sutton saat ini menjabat sebagai profesor ilmu komputer di University of Alberta.
- Turing Award sering disebut sebagai Hadiah Nobel di bidang komputasi, dengan hadiah uang sebesar 1 juta dolar yang didanai oleh Google.
-
What is Reinforcement Learning?
- Bidang kecerdasan buatan (AI) pada dasarnya berfokus pada pembangunan agen yang dapat mengindra dan bertindak. Reinforcement learning (RL) adalah proses di mana agen semacam ini mempelajari perilaku yang lebih baik melalui sinyal penghargaan.
- Dasar reinforcement learning dimulai pada awal 1980-an ketika Barto dan Sutton, berdasarkan pengamatan dari psikologi, memformalkan reinforcement learning sebagai kerangka masalah yang umum.
- Mereka mengembangkan algoritme reinforcement learning dengan memanfaatkan dasar matematis berbasis Markov decision process (MDP).
-
Kontribusi utama
- Barto dan Sutton mengembangkan pendekatan algoritmik dasar untuk reinforcement learning, khususnya mencakup temporal-difference learning, metode policy gradient, dan representasi fungsi pembelajaran yang memanfaatkan jaringan saraf.
- Buku teks mereka, "Reinforcement Learning: An Introduction", masih digunakan sebagai referensi standar di bidang ini dan telah dikutip lebih dari 75.000 kali.
-
Penerapan praktis reinforcement learning
- Dalam 15 tahun terakhir, reinforcement learning telah mengalami kemajuan besar dengan dikombinasikan bersama algoritme deep learning. Contoh yang menonjol antara lain kemenangan AlphaGo di permainan Go dan pengembangan ChatGPT.
- Reinforcement learning telah berhasil diterapkan di berbagai bidang, termasuk pembelajaran keterampilan motorik robot, pengendalian kemacetan jaringan, perancangan chip, dan optimasi iklan internet.
-
Inspirasi neurosains bagi reinforcement learning
- Menurut penelitian terbaru, algoritme reinforcement learning tertentu yang dikembangkan di AI terbukti paling sesuai untuk menjelaskan sistem dopamin di otak manusia.
-
Penjelasan tentang ACM A.M. Turing Award
- Turing Award telah diberikan sejak 1966 untuk menghormati ilmuwan komputer dan insinyur yang memajukan industri teknologi informasi.
-
Penerima 2024 ACM A.M. Turing Award
- Andrew Barto adalah profesor emeritus Ilmu Informasi dan Komputer di University of Massachusetts Amherst dan telah menerima berbagai penghargaan.
- Richard Sutton adalah profesor ilmu komputer di University of Alberta, aktif di berbagai lembaga penelitian, dan telah menerima sejumlah penghargaan.
1 komentar
Komentar Hacker News
Keren sekali. Saya dan istri saya membeli rumah milik Andy Barto dan istrinya
Keren! Dia memang sangat layak mendapatkannya. Mereka menyediakan dua edisi buku teks RL dalam bentuk PDF gratis
Ini saat yang tepat untuk membaca ulang The Bitter Lesson
Sutton adalah seorang akselerasionis manusia, dan tidak peduli jika semua manusia mati. Dia tidak bisa dipercaya dan bukan sosok yang patut dirayakan
Akan lebih baik jika hadiahnya diberikan kepada para fisikawan
Mengejutkan bahwa Sutton tinggal di Edmonton, Kanada, bukan di AS
Mereka luar biasa, tetapi sayangnya buku AI karya Sutton dan Barto benar-benar buruk
Saya menggunakan buku RL mereka dalam mata kuliah yang saya ajarkan
Selamat yang setulus-tulusnya kepada Andrew Barto dan Richard Sutton atas Turing Award mereka
Ini memang sudah lama ditunggu. Mereka membawa gagasan ini dari awal sampai akhir, dan mengembangkannya menjadi satu bidang utuh, bukan sekadar subbab dalam buku dynamic programming