- Buku ini bertujuan memperkenalkan konsep dasar, permasalahan, dan algoritme reinforcement learning dengan cara yang ramah secara matematis.
- Tidak hanya menjelaskan prosedur algoritme, tetapi juga menerangkannya dari sudut pandang matematis agar pembaca dapat memahami mengapa algoritme tersebut dirancang dan mengapa efektif.
- Kedalaman matematikanya diatur pada tingkat yang sesuai, serta menyediakan contoh yang dapat dibaca secara selektif oleh pembaca.
- Buku ini membantu pembaca memahami ide inti algoritme dengan lebih baik dengan memisahkannya dari elemen-elemen yang kompleks.
- Setiap bab disusun berdasarkan bab sebelumnya dan menyediakan landasan untuk bab berikutnya.
Isi
- Buku ini terdiri dari 10 bab dan dibagi menjadi dua bagian tentang alat dasar dan algoritme.
- Setiap bab saling terkait, sehingga perlu mempelajari bab-bab awal terlebih dahulu.
Pembaca sasaran
- Buku ini ditujukan bagi mahasiswa tingkat akhir, mahasiswa pascasarjana, peneliti, dan praktisi yang tertarik pada reinforcement learning.
- Buku ini dimulai dari konsep dasar agar dapat dipahami bahkan tanpa pengetahuan latar belakang tentang reinforcement learning.
- Diperlukan pengetahuan tentang teori probabilitas dan aljabar linear, dan dasar matematika yang diperlukan disertakan dalam lampiran.
Video kuliah
- Pembelajaran dapat menjadi lebih baik dengan menggabungkan buku dan video kuliah.
- Video kuliah berbahasa Mandarin dapat dilihat di kanal Bilibili dan kanal YouTube, dan hingga Februari 2025 telah mencatat lebih dari 1.300.000 penayangan.
- Video kuliah berbahasa Inggris diunggah ke YouTube.
Tentang penulis
- Informasi penulis dapat dilihat di situs pribadi dan situs web grup riset.
- Sejak 2019, penulis mengajar mata kuliah pascasarjana tentang reinforcement learning, dan buku ini disiapkan sebagai catatan kuliah.
- Penulis berharap buku ini membantu pembaca memasuki bidang reinforcement learning dengan lancar.
Sitasi
- Judul buku: "Mathematical Foundations of Reinforcement Learning"
- Penulis: S. Zhao
- Tahun terbit: 2025
- Penerbit: Springer Nature Press dan Tsinghua University Press
Riwayat pembaruan
- Februari 2025: meraih 5.000+ bintang
- Desember 2024: meraih 4.000+ bintang
- Oktober 2024: desain sampul buku selesai
- September 2024: revisi final sebelum penerbitan Springer
- Agustus 2024: meraih 3.000+ bintang dan menambahkan kode
- Juni 2024: revisi final sebelum penerbitan
- April 2024: menambahkan kode lingkungan Grid World
- Maret 2024: meraih 2.000 bintang
- Maret 2024: draf versi ketiga online
- September 2023: meraih 1.000+ bintang
- Agustus 2023: draf versi kedua online
- November 2022: dijadwalkan diterbitkan bersama oleh Springer Nature dan Tsinghua University Press
- Oktober 2022: catatan kuliah dan video tersedia online
- Agustus 2022: draf pertama online
2 komentar
Terima kasih telah memperkenalkan materi yang bagus.
Komentar Hacker News
Pada era OpenAI Gym, reinforcement learning (RL) punya keunggulan besar karena mudah diakses oleh pemula. Kita bisa belajar RL sebagai hobi di lingkungan kecil dan mencoba menerapkannya pada masalah sederhana seperti Cartpole. Saya penasaran apakah ada tugas atau lingkungan belajar RL yang serupa dan mudah diakses, tetapi terkait dengan LLMs. Saya juga penasaran apakah ada hal yang bisa dilakukan di ranah LLM x RL hanya dengan MacBook Air biasa
Sumber bagus lainnya untuk RL adalah kumpulan buku teks karya Mykel Kochenderfer
Buku ini mengatakan bahwa pembaca perlu memiliki pengetahuan tentang teori probabilitas dan aljabar linear. Kalimat seperti ini selalu harus dibaca dengan sedikit skeptis dan dengan pemahaman bahwa itu ditulis oleh para penggemar matematika. Programmer rata-rata dengan kemampuan matematika rata-rata perlu berhati-hati
Saya tidak tahu bagaimana memahami materi ini bisa membantu mendapatkan pekerjaan di bidang ini. Untuk saat ini saya tetap menjadi software engineer (SWE)