- Ada di dalam repo yang diberi nama Mctx (MCTS-in-JAX)
- Library yang sangat cepat yang mengimplementasikan algoritme Monte Carlo Tree Search (MCTS) secara native di JAX
- Algoritme pencarian yang memilih langkah terbaik dalam game berbasis giliran dengan pendekatan "seleksi → ekspansi → simulasi → pembaruan node pohon kebijakan"
- Ini adalah komponen paling kompleks di AlphaGo, dan membuatnya efisien sangatlah penting
- Digunakan bukan hanya di AlphaGo, tetapi juga di AlphaZero (Go, Chess, Shogi) dan MuZero (AlphaZero + game Atari)
1 komentar
Saya melihat tweet ini sendiri di HN: https://news.ycombinator.com/item?id=34801636
Sebenarnya repo ini sudah dibuka sekitar 1 tahun yang lalu, dan ada juga komentar yang mengkritik bahwa ini bukan keseluruhan AlphaGo sehingga judulnya dianggap clickbait.
Katanya, implementasi asli AlphaGo menggunakan TensorFlow/TPU, dan yang ini hanya reimplementasi dengan JAX.