8 poin oleh xguru 2023-02-17 | 1 komentar | Bagikan ke WhatsApp
  • Ada di dalam repo yang diberi nama Mctx (MCTS-in-JAX)
  • Library yang sangat cepat yang mengimplementasikan algoritme Monte Carlo Tree Search (MCTS) secara native di JAX
    • Algoritme pencarian yang memilih langkah terbaik dalam game berbasis giliran dengan pendekatan "seleksi → ekspansi → simulasi → pembaruan node pohon kebijakan"
  • Ini adalah komponen paling kompleks di AlphaGo, dan membuatnya efisien sangatlah penting
  • Digunakan bukan hanya di AlphaGo, tetapi juga di AlphaZero (Go, Chess, Shogi) dan MuZero (AlphaZero + game Atari)

1 komentar

 
xguru 2023-02-17

Saya melihat tweet ini sendiri di HN: https://news.ycombinator.com/item?id=34801636
Sebenarnya repo ini sudah dibuka sekitar 1 tahun yang lalu, dan ada juga komentar yang mengkritik bahwa ini bukan keseluruhan AlphaGo sehingga judulnya dianggap clickbait.
Katanya, implementasi asli AlphaGo menggunakan TensorFlow/TPU, dan yang ini hanya reimplementasi dengan JAX.