DeepMind merilis open source inti AlphaGo dan AlphaZero

xguru · 2023-02-17T14:33:34+09:00

Ada di dalam repo yang diberi nama Mctx (MCTS-in-JAX) Library yang sangat cepat yang mengimplementasikan algoritme Monte Carlo Tree Search (MCTS) secara native di JAX Algoritme pencarian yang memilih langkah terbaik dalam game berbasis giliran dengan pendekatan "seleksi → ekspansi → simulasi → pembaruan node pohon kebijakan" Ini adalah komponen paling kompleks di AlphaGo, dan membuatnya efisien sangatlah penting Digunakan bukan hanya di AlphaGo, tetapi juga di AlphaZero (Go, Chess, Shogi) dan MuZero (AlphaZero + game Atari)

Ada di dalam repo yang diberi nama Mctx (MCTS-in-JAX)
Library yang sangat cepat yang mengimplementasikan algoritme Monte Carlo Tree Search (MCTS) secara native di JAX
- Algoritme pencarian yang memilih langkah terbaik dalam game berbasis giliran dengan pendekatan "seleksi → ekspansi → simulasi → pembaruan node pohon kebijakan"
Ini adalah komponen paling kompleks di AlphaGo, dan membuatnya efisien sangatlah penting
Digunakan bukan hanya di AlphaGo, tetapi juga di AlphaZero (Go, Chess, Shogi) dan MuZero (AlphaZero + game Atari)

1 komentar

xguru 2023-02-17

Saya melihat tweet ini sendiri di HN: https://news.ycombinator.com/item?id=34801636
Sebenarnya repo ini sudah dibuka sekitar 1 tahun yang lalu, dan ada juga komentar yang mengkritik bahwa ini bukan keseluruhan AlphaGo sehingga judulnya dianggap clickbait.
Katanya, implementasi asli AlphaGo menggunakan TensorFlow/TPU, dan yang ini hanya reimplementasi dengan JAX.

DeepMind merilis open source inti AlphaGo dan AlphaZero

Bacaan terkait

1 komentar