Ikhtisar Project Dojo milik Tesla
(perspectives.mvdirona.com)<p>Tulisan dari James Hamilton, VP di AWS<br />
- Sistem machine learning Dojo menarik dari 3 sisi <br />
1. Jaringan berskala besar <br />
→ Setiap chip D1 menyediakan networking 16.000Gbps (4 kanal 4Tbps), dan digabungkan menjadi MCM 25-chip (Multi-Chip Modules) untuk menyediakan bandwidth 36.000Gbps (4x 9Tb)<br />
2. Rasio memori terhadap komputasi yang sangat kecil <br />
→ Setiap chip D1 memiliki 354 unit fungsional, dan tiap unit hanya punya 1,25 mega SRAM serta tidak memiliki DRAM, sehingga satu chip D1 bahkan memiliki memori kurang dari setengah 1 giga (442,5Mb)<br />
→ Menempatkan pool DRAM besar di ujung rack berisi 5 unit, dan rack komputasinya sendiri tidak memiliki DRAM<br />
→ Jika dipikirkan bagaimana sistem ini bisa bekerja dengan memori sesedikit itu, kemungkinan ini adalah kombinasi dari bandwidth jaringan yang sangat besar dan sistem yang dirancang untuk menjalankan model vision yang memakai memori jauh lebih sedikit dibanding tugas training ML umum lainnya<br />
3. Kepadatan daya yang sangat tinggi <br />
→ Setiap chip D1 hanya mengonsumsi 400W, yang merupakan perkiraan mutakhir untuk ukuran ini, tetapi ini digabungkan ke dalam MCM 25-chip yang cukup rapat sehingga hanya mengonsumsi 15kw (10kw untuk D1 dan 5kw untuk voltage regulator)<br />
→ Dengan begitu, sistem training Dojo 10-rack yang terisi penuh mencapai 1,8 megawatt <br />
→ Dari sudut pandang skala, data center berukuran menengah biasanya beroperasi di kisaran 30~40 megawatt<br />
<br />
- Meski bagian kecil, menempatkan VRD (Voltage Regulator Down) langsung di tile tampaknya merupakan upaya yang baik untuk menyuplai daya 52V yang luar biasa tinggi. Bahkan dengan konsumsi daya 15Kw, pada 52V masih tetap mengonsumsi 288A<br />
- 354 unit fungsional digabungkan dalam satu chip D1 berukuran 645mm^2. 25 chip D1 membentuk modul multi-chip yang disebut training tile, 12 training tile membentuk rack, dan 10 rack mengisi Exapod.<br />
- "Sistem yang sangat inovatif"</p>
1 komentar