- Co-founder sekaligus CSO Thomas Wolf berlatar belakang fisika & hukum
- Daftar bacaan yang ia baca saat masuk ke bidang NLP/AI/ML pada 2016–17
- Artinya, perlu diingat bahwa ini adalah masa sebelum revolusi ChatGPT/Transformer/Diffusion
- Buku "Deep Learning" adalah referensi yang baik untuk mendapatkan gambaran cepat tentang alat-alat yang digunakan saat ini
- "Artificial Intelligence: A Modern Approach" adalah referensi yang sangat baik untuk semua alat dan metode sebelum era jaringan saraf
- "Machine Learning: A Probabilistic Perspective" adalah referensi yang sangat baik untuk mendalami pendekatan probabilistik dan mendapatkan paparan yang baik terhadap alat-alat Bayesian
- "Information Theory, Inference and Learning Algorithms" adalah permata kecil yang menjelaskan probabilitas dan teori informasi dengan kejernihan yang hampir sulit dipercaya
- "The Book of Why: The New Science of Cause and Effect" adalah pengantar yang baik tentang kausalitas
- "Reinforcement Learning: An Introduction(Pembelajaran Penguatan yang Kokoh)" adalah referensi yang sangat baik untuk mendapatkan pengantar tentang reinforcement learning
- Ada tiga referensi yang sangat bagus tentang pemrosesan bahasa alami yang menurutnya menarik
- Ia melengkapinya dengan beberapa kursus online
- Jika bergabung ke bidang ini setelah revolusi Transformer dan pelatihan skala besar, kemungkinan Anda akan ingin menempuh jalur yang berbeda
- Beberapa saran untuk 2024:
- Baca buku kami tentang NLP dan Transformer, Natural Language Processing with Transformers. Meskipun ditulis sebelum ChatGPT, buku ini masih sangat relevan dan di bagian akhir juga membahas pelatihan LLM
- Ikuti beberapa kelas online tentang deep learning dari tokoh-tokoh terkenal di bidang ini
- Anda tetap bisa membaca beberapa buku dari daftar di atas untuk wawasan umum, dan khususnya saya masih menganggap "Information Theory, Inference and Learning Algorithms" sebagai permata
- Bergabunglah dengan Hugging Face untuk belajar lewat praktik :)
4 komentar
Namanya terasa agak familiar, jadi saya cek dan ternyata saya pernah melihat bahwa sekitar akhir Maret dia merilis video tentang tren pengembangan model LLM. (Saya sendiri masih belum menontonnya sampai habis T_T)
Ini adalah video YouTube berjudul 'A Little guide to building Large Language Models in 2024', yang membahas berbagai aspek mulai dari persiapan data untuk pengembangan LLM hingga metode pelatihan/evaluasi.
Video: https://youtube.com/watch/…
Slide: https://docs.google.com/presentation/d/…
⚠️Iklan⚠️ Tulisan rangkumannya: https://discuss.pytorch.kr/t/2024-llm/3890
<Deep Learning> - Ian Goodfellow, Yoshua Bengio, Aaron Courville http://aladin.kr/p/OLwph
<Artificial Intelligence 1~2 - 2 jilid lengkap> - Stuart Russell, Peter Norvig http://aladin.kr/p/g4yZY
<Machine Learning machine learning> - Kevin Murphy http://aladin.kr/p/RGGL8
<Information Theory, Inference and Learning Algorithms (Hardcover)> - David MacKay http://aladin.kr/p/LFEp0
<The Book of Why: The New Science of Cause and Effect (Paperback)> - Dana Mackenzie, Judea Pearl http://aladin.kr/p/cLywB
<Reinforcement Learning yang Kokoh> - Richard Sutton, Andrew Barto http://aladin.kr/p/3NQoU
Natural Language Processing with Representation Learning - Kyunghyun Cho
https://github.com/nyu-dl/NLP_DL_Lecture_Note/…
<Neural Network Methods in Natural Language Processing (Paperback)> - Yoav Goldberg http://aladin.kr/p/non6R
<Dasar-Dasar Pemrosesan Bahasa Alami> - Jacob Eisenstein http://aladin.kr/p/rPoLB
Terima kasih sudah merangkumnya!!
Saya juga menyalin daftar yang Anda susun sambil membagikan tulisannya; jika Anda tidak berkenan, saya akan menghapusnya. 🙇♂️
https://discuss.pytorch.kr/t/gn-huggingface-ai-txt/4439/2
Terima kasih T_T