Ilya Sutskever: "Jika Anda mempelajari semua ini, Anda akan mengetahui 90% hal yang penting"
(reddit.com)Ilya Sutskever membagikan daftar bacaan yang direkomendasikan terkait machine learning/AI
- The Annotated Transformer
- The First Law of Complexodynamics
- The Unreasonable Effectiveness of RNNs
- Understanding LSTM Networks
- Recurrent Neural Network Regularization
- Keeping Neural Networks Simple by Minimizing the Description Length of the Weights
- Pointer Networks
- ImageNet Classification with Deep CNNs
- Order Matters: Sequence to sequence for sets
- GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism
- Deep Residual Learning for Image Recognition
- Multi-Scale Context Aggregation by Dilated Convolutions
- Neural Quantum Chemistry
- Attention Is All You Need
- Neural Machine Translation by Jointly Learning to Align and Translate
- Identity Mappings in Deep Residual Networks
- A Simple NN Module for Relational Reasoning
- Variational Lossy Autoencoder
- Relational RNNs
- Quantifying the Rise and Fall of Complexity in Closed Systems: The Coffee Automaton
- Neural Turing Machines
- Deep Speech 2: End-to-End Speech Recognition in English and Mandarin
- Scaling Laws for Neural LMs
- A Tutorial Introduction to the Minimum Description Length Principle
- Machine Super Intelligence Dissertation
- PAGE 434 onwards: Komogrov Complexity
- CS231n Convolutional Neural Networks for Visual Recognition
Kumpulan tautan: https://arc.net/folder/D0472A20-9C20-4D3F-B145-D2865C0A9FEE
3 komentar
Sepertinya ada masalah pada crawling bot Neo.
Sepertinya Reddit memblokirnya. Jadi saya masukkan secara manual ;)
Opini Hacker News
Ringkasan kumpulan komentar Hacker News
Judulnya mengecilkan cakupan tugas ini. Jika Anda membuka untuk melihat isinya:
Beberapa waktu lalu saya juga menyalin daftar itu di tautan agar lebih mudah di-
wget(misalnya mengambil semua PDF arXiv)wget.pdfuniteuntuk menggabungkannya menjadi satu PDF, lalu mencetaknya sebagai buku spiral di percetakan. Hasilnya sangat bagus.Perlu diingat, tidak ada konfirmasi bahwa ini adalah daftar yang sebenarnya.
Berapa lama waktu yang dibutuhkan untuk mempelajari prasyaratnya agar bisa mempelajari semua ini jika Anda belum punya latar belakang CS?
Yang sering dilupakan orang adalah tanpa tujuan yang jelas dan nyata, sebanyak apa pun paper inti atau menarik yang Anda baca, Anda tetap tidak akan mengingat apa pun.
Ada beberapa diskusi lama tentang ini, sejak Oktober 2022. Saya penasaran seberapa usang daftar ini sekarang.
Gagasan bahwa ini hanyalah folder bookmark seseorang cukup masuk akal. Mana buktinya bahwa ini direkomendasikan oleh Ilya?
Klaim bahwa ini mencakup 90% hal yang penting dalam ML terdengar agak berani.
Tidak ada apa pun di sini tentang LLM, padahal in-context learning, retrieval augmentation, penggunaan tool, dan multimodality benar-benar sedang berkembang pesat.
Membaca 30 studi tidak berarti “sudah belajar dan paham”. Terutama jika Anda mulai dari nol.