- Artikel tentang pentingnya secara historis makalah "Backpropagation Applied to Handwritten Zip Code Recognition" yang diterbitkan oleh Yann LeCun dkk. pada 1989; makalah ini dianggap sebagai salah satu contoh aplikasi praktis paling awal yang melatih jaringan saraf dari awal hingga akhir menggunakan backpropagation.
- Penulis mencoba mereproduksi pekerjaan dalam makalah tersebut dengan alat modern seperti PyTorch, dan mencatat bahwa jaringan aslinya diimplementasikan dalam Lisp menggunakan simulator backpropagation SN dari Bottou dan LeCun 1988 (yang kemudian dinamai Lush).
- Jaringan asli dilatih selama 3 hari pada workstation SUN-4/260, tetapi reproduksi oleh penulis menggunakan CPU MacBook Air (M1) hanya memerlukan sekitar 90 detik.
- Penulis juga bereksperimen dengan teknik deep learning modern seperti menggunakan optimizer Adam, memperkenalkan augmentasi data dan dropout, serta mengganti fungsi aktivasi tanh dengan ReLU, yang menurunkan tingkat kesalahan sekitar 60%.
- Penulis menyarankan bahwa peningkatan lebih lanjut dapat dicapai dengan memperbesar ukuran jaringan atau dataset, tetapi hal ini dapat meningkatkan biaya komputasi dan menyebabkan latensi inferensi.
- Dengan meninjau kemajuan deep learning selama 33 tahun terakhir, penulis menunjukkan bahwa prinsip dasarnya tetap sama, tetapi skala dataset dan model telah meningkat drastis, sementara waktu yang dibutuhkan untuk melatih model telah berkurang secara signifikan.
- Penulis berspekulasi bahwa pada 2055 jaringan saraf akan menjadi jauh lebih besar, dan sebagian besar aplikasi akan dicapai dengan menyetel halus sebagian kecil jaringan secara ringan, melalui prompt engineering, atau dengan mendistilasi data maupun model ke jaringan inferensi yang lebih kecil dan bertujuan khusus.
1 komentar
Opini Hacker News