Belajar AI dengan Excel
- Mempelajari cara kerja AI melalui LLM nyata yang diimplementasikan di Excel
- Mengimplementasikan forward pass GPT-2 hanya dengan fungsi Excel tanpa pemanggilan API eksternal
- Bertujuan menunjukkan bahwa jika Anda bisa memahami spreadsheet, Anda bisa memahami AI
- Pelajaran 1: Memahami GPT dengan Excel
- Pelajaran 2: Byte Pair Encoding dan tokenisasi
- Tambahan: melihat detail implementasi Excel secara mendalam (ditujukan bagi yang memahami Transformers)
- Tersedia dalam format XLSB (Excel Binary) sehingga bisa diunduh dan dijalankan (bisa di Mac/Windows, tetapi Windows direkomendasikan)
- Batasan implementasi
- Model GPT2 kecil lengkap (124M parameter), termasuk tahap BPE, multi-head attention, dan multilayer perceptron
- Hanya mendukung inferensi/forward pass (tanpa pelatihan)
- Konteks dibatasi pada panjang 10 token
- Batas 10 karakter per kata
- Hanya mendukung keluaran zero temperature
FAQ
- Tentang Google Sheets: proyek ini dimulai di Google Sheets, tetapi seluruh model menjadi terlalu besar sehingga dipindahkan ke Excel. Cara agar tetap berjalan di Google Sheets masih dieksplorasi, tetapi kemungkinan tidak akan cocok sebagai satu file seperti di Excel.
- Mengapa tidak bisa dipakai bercakap-cakap seperti ChatGPT: selain panjang konteks yang sangat pendek, proyek ini juga tidak memiliki instruction tuning dan reinforcement learning from human feedback (RLHF) yang dibutuhkan untuk menjadikannya chatbot interaktif.
- Asal nama: nama "Spreadsheets-are-all-you-need" merupakan permainan dari judul makalah terkenal "Attention Is All You Need", yang pertama kali menjelaskan arsitektur pembelajaran mesin Transformer.
Pendapat GN⁺
- Proyek ini membantu meningkatkan aksesibilitas terhadap AI dan machine learning. Dengan memakai alat yang akrab seperti Excel untuk memahami teknologi yang kompleks, proyek ini memberi kesempatan bagi nonspesialis untuk mempelajari prinsip dasar AI.
- Implementasi melalui Excel berguna untuk memahami secara visual bagaimana model AI nyata bekerja, tetapi bukan sesuatu yang digunakan untuk pengembangan AI yang sebenarnya. Karena itu, mempelajari AI dengan cara ini tidak serta-merta menjadikan seseorang pengembang AI profesional.
- Alat pembelajaran seperti ini dapat meningkatkan minat publik terhadap AI dan berkontribusi pada demokratisasi teknologi AI. Namun, saat membangun sistem AI nyata, tetap dibutuhkan alat dan framework yang lebih profesional.
- Proyek serupa untuk tujuan edukasi antara lain Google Machine Learning Crash Course atau kursus Machine Learning oleh Profesor Andrew Ng di Coursera. Kursus-kursus ini menggabungkan teori dan praktik untuk memberikan pembelajaran yang lebih mendalam.
- Saat mengadopsi teknologi ini, penting untuk memahami bahwa pendekatannya berbeda dari pengembangan model AI yang sebenarnya. Proyek ini berfokus pada tujuan pendidikan, dan dalam proyek pengembangan AI nyata umumnya digunakan framework AI profesional seperti TensorFlow dan PyTorch.
2 komentar
Opini Hacker News
Sapaan dan ucapan terima kasih dari kreator
Mengajarkan jaringan saraf dengan spreadsheet
Menjelaskan jaringan saraf dengan spreadsheet
Berbagi tautan spreadsheet
Pertanyaan tentang perlunya RLHF
Kekaguman pada cara GPT-2 diimplementasikan di spreadsheet
Kemungkinan mengimplementasikan GPT-3 atau GPT-4 di spreadsheet
Proyek hebat yang membantu memahami LLM
Berbagi contoh penyelesaian PDE di Excel
Perusahaan AI dengan bank investasi sebagai pelanggan