- Artikel terbaru dari MIT Technology Review memperkenalkan gagasan membandingkan LLM lokal dengan Wikipedia cadangan offline
- Ukuran file model LLM utama di pustaka Ollama dan kapasitas bundel Wikipedia offline yang disediakan Kiwix dibandingkan secara langsung
- File LLM dan data Wikipedia memiliki tujuan, kekuatan, dan kelemahan yang berbeda sehingga sulit dibandingkan secara sederhana, tetapi ada perbedaan menarik dari sisi kapasitas
- Beberapa LLM (model 1~4GB) lebih besar daripada Simple English Wikipedia (sekitar 1GB), dan Wikipedia penuh (57GB) lebih besar daripada LLM besar (20~32GB)
- Selain ukuran file, perlu dipertimbangkan hal-hal praktis seperti kebutuhan memori dan CPU, dan pilihan bisa berbeda tergantung tujuan penggunaan sebenarnya
Perbandingan LLM Lokal dan Wikipedia Offline
Pendahuluan dan Latar Belakang Perbandingan
- MIT Technology Review baru-baru ini memperkenalkan artikel berjudul "How to run an LLM on your laptop"
- Artikel tersebut menekankan bahwa menjalankan LLM secara lokal memungkinkan pemanfaatan pengetahuan bahkan di lingkungan offline
- Perumpamaan Simon Willison sangat berkesan: "LLM offline itu seperti versi ringkasan dan tidak lengkap dari Wikipedia; dalam situasi kiamat, jika hanya ada USB, itu bisa membantu me-reboot peradaban"
Perbandingan Ukuran Model dan Data
- Ukuran file berbagai model LLM di pustaka Ollama dibandingkan dengan bundel Wikipedia offline yang disediakan oleh Kiwix
- Untuk perbandingan ini, cakupan dibatasi pada model yang dapat dijalankan pada perangkat keras konsumen umum dan data Wikipedia tanpa gambar
- Hasil perbandingan utama adalah sebagai berikut:
- Versi ringkasan terkecil
- Best of Wikipedia (50 ribu artikel teratas, versi ringkasan): 356.9MB
- Simple English Wikipedia (versi ringkasan): 417.5MB
- Model LLM representatif (kecil)
- Qwen 3 0.6B: 523MB
- Deepseek-R1 1.5B: 1.1GB
- Llama 3.2 1B: 1.3GB
- Model LLM representatif (menengah-besar)
- Deepseek-R1 8B / Qwen 3 8B: 5.2GB
- Gemma3n e4B: 7.5GB
- Deepseek-R1 14B: 9GB
- Qwen 3 14B: 9.3GB
- Wikipedia penuh
- Wikipedia (penuh): 57.18GB
- 50 ribu artikel teratas Wikipedia sangat kecil, hanya 356.9MB
- LLM terkecil (0.6B, Qwen) berukuran 523MB, lebih besar daripada versi ringkasan Wikipedia sederhana
- Wikipedia penuh (57.18GB) jauh lebih besar daripada LLM terbesar (20GB)
Batasan Perbandingan dan Hal yang Perlu Dipertimbangkan
- Sulit dibandingkan secara langsung: ensiklopedia (data) dan LLM (model generatif) pada dasarnya berbeda dalam tujuan dan struktur
- Ukuran file bukan satu-satunya hal penting: selain ukuran file, LLM juga membutuhkan memori dan sumber daya CPU saat dijalankan. Wikipedia offline lebih mudah dijalankan di perangkat berspesifikasi rendah
- Kegunaan berdasarkan tujuan nyata: misalnya, Anda bisa hanya mengunduh bidang kimia, atau menggunakan LLM yang dioptimalkan untuk perangkat keras tertentu
- Subjektivitas kriteria pemilihan: pemilihan item yang digunakan untuk perbandingan bersifat subjektif
Kesimpulan dan Implikasi
- 50 ribu artikel teratas Wikipedia dan model Llama 3.2 3B memiliki ukuran file yang kurang lebih serupa
- Bundel Wikipedia terkecil bahkan lebih kecil daripada LLM terkecil, sedangkan file Wikipedia penuh lebih besar daripada LLM terbesar
- Di lingkungan dengan penyimpanan yang cukup, layak juga mempertimbangkan untuk mengunduh dan memanfaatkan baik LLM maupun data Wikipedia
1 komentar
Komentar Hacker News
gpgkeydiarahkan kehttp, sehingga keamanan jadi bolongwikipedia_en_all_maxi_2024-01.zim, lalu ingin mengekstrak halamannya dengan libzim dan menghubungkannya ke LLM. File zim menyimpan halaman dalam HTML dan ukurannya sekitar 100GB. Alasannya, saya ingin mencocokkan daftar game yang tersimpan massal di HDD saya (hanya judul, tanpa kategori terpisah) dengan artikel Wikipedia untuk menyusunnya berdasarkan genre atau informasi lain. Dari percobaan saya, LLM (Mistral Small 3.2 quantized) ternyata sangat bagus dalam merapikan kekacauan seperti itu. Ia juga bisa dijalankan cepat dari skrip kustom dengan llama.cpp