Llama2.c: Kode inferensi Llama 2 yang ditulis dalam C murni
(github.com/karpathy)- Tulisan ini adalah penjelasan yang dibuat secara otomatis menggunakan GPT-4, sehingga mungkin mengandung kekeliruan. :smile:
- Jika Anda menemukan informasi yang keliru, mohon beri tahu melalui komentar! :bowing_man:
Perkenalan
Llama2.c adalah implementasi inferensi Llama 2 dalam C murni yang dikembangkan oleh Andrej Karpathy. Proyek ini merupakan pustaka ringan untuk inferensi model machine learning, ditulis dalam bahasa C sehingga dapat digunakan di berbagai platform. Pustaka ini dirancang khusus agar berjalan cepat di CPU, terutama untuk model-model kecil.
Ringkasan
Pustaka ini adalah pustaka ringan untuk inferensi model machine learning, ditulis dalam bahasa C sehingga dapat digunakan di berbagai platform. Pustaka ini dirancang khusus agar berjalan cepat di CPU, terutama untuk model-model kecil. Pustaka ini dirancang khusus agar berjalan cepat di CPU, terutama untuk model-model kecil.
Proyek ini menyediakan berbagai opsi optimasi, sehingga pengguna dapat menjalankan kode lebih cepat sesuai sistemnya. Misalnya, dapat digunakan opsi kompilasi seperti -O3, -Ofast, -ffast-math, -funsafe-math-optimizations, -march=native. Opsi-opsi ini mencakup optimasi seperti vektorisasi, loop unrolling, prediksi percabangan, dan beberapa di antaranya bahkan dapat melanggar spesifikasi C/IEEE.
Proyek ini masih dalam pengembangan dan masih ada beberapa masalah yang perlu diselesaikan. Misalnya, alasan adanya spasi di depan saat menjalankan ./run pada kode sampling C, dukungan multi-query untuk model-model kecil, serta dukungan inferensi yang melampaui panjang urutan maksimum.
Referensi
- Opsi optimasi GCC: Anda dapat mempelajari berbagai opsi optimasi GCC secara lebih rinci.
- Floating point math di GCC: Anda dapat memperoleh informasi lebih rinci tentang opsi
-ffast-mathdan-funsafe-math-optimizations. - GitHub Andrej Karpathy: Anda dapat melihat proyek-proyek lain dari Andrej Karpathy.
- Lisensi Llama2.c: Anda dapat melihat lisensi MIT untuk proyek ini.
- Daftar kontributor Llama2.c: Anda dapat melihat orang-orang yang berkontribusi pada proyek ini.
1 komentar
Baca lebih lanjut