LLaMA-rs - LLaMA yang diimplementasikan dengan Rust
(github.com/setzer22)- Proyek yang mem-porting
llama.cppke Rust - Mendukung model versi f16 atau 4-bit quantized
- Sama seperti versi asli, tetap menggunakan library tensor ggml sehingga performanya setara dengan versi original
1 komentar
Implementasi Rust untuk LLaMA juga ada, yaitu RLLaMA - Rust+OpenCL+AVX2.
llama.cpp - Inferensi model LLaMA Facebook dengan C/C++ murni