- Dapat menggunakan berbagai LLM melalui REST API yang kompatibel dengan OpenAI
- Bisa berjalan tanpa GPU. Mendukung akselerasi GPU pada LLM yang kompatibel dengan llama.cpp
- Mendukung banyak model, serta transkripsi audio, pembuatan teks, dan pembuatan gambar (Stable Diffusion)
- Setelah dimuat sekali, model disimpan di memori untuk mendukung inferensi yang cepat
- Mendukung semua model yang kompatibel dengan ggml: llama, gpt4all, rwkv, whisper, vicuna, koala, gpt4all-j, cerebras, falcon, dolly, starcoder,..
Belum ada komentar.