30 poin oleh xguru 2023-12-04 | 4 komentar | Bagikan ke WhatsApp
  • Mendukung menjalankan LLM dengan mudah di sebagian besar komputer tanpa instalasi, hanya dengan 1 file
  • Framework yang menggabungkan llama.cpp dan Cosmopolitan Libc
    • Satu build dapat dijalankan di berbagai OS dan beragam arsitektur CPU
  • Menyediakan model LLaVA yang mendukung chat dan pengenalan gambar sebagai contoh
    • Cukup unduh dan jalankan file 4GB llava-v1.5-7b-q4-server.llamafile
    • Untuk Mac/Linux/BSD, jalankan chmod +x lalu eksekusi langsung
    • Untuk Windows, tambahkan .exe setelah ekstensi lalu jalankan langsung
    • Saat dijalankan, browser akan terbuka otomatis dan menampilkan antarmuka chat
  • Juga menyediakan llamafile lain seperti Mistral-7B-Instruct dan WizardCoder-Python-13B

4 komentar

 
edunga1 2023-12-19

curl --location https://huggingface.co/jartine/llava-v1.5-7B-GGUF/… > llamafile

Saya sangat terkejut karena cukup dengan satu perintah curl, ini bisa langsung dijalankan..

 
cosine20 2023-12-08

Wah, gila banget wkwkwk

 
ragingwind 2023-12-04

Ternyata memang bisa dijalankan dengan sangat mudah.

 
xguru 2023-12-04

Sudah pernah naik di GN⁺, tetapi mungkin karena pengantar dari ringkasan AI kurang memadai, topik ini kurang populer, jadi saya rangkum sekali lagi. Menurut saya ini percobaan yang cukup menarik.
Melalui "Llamafile", LLM dapat didistribusikan dan dijalankan sebagai satu file tunggal

Model dasarnya adalah LLaVA: Visual Instruction Tuning

Saat pertama kali diumumkan terasa seperti proyek iseng, tetapi ternyata Cosmopolitan dan Redbean juga bisa dipakai seperti ini. Sepertinya ini akan menjadi kasus penggunaan yang sangat bagus.