11 poin oleh GN⁺ 2024-01-30 | 4 komentar | Bagikan ke WhatsApp
  • LLM berkinerja tinggi untuk pembuatan kode, dibangun dengan melakukan sampling lebih banyak data pada Llama 2 dengan dataset yang dioptimalkan untuk kode dan melatihnya lebih lama
  • Mencatat skor 67.8 pada HumanEval, menunjukkan performa terbaik di antara model terbuka
  • Sama seperti lisensi sebelumnya, dapat digunakan untuk tujuan riset maupun komersial
  • Tiga model
    • CodeLlama-70B
    • CodeLlama-70B-Python
    • CodeLlama-70B-Instruct
  • Kini tersedia dalam empat ukuran: 7B/13B/34B/70B

4 komentar

 
ragingwind 2024-01-30

Kalau bisa dijalankan secara lokal di M2 Max ke atas, sepertinya ini bakal jadi mainan terbaik.

 
xguru 2024-01-30

Kalau sudah dikuantisasi, sepertinya mungkin akan berjalan dengan baik. Kalau menunggu sebentar lagi, bukannya akan segera keluar?

 
xguru 2024-01-30

Tautan di atas adalah tautan untuk meminta akses ke Meta, tetapi di Hugging Face semuanya sudah dibuka sepenuhnya
https://huggingface.co/codellama

 
GN⁺ 2024-01-30
Komentar Hacker News
  • Mengembangkan plugin Jetbrains, CodeGPT, yang bisa dijalankan secara lokal. Plugin tersebut bisa dilihat di sini.
  • Modelnya bisa dilihat di Hugging Face: CodeLlama-70b-hf.
  • Seorang pengguna yang memakai ChatGPT dan GitHub Copilot penasaran bagaimana model-model seperti ini bisa dimanfaatkan di VS Code. Ada banyak ekstensi GPT untuk VS Code, tetapi kebanyakan tidak diperbarui atau berujung ke paket berbayar, sehingga ia merasa lebih baik tetap menggunakan GitHub Copilot.
  • Meta patut diapresiasi karena menunjukkan komitmen yang luar biasa terhadap machine learning open source.
  • Melihat betapa bagusnya model kode berukuran kecil, jadi penasaran kemampuan seperti apa yang akan ditunjukkan model 70B ini.
  • Banyak orang menyebut penggunaan 4090 dan model kecil, tetapi jarang terlihat analisis soal konsumsi energi. Saya rasa Microsoft sangat mensubsidi Copilot, dan jika seseorang menggunakan Copilot selama 30% dari waktunya dalam sehari, saya penasaran berapa kWh yang dikonsumsi model 7B atau 13B di 4090 dalam sebulan, serta berapa biaya energinya.
  • Penasaran apa model Copilot lokal terbaik saat ini, dan apakah ada ekstensi di vscode yang bisa memberikan pengalaman serupa. Karena punya 4090, saya berharap bisa menjalankan cukup banyak model.
  • Baptiste Roziere baru-baru ini memberikan presentasi yang sangat bagus tentang Code Llama, dan presentasinya bisa ditonton di sini.
  • Akan menarik jika ini bisa dijalankan secara lokal di perangkat seperti M2 Max dan berfungsi seperti Copilot melalui plugin IDE. Ini bisa menghemat waktu untuk menyelesaikan masalah membosankan di proyek atau menulis kode "boilerplate", sehingga bisa lebih fokus pada tugas rekayasa perangkat lunak yang lebih sulit.
  • Kemungkinan programmer rata-rata tidak punya perangkat yang mampu menjalankan ini pada kecepatan yang mereka butuhkan, jadi tidak begitu jelas plugin ini ditujukan untuk siapa. Meski begitu, ini tetap fitur yang keren.