Perombakan vLLM Recipes - konfigurasi per kombinasi model+hardware dalam sekali klik
(recipes.vllm.ai)recipes.vllm.ai telah dirombak besar-besaran. Dengan vLLM, Anda bisa mendapatkan jawaban secara interaktif untuk pertanyaan “bagaimana menjalankan model X di hardware Y?”.
Perubahan utama
URL mirror HuggingFace — ganti huggingface.co menjadi recipes.vllm.ai untuk langsung masuk ke resep model tersebut (contoh: recipes.vllm.ai/Qwen/Qwen3.6-35B-A3B)
Interactive command builder — pilih hardware, variant, dan strategi paralelisasi untuk menghasilkan perintah vllm serve yang siap dipakai
Hardware plug-in — beralih NVIDIA(Hopper/Blackwell)↔AMD(MI300X/MI355X) dengan satu klik, dengan flag dan environment variable diterapkan otomatis
JSON API — semua resep disediakan melalui path /.json sehingga bisa langsung dikonsumsi oleh agen dan alat otomasi
Berkontribusi resep dengan agent skill
Repository ini menyertakan agent skill, sehingga Anda dapat berkontribusi resep baru secara end-to-end. Mulai dari menjalankan benchmark hingga membuat resep dan mengirim PR, agen akan memandu prosesnya.
→ github.com/vllm-project/recipes
4 komentar
Sebentar lagi bakal bisa deploy ke perangkat apa pun cuma dengan sekali klik ya... ngeri juga wkwk
Sepertinya sekarang semuanya untuk penggunaan layanan akan bermunculan.
Sepertinya masih banyak model yang belum tersedia.
Jadi, ini tampaknya kesempatan bagus untuk berkontribusi.