Perombakan vLLM Recipes - konfigurasi per kombinasi model+hardware dalam sekali klik

recipes.vllm.ai telah dirombak besar-besaran. Dengan vLLM, Anda bisa mendapatkan jawaban secara interaktif untuk pertanyaan “bagaimana menjalankan model X di hardware Y?”.

Perubahan utama

URL mirror HuggingFace — ganti huggingface.co menjadi recipes.vllm.ai untuk langsung masuk ke resep model tersebut (contoh: recipes.vllm.ai/Qwen/Qwen3.6-35B-A3B)

Interactive command builder — pilih hardware, variant, dan strategi paralelisasi untuk menghasilkan perintah vllm serve yang siap dipakai

Hardware plug-in — beralih NVIDIA(Hopper/Blackwell)↔AMD(MI300X/MI355X) dengan satu klik, dengan flag dan environment variable diterapkan otomatis

JSON API — semua resep disediakan melalui path /.json sehingga bisa langsung dikonsumsi oleh agen dan alat otomasi

Berkontribusi resep dengan agent skill

Repository ini menyertakan agent skill, sehingga Anda dapat berkontribusi resep baru secara end-to-end. Mulai dari menjalankan benchmark hingga membuat resep dan mengirim PR, agen akan memandu prosesnya.

→ github.com/vllm-project/recipes

4 komentar

hmmhmmhm 2026-04-23

Sebentar lagi bakal bisa deploy ke perangkat apa pun cuma dengan sekali klik ya... ngeri juga wkwk

darjeeling 2026-04-23

Sepertinya sekarang semuanya untuk penggunaan layanan akan bermunculan.

arthurk 2026-04-23

Sepertinya masih banyak model yang belum tersedia.