Moonshot AI merilis Kimi K2.7-Code.

(marktechpost.com)

3 poin oleh recast7838 2 hari lalu | 1 komentar | Bagikan ke WhatsApp

Moonshot AI telah merilis 'Kimi K2.7-Code', model coding berbobot terbuka yang berfokus pada agen, dengan peningkatan besar pada performa coding dibanding model sebelumnya dan pengurangan konsumsi token penalaran sebesar 30%.

Terjemahan lengkap

Minggu ini, Moonshot AI merilis Kimi K2.7-Code. Ini adalah model yang berfokus pada agen dan dioptimalkan untuk coding. Bobot model didistribusikan di Hugging Face di bawah lisensi MIT yang dimodifikasi. Model ini juga dapat digunakan melalui Kimi API dan Kimi Code. K2.7-Code ditujukan untuk tugas rekayasa perangkat lunak jangka panjang, bukan percakapan umum. Model ini menyusun rencana melalui banyak tahap, memodifikasi kode, menjalankan alat, dan melakukan debugging. Moonshot AI menawarkannya bersama platform coding berlangganan.

Spesifikasi Kimi K2.7-Code

K2.7-Code adalah model Mixture-of-Experts (MoE). Model ini memiliki total 1 triliun (1T) parameter, dan 32 miliar (32B) parameter aktif per token. Arsitektur ini menggunakan skema di mana 8 ahli dipilih per token dari total 384 ahli, dengan 1 ahli dibagikan. Totalnya terdiri dari 61 layer, termasuk 1 dense layer.

Mekanisme attention menggunakan MLA, dan jalur feedforward menerapkan SwiGLU. Vision encoder MoonViT menambahkan 400 juta (400M) parameter untuk input gambar dan video. Model ini tersedia dengan kuantisasi INT4 native. Jendela konteksnya adalah 256K token (262.144). Ada dua batasan. Thinking mode wajib digunakan, dan jika dinonaktifkan API akan mengembalikan error. Parameter sampling dikunci pada temperature 1.0, top_p 0.95, n 1, dan penalty 0.0. Output maksimum default adalah 32.768 token. Model ini dapat di-self-host menggunakan vLLM, SGLang, dan KTransformers. Ukuran repositori Hugging Face sangat besar, sekitar 595GB di disk. Ini menargetkan deployment kelas server, bukan model untuk laptop.

Skor benchmark

Tim Moonshot merilis hasil dari 6 benchmark. Mereka membandingkan K2.7-Code dengan K2.6, GPT-5.5, dan Claude Opus 4.8. K2.7-Code mengungguli K2.6 di semua kategori. Kenaikan terbesar di bidang coding terlihat pada Kimi Code Bench v2, naik dari 50,9% menjadi 62,0%.

K2.7-Code mencatat 81,1% pada benchmark MCP Mark Verified, mengungguli 76,4% milik Opus 4.8. Model ini juga mencatat hasil yang mendekati GPT-5.5 pada MLS Bench Lite. K2.7-Code dijalankan di Kimi Code CLI, sementara GPT-5.5 diuji dengan Codex xhigh dan Opus 4.8 diuji di lingkungan Claude Code xhigh.

1 komentar

cnaa97 1 hari lalu

Benar-benar luar biasa