SuperGemma4 - model Gemma 4 26B tanpa sensor/dengan peningkatan kecepatan/terkuantisasi dari Google

xguru · 2026-04-16T11:31:02+09:00

Model khusus teks berbasis Gemma 4 26B IT yang dioptimalkan untuk Apple Silicon MLX dan dikuantisasi 4-bit, dengan ukuran sekitar 13GB Lebih pintar daripada versi asli, lebih cepat di mesin yang sama, serta model tanpa sensor yang stabil untuk kode, penggunaan alat, dan bahasa Korea Sebagai flagship khusus teks, fokus pada pemrosesan teks cepat alih-alih multimodal Quickbench meningkat ke 95,8 (versi asli 91,4) dan kecepatan generasi 8,7% lebih cepat (46,2 tok/s), sehingga waktu tunggu respons terasa jauh berkurang Sambil mempertahankan karakteristik tanpa sensor (uncensored) sebagai atribut inti, model ini tetap menghasilkan output yang stabil untuk kode, penggunaan alat, dan prompt bahasa Korea Skor pembuatan kode 98,6 (+6,3), menunjukkan hasil yang jauh lebih akurat daripada versi asli saat dipakai secara lokal untuk menulis atau me-refactor fungsi Python Skor prompt bahasa Korea 95,0 (+4,3), sehingga tetap bisa langsung dipakai tanpa rusak meski ditanya dalam bahasa Korea Kinerja pemrosesan bahasa Korea dan prompt bergaya agen lebih baik daripada versi asli Karena ini model tanpa sensor, nol jawaban yang tertahan oleh filter konten, sambil tetap menjaga output agar tidak tidak stabil atau rusak Bisa langsung digunakan untuk beban kerja/pipeline agen lokal seperti otomasi browser, pemanggilan alat, dan perencanaan Cara menjalankan: mlx_lm.server --model Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2 --port 8080 Dukungan serving kompatibel OpenAI tersedia otomatis, tanpa perlu pengaturan template tambahan (bahkan jika memasukkan path ke --chat-template, respons bisa rusak) MLX 4-bit, tensor BF16·U32, format Safetensors

Model khusus teks berbasis Gemma 4 26B IT yang dioptimalkan untuk Apple Silicon MLX dan dikuantisasi 4-bit, dengan ukuran sekitar 13GB
Lebih pintar daripada versi asli, lebih cepat di mesin yang sama, serta model tanpa sensor yang stabil untuk kode, penggunaan alat, dan bahasa Korea
Sebagai flagship khusus teks, fokus pada pemrosesan teks cepat alih-alih multimodal
Quickbench meningkat ke 95,8 (versi asli 91,4) dan kecepatan generasi 8,7% lebih cepat (46,2 tok/s), sehingga waktu tunggu respons terasa jauh berkurang
Sambil mempertahankan karakteristik tanpa sensor (uncensored) sebagai atribut inti, model ini tetap menghasilkan output yang stabil untuk kode, penggunaan alat, dan prompt bahasa Korea
- Skor pembuatan kode 98,6 (+6,3), menunjukkan hasil yang jauh lebih akurat daripada versi asli saat dipakai secara lokal untuk menulis atau me-refactor fungsi Python
- Skor prompt bahasa Korea 95,0 (+4,3), sehingga tetap bisa langsung dipakai tanpa rusak meski ditanya dalam bahasa Korea
- Kinerja pemrosesan bahasa Korea dan prompt bergaya agen lebih baik daripada versi asli
- Karena ini model tanpa sensor, nol jawaban yang tertahan oleh filter konten, sambil tetap menjaga output agar tidak tidak stabil atau rusak
Bisa langsung digunakan untuk beban kerja/pipeline agen lokal seperti otomasi browser, pemanggilan alat, dan perencanaan
Cara menjalankan:
- mlx_lm.server --model Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2 --port 8080
- Dukungan serving kompatibel OpenAI tersedia otomatis, tanpa perlu pengaturan template tambahan (bahkan jika memasukkan path ke --chat-template, respons bisa rusak)
MLX 4-bit, tensor BF16·U32, format Safetensors

8 komentar

kohs100 2026-04-17

Saya sedang memakai Heretic 31b yang ada di Hugging Face, tapi sepertinya saya juga harus mencoba yang ini.

jjangdww 2026-04-16

Saya juga harus mencobanya sekali.
Terima kasih atas informasinya yang bagus.

asdfg 2026-04-16

Lisensinya berbeda dengan gemma4 yang asli.

fanotify 2026-04-16

Benar juga, ternyata bukan Apache 2.0

caniel 2026-04-17

Di tab lisensi ada tautan ke Gemma 4, bisa dicek di mana?

adieuxmonth 2026-04-16

Gila banget banget

sea715 2026-04-16

Hehe, menarik juga karena ini model yang dibuat oleh komunitas lokal.

SuperGemma4 - model Gemma 4 26B tanpa sensor/dengan peningkatan kecepatan/terkuantisasi dari Google

Bacaan terkait

8 komentar