SuperGemma4 - model Gemma 4 26B tanpa sensor/dengan peningkatan kecepatan/terkuantisasi dari Google
(huggingface.co)- Model khusus teks berbasis Gemma 4 26B IT yang dioptimalkan untuk Apple Silicon MLX dan dikuantisasi 4-bit, dengan ukuran sekitar 13GB
- Lebih pintar daripada versi asli, lebih cepat di mesin yang sama, serta model tanpa sensor yang stabil untuk kode, penggunaan alat, dan bahasa Korea
- Sebagai flagship khusus teks, fokus pada pemrosesan teks cepat alih-alih multimodal
- Quickbench meningkat ke 95,8 (versi asli 91,4) dan kecepatan generasi 8,7% lebih cepat (46,2 tok/s), sehingga waktu tunggu respons terasa jauh berkurang
- Sambil mempertahankan karakteristik tanpa sensor (uncensored) sebagai atribut inti, model ini tetap menghasilkan output yang stabil untuk kode, penggunaan alat, dan prompt bahasa Korea
- Skor pembuatan kode 98,6 (+6,3), menunjukkan hasil yang jauh lebih akurat daripada versi asli saat dipakai secara lokal untuk menulis atau me-refactor fungsi Python
- Skor prompt bahasa Korea 95,0 (+4,3), sehingga tetap bisa langsung dipakai tanpa rusak meski ditanya dalam bahasa Korea
- Kinerja pemrosesan bahasa Korea dan prompt bergaya agen lebih baik daripada versi asli
- Karena ini model tanpa sensor, nol jawaban yang tertahan oleh filter konten, sambil tetap menjaga output agar tidak tidak stabil atau rusak
- Bisa langsung digunakan untuk beban kerja/pipeline agen lokal seperti otomasi browser, pemanggilan alat, dan perencanaan
- Cara menjalankan:
mlx_lm.server --model Jiunsong/supergemma4-26b-uncensored-mlx-4bit-v2 --port 8080- Dukungan serving kompatibel OpenAI tersedia otomatis, tanpa perlu pengaturan template tambahan (bahkan jika memasukkan path ke
--chat-template, respons bisa rusak)
- MLX 4-bit, tensor BF16·U32, format Safetensors
8 komentar
Saya sedang memakai Heretic 31b yang ada di Hugging Face, tapi sepertinya saya juga harus mencoba yang ini.
Saya juga harus mencobanya sekali.
Terima kasih atas informasinya yang bagus.
Lisensinya berbeda dengan gemma4 yang asli.
Benar juga, ternyata bukan Apache 2.0
Di tab lisensi ada tautan ke Gemma 4, bisa dicek di mana?
Gila banget banget
Ada juga di Ollama
https://ollama.com/0xIbra/supergemma4-26b-uncensored-gguf-v2
Model 31b yang sedikit lebih besar juga ada
https://huggingface.co/Jiunsong/SuperGemma4-31b-abliterated-mlx-4bit
https://huggingface.co/Jiunsong/SuperGemma4-31b-abliterated-GGUF
Hehe, menarik juga karena ini model yang dibuat oleh komunitas lokal.