-
R1 1776 adalah model open-source yang merupakan hasil fine-tuning model penalaran DeepSeek-R1 oleh Perplexity AI untuk menghapus sensor Partai Komunis Tiongkok.
-
Model ini ditujukan untuk menyediakan informasi akurat tanpa bias, sambil mempertahankan kemampuan matematika/penalarannya.
-
Saat ini model tersebut dapat diunduh di Hugging Face.
-
Menggunakan set evaluasi yang terdiri dari lebih dari 1.000 contoh multibahasa untuk mengukur kemungkinan penghindaran sensor (dengan evaluator manusia + LLM judge secara paralel)
-
Dapat menjawab tanpa menghindari topik sensitif seperti politik, masyarakat, dan hak asasi manusia di Tiongkok
-
Bahkan setelah proses penghapusan sensor, performanya tetap setara dengan model dasar pada benchmark seperti MATH/GPQA
7 komentar
Apakah perusahaan-perusahaan Korea juga tidak akan membatasi penggunaannya?
Sangat bagus ^o^
Apakah mereka melatihnya dengan cara yang sama seperti yang tertulis di dokumen DeepSeek?
Sepertinya model penalaran DeepSeek-R1 itu sendiri bersifat open source.
Yang diumumkan hanya model hasil pelatihan, sedangkan data mentahnya tidak dibuka sehingga ini bukan "open source". Meski terbatas, model yang sudah dilatih tetap bisa ditraining lebih lanjut atau dimodifikasi, jadi yang dirilis kali ini adalah versi yang diubah dengan cara seperti itu.
Karena itu, saya lebih suka menggunakan istilah open weight.
Selalu ada yang lebih hebat daripada yang sudah hebat.