22 poin oleh yeorinhieut 2025-02-19 | 7 komentar | Bagikan ke WhatsApp
  • R1 1776 adalah model open-source yang merupakan hasil fine-tuning model penalaran DeepSeek-R1 oleh Perplexity AI untuk menghapus sensor Partai Komunis Tiongkok.

  • Model ini ditujukan untuk menyediakan informasi akurat tanpa bias, sambil mempertahankan kemampuan matematika/penalarannya.

  • Saat ini model tersebut dapat diunduh di Hugging Face.

  • Menggunakan set evaluasi yang terdiri dari lebih dari 1.000 contoh multibahasa untuk mengukur kemungkinan penghindaran sensor (dengan evaluator manusia + LLM judge secara paralel)

  • Dapat menjawab tanpa menghindari topik sensitif seperti politik, masyarakat, dan hak asasi manusia di Tiongkok

  • Bahkan setelah proses penghapusan sensor, performanya tetap setara dengan model dasar pada benchmark seperti MATH/GPQA

7 komentar

 
wyswyg 2025-02-19

Apakah perusahaan-perusahaan Korea juga tidak akan membatasi penggunaannya?

 
carnoxen 2025-02-19

Sangat bagus ^o^

 
kandk 2025-02-19

Apakah mereka melatihnya dengan cara yang sama seperti yang tertulis di dokumen DeepSeek?

 
kandk 2025-02-19

Sepertinya model penalaran DeepSeek-R1 itu sendiri bersifat open source.

 
bootno2316 2025-02-20

Yang diumumkan hanya model hasil pelatihan, sedangkan data mentahnya tidak dibuka sehingga ini bukan "open source". Meski terbatas, model yang sudah dilatih tetap bisa ditraining lebih lanjut atau dimodifikasi, jadi yang dirilis kali ini adalah versi yang diubah dengan cara seperti itu.

 
superego 2025-02-21

Karena itu, saya lebih suka menggunakan istilah open weight.

 
dooboo 2025-02-19

Selalu ada yang lebih hebat daripada yang sudah hebat.