3 poin oleh GN⁺ 2024-04-30 | Belum ada komentar. | Bagikan ke WhatsApp

Latar belakang

  • Model gpt2-chatbot yang baru-baru ini dipublikasikan oleh LMSYS menunjukkan performa yang jauh melampaui model GPT-2 yang selama ini dikenal
  • Informasi tentang model tersebut sulit ditemukan, baik di situs LMSYS maupun di tempat lain
  • Dalam hasil benchmark API milik LMSYS pun, hanya model ini yang secara mencolok dikecualikan

Karakteristik utama model GPT2-Chatbot

  • Mengklaim dirinya sebagai "berbasis GPT-4" dan menyebut dirinya "ChatGPT"
  • Menunjukkan karakteristik yang berbeda dari model-model yang dilatih dengan dataset OpenAI yang dibuat oleh organisasi lain
  • Tampaknya menggunakan tokenizer tiktoken milik OpenAI
  • Ditemukan kerentanan prompt injection khas OpenAI
  • Menunjukkan karakteristik keluaran yang berbeda dari model organisasi lain

Opini subjektif tentang GPT2-Chatbot

  • Kemungkinan besar sebenarnya adalah GPT-4.5 atau GPT-5. Kualitas keluarannya tampak meningkat sebesar lompatan dari GPT-3.5 ke GPT-4
  • Bisa juga LMSYS melatih modelnya sendiri atau menggunakan pendekatan mirip MoE, tetapi melihat keterkaitannya dengan OpenAI, kemungkinan itu tampak kecil

Dugaan tentang tujuan publikasi GPT2-Chatbot

  • Tampaknya OpenAI diam-diam menggunakan LMSYS untuk melakukan benchmark terhadap model GPT terbarunya
  • Tujuannya untuk mendapatkan hasil benchmark yang umum, menghindari penilaian negatif akibat ekspektasi berlebihan, dan meminimalkan kewaspadaan dari pesaing lain

Menimbang kemungkinan lain

  • Ada kemungkinan model ini benar-benar berbasis arsitektur GPT-2. Menurut riset terbaru, GPT-2 menunjukkan performa yang lebih unggul daripada model lain di area tertentu
  • Penyebutan dirinya sebagai GPT-4 bisa jadi karena memanfaatkan dataset yang dihasilkan oleh GPT-4
  • Fakta bahwa MBZUAI, salah satu sponsor LMSYS, terlibat dalam riset tersebut juga patut diperhatikan

Opini GN⁺

  • Berbagai spekulasi seputar identitas gpt2-chatbot terasa menarik. Saya setuju dengan pendapat bahwa kemungkinan besar ini adalah model terbaru OpenAI
  • Di sisi lain, kemungkinan bahwa model ini berbasis arsitektur GPT-2 juga tidak bisa sepenuhnya dikesampingkan. Melihat hasil riset terbaru, potensi GPT-2 tampaknya masih sangat tinggi
  • Dugaan bahwa OpenAI diam-diam melakukan benchmark melalui LMSYS juga cukup meyakinkan. Ini strategi untuk menghindari kewaspadaan pesaing sambil tetap mendapatkan evaluasi yang objektif
  • Ke depan, tampaknya akan ada beragam eksperimen dan riset lanjutan untuk mengungkap jati diri gpt2-chatbot. Ini bisa menjadi momentum untuk mengukur perkembangan di bidang large language model
  • Sejak awal, nama "gpt2-chatbot" sendiri mungkin memang dimaksudkan untuk memberi kesan bahwa ini adalah GPT-2. Kemungkinan bahwa OpenAI sengaja memberinya nama itu juga tidak bisa diabaikan

Belum ada komentar.

Belum ada komentar.