-
Menurut OpenAI, GPT-4 mungkin hanya menunjukkan perbedaan yang halus dibanding GPT-3.5 dalam percakapan sehari-hari. Namun, semakin kompleks tugasnya, GPT-4 disebut lebih stabil, lebih kreatif, dan lebih mampu menangani instruksi yang bernuansa.
-
Selain itu, GPT-4 juga mendukung keluaran teks melalui masukan gambar. Contoh yang diberikan OpenAI adalah mengirimkan sebuah gambar lalu meminta dijelaskan 'bagian mana yang lucu' dari isinya. OpenAI kemudian menganalisis humor pada meme tersebut dan menjelaskannya. (Fitur ini masih berupa pratinjau riset dan belum tersedia untuk penggunaan publik.)
-
Model GPT-4 kali ini memungkinkan frasa yang sebelumnya digunakan pada era GPT-3.5 untuk menetapkan peran tertentu bagi AI dimasukkan ke area terpisah bernama system, sehingga gaya dan tugas AI dapat ditentukan dengan lebih langsung. (OpenAI juga mengetahui bahwa bagian ini berpotensi disalahgunakan untuk apa yang disebut 'jailbreak' (untuk melewati pembatasan konten))
-
GPT-4 masih mengalami masalah halusinasi. (Memercayai sesuatu yang sebenarnya tidak ada dan menyebabkan kesalahan penalaran.) Namun, dalam evaluasi internal, nilainya 40 persen lebih tinggi dibanding model sebelumnya.
-
GPT-4 masih memiliki risiko menghasilkan konten yang tidak diizinkan, tetapi dibanding GPT-3.5, tingkat pembuatan konten yang melanggar turun 82 persen, dan untuk permintaan sensitif (saran medis, melukai diri sendiri), frekuensi respons yang mengikuti kebijakan 29 persen lebih tinggi.
-
Saat ini model GPT-4 tersedia bagi pelanggan ChatGPT Plus, dengan batas 100 pesan per 4 jam. OpenAI menyatakan akan ada kebijakan berbayar tambahan terkait batas ini, dan dalam jangka panjang mereka berencana menyediakannya juga bagi pengguna gratis.
Ringkasan di atas tidak mencakup bagaimana GPT-4 dilatih, penjelasan tentang OpenAI Evals, contoh-contoh detail, serta benchmark langsung. Mungkin juga ada fakta penting lain yang terlewat, jadi silakan merujuk ke artikel aslinya.
10 komentar
Seperti di 3.5, kebiasaan menjawab dengan asal menebak(?) jauh berkurang, dan kalau tidak tahu, model ini cenderung jujur mengatakan tidak tahu.
Sepertinya akan sulit untuk tetap bisa bertahan hidup dengan makan dari pekerjaan seperti sekarang sampai pensiun.
Skynet sepertinya sudah tidak lama lagi..
Kehebatan GPT-4
https://www.clien.net/service/board/park/17962934
Ada berbagai meme di sana.
Di komentar ada perbandingan jawaban 3.5 dan 4 tentang cara menenangkan pacar saat sedang ngambek, dan perbedaannya cukup besar. hehe
Ulasan Lee Sang-hoon tentang GPT-4 Technical Report yang diunggah di grup TensorFlow Korea
https://www.facebook.com/groups/TensorFlowKR/posts/1992265094447872
Begitu keluar, saya langsung melemparkan pertanyaan seperti ini ke GPT-4 dan GPT-3.5.
Jawaban GPT-3.5 dan GPT-4 sangat kontras. GPT-4, mengikuti prosedur, mengelompokkan peran tiap file dan memberikan petunjuk yang benar sehingga jika diikuti langsung di editor Godot, hasilnya bisa benar-benar tercapai. Sementara itu, GPT-3.5 hanya memuntahkan kode rusak yang sekilas tampak seperti bisa berjalan.
Sekarang mungkin game buatan pengembang solo akan bermunculan deras... rasanya ini adalah momen terbaik untuk mengembangkan game dibanding sebelumnya.
Tentu ada kekhawatiran tentang game produksi massal seperti halnya novel produksi massal... namun pada akhirnya saya berharap perusahaan game AAA juga akan banyak mengubah lingkungan kerja mereka sehingga game yang lebih efisien, berkualitas lebih tinggi, dan bebas bug bisa dirilis dengan baik.
Jadi ingin jadi Luddites... T_T
Ke depannya masih bisa hidup dengan menerima gaji nggak ya..
Harus berdoa supaya jadi warga Roma, ya wkwk
Saya memilih Godot Engine karena menurut saya justru lebih cocok untuk pengujian karena referensinya lebih sedikit dibanding Unity. Soalnya saya penasaran, ketika materi yang tersedia secara umum tidak begitu banyak, sejauh mana ia bisa menjawab. Tapi hasilnya sangat bagus sampai saya terkejut....