Penundaan pengembangan GPT-5 "Orion"

(wsj.com)

12 poin oleh GN⁺ 2024-12-23 | 7 komentar | Bagikan ke WhatsApp

Proyek AI generasi berikutnya milik OpenAI, GPT-5 (nama kode Orion), sedang mengalami penundaan jadwal dan menimbulkan biaya yang sangat besar
GPT-5 menargetkan kemajuan besar pada teknologi yang memungkinkan ChatGPT, tetapi peluang keberhasilan dan jadwalnya tidak pasti
Microsoft sebagai investor utama berharap peluncuran pada pertengahan 2024, namun berbagai masalah muncul dalam pengujian internal OpenAI

Status proyek dan biaya

GPT-5 sudah menjalani dua kali pelatihan skala besar, dan setiap pelatihan menelan biaya ratusan juta dolar
Model ini belum memenuhi performa yang diharapkan, dan saat ini performanya hanya sedikit lebih baik daripada GPT-4 yang ada
CEO OpenAI Sam Altman menegaskan bahwa GPT-5 akan menghadirkan kemajuan yang terobosan

Data pelatihan dan masalah teknis

Pelatihan LLM membutuhkan data dalam jumlah sangat besar, tetapi saat ini internet kekurangan data berkualitas tinggi yang memadai
OpenAI mengadopsi metode menghasilkan data secara langsung melalui penyelesaian soal matematika, penulisan kode perangkat lunak, dan sebagainya
Data sintetis (data yang dihasilkan AI) juga digunakan, tetapi proses pembuatan data sendiri berisiko menimbulkan kesalahan dan hasil yang tidak masuk akal

Masalah internal dan tekanan persaingan

Konflik internal OpenAI serta upaya perekrutan talenta oleh para pesaing meningkat
Lebih dari 24 personel kunci, termasuk salah satu pendiri Ilya Sutskever dan CTO Mira Murati, telah keluar
Pesaing seperti Anthropic dan Google meluncurkan LLM yang lebih baik, sehingga persaingan makin ketat

Pendekatan baru: model penalaran

OpenAI mengembangkan model penalaran baru untuk meningkatkan performa LLM
- Menyadari keterbatasan pendekatan lama yang hanya memperbesar skala data
- Model o1 menghasilkan beberapa jawaban untuk satu pertanyaan lalu menganalisisnya untuk memilih jawaban terbaik
- Model ini dapat menyelesaikan masalah kompleks, menjelaskan proses jawabannya, dan belajar darinya

Trade-off biaya dan performa

Model berbasis penalaran meningkatkan performa dibanding metode lama, tetapi bebannya pada biaya sangat tinggi
- Biaya komputasi meningkat karena harus menghasilkan beberapa jawaban untuk satu pertanyaan
Para peneliti berupaya menggabungkan model penalaran dengan pendekatan lama yang berpusat pada data untuk menyiapkan fondasi GPT-5

Tantangan industri dan kekurangan data

Industri AI semakin menghadapi masalah kekurangan data dan berbagai keterbatasan
Seperti analogi bahwa data adalah "bahan bakar fosil AI", situasinya kini membuat tambahan data berkualitas tinggi semakin sulit diperoleh
Jika pengembangan GPT-5 terhenti, muncul pula kemungkinan bahwa peningkatan AI akan stagnan

Kesimpulan

OpenAI sedang mengalami kesulitan dalam proyek Orion akibat masalah teknis, keuangan, dan sumber daya manusia
Model penalaran baru sedang dieksplorasi sebagai kemungkinan terobosan baru bagi perkembangan AI
Namun, perilisan model yang layak diakui sebagai GPT-5 masih tetap tidak pasti

7 komentar

aer0700 2024-12-24

Seperti perusahaan petrokimia yang memurnikan minyak menjadi bensin, solar, dan sebagainya,
mungkin juga bisa ada model bisnis di mana perusahaan pemurnian data merapikan data mentah menjadi lebih tertata.
Misalnya, file Excel dan PPT prosedur operasi standar yang menumpuk tak terhitung banyaknya di dalam perusahaan dibersihkan lalu dipakai untuk fine-tuning GPT?

softer 2024-12-23

Sepertinya ini batas yang sudah diperkirakan, dan saya juga agak merasa akan menarik kalau arahnya dibelokkan ke sisi yang mengenali dan berpikir sendiri

windrod 2024-12-23

Membicarakan soal apakah ada penundaan pengembangan atau tidak ketika sebenarnya belum ada roadmap atau tolok ukur yang benar-benar ditetapkan, kemungkinan besar ini juga cuma bocoran informasi bernuansa pemasaran.

mammal 2024-12-23

model o1 menghasilkan beberapa jawaban untuk satu pertanyaan lalu menganalisisnya untuk memilih jawaban terbaik

o1 bukan model berbasis MCTS atau pencarian, melainkan model yang memperluas CoT dengan RL.

curiousotter 2024-12-23

Menghasilkan beberapa jawaban -> pada bagian ini, bukan berarti beberapa jawaban dihasilkan secara paralel lalu dipilih satu di antaranya
melainkan seperti yang Anda sampaikan, jawaban dihasilkan secara berurutan dengan CoT sampai dinilai sudah menjadi jawaban yang tepat, lalu menghasilkan jawaban terbaik..
Saya juga jadi berpikir mungkin ini salah terjemahan dalam proses penerjemahan, tetapi saya tidak tahu karena sulit memeriksa teks aslinya..

mammal 2024-12-23

Behind the scenes, OpenAI’s o1 menawarkan beberapa respons untuk setiap pertanyaan dan menganalisisnya untuk menemukan yang terbaik. Model ini dapat melakukan tugas yang lebih kompleks, seperti menulis rencana bisnis atau membuat teka-teki silang, sambil menjelaskan penalarannya—yang membantu model belajar sedikit dari setiap jawaban.

Semua daya pikir tambahan itu mahal. OpenAI sekarang harus membayar untuk menghasilkan beberapa jawaban untuk satu kueri, bukan hanya satu.

Sepertinya wartawannya memahami ini sebagai metode menghasilkan beberapa jawaban lalu memilih salah satunya.

GN⁺ 2024-12-23

Opini Hacker News

Seiring meningkatnya biaya pelatihan model, waktu yang dibutuhkan untuk training juga menjadi lebih lama. Alasan model yang lebih kecil bisa berinovasi lebih cepat adalah karena loop umpan baliknya lebih pendek
Penjelasan tentang pengembangan GPT-4 oleh OpenAI tidak cukup memberi kepercayaan pada artikel tersebut
Disebutkan bahwa LLMs tampaknya telah mencapai batas di mana kemajuan tidak lagi bisa dicapai hanya dengan menambah data dan daya komputasi. Diperlukan ide-ide baru, dan pendanaan untuk itu sudah cukup tersedia
Tingkat kemampuan LLM saat ini akan jauh lebih berguna jika bisa memberikan indikator keandalan yang konservatif. Perlu ada output seperti "tidak tahu" atau "tidak yakin, tetapi..."
Yang lebih penting daripada rilis OpenAI berikutnya adalah bagaimana industri perangkat lunak mengintegrasikan teknologi ini dan mewujudkan nilainya
Yang bisa diduga dari pernyataan orang dalam adalah bahwa mereka menginginkan peningkatan 10x melalui scaling, serta perubahan pada data dan algoritme. Sumber data publik hampir habis, sementara perubahan algoritme terus menghasilkan peningkatan lewat riset
- Jika data terbatas, scaling akan mandek
- Menemukan cara untuk mengubah komputasi menjadi data yang lebih baik adalah langkah yang logis
- Dengan dirilisnya o3, pertahanan OpenAI berikutnya kemungkinan adalah set pelatihan sintetis terbaik
GPT-5 tidak tertunda; ia sebenarnya sudah dirilis setengah tahun lalu sebagai GPT-4o. Karena tidak cukup revolusioner, model itu tidak dinamai 5 dan kemungkinan di-rebrand pada saat terakhir
Disebutkan bahwa jurnalisme teknologi dibesar-besarkan, dan meskipun o3 sudah dirilis, artikel-artikel kritis masih terus muncul
o1-Pro secara subjektif jauh lebih unggul daripada GPT-4, dan o3 dinilai lebih baik lagi. Ini mengisyaratkan bahwa teknologinya berkembang pesat
Dunia sedang mempelajari bagaimana teknologi ini bisa bekerja dengan tepat, sehingga anggapan bahwa jadwalnya tertunda terasa hampir seperti komedi