- GPT-4.5 adalah model terbaru OpenAI, versi yang meningkatkan skalabilitas dalam pra-pelatihan (pre-training) dan pasca-pelatihan (post-training)
- Skala pembelajaran tanpa pengawasan (unsupervised learning) diperluas untuk memperkuat pengenalan pola dan wawasan kreatif
- Memungkinkan percakapan yang lebih alami, lebih memahami maksud pengguna, dan kecerdasan emosional (EQ) meningkat
- Dapat dimanfaatkan secara berguna untuk berbagai tugas seperti menulis, pemrograman, dan pemecahan masalah
- Tingkat terjadinya halusinasi (hallucination) diperkirakan akan berkurang
- Disediakan dalam bentuk pratinjau riset, dengan tujuan mengeksplorasi kekuatan dan keterbatasan model serta mengumpulkan berbagai kasus penggunaan
Perluasan pembelajaran tanpa pengawasan
- Untuk memajukan AI, dua sumbu dikembangkan: pembelajaran tanpa pengawasan dan penalaran (reasoning)
- Penguatan penalaran: model dilatih agar dapat berpikir secara sistematis untuk menyelesaikan masalah STEM yang kompleks
- Model seperti OpenAI o1 dan OpenAI o3-mini mengembangkan pendekatan ini
- Perluasan pembelajaran tanpa pengawasan: meningkatkan intuisi model dan akurasi pengetahuan tentang dunia melalui lebih banyak data
- GPT-4.5 dilatih di superkomputer Microsoft Azure AI dan memiliki pengetahuan yang lebih luas serta pemahaman yang lebih mendalam
- Karena itu, halusinasi berkurang dan hasil yang lebih dapat diandalkan dapat diberikan di berbagai topik
Perluasan paradigma GPT
- GPT-4.5 memiliki pengetahuan yang lebih unggul dibanding model sebelumnya
- Memberikan wawasan yang lebih dalam untuk pertanyaan historis seperti asal-usul bahasa
- Untuk pertanyaan seperti "Apa bahasa pertama?":
- Sangat mungkin tidak pernah ada satu bahasa pertama yang tunggal
- Bahasa diperkirakan muncul di Afrika lebih dari 100 ribu tahun lalu
- Bahasa purba (proto-languages) kemungkinan besar berkembang dari gestur, suara, sinyal, dan sebagainya
- Asal-usul bahasa tidak dapat diketahui secara pasti karena tidak ada catatan tertulis
- Dengan demikian, GPT-4.5 dapat memberikan jawaban yang mendalam juga di bidang linguistik dan sejarah
Pengetahuan dunia yang lebih mendalam
- Dalam hasil evaluasi SimpleQA, GPT-4.5 mencatat akurasi yang lebih tinggi dibanding model lain
- Perbandingan akurasi (Accuracy):
- GPT-4.5: 62.5%
- GPT-4o: 38.2%
- OpenAI o1: 47%
- OpenAI o3-mini: 15%
- Perbandingan tingkat halusinasi (Hallucination Rate) (semakin rendah semakin baik):
- GPT-4.5: 37.1%
- GPT-4o: 61.8%
- OpenAI o1: 44%
- OpenAI o3-mini: 80.3%
- GPT-4.5 mempertahankan akurasi yang lebih tinggi dan menurunkan tingkat halusinasi pada pertanyaan yang membutuhkan verifikasi fakta
Pelatihan untuk kolaborasi dengan manusia
- GPT-4.5 dilatih agar lebih memahami kebutuhan dan maksud manusia
- Dapat menafsirkan maksud pengguna dengan lebih cermat dan memungkinkan percakapan yang alami
- Dibanding model sebelumnya, kecerdasan emosional (EQ) meningkat sehingga lebih memahami nuansa yang halus
- Memiliki intuisi kreatif dan kepekaan estetika yang unggul untuk penulisan dan pekerjaan desain
- Evaluasi perbandingan (Win-rate vs GPT-4o)
- Tugas kreatif: 56.8%
- Pertanyaan profesional: 63.2%
- Pertanyaan sehari-hari: 57.0%
- GPT-4.5 melakukan kolaborasi dengan manusia secara alami dan memahami maksud pengguna dengan lebih akurat dalam percakapan
Prospek ke depan: kemampuan penalaran yang lebih kuat
- GPT-4.5 bukan model yang berpikir secara logis sebelum merespons
- Ini merupakan pendekatan yang berbeda dari model yang berfokus pada penalaran seperti OpenAI o1 dan OpenAI o3-mini
- Pada model masa depan, gabungan pra-pelatihan (pre-training) dan penalaran (reasoning) diperkirakan akan menjadi kunci
Penguatan keamanan
- GPT-4.5 dilatih dengan teknik supervisi baru yang mencakup SFT (fine-tuning pembelajaran terawasi) dan RLHF (pembelajaran penguatan dari umpan balik manusia) yang sudah ada
- Pengujian keamanan dilakukan sebelum model dirilis untuk mengevaluasi potensi risiko
- System card yang berisi hasil evaluasi dipublikasikan untuk mendorong riset dan umpan balik
Cara menggunakan GPT-4.5 di ChatGPT
- Mulai hari ini, pengguna ChatGPT Pro dapat memilih GPT-4.5 di web, seluler, dan desktop
- Minggu depan akan tersedia untuk pengguna Plus dan Team
- Minggu berikutnya akan tersedia untuk pengguna Enterprise dan Edu
- Fitur utama:
- Dapat mencari informasi terbaru
- Mendukung unggah file dan gambar
- Dapat digunakan untuk menulis dan coding dengan memanfaatkan canvas
- Namun, mode suara, video, dan fitur berbagi layar tidak didukung
Cara menggunakan GPT-4.5 di API
- Tersedia untuk pengembang melalui Chat Completions API, Assistants API, dan Batch API
- Fitur utama:
- Function Calling
- Structured Outputs
- Streaming
- System Messages
- Mendukung kemampuan vision melalui input gambar
- Contoh penggunaan oleh pengembang:
- Aplikasi yang mengutamakan kecerdasan emosional dan kreativitas (misalnya: asisten menulis, coaching belajar, brainstorming)
- Pekerjaan kode yang kompleks (misalnya: workflow coding multi-langkah, otomasi)
- Hal yang perlu dipertimbangkan terkait penyediaan API:
- GPT-4.5 adalah model dengan komputasi besar dan biaya tinggi, sehingga tidak menggantikan GPT-4o
- Sedang dipertimbangkan apakah akan terus disediakan di API dalam jangka panjang, dan umpan balik pengguna sangat penting
Kesimpulan
- GPT-4.5 adalah model yang memperluas batas pembelajaran tanpa pengawasan, sehingga dapat mengeksplorasi kemampuan yang kreatif dan baru
- Menjelajahi kemungkinan baru teknologi AI, dan menantikan kasus penggunaan inovatif dari pengguna.
4 komentar
Komentar Hacker News
Harga GPT 4.5 sangat mahal
Kesan saat menggunakan GPT-4.5
Fokus pada kecerdasan emosional (EQ)
Kecewa dengan posting blog dan demo live stream
Pendekatan OpenAI dan Anthropic yang berbeda
Performa GPT-4.5 dalam benchmark LLM Kagi
Cara menggunakan GPT-4.5 melalui API
uvxPerbandingan performa coding
Memahami upaya OpenAI
Harga GPT-4.5 (per 1M token)
Kalau dibandingkan dengan harga 4o, inputnya 30 kali lebih mahal dan outputnya 15 kali lebih mahal.
Tapi performanya juga tidak meningkat sebesar itu, jadi sepertinya cukup banyak yang tidak puas.
Kalau mencoba GPT-4.5 di Cursor, katanya model ini bekerja dengan efisien bahkan pada kasus-kasus yang gagal ditangani model lain.
Tentu saja karena terlalu mahal, pembayarannya harus berdasarkan pemakaian. Ada juga reaksi seperti, "Suruh coding yang kompleks begini bisa bangkrut nih."
https://x.com/cursor_ai/status/1895210110714290302
Sepertinya saya juga sempat berpikir serupa saat melihat harga Claude Code. Kalau pekerja bergaji bulanan, bukankah kalau sudah melewati upah per jam itu berarti bangkrut 😵💫
Mungkin ini justru kabar baik. Tergantung harga modelnya, nilai kita juga...;;;