4 poin oleh xguru 2025-02-28 | 4 komentar | Bagikan ke WhatsApp
  • GPT-4.5 adalah model terbaru OpenAI, versi yang meningkatkan skalabilitas dalam pra-pelatihan (pre-training) dan pasca-pelatihan (post-training)
  • Skala pembelajaran tanpa pengawasan (unsupervised learning) diperluas untuk memperkuat pengenalan pola dan wawasan kreatif
  • Memungkinkan percakapan yang lebih alami, lebih memahami maksud pengguna, dan kecerdasan emosional (EQ) meningkat
  • Dapat dimanfaatkan secara berguna untuk berbagai tugas seperti menulis, pemrograman, dan pemecahan masalah
  • Tingkat terjadinya halusinasi (hallucination) diperkirakan akan berkurang
  • Disediakan dalam bentuk pratinjau riset, dengan tujuan mengeksplorasi kekuatan dan keterbatasan model serta mengumpulkan berbagai kasus penggunaan

Perluasan pembelajaran tanpa pengawasan

  • Untuk memajukan AI, dua sumbu dikembangkan: pembelajaran tanpa pengawasan dan penalaran (reasoning)
    • Penguatan penalaran: model dilatih agar dapat berpikir secara sistematis untuk menyelesaikan masalah STEM yang kompleks
      • Model seperti OpenAI o1 dan OpenAI o3-mini mengembangkan pendekatan ini
    • Perluasan pembelajaran tanpa pengawasan: meningkatkan intuisi model dan akurasi pengetahuan tentang dunia melalui lebih banyak data
  • GPT-4.5 dilatih di superkomputer Microsoft Azure AI dan memiliki pengetahuan yang lebih luas serta pemahaman yang lebih mendalam
    • Karena itu, halusinasi berkurang dan hasil yang lebih dapat diandalkan dapat diberikan di berbagai topik

Perluasan paradigma GPT

  • GPT-4.5 memiliki pengetahuan yang lebih unggul dibanding model sebelumnya
    • Memberikan wawasan yang lebih dalam untuk pertanyaan historis seperti asal-usul bahasa
    • Untuk pertanyaan seperti "Apa bahasa pertama?":
      • Sangat mungkin tidak pernah ada satu bahasa pertama yang tunggal
      • Bahasa diperkirakan muncul di Afrika lebih dari 100 ribu tahun lalu
      • Bahasa purba (proto-languages) kemungkinan besar berkembang dari gestur, suara, sinyal, dan sebagainya
      • Asal-usul bahasa tidak dapat diketahui secara pasti karena tidak ada catatan tertulis
  • Dengan demikian, GPT-4.5 dapat memberikan jawaban yang mendalam juga di bidang linguistik dan sejarah

Pengetahuan dunia yang lebih mendalam

  • Dalam hasil evaluasi SimpleQA, GPT-4.5 mencatat akurasi yang lebih tinggi dibanding model lain
    • Perbandingan akurasi (Accuracy):
      • GPT-4.5: 62.5%
      • GPT-4o: 38.2%
      • OpenAI o1: 47%
      • OpenAI o3-mini: 15%
    • Perbandingan tingkat halusinasi (Hallucination Rate) (semakin rendah semakin baik):
      • GPT-4.5: 37.1%
      • GPT-4o: 61.8%
      • OpenAI o1: 44%
      • OpenAI o3-mini: 80.3%
  • GPT-4.5 mempertahankan akurasi yang lebih tinggi dan menurunkan tingkat halusinasi pada pertanyaan yang membutuhkan verifikasi fakta

Pelatihan untuk kolaborasi dengan manusia

  • GPT-4.5 dilatih agar lebih memahami kebutuhan dan maksud manusia
    • Dapat menafsirkan maksud pengguna dengan lebih cermat dan memungkinkan percakapan yang alami
    • Dibanding model sebelumnya, kecerdasan emosional (EQ) meningkat sehingga lebih memahami nuansa yang halus
    • Memiliki intuisi kreatif dan kepekaan estetika yang unggul untuk penulisan dan pekerjaan desain
  • Evaluasi perbandingan (Win-rate vs GPT-4o)
    • Tugas kreatif: 56.8%
    • Pertanyaan profesional: 63.2%
    • Pertanyaan sehari-hari: 57.0%
  • GPT-4.5 melakukan kolaborasi dengan manusia secara alami dan memahami maksud pengguna dengan lebih akurat dalam percakapan

Prospek ke depan: kemampuan penalaran yang lebih kuat

  • GPT-4.5 bukan model yang berpikir secara logis sebelum merespons
  • Ini merupakan pendekatan yang berbeda dari model yang berfokus pada penalaran seperti OpenAI o1 dan OpenAI o3-mini
  • Pada model masa depan, gabungan pra-pelatihan (pre-training) dan penalaran (reasoning) diperkirakan akan menjadi kunci

Penguatan keamanan

  • GPT-4.5 dilatih dengan teknik supervisi baru yang mencakup SFT (fine-tuning pembelajaran terawasi) dan RLHF (pembelajaran penguatan dari umpan balik manusia) yang sudah ada
  • Pengujian keamanan dilakukan sebelum model dirilis untuk mengevaluasi potensi risiko
  • System card yang berisi hasil evaluasi dipublikasikan untuk mendorong riset dan umpan balik

Cara menggunakan GPT-4.5 di ChatGPT

  • Mulai hari ini, pengguna ChatGPT Pro dapat memilih GPT-4.5 di web, seluler, dan desktop
  • Minggu depan akan tersedia untuk pengguna Plus dan Team
  • Minggu berikutnya akan tersedia untuk pengguna Enterprise dan Edu
  • Fitur utama:
    • Dapat mencari informasi terbaru
    • Mendukung unggah file dan gambar
    • Dapat digunakan untuk menulis dan coding dengan memanfaatkan canvas
    • Namun, mode suara, video, dan fitur berbagi layar tidak didukung

Cara menggunakan GPT-4.5 di API

  • Tersedia untuk pengembang melalui Chat Completions API, Assistants API, dan Batch API
  • Fitur utama:
    • Function Calling
    • Structured Outputs
    • Streaming
    • System Messages
    • Mendukung kemampuan vision melalui input gambar
  • Contoh penggunaan oleh pengembang:
    • Aplikasi yang mengutamakan kecerdasan emosional dan kreativitas (misalnya: asisten menulis, coaching belajar, brainstorming)
    • Pekerjaan kode yang kompleks (misalnya: workflow coding multi-langkah, otomasi)
  • Hal yang perlu dipertimbangkan terkait penyediaan API:
    • GPT-4.5 adalah model dengan komputasi besar dan biaya tinggi, sehingga tidak menggantikan GPT-4o
    • Sedang dipertimbangkan apakah akan terus disediakan di API dalam jangka panjang, dan umpan balik pengguna sangat penting

Kesimpulan

  • GPT-4.5 adalah model yang memperluas batas pembelajaran tanpa pengawasan, sehingga dapat mengeksplorasi kemampuan yang kreatif dan baru
  • Menjelajahi kemungkinan baru teknologi AI, dan menantikan kasus penggunaan inovatif dari pengguna.

4 komentar

 
GN⁺ 2025-02-28

Komentar Hacker News

  • Harga GPT 4.5 sangat mahal

    • Input: $75.00 per 1 juta token
    • Input yang di-cache: $37.50 per 1 juta token
    • Output: $150.00 per 1 juta token
    • Perbedaan harga sangat besar dibandingkan GPT 4o
    • GPT-4.5 adalah model yang sangat besar dan intensif komputasi, dan sedang dievaluasi apakah akan tetap ditawarkan lewat API dalam jangka panjang
    • Umpan balik pengguna penting
  • Kesan saat menggunakan GPT-4.5

    • Sangat lambat, tidak cocok untuk interaksi real-time
    • Gaya penulisan membaik, lebih kasual dan mudah didekati
    • Dalam perbandingan draf buku, perbedaan antara GPT4o dan GPT4.5 terlihat jelas
  • Fokus pada kecerdasan emosional (EQ)

    • Terlihat ada kecenderungan berubah menjadi "teman AI yang ramah"
    • Anthropic dan Grok juga bergerak ke arah ini
    • Berharap perilaku seperti ini tidak meresap ke respons API
  • Kecewa dengan posting blog dan demo live stream

    • Model baru ini tidak terlalu mengesankan
    • OpenAI tampak kesulitan untuk tetap unggul dari para pesaing
    • Harganya sangat tinggi, cukup mengejutkan
  • Pendekatan OpenAI dan Anthropic yang berbeda

    • Anthropic percaya satu paradigma tunggal (penalaran) bisa cocok untuk semua use case
    • OpenAI percaya diperlukan ansambel model dengan kemampuan yang beragam
    • GPT 4.5 berukuran besar sehingga bisa menyimpan lebih banyak data faktual
  • Performa GPT-4.5 dalam benchmark LLM Kagi

    • Meski mahal dan lambat, performanya tetap unggul
    • Untuk beberapa tugas, masih kurang memadai
  • Cara menggunakan GPT-4.5 melalui API

    • Bisa dijalankan menggunakan alat uvx
    • Perlu mengatur API key
  • Perbandingan performa coding

    • ChatGPT 4.5 sedikit lebih baik dalam coding dibanding ChatGPT 4o
    • Anthropic Claude 3.7 menunjukkan performa yang lebih baik
  • Memahami upaya OpenAI

    • GPT 4.5 adalah upaya penting untuk mengeksplorasi scaling law prapelatihan
    • Sebuah hadiah yang berkontribusi pada sains
 
xguru 2025-02-28

Harga GPT-4.5 (per 1M token)

  • Input $75
  • Input yang di-cache $37.50
  • Output $150
    Kalau dibandingkan dengan harga 4o, inputnya 30 kali lebih mahal dan outputnya 15 kali lebih mahal.

Tapi performanya juga tidak meningkat sebesar itu, jadi sepertinya cukup banyak yang tidak puas.

Kalau mencoba GPT-4.5 di Cursor, katanya model ini bekerja dengan efisien bahkan pada kasus-kasus yang gagal ditangani model lain.
Tentu saja karena terlalu mahal, pembayarannya harus berdasarkan pemakaian. Ada juga reaksi seperti, "Suruh coding yang kompleks begini bisa bangkrut nih."
https://x.com/cursor_ai/status/1895210110714290302

 
bearmett 2025-02-28

Sepertinya saya juga sempat berpikir serupa saat melihat harga Claude Code. Kalau pekerja bergaji bulanan, bukankah kalau sudah melewati upah per jam itu berarti bangkrut 😵‍💫

 
botplaysdice 2025-02-28

Mungkin ini justru kabar baik. Tergantung harga modelnya, nilai kita juga...;;;