7 poin oleh GN⁺ 2025-11-26 | Belum ada komentar. | Bagikan ke WhatsApp
  • Menunjukkan batas generalisasi model AI dan bias pelatihan yang berpusat pada reinforcement learning (RL), sambil menjelaskan mengapa sistem saat ini secara struktural belum bisa berpikir sefleksibel manusia
  • Pre-training dinilai mampu memperoleh pengetahuan alami dari data dalam jumlah sangat besar, tetapi kurang adaptif terhadap lingkungan nyata
  • Mendiagnosis bahwa era scaling (2012~2025) telah berakhir, dan kini dibutuhkan prinsip pembelajaran baru serta inovasi yang berpusat pada riset
  • SSI menargetkan model dengan kemampuan belajar setara manusia dengan menggabungkan continual learning dan pembelajaran melalui deployment di dunia nyata
  • Mengajukan arah riset AI ke depan dari sudut pandang bahwa kecerdasan buatan harus mengintegrasikan 'emosi dan value function', 'kemampuan generalisasi', dan 'alignment etis'

Ketidakstabilan model dan masalah generalisasi

  • Model AI saat ini unggul dalam evals, tetapi di lingkungan nyata menunjukkan 'jaggedness' berupa kesalahan yang berulang
    • Sebagai contoh, ketika diminta memperbaiki kode, model memperbaiki satu bug tetapi kembali membuat bug lain
  • Pelatihan RL dianalisis terlalu menyesuaikan diri pada metrik evaluasi tertentu sehingga menyebabkan penurunan kemampuan generalisasi
  • Dibandingkan dengan cara belajar manusia, model dianalogikan seperti 'murid competitive programming' yang overfit pada jenis soal tertentu sehingga kemampuan penerapan nyatanya rendah

Emosi dan Value Function

  • Sistem emosi manusia berperan penting dalam pengambilan keputusan, dan ditafsirkan sebagai padanan biologis dari value function
  • Melalui kasus manusia yang kekurangan emosi, ditekankan bahwa emosi adalah elemen esensial bagi penilaian dan pembelajaran yang efisien
  • Reinforcement learning saat ini hanya bergantung pada reward akhir, tetapi value function memungkinkan feedback pada tahap menengah sehingga efisiensi belajar meningkat
  • Hal ini mengisyaratkan bahwa AI ke depan perlu mengadopsi struktur value function yang memungkinkan regulasi emosional

Dari era scaling ke era riset

  • Periode 2012~2020 dibagi sebagai fase perkembangan yang berpusat pada riset, sedangkan 2020~2025 adalah fase perkembangan yang berpusat pada scaling
  • Perluasan sederhana data, parameter, dan compute telah mencapai batasnya, dan kini diperlukan eksplorasi recipe pembelajaran baru
  • RL muncul sebagai sumbu scaling baru, tetapi pemanfaatan sumber daya yang efisien dan prinsip pembelajaran baru menjadi tugas kunci tahap berikutnya
  • Melalui pernyataan, "sekarang adalah era riset lagi", ia menekankan perlunya inovasi mendasar yang melampaui scaling semata

Kemampuan generalisasi manusia dan efisiensi belajar

  • Manusia belajar cepat dengan sedikit data, yang dijelaskan berkat prior evolusioner dan value function yang efisien
  • Fakta bahwa manusia juga sangat mampu belajar di bidang yang tidak terkait evolusi seperti bahasa, matematika, dan coding mengisyaratkan adanya prinsip pembelajaran yang fundamental
  • Manusia belajar melalui self-correction, dan hal ini dimungkinkan oleh ketangguhan value function yang terinternalisasi
  • Sutskever menyebut ada cara untuk mengimplementasikan prinsip belajar setara manusia, tetapi rinciannya tidak dipublikasikan

Strategi SSI dan pendekatan superintelligence

  • SSI beroperasi dengan fokus riset menggunakan pendanaan sebesar $3B, dan lebih berkonsentrasi pada riset fundamental daripada produk
  • Tetap mempertahankan strategi 'superintelligence straight shot', sambil menjalankan rilis bertahap dan pembelajaran melalui deployment
  • Tujuannya adalah 'AI yang bisa mempelajari semua hal', yaitu bukan kumpulan pengetahuan yang sudah selesai, melainkan super learner yang terus belajar
  • Disebutkan bahwa jika model seperti ini diterapkan ke seluruh ekonomi, ada kemungkinan pertumbuhan ekonomi yang sangat cepat

Alignment dan keamanan

  • Masalah inti AI adalah 'power', dan semakin kuat sistemnya, semakin penting deployment bertahap dan feedback real-time
  • Diperkirakan bahwa ke depan riset keamanan kolaboratif antarperusahaan AI dan penguatan intervensi pemerintah akan tak terhindarkan
  • SSI menargetkan AI yang memedulikan 'sentient life', dan mengklaim ini lebih realistis diwujudkan daripada alignment yang hanya berpusat pada manusia
  • Ia mengusulkan perlunya membatasi kekuatan superintelligence atau mengendalikannya lewat kesepakatan timbal balik

Ko-evolusi manusia-AI dan keseimbangan jangka panjang

  • Dalam jangka panjang, dia mengajukan skenario bahwa manusia perlu bergabung dengan AI (Neuralink++) agar dapat memahami dan mengendalikannya
  • Ia juga menyinggung misteri neurosains tentang bagaimana hasrat sosial dan emosi manusia dikodekan secara evolusioner pada level tinggi
  • Hal ini mengisyaratkan bahwa struktur hasrat tingkat tinggi tersebut dapat menjadi petunjuk bagi riset alignment AI

Identitas SSI dan pembeda teknisnya

  • SSI adalah 'perusahaan yang berpusat pada riset' dengan tujuan utama menyelidiki prinsip generalisasi
  • Berbeda dari perusahaan lain, SSI mengejar pendekatan teknis baru, dan memperkirakan akan ada konvergensi strategi alignment di masa depan
  • Ia memproyeksikan kemunculan learner setingkat manusia dalam 5~20 tahun, yang kemudian akan memicu spesialisasi dan diferensiasi melalui kompetisi pasar

Self-play dan multi-agent

  • Self-play dinilai sebagai metode menarik yang memungkinkan belajar hanya dengan compute tanpa data
  • Namun, metode ini memiliki keterbatasan karena terutama berlaku untuk keterampilan sosial seperti negosiasi dan strategi
  • Belakangan ini, pendekatan tersebut berkembang ke bentuk seperti struktur Prover–Verifier atau LLM-as-a-Judge, yang membuka kemungkinan mengamankan keragaman melalui kompetisi antaragen

Selera riset

  • Riset yang hebat harus sekaligus memiliki 'keindahan, kesederhanaan, dan inspirasi yang tepat di dalam otak'
  • Ia menekankan pentingnya mengambil inspirasi dari otak manusia, tetapi meniru struktur esensialnya secara tepat
  • Ia menjelaskan bahwa keyakinan top-down terhadap konsep tingkat tinggi, bukan hasil eksperimen bottom-up, adalah pendorong yang membuat riset terus berlanjut

Ringkasan : Ilya Sutskever menyatakan bahwa "era yang berpusat pada scaling telah berakhir, dan kini dimulai era riset yang berfokus pada generalisasi, continual learning, dan alignment," sambil menegaskan bahwa SSI berada di pusat transisi tersebut.

Belum ada komentar.

Belum ada komentar.