1 poin oleh GN⁺ 2025-03-12 | 1 komentar | Bagikan ke WhatsApp

Kecerdasan Buatan Probabilistik

  • Kecerdasan buatan mengacu pada ilmu dan rekayasa sistem buatan yang mampu melakukan tugas yang memerlukan kecerdasan manusia. Dalam beberapa tahun terakhir, telah ada kemajuan menarik dalam pendekatan berbasis data yang berlandaskan pembelajaran, dan machine learning serta deep learning memungkinkan cara baru bagi sistem komputer untuk memahami dunia. Reinforcement learning telah menghasilkan terobosan dalam permainan kompleks seperti Go dan tugas-tugas robotika.

  • Aspek inti dari kecerdasan bukan hanya membuat prediksi, tetapi juga memahami ketidakpastian dari prediksi tersebut dan mempertimbangkan ketidakpastian ini saat mengambil keputusan. Makalah ini membahas "kecerdasan buatan probabilistik".

Pendekatan Probabilistik

  • Bagian pertama membahas pendekatan probabilistik terhadap machine learning. Dibahas perbedaan antara ketidakpastian "epistemik" yang disebabkan oleh kekurangan data dan ketidakpastian "aleatorik" yang berasal, misalnya, dari observasi dan hasil yang mengandung noise. Juga dibahas pendekatan konkret terhadap inferensi probabilistik serta pendekatan modern untuk inferensi aproksimasi yang efisien.

Mempertimbangkan Ketidakpastian dalam Tugas Pengambilan Keputusan Berurutan

  • Bagian kedua membahas pertimbangan ketidakpastian dalam tugas pengambilan keputusan berurutan. Active learning dan Bayesian optimization dibahas, yang merupakan pendekatan pengumpulan data dengan mengusulkan eksperimen informatif untuk mengurangi ketidakpastian epistemik. Juga dipertimbangkan reinforcement learning serta pendekatan deep RL modern yang menggunakan aproksimasi fungsi jaringan saraf. Pendekatan modern untuk model-based RL dibahas, yang memanfaatkan ketidakpastian epistemik dan aleatorik untuk memandu eksplorasi serta mempertimbangkan keamanan.

1 komentar

 
GN⁺ 2025-03-12
Opini Hacker News
  • Teks ini memiliki diagram penjelasan yang sangat bagus, dan tampaknya merupakan tinjauan berkualitas tinggi tentang machine learning dari sudut pandang probabilitas

    • Baru-baru ini saya sangat terkesan dengan buku teks gratis dan kuliah YouTube Zhao berjudul "Mathematical Foundation of Reinforcement Learning"
    • Jika tidak punya banyak waktu, ada baiknya sekilas melihat diagram isi ringkasan Zhao. Itu adalah peta konseptual yang bagus untuk seluruh bidang ini
    • Dan saya juga merekomendasikan menonton video pengantarnya
  • Saya menemukan materi ini beberapa hari lalu, dan itu menjadi alasan yang saya cari untuk benar-benar meninjaunya, karena Andreas Krause telah melakukan riset yang mendalam dan menarik tentang Gaussian Processes dan Bandits

  • Realitas eksistensial adalah distribusi potensi, bukan deretan keadaan

    • Potensi itu ada, dan probabilitas adalah deskripsi matematis dari distribusinya. Semua properti adalah dimensi (vektor)
    • Keadaan hanyalah pengukuran sesaat dari resolusi. Potensi saling berinteraksi melalui interferensi konstruktif dan destruktif
    • Interferensi konstruktif dan destruktif terselesaikan menjadi keadaan "sekarang" dari pengukuran sesaat
  • Pertanyaan tentang apakah LLM (yaitu, jaringan saraf) dapat memberi tahu probabilitas dari jawaban yang baru saja dikeluarkannya

    • Dulu sekali saya mempelajari hal-hal seperti ini di universitas, dan saya membuat interpreter Prolog dengan probabilitas dan koefisien kepercayaan untuk setiap istilah
  • Saya rasa dibutuhkan GUI agar interpretabilitas model bisa didemokratisasi dan bahkan gamer pun bisa ikut mengeksplorasinya

    • Pada dasarnya ini berarti melatih model lain yang mengubah LLM ke bentuk 3D lalu menempatkannya di dunia 3D yang dapat dipahami manusia
    • Sebagai contoh sederhana, representasikan LLM sebagai padang hijau dan objek-objek, lalu tetapkan manusia sebagai satu-satunya agen
  • Saya pikir Gaussian Processes dengan kernel yang tepat bisa sangat kuat hanya dengan beberapa data point dan sekumpulan kecil parameter

    • Saya menggunakannya dalam tugas computer vision sebagai proses nonlinear yang dapat diprediksi untuk menyesuaikan input, dan hasilnya sangat bagus
  • Ini tampaknya menjadi referensi terbaik tentang topik ini dan sebagian bertumpang tindih dengannya. Disebutkan "An Introduction to Statistical Learning" oleh Gareth James dkk.

    • Saya penasaran apakah materi ini akan lebih mudah diakses, dan contoh R/Python akan membantu
  • Kevin Murphy sedang mengganti nama seri Probabilistic Machine Learning miliknya

  • Gemini 2.0 Experimental 02-05 melihat ini hanya sebagai 107K token

    • Berguna jika Anda butuh bantuan untuk memecahnya
  • Laplace Approximation adalah cara "cepat dan sederhana" untuk mengubah distribusi probabilitas yang kompleks menjadi Gaussian sederhana (kurva lonceng)

    • Cara kerjanya adalah dengan menemukan titik tertinggi dan mencocokkan kelengkungan pada titik itu
    • Cepat dan mudah, tetapi bisa sangat tidak akurat dan terlalu percaya diri jika distribusi sebenarnya berbeda dari kurva lonceng
  • Saya mengambil kelas ini di ETH Zurich, dan ini adalah salah satu kelas favorit saya

    • Saya sangat terkesan terutama oleh cara mengkuantifikasi ketidakpastian dan cara membangun blok awal reinforcement learning
    • Ini bacaan yang bagus untuk data scientist dan ML engineer. Dokumen ini adalah catatan kuliah