2 poin oleh GN⁺ 2025-09-29 | 1 komentar | Bagikan ke WhatsApp
  • Analisis Data Bayesian adalah buku ajar yang banyak digunakan di bidang statistika dan ilmu data
  • Buku ini berfokus pada pemodelan probabilistik dan inferensi Bayesian, serta membahas berbagai metode analisis yang dapat diterapkan dalam praktik
  • Teknik komputasi berbasis kasus nyata seperti MCMC beserta metode implementasinya dibahas secara luas
  • Menyajikan contoh teori dan praktik secara seimbang agar dapat dipahami mulai dari pemula hingga ahli
  • Juga sangat bermanfaat di bidang machine learning, kedokteran, dan ilmu sosial

Pendahuluan

  • Analisis Data Bayesian, Edisi ke-3 adalah buku ajar inti yang memperkenalkan inferensi Bayesian secara sistematis dalam bidang statistika, ilmu komputer, dan teknik
  • Menekankan cara berpikir probabilistik dan analisis data di bawah ketidakpastian

Konsep Pemodelan Bayesian

  • Buku ini dimulai dari konsep prior probability dan posterior probability, lalu menjelaskan secara rinci metode inferensi berbasis data nyata
  • Menyajikan teori dasar yang mencakup berbagai distribusi probabilitas, estimasi parameter, serta persoalan prediksi

Aplikasi Analisis Data Nyata

  • Memuat berbagai studi kasus dan contoh penerapan menggunakan dataset nyata
  • Juga membahas secara mendalam teknik praktis seperti perancangan model, prapemrosesan data, dan MCMC (Markov Chain Monte Carlo) untuk komputasi
  • Menyediakan potongan kode yang dapat diterapkan di lingkungan praktik seperti R dan Python

Topik Lanjutan

  • Juga membahas secara luas model statistik tingkat lanjut seperti model hierarkis, analisis multivariat, dan metode Bayesian nonparametrik
  • Menjelaskan pula diagnostik model dan metode optimasi yang praktis

Pemanfaatan dan Dampak

  • Buku ini terus digunakan sebagai referensi di berbagai bidang luas seperti machine learning, bioinformatika, statistika medis, manajemen, dan ilmu sosial
  • Memungkinkan pembelajaran yang sistematis atas alat dan proses analisis Bayesian yang dapat diterapkan di dunia kerja nyata

1 komentar

 
GN⁺ 2025-09-29
Komentar Hacker News
  • Ini buku statistik favorit saya. Penulisnya, Andrew Gelman, membangun bidang baru dalam statistika Bayesian modern melalui riset teoretis tentang model Bayesian hierarkis, dan juga merilis Stan untuk penerapan praktis. Saya pernah mempelajari buku ini secara bertahap selama sekitar satu tahun, termasuk lampirannya. Setelah itu, buku ini menjadi fondasi yang sangat bermanfaat bagi riset saya tentang model Bayesian hierarkis. Ini bukan buku pengantar, melainkan sangat direkomendasikan bagi orang yang ingin meningkatkan kemampuan statistik mereka ke tingkat berikutnya. Jika membaca bab 1~5 terlebih dahulu, Anda bisa memahami filosofi pemodelan Gelman dengan baik, lalu untuk topik yang menarik saya sarankan memilih secara selektif sambil melihat daftar isi
    • Saya sangat menyukai Gelman, tetapi ungkapan bahwa ia "menciptakan bidang baru dalam statistika Bayesian" agak berlebihan
    • Pertanyaan yang meminta rekomendasi buku atau kuliah statistik yang layak dibaca sebelum bisa memahami buku ini
    • Ingin tahu apakah ada buku bagus yang berfokus pada statistik yang diterapkan pada pengujian nyata seperti riset medis, optimisasi, manufaktur, dan sebagainya
  • Saya pertama kali mengenal Gelman berkat penjelasan visual yang luar biasa tentang Linear Regression. Di sana Regression and Other Stories juga dikutip, tetapi karena bab terkait Bayesian tidak dibahas, saya jadi ingin membaca lebih lanjut
  • Saya sudah merasakan sendiri betapa bergunanya analisis Bayesian. Tim kami pernah memikirkan berapa banyak sampel yang harus diambil dari antara jutaan item agar validasi kualitas bisa dilakukan, dan saat itu kami menemukan solusi yang sangat elegan lewat analisis Bayesian. Matematikanya sendiri tidak sulit, jadi saya terkejut melihat para engineer bersikap sangat konservatif dalam mempelajari teknik dasar seperti ini. Padahal mereka semua sudah belajar matematika tahun pertama kuliah dengan baik
    • Saya penasaran apa yang ditolak oleh para engineer itu dan mengapa mereka perlu mempelajarinya. Banyak engineer setidaknya pernah mengambil kelas pengantar statistika, tetapi alasan mengapa mereka perlu mempelajari statistika Bayesian tidak begitu jelas. Bahkan p-value, interpretasi koefisien regresi, dan efek interaksi pun sulit ditafsirkan dengan benar dan mungkin juga kurang berguna dalam praktik. Sebaliknya, data scientist juga tidak harus mengerjakan seluruh aspek engineering seperti pipeline otomatisasi deployment, Kubernetes pod, atau distributed training untuk model pytorch, jadi memang ada prinsip pembagian kerja
  • BDA adalah buku terbaik untuk mempelajari pemodelan Bayesian secara ketat dan mendalam. Selain itu, ada juga berbagai pendekatan lain seperti Statistical Rethinking karya Richard McElreath, serta Regression and other stories karya Gelman dan Aki. Saya sendiri menulis buku yang menjelaskan topik ini dengan fokus pada kode dan contoh, dan sedang dibuka gratis sebagai open access
  • Tautan materi kuliah terkait bisa dilihat di sini
  • Saya menyukai blog statistika yang dijalankan dengan Gelman sebagai tokoh utamanya di Columbia. Di statmodeling.stat.columbia.edu ada berbagai diskusi statistika
    • Terima kasih sudah membagikannya; kalau ada tulisan yang menurut Anda sangat berkesan, saya ingin rekomendasinya
  • Jika Anda pemula, Doing Bayesian Data Analysis karya John Kruschke jauh lebih baik karena mudah dipahami dan enak dibaca
    • BDA adalah buku untuk mahasiswa pascasarjana; matematikanya tidak terlalu sulit, tetapi mengasumsikan pembacanya setidaknya sudah menempuh kuliah pertama statistika matematis
  • Saya sangat tertarik, tetapi buku ajar ini terasa terlalu berat. Akan bagus jika ada kursus kilat yang hanya mengajarkan teknik Bayesian untuk system performance engineer. Jika ada yang memahami kedua bidang ini, saya penasaran materi apa yang seharusnya dimasukkan dan apakah ada bahan belajar mandiri yang bisa direkomendasikan
    • Buku yang selalu saya gunakan ketika mengajar statistika adalah Statistical Rethinking. Buku itu berfokus pada bagaimana sebenarnya kita berpikir tentang pemodelan, yaitu proses menganalisis hipotesis dan memahami hipotesis yang diimplikasikan oleh model. Ada bagian yang sulit, tetapi justru itu juga bagian yang menyenangkan, dan buku ini menjelaskannya dengan sangat baik. Kekurangannya, buku ini tidak gratis (tetapi kuliah penulisnya tersedia gratis di YouTube, jadi walaupun tanpa bukunya saya tetap sangat merekomendasikan kuliahnya). Selain itu, Regression and Other Stories, yang salah satu penulisnya adalah Gelman, adalah buku yang menjelaskan topik ini dengan lebih mudah. Think Bayes dan Bayesian Methods for Hackers juga saya rekomendasikan untuk pemula dengan latar belakang coding. Untuk buku yang berfokus pada kelebihan teknik probabilistik (Bayesian) di bidang machine learning, saya merekomendasikan Probabilistic Machine Learning karya Kevin Murphy. Saya baru membaca edisi lamanya, tetapi saya dengar edisi barunya juga mendapat ulasan yang sangat baik
    • Bayesian Methods for Hackers (GitHub), serta materi online O'Reilly Bayesian Methods for Hackers juga layak dijadikan rujukan
  • Cara berpikir kuantitatif dasar dan intuisi statistika tetap penting. Bahkan jika tidak mempelajarinya dari Bayes, Anda tetap harus mempelajarinya dari tempat lain. Menurut "aturan akar kuadrat dari n", rasio sinyal terhadap noise meningkat sebanding dengan akar kuadrat dari jumlah pengukuran. Namun, seperti kata ayah saya, "semakin banyak Anda merata-ratakan data yang buruk, semakin besar kemungkinan Anda mendekati jawaban yang salah", jadi tetap harus hati-hati
  • foundation model dapat dipandang sebagai semacam mesin aproksimasi estimasi posterior (interference), tetapi ketidakpastian di situ umumnya diabaikan. Jika pendekatan yang lebih Bayesian dimanfaatkan dengan lebih baik, performanya mungkin bisa lebih bagus
  • Ada banyak masalah yang dataset-nya tidak terlalu besar, jadi foundation model tidak cocok untuk semua situasi, dan tergantung tugasnya metode Bayesian masih sangat valid
  • Aturan Bayes bersifat fundamental bagi inferensi probabilistik, jadi untuk menangani ketidakpastian secara kuantitatif kita perlu menggunakan metode Bayesian. Penerapannya pada model deep learning memang masih kurang efisien, tetapi secara prinsip bisa memberi hasil yang lebih baik
  • Dengan memanfaatkan data besar dan neural network, model Bayesian pun tetap bisa dipasang dengan baik, misalnya lewat variational inference, jadi relevansinya masih ada
  • Saya sedang menantikan buku Bayesian workflow