Apakah Data Science Sudah Menjadi Ilmu Semu?

(reddit.com)

10 poin oleh GN⁺ 2025-07-17 | 2 komentar | Bagikan ke WhatsApp

Ringkasan diskusi dan tanggapan yang diunggah di subreddit /r/DataScience
Penulis merasa skeptis terhadap kenyataan bahwa data science dijalankan hanya dengan nama “Generative AI” tanpa verifikasi maupun evaluasi
Kenyataannya, yang dilakukan hanyalah perhitungan z-score sederhana dengan kode yang dihasilkan ChatGPT, dan bahkan dibawa hampir ke tahap deployment tanpa evaluasi performa model
Di komunitas, banyak yang sama-sama menyoroti budaya perusahaan “kalau jalan ya deploy”, kurangnya validasi, penghindaran tanggung jawab, dan pengorbanan etika ilmiah
Banyak praktisi mengalami masalah serupa dan menyatakan kekhawatiran besar terhadap arus kemerosotan menjadi “ilmu semu”
Namun, sebagian juga berpendapat bahwa eksperimen cepat dan solusi sederhana kadang memang punya nilai praktis sehingga perlu sudut pandang yang seimbang

Data Science Has Become a Pseudo-Science

Penulis menyelesaikan studi master dan doktoral di Eropa, lalu bekerja di data science selama 10 tahun di industri dan akademia
Dalam 2 tahun terakhir, semakin sering muncul fenomena hasil yang dipromosikan atas nama “Generative AI” tanpa validasi apa pun
Sebagai contoh, pada proyek yang bertujuan mendeteksi anomali deret waktu, yang dilakukan hanyalah menghitung z-score dari selisih rata-rata dengan kode buatan ChatGPT, lalu deployment dibahas tanpa metrik performa apa pun
Cara seperti ini adalah wujud ilmu semu: bertanya pada black box dan menuruti hasilnya tanpa cara berpikir ilmiah, dan bahkan mempertanyakan hal itu pun dianggap tabu
Karena itu, penulis juga mempertimbangkan untuk kembali ke akademia, dan menulis posting ini untuk bertanya apakah rekan-rekan lain juga mengalami hal serupa

Filsafat “pokoknya kalau jalan, deploy saja” sudah sangat meluas (u/Illustrious-Pound266)
Ada juga contoh startup yang gagal karena menonjolkan AI tanpa validasi maupun roadmap (u/gothicserp3nt)
Bias atau diskriminasi yang tidak disengaja tidak ditinjau dengan semestinya (u/tehMarzipanEmperor)
Di banyak perusahaan, RAG atau AI dibungkus secara berlebihan dan dijalankan lebih demi show daripada akurasi (u/castleking, u/flowanvindir)
Suasana kerja saat ini terasa seperti “performance theater” (u/Ty4Readin, u/faulerauslaender)
Demi menunjukkan hasil, deployment yang tergesa-gesa, laporan yang tampak mewah, dan adopsi AI tanpa pengukuran menjadi hal biasa (u/glittering_tiger8996, u/Emergency-Job4136)
Banyak pula yang melihat bahwa situasi seperti ini sebenarnya sudah lama ada, dan GenAI hanya membuatnya lebih gamblang (u/RoomyRoots, u/303uru, u/TARehman)
Diterima karena cepat, meski explainability rendah dan keandalannya juga lemah
Akuntabilitas dalam pengambilan keputusan perusahaan makin menghilang (u/empathic_psychopath8, u/Jollyhrothgar)

Jika pendekatan sederhana bisa menyelesaikan masalah, maka itu juga perlu diakui secara pragmatis (u/AnarkittenSurprise)
Banyak komentar juga menyebut bahwa DS sejak awal memang selalu mengandung unsur yang tidak sepenuhnya ilmiah, atau bahkan “hanya sains pada namanya saja” (u/TaiChuanDoAddct, u/Time-Combination4710, u/LighterningZ)
Yang penting bukan sekadar memakai alat AI, melainkan kemampuan menggunakannya secara bertanggung jawab (u/Dror_sim, u/ResearchMindless6419)
Kritik seperti “datanya ada, tapi logikanya tidak” dan sekadar menjalankan package tanpa pengetahuan statistik juga muncul (u/gyp_casino, u/tmotytmoty)
Banyak yang menilai bahwa yang benar-benar penting adalah pengetahuan domain dan cara berpikir matematis, sedangkan AI/coding hanyalah alat (u/MightBeRong, u/Dror_sim)

Program MSDS berguna secara akademis, tetapi sering tidak relevan dengan pekerjaan (u/throwaway_ghost_122)
Kualitas pendidikan menurun, dan meningkatnya permintaan dari orang yang hanya mengejar gelar ikut menurunkan kualitas praktik lapangan secara umum (u/Yam_Cheap)
Akademia sendiri juga bukan pengecualian, karena ada kecenderungan makin banyak paper yang belum tervalidasi dan analisis yang dangkal (u/joule_3am, u/Mishtle)

Bidang asuransi dan kesehatan masih menuntut validasi ketat karena regulasinya kuat, termasuk tinjauan hukum (u/Mishtle, u/mikka1)
Sebaliknya, startup, sales, game, dan sebagian manufaktur lebih berorientasi pada kecepatan dan show (u/Vercingetorex89, u/Brackens_World)
Bahkan di sektor publik, masuknya ChatGPT mulai meruntuhkan sistem validasi lama (u/TheFluffyEngineer, u/joule_3am)

Banyak praktisi mengatakan mereka sedang mempertimbangkan keluar dari industri atau beralih ke akademia (u/thro0away12, u/Emotional_Plane_3500, u/candidFIRE)
Ada juga pandangan positif bahwa orang yang benar-benar kompeten justru bisa semakin menonjol dalam situasi seperti ini (u/OddEditor2467, u/sideshowbob01)

“Sekarang ini, cuma import pandas saja sudah bisa disebut data scientist” (u/vesnikos)
Kenyataan bahwa menyenangkan atasan lebih penting daripada berpikir probabilistik dan verifikasi ilmiah (u/tmotytmoty, u/WignerVille)
Banyak juga yang realistis bahwa dulu pun begitu, sekarang pun begitu, dan sulit menyebut DS di perusahaan sebagai ‘sains’ dalam arti sebenarnya (u/TaiChuanDoAddct, u/LighterningZ)

Tulisan ini beserta komentarnya menunjukkan dengan jelas bahwa praktik data science belakangan ini sering lebih dikendalikan oleh tuntutan pengiriman cepat dan pemasaran AI daripada konsistensi ilmiah serta validasi
Ada kekhawatiran mendalam bahwa label “Generative AI” digunakan untuk membungkam kritik yang masuk akal, dan bahwa kode yang tidak tervalidasi bisa langsung berujung pada deployment
Baik akademia maupun industri sama-sama tidak sempurna, tetapi diskusi ini menegaskan bahwa agar data science benar-benar layak disebut ‘sains’, dibutuhkan pemikiran kritis dari dalam komunitas, pendidikan yang lebih baik, dan refleksi atas budaya kerja praktik

ytuniverse 2025-07-17

Tautannya sepertinya tidak berfungsi.
https://reddit.com/r/datascience/…

xguru 2025-07-17

Terima kasih. Sudah saya perbaiki.