- Ringkasan diskusi dan tanggapan yang diunggah di subreddit /r/DataScience
- Penulis merasa skeptis terhadap kenyataan bahwa data science dijalankan hanya dengan nama “Generative AI” tanpa verifikasi maupun evaluasi
- Kenyataannya, yang dilakukan hanyalah perhitungan z-score sederhana dengan kode yang dihasilkan ChatGPT, dan bahkan dibawa hampir ke tahap deployment tanpa evaluasi performa model
- Di komunitas, banyak yang sama-sama menyoroti budaya perusahaan “kalau jalan ya deploy”, kurangnya validasi, penghindaran tanggung jawab, dan pengorbanan etika ilmiah
- Banyak praktisi mengalami masalah serupa dan menyatakan kekhawatiran besar terhadap arus kemerosotan menjadi “ilmu semu”
- Namun, sebagian juga berpendapat bahwa eksperimen cepat dan solusi sederhana kadang memang punya nilai praktis sehingga perlu sudut pandang yang seimbang
Data Science Has Become a Pseudo-Science
- Penulis menyelesaikan studi master dan doktoral di Eropa, lalu bekerja di data science selama 10 tahun di industri dan akademia
- Dalam 2 tahun terakhir, semakin sering muncul fenomena hasil yang dipromosikan atas nama “Generative AI” tanpa validasi apa pun
- Sebagai contoh, pada proyek yang bertujuan mendeteksi anomali deret waktu, yang dilakukan hanyalah menghitung z-score dari selisih rata-rata dengan kode buatan ChatGPT, lalu deployment dibahas tanpa metrik performa apa pun
- Cara seperti ini adalah wujud ilmu semu: bertanya pada black box dan menuruti hasilnya tanpa cara berpikir ilmiah, dan bahkan mempertanyakan hal itu pun dianggap tabu
- Karena itu, penulis juga mempertimbangkan untuk kembali ke akademia, dan menulis posting ini untuk bertanya apakah rekan-rekan lain juga mengalami hal serupa
Ringkasan komentar
Poin utama yang banyak disetujui
- Filsafat “pokoknya kalau jalan, deploy saja” sudah sangat meluas (
u/Illustrious-Pound266)
- Ada juga contoh startup yang gagal karena menonjolkan AI tanpa validasi maupun roadmap (
u/gothicserp3nt)
- Bias atau diskriminasi yang tidak disengaja tidak ditinjau dengan semestinya (
u/tehMarzipanEmperor)
- Di banyak perusahaan, RAG atau AI dibungkus secara berlebihan dan dijalankan lebih demi show daripada akurasi (
u/castleking, u/flowanvindir)
- Suasana kerja saat ini terasa seperti “performance theater” (
u/Ty4Readin, u/faulerauslaender)
- Demi menunjukkan hasil, deployment yang tergesa-gesa, laporan yang tampak mewah, dan adopsi AI tanpa pengukuran menjadi hal biasa (
u/glittering_tiger8996, u/Emergency-Job4136)
- Banyak pula yang melihat bahwa situasi seperti ini sebenarnya sudah lama ada, dan GenAI hanya membuatnya lebih gamblang (
u/RoomyRoots, u/303uru, u/TARehman)
- Diterima karena cepat, meski explainability rendah dan keandalannya juga lemah
- Akuntabilitas dalam pengambilan keputusan perusahaan makin menghilang (
u/empathic_psychopath8, u/Jollyhrothgar)
Sudut pandang lain
- Jika pendekatan sederhana bisa menyelesaikan masalah, maka itu juga perlu diakui secara pragmatis (
u/AnarkittenSurprise)
- Banyak komentar juga menyebut bahwa DS sejak awal memang selalu mengandung unsur yang tidak sepenuhnya ilmiah, atau bahkan “hanya sains pada namanya saja” (
u/TaiChuanDoAddct, u/Time-Combination4710, u/LighterningZ)
- Yang penting bukan sekadar memakai alat AI, melainkan kemampuan menggunakannya secara bertanggung jawab (
u/Dror_sim, u/ResearchMindless6419)
- Kritik seperti “datanya ada, tapi logikanya tidak” dan sekadar menjalankan package tanpa pengetahuan statistik juga muncul (
u/gyp_casino, u/tmotytmoty)
- Banyak yang menilai bahwa yang benar-benar penting adalah pengetahuan domain dan cara berpikir matematis, sedangkan AI/coding hanyalah alat (
u/MightBeRong, u/Dror_sim)
Masalah institusi dan pendidikan
- Program MSDS berguna secara akademis, tetapi sering tidak relevan dengan pekerjaan (
u/throwaway_ghost_122)
- Kualitas pendidikan menurun, dan meningkatnya permintaan dari orang yang hanya mengejar gelar ikut menurunkan kualitas praktik lapangan secara umum (
u/Yam_Cheap)
- Akademia sendiri juga bukan pengecualian, karena ada kecenderungan makin banyak paper yang belum tervalidasi dan analisis yang dangkal (
u/joule_3am, u/Mishtle)
Berbagi pengalaman menurut industri
- Bidang asuransi dan kesehatan masih menuntut validasi ketat karena regulasinya kuat, termasuk tinjauan hukum (
u/Mishtle, u/mikka1)
- Sebaliknya, startup, sales, game, dan sebagian manufaktur lebih berorientasi pada kecepatan dan show (
u/Vercingetorex89, u/Brackens_World)
- Bahkan di sektor publik, masuknya ChatGPT mulai meruntuhkan sistem validasi lama (
u/TheFluffyEngineer, u/joule_3am)
Keraguan dan keinginan untuk keluar
- Banyak praktisi mengatakan mereka sedang mempertimbangkan keluar dari industri atau beralih ke akademia (
u/thro0away12, u/Emotional_Plane_3500, u/candidFIRE)
- Ada juga pandangan positif bahwa orang yang benar-benar kompeten justru bisa semakin menonjol dalam situasi seperti ini (
u/OddEditor2467, u/sideshowbob01)
Sindiran dan sikap pasrah
- “Sekarang ini, cuma
import pandas saja sudah bisa disebut data scientist” (u/vesnikos)
- Kenyataan bahwa menyenangkan atasan lebih penting daripada berpikir probabilistik dan verifikasi ilmiah (
u/tmotytmoty, u/WignerVille)
- Banyak juga yang realistis bahwa dulu pun begitu, sekarang pun begitu, dan sulit menyebut DS di perusahaan sebagai ‘sains’ dalam arti sebenarnya (
u/TaiChuanDoAddct, u/LighterningZ)
Kesimpulan
- Tulisan ini beserta komentarnya menunjukkan dengan jelas bahwa praktik data science belakangan ini sering lebih dikendalikan oleh tuntutan pengiriman cepat dan pemasaran AI daripada konsistensi ilmiah serta validasi
- Ada kekhawatiran mendalam bahwa label “Generative AI” digunakan untuk membungkam kritik yang masuk akal, dan bahwa kode yang tidak tervalidasi bisa langsung berujung pada deployment
- Baik akademia maupun industri sama-sama tidak sempurna, tetapi diskusi ini menegaskan bahwa agar data science benar-benar layak disebut ‘sains’, dibutuhkan pemikiran kritis dari dalam komunitas, pendidikan yang lebih baik, dan refleksi atas budaya kerja praktik
2 komentar
Tautannya sepertinya tidak berfungsi.
https://reddit.com/r/datascience/…
Terima kasih. Sudah saya perbaiki.