13 poin oleh xguru 2025-01-23 | 1 komentar | Bagikan ke WhatsApp
  • Saat DrivenData dimulai pada 2014, pemanfaatan data science untuk kebaikan sosial masih berada pada tahap awal
  • Pada saat itu, teknik data science terutama digunakan oleh perusahaan seperti Netflix dan Amazon untuk pemasaran serta rekomendasi konten, dan hampir tidak ada contoh pemanfaatannya untuk organisasi nirlaba, NGO, perusahaan sosial, atau layanan pemerintah
  • Tujuan awal dan latar belakang
    • Talenta data science sangat langka dan biaya perekrutannya tinggi, dan kesenjangan ini bahkan lebih parah di organisasi yang menangani masalah sosial
    • Berawal dari Harvard Innovation Lab, dengan tujuan menjembatani kesenjangan kemampuan data science untuk masalah sosial
    • Tujuannya adalah memanfaatkan teknologi mutakhir data science dan crowdsourcing untuk menyelesaikan tantangan sosial utama di dunia
  • Dua kutipan yang mencerminkan pandangan saat itu
    • "Menjadikan big data berguna untuk pengambilan keputusan kemanusiaan adalah tantangan sekaligus peluang utama di era jaringan." – UN OCHA
    • "Orang-orang paling berbakat dari generasi saya menghabiskan pikirannya untuk membuat orang mengklik iklan… sungguh membuat frustrasi." – Jeff Hammerbacher, mantan manajer data Facebook
  • Perubahan selama 10 tahun terakhir
    • Berbagai upaya telah dilakukan untuk menerapkan data science dan AI pada dampak sosial
    • Lebih dari 150 proyek, bekerja sama dengan sekitar 80 mitra (Bank Dunia, Bill & Melinda Gates Foundation, NASA, dll.)
    • Menyelenggarakan lebih dari 75 kompetisi data science dengan total hadiah lebih dari $4,7 juta
  • Selama 10 tahun terakhir, DrivenData telah mengumpulkan praktik terbaik dan pelajaran dari upayanya mengejar kebaikan sosial melalui data science
  • Pada titik ini, mereka ingin bersama-sama memikirkan apa yang telah efektif, apa yang masih menantang, dan arah menuju masa depan yang lebih baik

Pratinjau 10 pelajaran utama

Contoh ketika data science bekerja dengan baik

  1. Data science memberi dampak yang berarti pada masalah sosial
  2. Data yang baik menghasilkan solusi yang baik
  3. Upaya paling berhasil ketika difokuskan pada masalah yang konkret dan kebutuhan manusia
  4. Paling efektif ketika menggabungkan kekuatan mesin dan manusia
  5. Perspektif lintas disiplin dan fleksibilitas memberi keuntungan bagi organisasi

Hal-hal yang masih menantang

  1. Data science adalah aktivitas litbang yang berulang, dan sektor sosial kurang berinvestasi dalam hal ini
  2. Sulit merekrut dan mendukung data scientist dengan baik
  3. Open source masih kurang dalam pengembangan solusi untuk non-developer
  4. Hype wave teknologi mendapat perhatian yang berlebihan
  5. Data science dan AI memiliki implikasi etis yang besar, tetapi alat dan praktik untuk mendukung penggunaan etis masih tertinggal

Zaman sedang berubah

Selama 10 tahun terakhir, laju perkembangan teknologi data dan AI sangatlah cepat. Unsur inovasi utama yang memungkinkan hal ini antara lain sebagai berikut:

  • Komputasi dan penyimpanan
    • Perluasan cloud computing dan storage membuat sumber daya yang dibutuhkan menjadi lebih murah dan lebih mudah diakses
    • Menurunkan biaya awal mulai dari eksperimen berbasis GPU hingga deployment cluster yang dapat diskalakan untuk menjalankan model secara real-time
  • Deep learning
    • Deep learning membawa perubahan yang revolusioner dalam data science
    • Arsitektur yang efektif seperti generative adversarial networks (GAN), transformer, variational autoencoder, dan graph neural network meningkat secara eksplosif
    • Ekosistem yang berpusat pada PyTorch dan TensorFlow berkembang, dan alat, library, serta model pra-latih mempercepat laju kemajuan
  • Demokratisasi akses teknologi
    • Data science dijuluki sebagai "pekerjaan paling seksi di abad ke-21", dan peluang belajar meningkat secara eksplosif
    • Melalui MOOCs, bootcamp, kompetisi data, dan lainnya, semakin banyak orang memperoleh keterampilan dasar data science
  • AI generatif
    • Munculnya large language model (LLM) mengubah cara kerja
    • Memperpendek waktu yang dibutuhkan untuk tugas-tugas kompleks dan membuka kemungkinan baru
    • Masih dikaji apakah AI generatif hanyalah tren sesaat atau inovasi nyata, tetapi jelas bahwa AI akan terus dimanfaatkan

Terlepas dari perubahan teknologi ini, sejumlah pola umum tetap teramati melampaui teknologi tertentu. Artikel ini membahas terutama hal-hal yang telah bekerja dengan baik selama 10 tahun terakhir dan hal-hal yang masih menjadi tantangan.

Contoh ketika data science bekerja dengan baik

Data science memberi dampak yang berarti pada masalah sosial

  • Situasi 10 tahun lalu
    • Potensi alat data science sudah jelas, tetapi penerapannya untuk dampak sosial masih terbatas
    • Saat itu, pembahasan terbatas pada beberapa contoh kasus dan lebih berpusat pada gagasan tentang kemungkinan di masa depan
  • Perkembangan saat ini
    • Model machine learning memengaruhi pengambilan keputusan di berbagai bidang seperti layanan kesehatan dan pengelolaan sumber daya alam
    • Data science membantu mengelola masalah seperti harmful algal blooms, perikanan yang tidak berkelanjutan, dan bencana alam akibat perubahan iklim, serta berkontribusi pada inklusi keuangan dan konservasi satwa liar
    • Di ranah publik, visualisasi data telah menjadi medium utama untuk peliputan berita dan penyampaian pesan
      • Contoh: kampanye pencegahan penyebaran COVID-19, dashboard WHO
  • Contoh konkret penggunaan citra satelit
    • Di Yaman, citra satelit digunakan untuk menganalisis jenis tanaman dan risiko iklim, sehingga memberikan informasi bagi program ketahanan pangan Bank Dunia
  • Kontribusi AI terhadap kemajuan ilmiah
    • AlphaFold: model prediksi struktur protein yang menyelesaikan pekerjaan yang sebelumnya memakan waktu bertahun-tahun hanya dalam beberapa jam dan menyediakan seluruh struktur protein secara gratis bagi para ilmuwan
    • Model transformer: diterapkan untuk mendeteksi ujaran kebencian dalam meme multimodal
    • Teknologi identifikasi individu: meningkatkan pelacakan spesies yang terancam punah (seperti paus) dan diperluas ke berbagai spesies lainnya
  • Perubahan di sektor sosial
    • Pada pertengahan 2010-an, pembahasan tentang pemanfaatan data terutama berfokus pada "pengukuran dampak"
    • Kini, fokusnya adalah pada bagaimana alat data science mengubah cara organisasi beroperasi dan memberi kemampuan baru
    • Pembahasan saat ini berfokus pada apa yang data science dan AI dapat "lakukan" melampaui apa yang bisa diukur

Data yang baik menghasilkan solusi yang baik, dan aksesibilitas data telah meningkat pesat

  • Meningkatnya peran data dalam keseharian
    • Data dihasilkan dalam setiap aktivitas, seperti berbelanja, menggunakan layanan darurat, atau mengunjungi rumah sakit
    • Peralatan rumah tangga, wearable device, kendaraan, ponsel, dan aplikasi mengumpulkan data penggunaan
    • Kemajuan teknologi sensor dan kamera meningkatkan pemanfaatan data gambar dan video
  • Dua tahap pemanfaatan data
    1. Mencatat data secara digital dan membuatnya dapat diamati
    2. Berkembang ke tahap memanfaatkan data untuk belajar dan menemukan pola
  • AI dan machine learning yang bertumpu pada data
    • Kuantitas dan kualitas data yang lebih besar mendukung penemuan pola baru dan pengembangan algoritma
    • Contoh: deteksi kanker, algoritma rekomendasi Spotify, data pelatihan ChatGPT
  • Hierarki data science Monica Rogati
    • Fungsi-fungsi tingkat lanjut dalam data science memerlukan fondasi data yang kuat
    • Investasi yang bijak pada infrastruktur data menjadi dasar untuk mewujudkan kemampuan tingkat atas
  • Pemanfaatan data untuk nilai sosial
    • Pemerintah dan lembaga besar memperluas pembukaan data publik
    • Jenis data yang dimanfaatkan DrivenData:
      • Data cuaca, data transportasi, data OpenStreetMap: perencanaan lalu lintas udara, mendukung ketahanan bencana
      • Citra satelit: pemetaan cakupan banjir, estimasi biomassa hutan
      • Data transaksi seluler: analisis perilaku dan sikap keuangan
      • Data survei: wawasan opini dan perilaku dalam skala besar
      • Rekaman audio: klasifikasi tingkat literasi anak
      • Citra resolusi tinggi: prediksi kemungkinan kekambuhan melanoma
      • Data teks: analisis otomatis konsep klinis dalam catatan pendapat dokter
  • Pentingnya aksesibilitas dan kegunaan data
    • Data tidak cukup hanya dibuka ke publik
    • Jika tersedia dalam format yang dapat dibaca mesin, dokumentasi yang jelas, dan contoh use case, partisipasi dan pemanfaatannya akan meningkat
    • Banyak organisasi berinvestasi dalam pengumpulan data, tetapi kurang memberi perhatian pada investasi tambahan untuk memanfaatkannya
    • Dokumentasi data dan contoh penerapan memainkan peran yang sama pentingnya dengan hadiah kompetisi

Upaya paling berhasil ketika difokuskan pada masalah yang konkret dan kebutuhan manusia

  • Jebakan pendekatan yang berpusat pada teknologi
    • Organisasi berdampak sosial sering berupaya mengikuti tren teknologi terbaru
    • "Big data" dan alat AI sering terlihat seperti solusi serba bisa, tetapi pada praktiknya paling efektif ketika difokuskan pada penyelesaian masalah yang spesifik
  • Kunci perancangan proyek yang sukses
    • Menentukan pengguna dan masalah secara spesifik, lalu menetapkan tujuan terukur yang dapat menyelesaikannya
    • Menggunakan alat desain berpusat pada manusia untuk memahami apa yang "diinginkan" orang, dan mengembangkan solusi yang melampaui apa yang secara teknis "memungkinkan"
  • Contoh konkret
    • Deteksi ledakan alga (CyFi)
      • Bekerja sama dengan NASA untuk mendeteksi ledakan sianobakteri berbahaya melalui citra satelit
      • Membantu pengelola air menilai kondisi ledakan alga secara akurat dan mengalokasikan sumber daya dengan lebih efisien
    • Identifikasi satwa liar (Zamba)
      • Bekerja sama dengan Institut Max Planck untuk mengembangkan alat identifikasi hewan otomatis menggunakan data camera trap
      • Meningkatkan kemudahan penggunaan melalui Zamba Cloud, yang UI-nya disempurnakan berdasarkan umpan balik peneliti
  • Pentingnya sudut pandang pengguna
    • Pendefinisian masalah
      • Memahami masalah dan kebutuhan secara jelas melalui wawancara pengguna dan pengumpulan masukan
      • Mencerminkan perspektif manusia di balik titik-titik data
    • Penyampaian solusi
      • Diperlukan pengujian UI/UX dan komunikasi yang jelas agar pengguna dapat memanfaatkan solusi secara efektif dan memahami manfaatnya
      • Membantu pengguna memahami kekuatan dan keterbatasan model secara intuitif, serta menjelaskan cara pemanfaatannya melalui contoh nyata
  • Kesimpulan
    • Peran ilmuwan data adalah menghubungkan kemampuan teknis dengan kebutuhan sosial
    • Proyek yang paling efektif adalah yang tidak terjebak pada teknologi terbaru, melainkan berfokus pada pemecahan masalah dan hasil nyata

Solusi paling efektif ketika kekuatan mesin dan manusia digabungkan

  • Risiko ekspektasi berlebihan terhadap AI
    • Model data science dan AI tidak mahakuasa, dan setiap model memiliki keterbatasan sampai tingkat tertentu
    • Keberhasilan tidak dijamin hanya dengan mengadopsi AI
    • Solusi terbaik muncul dari sistem yang menggabungkan kekuatan mesin dan manusia
  • Contoh alat Zamba
    • Zamba memprediksi secara probabilistik apakah ada hewan dalam rekaman camera trap satwa liar
    • Model terkadang bisa salah, tetapi probabilitas yang diberikannya memungkinkan penyusunan strategi peninjauan yang efisien
      • Contoh: meninjau terlebih dahulu rekaman yang paling mungkin menampilkan simpanse, atau menetapkan ambang probabilitas untuk menganggap rekaman sebagai rekaman kosong
      • Hasilnya, dimungkinkan untuk mengidentifikasi 85% rekaman simpanse sambil hanya meninjau kurang dari 5% dari keseluruhan rekaman
  • Hasil kolaborasi mesin-manusia
    • Contoh skrining AI kanker payudara: ketika ahli radiologi dan AI bekerja sama, akurasinya lebih tinggi daripada saat masing-masing bekerja sendiri
    • Penekanan pada interpretabilitas dan explainability AI: menyediakan informasi agar manusia dapat menilai hasil AI dan mengintegrasikannya ke dalam konteks
      • Contoh: dalam kompetisi identifikasi paus, model menyediakan visualisasi fitur yang digunakan untuk mencocokkan paus individual
  • Pola serupa dalam AI generatif
    • Umpan balik manusia sangat penting bagi perkembangan alat yang berguna seperti ChatGPT
    • Data umpan balik dapat digunakan untuk terus meningkatkan model agar mempelajari kasus yang semakin sulit
  • Evaluasi biaya kesalahan dan titik perbaikan
    • Perancangan sistem dapat diperbaiki dengan dua pertanyaan:
      1. "Jika ada model yang sempurna, bagaimana Anda akan menggunakannya?"
      2. "Jika model itu kadang salah, bagaimana Anda akan menanganinya?"
    • Ini membantu mengidentifikasi batas toleransi kesalahan sistem dan bagian yang memerlukan peninjauan manusia
  • Pelajaran bagi organisasi
    • Kasus pemerintah Belanda pada 2021: 26.000 rumah tangga secara keliru dituduh melakukan penipuan tunjangan sosial karena algoritma yang tidak tepat
    • Mengandalkan algoritma tanpa peninjauan manusia yang memadai menimbulkan biaya sosial yang tinggi
    • Sebaliknya, menggabungkan kekuatan algoritma dan manusia dapat memaksimalkan efisiensi dan efektivitas

Perspektif multidisipliner dan fleksibilitas membantu organisasi

  • Pengalaman proyek lintas bidang
    • Dengan menangani berbagai bidang seperti inklusi keuangan, aksi iklim, dan layanan kesehatan, manfaat perspektif multidisipliner menjadi jelas
    • Pola machine learning dalam konteks tertentu dapat diperluas dan diterapkan ke bidang lain
      • Contoh: penerapan lintas model computer vision untuk konservasi hutan kelp dan model untuk mendeteksi lesi pada biopsi serviks
  • Fleksibilitas pendekatan
    • Masalah yang berbeda seperti deteksi dini hama tanaman dan ekstraksi keterampilan dari resume sama-sama dapat didasarkan pada named entity recognition (NER)
    • Pelajaran dan pengalaman dari pendekatan yang sudah ada dapat diterapkan ke masalah lain dengan biaya yang lebih rendah
  • Contoh konkret
    • Pendekatan pemrosesan bahasa alami yang mengenali tanaman, hama, penyakit, dan bahan kimia dalam pesan WhatsApp
    • Membantu petani kecil memahami tren baru dan meningkatkan saran berbasis sains
  • Keseimbangan antara keahlian dan sudut pandang pengguna
    • Kolaborasi dengan pakar domain memastikan konteks yang sesuai untuk masalah yang dihadapi
    • Memasukkan perspektif pengguna dalam proses data science untuk merancang solusi yang tepat
  • Mengidentifikasi "pekerjaan yang layak dilakukan"
    • Keahlian teknis saja tidak cukup; dibutuhkan empati, komunikasi, rasa ingin tahu, dan fleksibilitas
    • Perlu brainstorming tentang area tempat machine learning dapat menambah nilai, sambil memahami secara mendalam untuk siapa pendekatan itu ditujukan dan bagaimana akan digunakan
  • Memenuhi beragam kebutuhan organisasi
    • Kebutuhan tiap organisasi berbeda, mulai dari riset eksploratif hingga tahap prototyping dan produksi
    • Bekerja sama dengan berbagai mitra, mulai dari organisasi penyedia data besar (Candid, NASA, dan lainnya) hingga organisasi yang baru pertama kali membangun sistem data
    • Penting untuk menjaga kesesuaian teknologi sekaligus menarik fleksibilitas dari pengalaman yang kaya

Bagian yang masih menantang

Data science bersifat iteratif, dan sektor sosial kurang berinvestasi dalam R&D

  • Hakikat dan nilai R&D
    • Riset dan pengembangan adalah proses pembelajaran yang memerlukan investasi modal, eksperimen, refleksi, dan kemauan untuk menerima kegagalan
    • Pendekatan yang serba pasti dan jangka pendek memiliki keterbatasan dalam menyelesaikan cakupan masalah yang dibutuhkan di sektor sosial
    • Investasi jangka panjang dan inovasi yang nonlinier menghasilkan pencapaian utama
  • Kurangnya investasi R&D di sektor sosial
    • Menurut survei NSF tahun 2022, 94% organisasi nirlaba besar sama sekali tidak melakukan aktivitas R&D
    • Meskipun data science pada dasarnya merupakan aktivitas R&D, investasi di bidang ini masih kurang
  • Sifat iteratif data science
    • Data science memanfaatkan pembelajaran berulang dan loop umpan balik untuk menghasilkan hasil yang optimal dan meningkatkan efisiensi layanan
    • Menggunakan kerangka kerja yang menekankan iterasi, seperti kursus data science Harvard dan CRISP-DM (proses standar data mining)
  • Pentingnya data science yang berpusat pada manusia
    • Proses pembelajaran berfokus pada perancangan solusi yang efektif dan dipadukan dengan kerangka inovasi yang dapat diulang
    • Desain berpusat pada manusia memperkuat keterkaitan antara kebutuhan nyata dan solusi
  • Contoh keberhasilan R&D di perusahaan swasta
    • Perusahaan swasta memahami dengan jelas nilai pemanfaatan data melalui proses R&D
    • Contoh inovasi AI terbaru menunjukkan hasil yang tidak akan mungkin tercapai tanpa investasi R&D yang berkelanjutan
  • Kesimpulan
    • Hasil awal proyek R&D data mungkin tidak pasti, tetapi proses untuk menciptakan nilai dari data itu sendiri merupakan metodologi yang telah terbukti
    • Investasi jangka panjang dan berkelanjutan dalam R&D sangat penting untuk mempercepat inovasi dan mengatasi tantangan di sektor sosial

Sulit merekrut dan mendukung ilmuwan data, dan ilmuwan data yang bekerja sendiri memiliki tingkat kepuasan yang rendah

  • Tantangan dari sudut pandang organisasi
    • Rekrutmen
      • Sulit mengidentifikasi dan mengevaluasi kandidat yang tepat ketika belum ada data scientist di organisasi
      • Istilah "data scientist" tidak memiliki definisi yang jelas karena mencakup beragam keterampilan dan pengalaman
    • Menarik dan mempertahankan talenta
      • Permintaan yang tinggi terhadap data scientist membentuk pasar perekrutan yang sangat kompetitif
      • Selain faktor motivasi untuk menyelesaikan masalah sosial, organisasi juga harus menawarkan pekerjaan teknis yang menarik, gaji yang kompetitif, dan peluang pengembangan profesional
      • Pada tahap awal perekrutan, lebih sulit lagi untuk menyediakan faktor-faktor tersebut
    • Manajemen dan dukungan
      • Agar data scientist tetap produktif, organisasi harus mendefinisikan cakupan masalah dengan jelas serta menyediakan arah, infrastruktur, dan data
      • Kurangnya latar belakang teknis membuat orang mudah meremehkan atau melebih-lebihkan tingkat kesulitan pekerjaan
  • Tantangan dari sudut pandang pengembang
    • Pembelajaran dan pertumbuhan
      • Data science adalah bidang yang berkembang cepat, sehingga peluang untuk belajar dan bertumbuh di dalam tim sangat penting
      • Dalam lingkungan yang menyulitkan code review, umpan balik model, dan pembagian beban kerja, peluang pertumbuhan menjadi terbatas
    • Kurangnya arah dan dukungan
      • Jika pekerjaan tidak didukung dengan baik, kepuasan dan produktivitas data scientist akan menurun
    • Kesenangan dalam bekerja
      • Proses mendiskusikan dan memecahkan masalah bersama rekan kerja meningkatkan kepuasan kerja
      • Hal ini bisa diatasi melalui jaringan eksternal, tetapi kolaborasi di dalam organisasi lebih efisien
  • Tanda-tanda perubahan
    • Belakangan ini semakin banyak organisasi di sektor sosial yang membentuk tim data internal
    • DrivenData berperan sebagai mitra yang mendukung perekrutan, onboarding, dan transisi kerja bagi data scientist dan engineer tahap awal
    • Pendekatan bekerja sama dengan tim spesialis data science eksternal untuk menyediakan kapasitas yang fleksibel menguntungkan baik bagi organisasi maupun data scientist
  • Prospek masa depan
    • Sebagian organisasi mulai berhasil membangun tim data, tetapi permintaan terhadap keterampilan data science masih tetap tinggi
    • Tantangan membangun tim data dari nol diperkirakan akan terus berlanjut

Open source belum cukup mengembangkan solusi untuk non-pengembang

  • Keterbatasan open source
    • Perangkat lunak open source sering berkembang efektif karena komunitas pengembang juga merupakan pengguna yang sama
    • Para kontributor termotivasi untuk memperbaiki alat yang akan mereka gunakan sendiri
    • Namun, untuk alat yang ditujukan bagi non-pengembang atau non-spesialis, motivasi seperti ini tidak bekerja
  • Tantangan alat untuk non-spesialis
    • Dalam proyek data science, sering kali dikembangkan metodologi dan alat untuk non-pengembang
    • Meski dirilis sebagai open source, jika tidak ada investasi dan pengembangan berkelanjutan, proyek bisa mandek atau dihentikan
    • Agar benar-benar berkembang menjadi solusi yang sukses, diperlukan pengembangan lanjutan setelah tahap prototipe dan uji pilot yang realistis
  • Contoh konkret: Concept to Clinic
    • Pada 2017-18, dikembangkan aplikasi terbuka yang menggunakan AI untuk membantu radiografer memproses CT scan
    • Untuk mendorong kontribusi, diperkenalkan sistem insentif terstruktur yang memberi poin dan imbalan finansial kepada para kontributor
    • Tanpa pendekatan ini, kemungkinan besar pengembangan proyek tidak akan mungkin dilakukan
  • Syarat untuk keberhasilan open source yang berkelanjutan
    • Sekadar merilis sesuatu sebagai open source tidak cukup untuk menjamin dampak jangka panjang
    • Agar dapat berkembang dari prototipe menjadi solusi bagi pengguna akhir, diperlukan roadmap yang jelas dan dukungan pendanaan berkelanjutan
    • Saat mengembangkan aplikasi penting, open source hanyalah bagian dari perjalanan, bukan tujuan akhir

Hype teknologi mendapat perhatian yang berlebihan

  • Sektor sosial dan inovasi teknologi
    • Sektor sosial selama 10 tahun terakhir sangat terkait dengan gelombang inovasi teknologi baru
    • Organisasi tergoda untuk mengadopsi teknologi baru demi meningkatkan efisiensi di tengah sumber daya yang terbatas
    • Tekanan bahwa mereka akan tertinggal jika tidak mengikuti tren teknologi terbaru membuat strategi sering berubah
  • Masalah adopsi teknologi yang dibesar-besarkan
    • Sulit memilah elemen inovasi yang benar-benar penting dari hype teknologi
    • Adopsi teknologi sering berujung pada ekspektasi berlebihan dan eksekusi yang kurang matang
    • Contoh:
      • Blockchain: dibanding ekspektasi yang tinggi, manfaat nyata bagi sektor sosial sangat minim
      • Aplikasi mobile: biaya dikeluarkan secara tidak efisien karena ada tekanan bahwa ini "wajib", bahkan ketika sebenarnya tidak diperlukan
  • Pentingnya organisasi teknologi spesialis
    • Organisasi spesialis teknologi yang mampu menangani hype teknologi secara efisien menghasilkan kinerja terbaik
    • DrivenData bekerja sama dengan DataKind, DSSG Fellowship, Delta Analytics, dan lainnya dengan memanfaatkan keahlian teknis
    • Namun, bahkan kelompok ahli ini pun sulit mengakumulasi pelajaran dari hype teknologi masa lalu secara sistematis
  • Perubahan yang dibutuhkan: ‘pemecah gelombang’ untuk menghadapi hype teknologi
    • Diperlukan kemampuan untuk memisahkan inovasi nyata dari ekspektasi berlebihan dan mengidentifikasi perkembangan inti
    • Kepemimpinan teknis yang memahami teknologi mutakhir sekaligus memiliki wawasan mendalam tentang sektor sosial sangat penting
    • Kepemimpinan dan ekosistem seperti ini saat ini masih kurang, dan keduanya diperlukan untuk membangun pendekatan yang berkelanjutan dan matang
  • Pendekatan strategis terhadap teknologi terbaru seperti AI
    • Potensi AI sangat besar, tetapi yang dibutuhkan bukan sekadar antusiasme melainkan strategi yang hati-hati dan keahlian yang mendalam
    • Tanpa membangun fondasi berbasis data yang kuat, ada risiko terjebak dalam siklus tidak efisien di mana hype teknologi terus terulang
    • Tanpa investasi dan perencanaan yang mendasar, inovasi teknologi di sektor sosial akan sulit menghasilkan capaian yang nyata

Data science dan AI memiliki implikasi etis yang besar, tetapi adopsi yang cepat melampaui alat dan praktik yang mendukungnya

  • Perluasan data science dan AI serta pentingnya etika
    • Data science dan machine learning telah terintegrasi ke berbagai bidang seperti layanan kesehatan, respons bencana, dan putusan pidana
    • Risiko yang ditimbulkan oleh penggunaan yang salah kini jauh lebih besar daripada sebelumnya
  • Kenyataan bahwa pertimbangan etis masih kurang
    • Data scientist memiliki perspektif unik untuk memahami implikasi etis dari model dan pipeline
    • Namun, perspektif ini sering kali tidak diintegrasikan ke dalam siklus hidup proyek data science
  • Pengembangan checklist open source untuk menangani trade-off etis
    • Diintegrasikan ke dalam workflow data science agar trade-off etis dapat didiskusikan
    • Prinsip utama:
      • Keputusan etis harus mengenali trade-off yang paling penting dalam konteks tertentu, serta bertujuan untuk melanjutkan secara bertanggung jawab dan meminimalkan dampak buruk
      • Masalah etis muncul di seluruh tahapan proyek, termasuk pengumpulan data, penyimpanan, analisis, pemodelan, dan deployment
      • Diskusi etis sering terdorong ke belakang dalam prioritas karena tenggat waktu dan tuntutan yang mendesak
      • Untuk mencegah hal ini, pertanyaan etis harus diintegrasikan ke aspek lain dari workflow dan waktu harus dialokasikan secara sengaja
  • Keadilan algoritmik dan mitigasi bias
    • Model yang dilatih dengan data bias akan mereproduksi ketimpangan, sehingga teknologi sedang dikembangkan untuk mengidentifikasi dan mengurangi hal tersebut
    • Contoh: bekerja sama dengan Wellcome Trust untuk membuat kasus mitigasi bias yang mempertimbangkan fairness dalam model prediksi stres psikologis
      • Menganalisis bias melalui metrik fairness yang terukur dan menyediakan cara mitigasinya
  • Pentingnya pertimbangan etis di era AI
    • Di tengah penyebaran AI yang cepat, perusahaan justru membubarkan tim responsible AI demi menghemat biaya
    • Di sektor sosial, tanggung jawab terhadap penerima manfaat lebih besar sehingga biaya kegagalan etis juga lebih tinggi
    • Jika praktik etis tidak diperkuat, adopsi AI berisiko menimbulkan masalah yang lebih besar
  • Kesimpulan
    • Membangun alat dan praktik etis untuk mendukung adopsi AI kini lebih penting daripada sebelumnya
    • Pemanfaatan teknologi secara bertanggung jawab harus menjamin kepercayaan dan keberlanjutan di sektor sosial

Prospek ke depan

  • Perubahan dan peluang dalam data science
    • Selama 10 tahun terakhir, data science telah mendorong perubahan penting di sektor sosial sambil mengalami keberhasilan dan tantangan sekaligus
    • Kesadaran akan potensi data dan AI meningkat, tetapi masih ada pertanyaan besar yang harus dijawab:
      • Bagaimana kemajuan teknologi yang berkelanjutan dapat diterapkan secara nyata pada masalah sosial terbesar?
      • Bagaimana memastikan manfaatnya tidak hanya terkonsentrasi pada segelintir perusahaan besar?
      • Bagaimana mewujudkan penerapan teknologi yang bertanggung jawab bagi alam dan umat manusia?
  • Pentingnya pelajaran yang diperoleh dari pengalaman
    • Upaya yang didasarkan pada pelajaran dari pengalaman masa lalu menghasilkan pencapaian terbesar
    • DrivenData bangga menjadi bagian dari komunitas mitra, klien, dan pengembang yang menggunakan data dan AI untuk kebaikan sosial
    • Jika Anda tertarik pada topik serupa atau memiliki ide tambahan, silakan berbagi
  • Harapan untuk masa depan
    • Jika 10 tahun terakhir begitu gemilang, 10 tahun ke depan diperkirakan akan membawa perubahan yang lebih besar lagi
    • Masih banyak pekerjaan yang harus dilakukan, dan masih banyak yang harus dipelajari
    • Menghadapi tantangan ini, kami menantikan masa depan yang mengeksplorasi kemungkinan baru dan menciptakan dampak sosial yang lebih baik

1 komentar

 
halfenif 2025-01-23

"Orang-orang paling berbakat di generasi saya mencurahkan pemikiran mereka untuk membuat orang mengklik iklan… sungguh membuat frustrasi."

Kalau benar-benar dipikir-pikir, memang begitu ya.