- Model AI seperti CheXNet yang dipublikasikan pada 2017 menunjukkan kinerja lebih akurat daripada radiolog manusia dalam diagnosis pneumonia, tetapi gagal mereproduksi hasil tersebut di praktik medis nyata
- Meski baru-baru ini ratusan model AI radiologi telah memperoleh persetujuan FDA, jumlah posisi kerja dan gaji radiolog di AS justru mencatat rekor tertinggi sepanjang masa
- Keterbatasan AI medis disebabkan oleh kurangnya data, perbedaan dengan lingkungan nyata, hambatan regulasi dan asuransi, serta struktur kerja di mana radiolog manusia menangani banyak peran selain diagnosis
- Alih-alih otomatisasi penuh, sistem yang menggabungkan manusia dan AI telah menjadi standar industri medis, dan bahkan ketika AI berkembang, kebutuhan tenaga radiolog tidak berkurang
- Dekade pertama penyebaran AI medis menunjukkan paradoks bahwa meski teknologi AI sangat berpotensi meningkatkan produktivitas, dalam praktiknya justru memicu permintaan lebih besar terhadap tenaga kerja manusia
Pendahuluan: adopsi AI dan ekspektasi
- Model AI seperti CheXNet yang muncul pada 2017 dilatih dengan lebih dari 100 ribu data rontgen dada, dan menunjukkan hasil yang lebih unggul daripada spesialis manusia dalam akurasi pembacaan pneumonia
- Berbagai perusahaan seperti Annalise.ai, Lunit, Aidoc, dan Qure.ai telah meluncurkan sistem AI yang dapat mendeteksi ratusan penyakit, dan juga bisa diintegrasikan ke sistem rekam medis rumah sakit
- Ada lebih dari 700 model AI radiologi yang disetujui FDA, setara dengan 75% dari seluruh perangkat AI medis
- Radiologi selama ini dinilai sebagai bidang yang paling cocok untuk digantikan AI karena memiliki input digital, pengenalan pola, dan pengukuran hasil yang jelas
- Namun dalam kenyataannya, permintaan untuk pelatihan radiolog justru mencapai titik tertinggi sepanjang masa, dan upah juga naik 48% dibanding 2015, menunjukkan peningkatan kebutuhan tenaga manusia
Keterbatasan sistem diagnosis radiologi AI
Perbedaan antara lingkungan nyata dan data pelatihan
- Model AI radiologi menunjukkan kinerja unggul pada data yang terstandarisasi dan dalam kondisi tertentu, tetapi di lingkungan rumah sakit nyata performanya menurun karena perbedaan data antar rumah sakit, karakteristik alat diagnostik, dan kurangnya keragaman
- Sebagian besar model hanya memberikan akurasi tinggi untuk penyakit tertentu atau satu jenis citra, sehingga dalam kasus yang beragam muncul ketidaknyamanan karena harus bergantian memakai banyak model
- Bahkan algoritme yang disetujui FDA pun hanya menangani sebagian kecil dari pekerjaan pembacaan citra nyata, dan umumnya berfokus pada sejumlah kecil penyakit penting seperti stroke, kanker payudara, dan kanker paru
- Ada juga masalah kurangnya data anak-anak, perempuan, dan kelompok ras minoritas, serta turunnya kemampuan prediksi ketika penyakit muncul secara halus atau bercampur dengan penyakit lain
Kesenjangan antara benchmark dan penerapan klinis
- Dalam pengujian benchmark, AI mencatat metrik kuantitatif yang tinggi, tetapi di lingkungan klinis nyata radiolog manusia dan sistem bantu tidak menghasilkan hasil sebaik yang diharapkan
- Misalnya, di bidang mamografi, sistem AI pendukung memang meningkatkan sensitivitas pembacaan, tetapi hanya menambah pemeriksaan lanjutan dan biopsi yang tidak perlu tanpa meningkatkan tingkat penemuan kanker
- Hasil juga menunjukkan bahwa ‘pembacaan ganda’, yaitu ketika satu atau dua pembaca manusia membaca bersama, memiliki kemampuan deteksi kanker yang lebih tinggi dibanding bantuan AI, serta tingkat pemeriksaan ulang yang tidak perlu lebih rendah
Regulasi hukum dan kelembagaan membatasi laju otomatisasi
- FDA membagi perangkat lunak radiologi menjadi ‘alat bantu/klasifikasi’ dan ‘alat otomatisasi penuh’
- Otomatisasi penuh jarang terjadi, dan hanya diterapkan pada kondisi khusus tertentu seperti IDx-DR
- Untuk citra yang sulit dibaca AI, perangkat lunak harus menghentikan prosesnya sendiri lalu meneruskannya kepada tenaga medis
- Persyaratan regulasi tinggi, dan setiap kali model dilatih ulang atau diubah, persetujuan baru juga diperlukan
- Perusahaan asuransi memandang alat otomatisasi berisiko menimbulkan kerugian massal jika terjadi kesalahan, sehingga cenderung enggan memberikan pertanggungan untuk hasil diagnosis yang hanya dilakukan oleh AI
- Secara hukum, standar yang berlaku adalah hanya pembacaan yang diinterpretasikan dan ditandatangani langsung oleh dokter yang dapat ditanggung asuransi
Perubahan peran radiolog manusia
- Dalam praktiknya, radiolog hanya menggunakan 36% waktunya untuk interpretasi citra, sementara sisanya dialokasikan untuk berbagai tugas seperti konsultasi dengan pasien dan kolega, pengawasan pemeriksaan, pendidikan, dan perubahan resep
- Bahkan ketika waktu pembacaan citra berkurang, tidak terjadi PHK yang tidak perlu; sebaliknya, pekerjaan baru justru bertambah sehingga volume keseluruhan pembacaan citra meningkat
- Sebagai contoh, saat beralih dari film ke digital, produktivitas pembacaan citra memang melonjak, tetapi tidak ada pengurangan tenaga medis, dan total pemeriksaan citra malah meningkat lebih dari 60%
- Peningkatan kecepatan pemrosesan citra berujung pada pemanfaatan yang lebih beragam dalam sistem medis, seperti pengurangan waktu tunggu pemeriksaan dan peningkatan kemampuan merespons situasi darurat
Prospek ke depan: pelajaran dari 10 tahun pertama penyebaran AI
- Dalam 10 tahun terakhir, penerapan dalam layanan medis sehari-hari berkembang jauh lebih lambat daripada tingkat kemajuan teknis model AI
- Faktor nonteknis seperti regulasi, asuransi, konsultasi pasien, dan otonomi dokter menjadi hambatan bagi penggantian total
- AI menjadi model dasar yang berkontribusi pada peningkatan produktivitas melalui kolaborasi dengan manusia, bukan penggantian tenaga kerja
- Pada platform besar (misalnya Facebook), kemungkinan otomatisasi dengan AI mungkin tinggi, tetapi semakin beragam tugas yang menyusun pekerjaan berbasis pengetahuan, semakin besar kecenderungan adopsi perangkat lunak untuk menambah, bukan mengurangi, beban kerja manusia
- Pengalaman di bidang radiologi menunjukkan hasil paradoks: alih-alih segera menggantikan pekerjaan manusia, AI justru mempertahankan atau memperluas permintaan tenaga manusia bersamaan dengan perubahan sosial, institusional, dan perilaku
1 komentar
Komentar Hacker News
Saya adalah dokter radiologi intervensi sekaligus pemegang gelar master ilmu komputer; di luar bidang radiologi, saya kurang paham mengapa orang tidak mengerti kenapa AI masih belum menggantikan radiologi. Penjelasannya begini: untuk pertanyaan apakah AI bisa melakukan diagnosis pencitraan lebih baik daripada radiolog manusia, jawabannya hampir pasti ‘ya’ atau akan segera begitu. Tetapi untuk pertanyaan apakah radiologi akan tergantikan, jawabannya hampir pasti ‘tidak’. Alasannya adalah risiko hukum medis. Selama hukum saat ini tidak berubah, radiolog harus memberikan tanda tangan akhir pada setiap laporan. Jadi meskipun AI membaca gambar dan menulis laporan sempurna, verifikasi akhir radiolog tetap menjadi bottleneck. Saat ini radiolog membaca setidaknya 60~100 pemeriksaan berbagai jenis per hari dengan cepat, dan itu sudah mendekati batas kemampuan manusia. Walaupun AI menulis semua laporan, semuanya tetap harus ditinjau dan ditandatangani, sehingga selisih waktu hampir tidak ada. Tentu mungkin ada satu-dua dokter yang ceroboh dan hanya menekan tombol tanda tangan, tetapi pasti ada pengacara yang siap menggugat soal itu
Pada 2016, ketika Tesla merilis video demo full self-driving dengan narasi “pengemudi duduk di sana hanya untuk alasan hukum dan tidak melakukan apa-apa, mobil mengemudi sendiri”, saya sempat berpikir industri truk akan berubah selamanya dan mempertimbangkan ulang masuk ke industri itu. Tetapi sekarang 2025 sudah di depan mata, dan sebagian besar perubahan berlangsung lambat atau hampir tidak terjadi sama sekali. Optimisme bahwa teknologi akan mengubah dunia secara besar-besaran memang meluas, tetapi pada praktiknya perubahan sering sangat lambat atau mandek
Anekdot terbaik tentang machine learning dan radiologi adalah masa ketika semua orang berlomba membedakan pasien COVID dari X-ray paru dengan AI. Ada satu kelompok riset yang menghasilkan performa deteksi yang lumayan baik, tetapi kemudian diketahui bahwa AI itu mempelajari perbedaan font watermark gambar dari rumah sakit yang berbeda di dalam dataset, sehingga yang dibedakan bukan status infeksi COVID melainkan ‘font’-nya. Lihat makalah rujukan: makalah Nature Machine Intelligence Kata kunci pencarian: “AI for radiographic COVID-19 detection selects shortcuts over signal”. Anda juga bisa menemukan makalah open access
Inti artikelnya adalah tiga hal ini: 1) jika Anda ingin memberi model lebih banyak pekerjaan, Anda akan terbentur regulasi hukum 2) regulator dan perusahaan asuransi tidak menyetujui/menanggung model otonom 3) diagnosis hanya mengambil porsi kecil dari pekerjaan radiolog; sebagian besar tugas lainnya adalah komunikasi dengan pasien dan tenaga medis lain. Jadi bahkan jika model machine learning mendiagnosis dengan sempurna dan gratis, radiolog tidak bisa langsung ‘digantikan’
Bahkan hari ini saja saya merujuk seorang pasien perempuan untuk biopsi inti ke radiologi, seorang pasien laki-laki untuk suntikan lumbal, pasien lain untuk suntikan bahu, dan sebulan lalu saya merujuk pasien perempuan lain untuk embolisasi endometriosis. Ke depan saya juga akan merujuk untuk embolisasi kebocoran urin pasca-nefrektomi. Apakah LLM bisa melakukan prosedur-prosedur ini? Jika AI mengkomoditisasi satu keterampilan, kelompok spesialis akan beralih ke keterampilan lain dan menyerahkan pekerjaan yang sudah terkomoditisasi. Misalnya, setelah interpretasi ECG diotomatisasi ke perangkat, tarif kompensasinya turun drastis sehingga saya pun sengaja menjauh dari keterampilan itu dan fokus ke layanan otak serta gangguan gerak. Jadi jika pasien butuh interpretasi ECG, saya langsung kirim ke kardiolog dan minta berbagai pemeriksaan tambahan. Ini menambah biaya dan waktu bagi pasien serta sistem kesehatan, tetapi begitulah kenyataannya. Ke depan mungkin akan muncul bidang ‘gurun medis’ tempat para ahli AI tidak mau bekerja, terutama untuk lansia, daerah terpencil, dan psikiatri
Pada 2016 Geoffrey Hinton pernah berkata bahwa ‘sudah saatnya menghentikan pelatihan radiolog’. Kalau kita percaya semua klaim para pendukung AI, dunia seharusnya sudah runtuh sejak lama
Saya seorang dokter sekaligus full-stack engineer, jadi saya tidak ingin mengambil radiologi atau pelatihan tambahan. AI akan lebih dulu memperkuat radiologi, lalu setelah itu mulai menggantikan sebagian pekerjaan. Radiolog yang ada akan secara alami berpindah ke area baru seperti radiologi intervensi
Pada bulan Mei tahun ini, New York Times juga menerbitkan artikel serupa berjudul ‘AI tidak menggantikan radiolog’ Lihat artikel NYT. Pendapat dokter dan pernyataan Hinton menarik: “AI akan membantu dan melakukan kuantifikasi, tetapi tidak akan mengambil alih kesimpulan interpretatif dari teknologi ini” “Dalam 5 tahun, tidak menggunakan AI justru akan dianggap malapraktik” “Tetapi pada akhirnya manusia dan AI akan berjalan bersama” Hinton juga kemudian mengakui lewat email bahwa ia berbicara terlalu umum; yang ia maksud hanya interpretasi gambar, arah umumnya benar, tetapi prediksi waktunya salah
Transformasi AI di radiologi harus diwajibkan. Radiologi harus menggunakan AI untuk persentase tertentu setiap hari, produktivitasnya harus dilipatgandakan, dan jika tidak maka harus dipecat. Seperti kata para CEO, AI adalah teknologi paling transformatif yang pernah kita lihat, jadi karena rasa cemas kita harus menerimanya. Selain itu tidak bisa ditoleransi
Saya tidak percaya jika interpretasi hasil AI diserahkan kepada dokter yang bukan radiolog. Walaupun AI unggul pada benchmark, tanpa latar belakang pengetahuan untuk menganalisisnya langsung, situasinya seperti membaca makalah 20 halaman tanpa bisa menilai apakah itu layak dipercaya