- Para pendiri Ligo Biosciences membagikan implementasi open source dari AlphaFold3, model terbaru untuk prediksi struktur protein
- Google DeepMind dan startup baru mereka, Isomorphic Labs, sedang memperluas bisnis ke pengembangan obat
- Mereka mengembangkan AlphaFold3 untuk mempercepat pengembangan obat dan menciptakan permintaan dari perusahaan farmasi
- Mereka sudah menandatangani kontrak senilai $3 miliar dengan Novartis dan Eli Lilly
- AlphaFold3 adalah model prediksi struktur biomolekuler (
biomolecular structure prediction) dengan 3 fungsi utama
- Prediksi struktur protein
- Prediksi struktur interaksi obat-protein
- Prediksi struktur kompleks asam nukleat-protein
- AlphaFold3 sangat penting dalam bidang sains karena sangat mempercepat pemetaan struktur protein
- Dibandingkan seorang mahasiswa doktoral yang meneliti satu struktur selama seluruh masa studi doktoralnya, dengan AlphaFold3 prediksi yang menyaingi akurasi eksperimental bisa diperoleh dalam hitungan menit
- Masalahnya, DeepMind mengumumkan AlphaFold3 pada bulan Mei tetapi tidak membuka source code-nya
- Hal ini memunculkan pertanyaan tentang reprodusibilitas dan ketidakpuasan di komunitas ilmiah
- AlphaFold3 adalah kemajuan mendasar dalam teknologi pemodelan struktur yang dapat dimanfaatkan oleh seluruh industri biotek, sehingga cakupan penggunaannya sangat luas
- Teknologi penyuntingan gen CRISPR: ilmuwan dapat melihat dengan tepat bagaimana DNA berinteraksi dengan protein Cas yang berfungsi seperti gunting
- Riset kanker: dapat memprediksi bagaimana obat potensial berikatan dengan target kanker. Salah satu sorotan makalah DeepMind adalah prediksi struktur kompleks inhibitor KRAS klinis dan targetnya
- Prediksi antibodi/nanobody dan target: AlphaFold3 meningkatkan akurasi untuk kelas molekul ini hingga 2 kali dibanding alat peringkat berikutnya
- Sayangnya, karena lisensinya nonkomersial, tidak ada perusahaan yang bisa menggunakannya
- Karena itu mereka merilis implementasi open source AlphaFold3
- Mereka membuka seluruh model yang dilatih pada protein rantai tunggal, dan dua fungsi lainnya akan segera dilatih serta dirilis
- Kode pelatihan juga disertakan
- Bobot model akan dibuka setelah pelatihan dan benchmarking selesai
- Mereka menggunakan lisensi Apache 2.0 agar benar-benar menjadi open source
- Melalui makalahnya, DeepMind telah mengungkap seluruh arsitektur model beserta pseudocode untuk setiap komponennya
- Ini sepenuhnya diterjemahkan ke PyTorch, tetapi membutuhkan jauh lebih banyak reverse engineering daripada yang diperkirakan
- Pada tahap implementasi awal, mereka menemukan berbagai masalah dalam makalah DeepMind yang dapat mengganggu pelatihan. Hal ini tampaknya akan menarik bagi komunitas deep learning
- Penskalaan loss MSE berbeda dari Karras et al. (2022). Bobot yang disediakan dalam makalah tidak menurunkan loss pada tingkat noise yang tinggi
- Residual layer hilang dari makalah
- Setelah menambahkan residual layer yang hilang, ada keuntungan pada gradient flow dan konvergensi
- Mereka penasaran apakah ada yang tahu alasan DeepMind menghilangkan residual connection di blok DiT
- Dalam bentuk modul MSA saat ini, ada dead layer
- Pair weighted averaging terakhir dan transition layer tidak dapat berkontribusi pada pair representation sehingga gradien tidak terpropagasi
- Ini diganti dengan urutan seperti ExtraMsaStack di AlphaFold2
- Menggunakan weight sharing juga bisa menjadi alternatif, tetapi penjelasan tentang hal ini di makalah cukup ambigu
- Di Ligo (YC S24), mereka menggunakan ide AlphaFold3 untuk perancangan enzim
- Mereka menganggap open-sourcing AlphaFold3 sebagai misi sampingan yang membantu komunitas
Pendapat GN⁺
- AlphaFold3 adalah teknologi revolusioner di bidang prediksi struktur protein dan diperkirakan akan berdampak besar pada pengembangan obat serta riset ilmu hayati
- Namun, keputusan DeepMind untuk tidak membuka source code dapat dipandang bertentangan dengan reprodusibilitas dan semangat kolaborasi di komunitas ilmiah
- Proyek open source dengan fungsi serupa AlphaFold3 antara lain OpenFold dan RoseTTAFold
- Saat mengadopsi AlphaFold3, akurasi model, keterbatasan, dan kebutuhan sumber daya komputasi perlu ditinjau secara cermat
- Munculnya implementasi open source ini memungkinkan lebih banyak peneliti dan perusahaan mendapatkan manfaat AlphaFold3, tetapi komersialisasi masih tetap memiliki keterbatasan
1 komentar
Komentar Hacker News
DeepMind dan AlphaFold sedang beralih ke sumber tertutup
Penasaran bagaimana prediksi divalidasi
Penasaran apakah ada rencana menerbitkan makalah tentang implementasinya
Senang versi open ini bisa digunakan dalam lingkungan komersial
Sepertinya akan lebih baik jika nama implementasi ini diubah
Kode model itu sendiri hanyalah sebagian kecil dari tantangan
Pernah punya pengalaman singkat dengan proteomik komputasional
Siapa sangka hanya merilis pseudocode saja tidak cukup
Penasaran apakah mereka familier dengan ColabFold
Penasaran apa langkah selanjutnya