Machine Learning di Lingkungan Produksi (Kuliah CMU)
(mlip-cmu.github.io)Proses produksi machine learning di Carnegie Mellon University
-
Ikhtisar kursus
- Kursus ini membahas cara membangun, menerapkan, dan memelihara model machine learning sebagai produk perangkat lunak.
- Mencakup seluruh siklus hidup, termasuk AI yang bertanggung jawab, MLOps, keselamatan, keamanan, keadilan, dan kemampuan penjelasan.
- Ditujukan bagi mahasiswa yang memiliki pengalaman data science dan keterampilan pemrograman dasar.
-
Tujuan kursus
- Mempelajari cara mengubah model machine learning menjadi produk, menjamin kualitasnya, serta mengoperasikan dan memeliharanya dalam skala besar.
- Mendorong kolaborasi antara software engineer dan data scientist untuk membangun pemahaman bersama yang diperlukan dalam membangun sistem ML.
- Cocok bagi mahasiswa yang mempertimbangkan karier sebagai ML engineer.
-
Topik utama
- Perancangan untuk prediksi yang salah, serta cara menjamin keselamatan dan keamanan.
- Perancangan antarmuka pengguna dan sistem yang dapat berfungsi di lingkungan nyata.
- Cara menerapkan dan memperbarui model secara andal.
- Cara mendeteksi masalah kualitas data, concept drift, dan feedback loop.
- Cara merancang dan menguji sistem ML skala besar.
- Cara mengidentifikasi dan mengukur persyaratan kualitas penting selain akurasi prediksi model, seperti keadilan, kemampuan penjelasan, privasi, ketahanan, dan keselamatan.
-
Hasil pembelajaran
- Analisis trade-off saat merancang sistem produksi yang mencakup komponen ML.
- Merencanakan kesalahan pada komponen ML dan mengimplementasikan sistem yang tangguh.
- Merancang infrastruktur data dan sistem untuk eksperimen.
- Menjamin kualitas seluruh pipeline ML.
- Mempertimbangkan persyaratan tingkat sistem saat membangun produk ML yang kompleks.
- Berkomunikasi secara efektif dalam tim multidisiplin.
-
Praktikum dan proyek
- Mahasiswa akan berpartisipasi dalam proyek membangun, menerapkan, mengevaluasi, dan memelihara layanan rekomendasi film untuk 1 juta pengguna.
-
Perkuliahan dan praktikum
- Kuliah diadakan pada hari Senin dan Rabu, sedangkan praktikum diadakan pada hari Jumat pada berbagai slot waktu.
- Aktivitas selama kelas dapat diikuti melalui Slack, dan rekaman kuliah tersedia di Canvas.
-
Penilaian dan tugas
- Penilaian dilakukan melalui tugas individu, proyek kelompok, ujian tengah semester, partisipasi, praktikum, dan kuis bacaan.
- Setiap tugas menyediakan spesifikasi yang jelas dan distribusi nilai agar mahasiswa dapat memiliki ekspektasi yang jelas.
-
Kerja tim dan kolaborasi
- Proyek tim dilakukan dalam kelompok beranggotakan 3-5 mahasiswa, dan kerja tim bersifat wajib.
- Tim bekerja secara mandiri, dan kolaborasi di dalam tim sangat dianjurkan.
-
Informasi lainnya
- Pengumuman penting disampaikan melalui Slack, dan pertanyaan dapat diajukan melalui email maupun Slack.
- Materi kuliah tersedia secara publik di GitHub dan juga disediakan bagi mahasiswa yang ingin belajar mandiri.
Kursus ini memberikan keterampilan dan pengetahuan penting bagi mahasiswa yang tertarik pada pengembangan produk perangkat lunak berbasis machine learning, serta menawarkan kesempatan untuk membangun pengalaman praktis melalui berbagai studi kasus dan proyek nyata.
1 komentar
Komentar Hacker News
Kafka, Docker, Kubernetes, dan Jenkins adalah alat standar industri, dan fokus pada MLOps terasa menyegarkan. Bagus karena tidak berhenti pada membangun model, tetapi juga membahas keterhubungannya dengan sistem produksi yang nyata. Mengesankan juga bahwa topik seperti explainability, fairness, dan monitoring ikut dibahas
Hampir tidak ada pembahasan tentang kualitas data, dan itu baru muncul di bab 16... Saya jadi penasaran seberapa banyak pengalaman praktis para penulis di industri. Kualitas data dan pembersihan data memakan 90% waktu
Adakah yang tahu literatur atau kuliah tentang membangun infrastruktur klaster machine learning? Saya terutama tertarik pada pembangunan dan penskalaan infrastruktur storage, serta pendekatan networking dan scheduling
Saya penasaran apakah ada tempat untuk mengikuti ini bersama orang-orang lain yang bukan mahasiswa
Saya penasaran apakah siapa pun bisa mendaftar atau harus diterima dulu di program ilmu komputer top di negaranya
Senang bisa melihat kursus ini di sini. Christian adalah orang yang luar biasa dan melakukan pekerjaan yang hebat. Saya tahu awal mula kursus dan buku ini, dan bisa sangat merekomendasikannya
Saya sudah bekerja di platform dan sistem ML selama 9,5 tahun di berbagai skala. Materinya terlihat sangat bagus
Menarik; saya melihat praktiknya, dan sebagai full-stack developer yang tidak punya banyak pengalaman dengan LLM, saya sudah familier dengan separuhnya (git, flask, kafka, kubernetes), sisanya ya hanya kode. Tidak ada matematika rumit terkait ML
Saya suka ide mempelajari satu-satunya "Kubernetis"
Mungkin saya meremehkan kompleksitas kursus ini, tetapi ini terdengar seperti kursus tingkat pemula. Sampai alat penjelasan model pun, sebagian besar isinya jujur saja tampak cukup sederhana. Saya rasa bagus bahwa mereka menggunakan alat standar industri untuk sebagian besar use case