2 poin oleh GN⁺ 2025-01-29 | 1 komentar | Bagikan ke WhatsApp

Proses produksi machine learning di Carnegie Mellon University

  • Ikhtisar kursus

    • Kursus ini membahas cara membangun, menerapkan, dan memelihara model machine learning sebagai produk perangkat lunak.
    • Mencakup seluruh siklus hidup, termasuk AI yang bertanggung jawab, MLOps, keselamatan, keamanan, keadilan, dan kemampuan penjelasan.
    • Ditujukan bagi mahasiswa yang memiliki pengalaman data science dan keterampilan pemrograman dasar.
  • Tujuan kursus

    • Mempelajari cara mengubah model machine learning menjadi produk, menjamin kualitasnya, serta mengoperasikan dan memeliharanya dalam skala besar.
    • Mendorong kolaborasi antara software engineer dan data scientist untuk membangun pemahaman bersama yang diperlukan dalam membangun sistem ML.
    • Cocok bagi mahasiswa yang mempertimbangkan karier sebagai ML engineer.
  • Topik utama

    • Perancangan untuk prediksi yang salah, serta cara menjamin keselamatan dan keamanan.
    • Perancangan antarmuka pengguna dan sistem yang dapat berfungsi di lingkungan nyata.
    • Cara menerapkan dan memperbarui model secara andal.
    • Cara mendeteksi masalah kualitas data, concept drift, dan feedback loop.
    • Cara merancang dan menguji sistem ML skala besar.
    • Cara mengidentifikasi dan mengukur persyaratan kualitas penting selain akurasi prediksi model, seperti keadilan, kemampuan penjelasan, privasi, ketahanan, dan keselamatan.
  • Hasil pembelajaran

    • Analisis trade-off saat merancang sistem produksi yang mencakup komponen ML.
    • Merencanakan kesalahan pada komponen ML dan mengimplementasikan sistem yang tangguh.
    • Merancang infrastruktur data dan sistem untuk eksperimen.
    • Menjamin kualitas seluruh pipeline ML.
    • Mempertimbangkan persyaratan tingkat sistem saat membangun produk ML yang kompleks.
    • Berkomunikasi secara efektif dalam tim multidisiplin.
  • Praktikum dan proyek

    • Mahasiswa akan berpartisipasi dalam proyek membangun, menerapkan, mengevaluasi, dan memelihara layanan rekomendasi film untuk 1 juta pengguna.
  • Perkuliahan dan praktikum

    • Kuliah diadakan pada hari Senin dan Rabu, sedangkan praktikum diadakan pada hari Jumat pada berbagai slot waktu.
    • Aktivitas selama kelas dapat diikuti melalui Slack, dan rekaman kuliah tersedia di Canvas.
  • Penilaian dan tugas

    • Penilaian dilakukan melalui tugas individu, proyek kelompok, ujian tengah semester, partisipasi, praktikum, dan kuis bacaan.
    • Setiap tugas menyediakan spesifikasi yang jelas dan distribusi nilai agar mahasiswa dapat memiliki ekspektasi yang jelas.
  • Kerja tim dan kolaborasi

    • Proyek tim dilakukan dalam kelompok beranggotakan 3-5 mahasiswa, dan kerja tim bersifat wajib.
    • Tim bekerja secara mandiri, dan kolaborasi di dalam tim sangat dianjurkan.
  • Informasi lainnya

    • Pengumuman penting disampaikan melalui Slack, dan pertanyaan dapat diajukan melalui email maupun Slack.
    • Materi kuliah tersedia secara publik di GitHub dan juga disediakan bagi mahasiswa yang ingin belajar mandiri.

Kursus ini memberikan keterampilan dan pengetahuan penting bagi mahasiswa yang tertarik pada pengembangan produk perangkat lunak berbasis machine learning, serta menawarkan kesempatan untuk membangun pengalaman praktis melalui berbagai studi kasus dan proyek nyata.

1 komentar

 
GN⁺ 2025-01-29
Komentar Hacker News
  • Kafka, Docker, Kubernetes, dan Jenkins adalah alat standar industri, dan fokus pada MLOps terasa menyegarkan. Bagus karena tidak berhenti pada membangun model, tetapi juga membahas keterhubungannya dengan sistem produksi yang nyata. Mengesankan juga bahwa topik seperti explainability, fairness, dan monitoring ikut dibahas

    • Apakah ini tingkat pemula? Melihat praktiknya, tampaknya ada banyak materi yang bisa dipelajari lewat tutorial oleh software engineer tingkat menengah atau pemula yang termotivasi. Git, Flask, dan orkestrasi container memang berguna, tetapi bagi orang yang sudah pernah bekerja di lingkungan produksi, itu terasa dasar. Tantangan yang lebih mendalam seperti optimisasi jaringan untuk distributed training atau pengelolaan inferensi skala besar tampaknya kurang dibahas. Saya juga penasaran apakah itu akan dibahas dalam proyek kelompok
    • Saya juga penasaran dengan relevansi jangka panjang dari alat yang digunakan. Jenkins ada di mana-mana, tetapi bukankah lebih masuk akal untuk memperkenalkan sesuatu yang lebih modern untuk CI/CD seperti GitHub Actions atau ArgoCD? Kubernetes jelas wajib diketahui, tetapi bagaimana dengan alternatif atau alat pelengkap untuk edge deployment atau sistem serverless? Rasanya ada peluang untuk melangkah sedikit lebih jauh ke masa depan
  • Hampir tidak ada pembahasan tentang kualitas data, dan itu baru muncul di bab 16... Saya jadi penasaran seberapa banyak pengalaman praktis para penulis di industri. Kualitas data dan pembersihan data memakan 90% waktu

  • Adakah yang tahu literatur atau kuliah tentang membangun infrastruktur klaster machine learning? Saya terutama tertarik pada pembangunan dan penskalaan infrastruktur storage, serta pendekatan networking dan scheduling

  • Saya penasaran apakah ada tempat untuk mengikuti ini bersama orang-orang lain yang bukan mahasiswa

  • Saya penasaran apakah siapa pun bisa mendaftar atau harus diterima dulu di program ilmu komputer top di negaranya

  • Senang bisa melihat kursus ini di sini. Christian adalah orang yang luar biasa dan melakukan pekerjaan yang hebat. Saya tahu awal mula kursus dan buku ini, dan bisa sangat merekomendasikannya

  • Saya sudah bekerja di platform dan sistem ML selama 9,5 tahun di berbagai skala. Materinya terlihat sangat bagus

  • Menarik; saya melihat praktiknya, dan sebagai full-stack developer yang tidak punya banyak pengalaman dengan LLM, saya sudah familier dengan separuhnya (git, flask, kafka, kubernetes), sisanya ya hanya kode. Tidak ada matematika rumit terkait ML

    • Apakah ini berarti ML ops adalah bidang yang tidak terlalu sulit diakses oleh developer biasa tanpa PhD?
  • Saya suka ide mempelajari satu-satunya "Kubernetis"

  • Mungkin saya meremehkan kompleksitas kursus ini, tetapi ini terdengar seperti kursus tingkat pemula. Sampai alat penjelasan model pun, sebagian besar isinya jujur saja tampak cukup sederhana. Saya rasa bagus bahwa mereka menggunakan alat standar industri untuk sebagian besar use case