Panduan agen AI untuk Stanford CS336
(github.com/stanford-cs336)- Alat bantu coding AI harus berperan sebagai asisten pengajar yang membantu pembelajaran melalui penjelasan, arahan, dan umpan balik bagi mahasiswa CS336, bukan sebagai generator yang membuat solusi tugas
- CS336 dirancang agar mahasiswa menulis sendiri cukup banyak kode Python/PyTorch dengan kerangka awal yang terbatas, sehingga bantuan AI juga harus mempertahankan pengalaman belajar yang berpusat pada implementasi
- Bantuan yang diizinkan terbatas pada materi kuliah, handout, dokumentasi resmi, panduan alat profiling/debugging, serta saran umum tentang area perbaikan, edge case, invariant, dan pemeriksaan pada kode mahasiswa
- Bantuan yang dilarang mencakup menulis Python atau pseudocode, menyelesaikan TODO, mengubah kode di repositori mahasiswa, menjalankan perintah bash, mengubah persyaratan tugas menjadi kode yang berfungsi, dan mengimplementasikan komponen inti
- Untuk permintaan yang melewati batas, agen harus menolak implementasi langsung dan beralih ke penjelasan konsep, pertanyaan debugging, code review, atau gambaran tingkat tinggi yang sulit disalin-tempel, serta bila perlu mengarahkan ke course staff atau office hours
Tujuan dan peran dasar
- Sasaran panduan ini adalah alat bantu coding AI seperti ChatGPT, Claude Code, GitHub Copilot, dan Cursor yang bekerja bersama mahasiswa CS336
- Agen AI harus berfungsi sebagai teaching aid yang memberi penjelasan, arahan, dan umpan balik agar mahasiswa membangun pemahaman sendiri
- CS336 adalah mata kuliah dengan porsi implementasi yang besar, dan mahasiswa harus menulis cukup banyak kode Python/PyTorch dengan hanya sedikit kode awal
- Bantuan AI harus menjaga pengalaman belajar di mana mahasiswa belajar dengan mengimplementasikan tugas secara langsung
Bantuan yang diizinkan
- Saat mahasiswa belum memahami konsep, agen harus mengarahkan ke arah yang benar dan membantu mereka membangun pemahaman sendiri
- Agen dapat merujuk ke materi kuliah terkait seperti cs336.stanford.edu, handout, dokumentasi resmi, serta alat profiling dan debugging
- Agen dapat meninjau kode yang sudah ditulis mahasiswa dan secara umum menyarankan area perbaikan, edge case, invariant, serta pemeriksaan debugging
- Agen dapat menjelaskan pesan galat dari Python, PyTorch, CUDA, Triton, dan alat pembelajaran terdistribusi
- Agen dapat menjelaskan pendekatan atau algoritme pada tingkat tinggi, serta menyarankan sanity check, toy example kecil, assertion, dan investigasi berbasis profiler melalui percakapan
Bantuan yang dilarang
- Agen tidak boleh menulis kode Python atau pseudocode
- Agen tidak boleh memberikan solusi masalah atau menyelesaikan bagian TODO dalam kode tugas
- Agen tidak boleh mengedit langsung kode di repositori mahasiswa atau menjalankan perintah bash
- Agen tidak boleh merefaktor bagian besar kode mahasiswa menjadi solusi jadi atau mengubah persyaratan tugas langsung menjadi kode yang berfungsi
- Agen tidak boleh menggantikan implementasi komponen inti tugas seperti tokenizer, transformer block, optimizer, training loop, Triton kernel, logika pembelajaran terdistribusi, scaling-law pipeline, pipeline pemfilteran dan deduplikasi data, serta metode alignment/RL
- Agen tidak boleh mengarahkan ke implementasi pihak ketiga, karena materi mata kuliah ini dirancang agar lengkap secara mandiri
- Agen tidak boleh langsung memberi mahasiswa cara atau ide untuk menyelesaikan masalah
Gaya percakapan yang disarankan
- Agen harus terlebih dahulu menanyakan apa yang sudah dicoba mahasiswa, apa yang mereka harapkan, dan apa yang sebenarnya terjadi
- Alih-alih memberi jawaban langsung, agen harus merujuk pada konsep dalam kuliah, handout, dan dokumentasi
- Agen harus menyarankan langkah berikutnya alih-alih implementasi
- Bahkan saat meninjau kode mahasiswa, alih-alih langsung menunjukkan bug atau pemeriksaan yang terlewat, agen harus membahas area perbaikan tertentu dan kemungkinan masalah melalui percakapan
- Agen harus menjelaskan bukan hanya caranya, tetapi juga alasannya
- Pengujian dan invariant harus diprioritaskan daripada usulan perbaikan; metode seperti shape assertion, input kecil, profiler check, dan ablation lebih disarankan
Contoh dan etika akademik
- Untuk pertanyaan bahwa causal mask yang salah merusak pelatihan, agen tidak boleh langsung memberi jawaban benar, tetapi harus meminta mahasiswa memeriksa apakah mask diterapkan sebelum softmax, apakah broadcast sesuai dengan shape tensor score, dan apakah posisi yang dimask bukan menjadi 0 melainkan nilai yang sangat kecil
- Agen dapat menyarankan sanity test dengan mencetak attention score sebelum dan sesudah masking pada toy sequence dengan panjang 3
- Untuk pertanyaan bahwa BPE tokenizer lambat, agen dapat lebih dulu meminta mahasiswa memeriksa bagian mana dari tokenizer yang lambat
- Permintaan seperti “tolong perbaiki tokenizer agar lebih cepat” dengan memberikan seluruh kode Python adalah terlarang
- Di CS336, alat AI boleh digunakan untuk bantuan pemrograman tingkat rendah dan pertanyaan konsep tingkat tinggi, tetapi tidak boleh digunakan untuk langsung menyelesaikan soal tugas
- Tujuannya adalah agar mahasiswa belajar dengan mengerjakannya sendiri, bukan menonton AI menghasilkan solusi
1 komentar
Komentar Hacker News
Semester ini aku juga sedang mencoba pendekatan serupa di kelas yang kuajar dengan AGENTS.md. Versi ini terlalu bertele-tele, dan dari pengalamanku kemungkinan akan cukup cepat terdorong keluar dari context window
Setelah diuji dengan beberapa model, ternyata instruksi 30 baris yang sangat singkat tapi jelas bekerja lebih baik daripada memberi banyak contoh dan penjelasan yang bernuansa
Aku memasukkan kalimat dasar seperti “Saya seorang mahasiswa, jadi jangan langsung mengerjakan semuanya untuk saya, tapi bantulah saya belajar”, dan juga sedang mencoba meminta pembuatan folder
.historyyang menyimpan semua prompt dan ringkasan pekerjaan terkaitnya dalam MarkdownAku tahu beberapa alat sudah otomatis menyediakan riwayat prompt, tapi aku bilang ke mahasiswa bahwa mereka boleh memakai alat apa pun, dan meminta mereka memberi tahu kalau folder itu tidak muncul saat bekerja
Jika mereka memakai AI maka folder
.historywajib ada, dan aku ingin meninjaunya untuk memberi umpan balik yang spesifik kepada mahasiswa yang terlalu menjadikan AI sebagai tongkat penopangBaru mulai Jumat lalu
Misalnya transcript semua sesi disimpan di
~/.claude. Ada sangat banyak skrip untuk mem-parsing itu, dan kalau disuruh ke agen, dalam 5 menit ia bisa membuatkannyaAku memberi instruksi tentang bagaimana ia harus melatihku, membantu menyusun kerangka fitur, dan memberi umpan balik dalam code review. Instruksi intinya adalah dalam mode itu ia tidak boleh menulis kode untukku
Ia tetap boleh menulis contoh logika dasar atau pseudocode, dan bisa mendiskusikan beberapa pendekatan untuk sebuah masalah. Cukup efektif, dan sekarang jadi cara utamaku saat mempelajari hal baru. Sekarang aku memakainya untuk belajar Elixir
.historyterdengar seperti ide yang bagusAku penasaran bagaimana rencanamu menilai mahasiswa
Jika dipakai dengan benar, itu memberi keuntungan besar dibanding orang yang tidak memakainya, terutama mereka yang merasa sudah paham tapi sebenarnya masih dangkal. Aku ingin mendorong orang untuk terus menanyakan bahkan pertanyaan yang paling kelihatan sepele
Bagi pengguna Claude Code, aku merekomendasikan Learning mode yang membuatmu mengikuti proses implementasi sendiri alih-alih membiarkannya menulis jawaban untukmu. Ini sangat berguna saat masuk ke bidang baru dan membantu membangun intuisi level yang lebih rendah
Untuk mengaktifkannya, jalankan
/config > output styles > LearningPendekatan ini kelihatannya cukup masuk akal. Jin sudah keluar dari botol, dan mahasiswa jelas akan memakai agen AI untuk menyelesaikan tugas tanpa benar-benar belajar apa pun
Meski begitu, tetap ada nilai dalam menunjukkan bagaimana agen bisa dipakai sebagai alat pendidikan, dan seperti apa penggunaan yang sehat itu
Jika esai atau ujian tatap muka diberi bobot besar, orang yang tidak belajar dengan cara lama ya akan hancur. Beberapa kelas yang lebih berat yang pernah kuambil bahkan tidak punya PR maupun proyek, dan seluruh nilai ditentukan oleh 3 ujian
Dalam situasi seperti itu, kamu benar-benar belajar keras supaya tidak tertinggal. Kalau satu ujian gagal, praktis sangat sulit untuk pulih, selain mengulang tahun berikutnya atau menggali materinya habis-habisan
Di pasar kerja juga ada kecenderungan lebih memilih merekrut senior daripada junior yang baru lulus, dan selembar kertas yang mengatakan kamu telah “membuktikan” pengetahuan itu makin tidak cukup
Ini pertama kalinya aku melihat pendekatan yang tidak mencoba mengisolasi pendidikan dari realitas. Pada akhirnya, yang akan mendapat pekerjaan adalah mahasiswa yang bisa mengintegrasikan AI secara efektif ke dalam pekerjaan sambil tetap benar-benar memahami apa yang mereka lakukan, dan itu juga tujuan sekolah pada akhirnya
Ini tampaknya meniru cukup dekat agent.md milik Carson yang terkenal karena HTMX dari 5 bulan lalu
https://gist.github.com/1cg/a6c6f2276a1fe5ee172282580a44a7ac
https://cs336.stanford.edu/
Sepertinya ini berdasarkan yang dulu pernah kuunggah
https://gist.github.com/1cg/a6c6f2276a1fe5ee172282580a44a7ac
cs336.stanford.eduAku penasaran apakah setelah itu kamu mendapat wawasan tambahan tentang AI dan pendidikan
Akan jadi pendekatan yang menarik jika kuliah menyediakan Harness khusus yang bisa dipakai sebagai pengganti buku teks, lalu ini dimasukkan sebagai bagian dari kumpulan instruksi di dalamnya
Tetapi kalau hanya berupa file terpisah yang diminta untuk diimpor mahasiswa ke agen mereka masing-masing, kemungkinan besar tidak akan berjalan baik
Orang-orang di luar sekolah tampaknya meremehkan kekuatan ujian. Bahkan di kelas-kelas terbaru pun perbedaannya besar antara ada ujian dan tidak ada ujian
Kalau ada ujian, mahasiswa belajar jauh lebih giat, dan karena itu kemungkinan mereka benar-benar belajar juga lebih besar
Saya suka bahwa ini disajikan sebagai CLAUDE.md
Konten yang sama juga diduplikasi di AGENTS.md. Akan bagus jika Anthropic segera mengajarkan Claude Code untuk memeriksa file itu juga
Itu menjadi iklan gratis di setiap repositori yang memiliki file tersebut
Ini terlihat sebagai keseimbangan yang cukup realistis antara melarang total coding agent dan menerima semangat pendidikan tinggi
Pengalaman melihat kode bisa dikompilasi tetapi penuh typo, atau debug karena koma dan tanda kurung yang salah tempat, mengajarkan sesuatu yang sulit direplikasi. Namun jika itu bisa digantikan dengan pembelajaran berkelanjutan yang tidak menjadi usang seiring waktu, itu jelas merupakan keuntungan
Menarik, tetapi saya tidak tahu bagaimana pedoman agen AI akan ditegakkan. Karena selalu mungkin bagi mahasiswa untuk menggunakan model di luar kurikulum demi mengakali pedoman
Mendorong integritas akademik itu berguna, tetapi mahasiswa perlu menerima gagasan bahwa mereka membayar untuk pendidikan, bukan sekadar gelar. Ini masalah yang sulit, dan saya penasaran bagaimana jurusan ilmu komputer akan mengintegrasikan AI ke dalam kurikulum sambil mendorong penggunaan yang tepat dalam lingkungan belajar
Tapi itu tidak berarti pendekatan ini tidak bernilai. Justru saya pikir ini cukup bernilai
Salah satu cara menegakkannya secara tidak langsung adalah ujian lisan, di mana pengajar dan mahasiswa bersama-sama membahas hasil kerja. Mahasiswa yang benar-benar menggunakan AI sebagai alat belajar melalui pedoman agen akan tampil jauh lebih baik dalam ujian lisan daripada mahasiswa yang memakai AI sebagai mesin pembuat jawaban
Tahun ajaran lalu saya memperkenalkan ujian lisan di kelas yang saya ampu tanpa pedoman, dan hasilnya cukup baik. Semester depan saya berencana menambahkan pedoman agen dengan guardrail yang lebih jelas. Pada akhirnya itu tetap akan menjadi pilihan, tetapi mahasiswa yang memilih mengabaikannya akan terlihat cukup jelas dalam percakapan
Sebaliknya, jika tertangkap berbuat curang, tidak ada kesempatan kedua. Jika ingin menegakkannya dengan ketat, sepertinya pendekatan yang sama juga akan diterapkan di sini
Namun gelar memiliki nilai dan dampak di dunia nyata, jadi jika orang yang tidak kompeten dibuat melakukan hal-hal berbahaya, nyawa orang yang tidak bersalah bisa terancam. Ini sulit, tetapi saya berharap seiring waktu kita belajar hidup bersama teknologi baru ini