- Kasus porting penuh parser HTML5 JustHTML dari Python ke JavaScript, diselesaikan dalam sekitar 4,5 jam menggunakan Codex CLI dan GPT-5.2
- Library baru JustJSHTML adalah parser HTML5 tanpa dependensi yang lulus 9.200 pengujian dari html5lib-tests sambil mereplikasi desain API asli secara utuh
- Seluruh proses dilakukan dengan 8 prompt dan beberapa perintah lanjutan, dengan GPT-5.2 menghasilkan otomatis 9.000 baris kode dan 43 commit
- Proyek ini selesai dalam bentuk open source yang lengkap, termasuk auto-commit, pengujian, dokumentasi, dan pembuatan halaman playground
- Eksperimen ini kembali menyoroti produktivitas nyata agen coding berbasis LLM, sekaligus memunculkan pertanyaan baru soal hak cipta, etika, dan reliabilitas
Gambaran proyek
- JustHTML adalah parser HTML5 yang patuh standar yang dikembangkan oleh Emil Stenström, ditulis dalam Python dan merupakan implementasi yang lulus seluruh html5lib-tests
- html5lib-tests adalah standar pengujian interoperabilitas untuk parser HTML5, digunakan oleh berbagai proyek seperti html5ever milik Servo
- Simon Willison memutuskan untuk melakukan porting proyek ini sendiri ke JavaScript, memanfaatkan Codex CLI dan GPT-5.2 dengan intervensi manual seminimal mungkin
- Hasilnya, JustJSHTML, dapat berjalan di browser maupun lingkungan Node.js dan ditulis dalam JavaScript murni tanpa dependensi eksternal
Proses pengembangan
- Di lingkungan lokal, ia meng-clone repository justhtml dan html5lib-tests, lalu membuat direktori baru justjshtml
- Codex CLI dijalankan dengan opsi
--yolo (melewati persetujuan dan sandbox) untuk menggunakan model GPT-5.2
- Pada prompt pertama, model diminta menganalisis kode Python yang ada dan menulis spesifikasi API JavaScript baru (
spec.md)
- Sebagai tahap awal (Milestone 0.5), model diminta mengimplementasikan versi yang lulus pengujian parsing dokumen HTML sederhana
- Setelah itu, pengembangan otomatis dilanjutkan secara bertahap melalui perintah seperti “Implement Milestone 0.5” dan “commit and push often”
- GitHub Actions dikonfigurasi untuk menjalankan pengujian pada setiap commit
- Hasil akhirnya mencakup 43 commit, 9.000 baris kode, dan lulus 9.200 pengujian
Hasil dan artefak
- Codex CLI menggunakan total 2.089.858 token, dan dijalankan tanpa biaya tambahan dalam langganan bulanan ChatGPT Plus
- Library yang selesai mencakup fitur berikut
- Ekstensi API seperti stream(), query()/matches(), dan toMarkdown()
- skrip unit test no-deps dan integrasi CI
- Perbaikan bug rinci seperti kesalahan penanganan tag
<br>
- playground.html dibuat secara otomatis sehingga bisa langsung diuji di browser
- README.md mencakup cara penggunaan, proses build, serta contoh untuk lingkungan Node.js dan HTML
Implikasi penggunaan LLM
- GPT-5.2 mampu menyelesaikan ratusan pemanggilan alat dan pekerjaan berkelanjutan selama berjam-jam dengan pengawasan minimal
- Jika definisi masalah bisa dibuat dengan pendekatan test-driven, agen coding dapat secara mandiri menghasilkan kode dengan tingkat kematangan tinggi
- Pekerjaan yang terstruktur seperti porting antarbahasa sangat efisien untuk dikerjakan oleh LLM
- Biaya pembuatan kode pada praktiknya turun ke tingkat 'hampir gratis', meski biaya pemeliharaan kode yang tervalidasi tetap ada
Pertanyaan etis dan hukum yang muncul
- Apakah ada pelanggaran hak cipta terhadap kode sumber Rust dan Python asli
- Masalah kepemilikan hak cipta atas kode yang dihasilkan LLM
- Dampak model pengembangan seperti ini terhadap ekosistem open source
- Reliabilitas kode yang dihasilkan otomatis dan tanggung jawab penggunaannya di produksi
- Apakah kualitasnya dapat dibandingkan dengan kode yang dikembangkan berbulan-bulan oleh pakar manusia
Kesimpulan
- Kasus ini menunjukkan tahap baru dalam otomatisasi pemrograman dan membuktikan potensi praktis agen coding AI
- Pada saat yang sama, kasus ini menyisakan tantangan berupa perlunya standar hukum dan etika yang jelas serta pendefinisian ulang cara kolaborasi open source
Belum ada komentar.