- Browser yang dapat merender HTML dan CSS berhasil diimplementasikan langsung dalam Rust hanya dalam 3 hari oleh satu orang dan satu agen LLM
- Proyek ini selesai dengan sekitar 20.150 baris kode, mencakup fitur dasar seperti scroll, tombol kembali, dan mode headless
- Dirancang agar berjalan di Windows, macOS, dan Linux tanpa library Rust eksternal
- Proses pengembangan dilakukan melalui kolaborasi dengan agen Codex; manusia menangani koordinasi dan verifikasi, sementara agen menulis kode
- Pada akhirnya, ini menjadi contoh yang menunjukkan bahwa kombinasi "satu orang + satu agen" lebih efisien daripada banyak agen
Gambaran proyek
- Tujuannya adalah membuat browser dasar yang dapat merender HTML dan CSS sepenuhnya dari nol
- JavaScript tidak didukung
- Pengembang memulainya “untuk bersenang-senang”, lalu mengerjakannya bersama agen LLM (Codex)
- Ditetapkan sejumlah batasan seperti selesai dalam 3 hari, tanpa dependensi Rust eksternal, dan dukungan untuk 3 OS utama
- Browser ini memiliki rendering engine sendiri, serta mencakup fitur screenshot, klik tautan, dan pengujian regresi
Hari 1 – implementasi awal
- Dimulai dari rendering “Hello World”, lalu ditambahkan penanganan tag bertingkat dan fitur screenshot
- Spesifikasi HTML/CSS didefinisikan, dan fitur perbandingan gambar diperkenalkan untuk pengujian E2E
- Hanya dalam sehari, proyek ini sudah mampu mengambil situs web dengan X11 dan cURL lalu merendernya
- Codebase mencapai sekitar 7.500 baris, dengan setiap file dijaga tetap di bawah 1.000 baris
Hari 2 – perluasan fitur
- Untuk mengatasi masalah jendela yang terbuka saat pengujian, ditambahkan mode
--headless
- Perubahan ukuran jendela, kompatibilitas, performa, dan rendering font ditingkatkan
- Alur kerja dilakukan dengan membagikan screenshot situs web lalu meminta Codex mereproduksinya
- Sebagian besar kode ditulis oleh agen, sementara manusia bertugas meninjau dan menyetujui
Hari 3~4 – penyelesaian dan dukungan lintas platform
- Ditambahkan fitur penting browser seperti scroll, log debug, dan tombol kembali
- Dukungan macOS dan Windows diimplementasikan dan lolos pengujian
- Integrasi CI dan build rilis diselesaikan, dengan total waktu pengembangan sekitar 72 jam
Hasil dan statistik kode
- Codebase akhir terdiri dari sekitar 20.150 baris dalam 72 file
- File-file utama mencakup modul
layout, style, platform, browser, dan lainnya
- Cargo.lock kosong, artinya program dapat dijalankan sepenuhnya secara mandiri tanpa paket Rust eksternal
- Binary hasil build CI dan source code dapat langsung diunduh dari GitHub
Pelajaran utama
- Kombinasi satu orang + satu agen lebih efisien daripada menggunakan ribuan agen
- Satu agen yang menangani satu codebase dalam waktu lama dapat menghasilkan kemajuan nyata
- Ada potensi untuk diperluas ke bentuk di mana beberapa orang masing-masing memiliki agennya sendiri
- Memperlambat laju justru bisa menghasilkan hasil yang lebih cepat dan lebih baik
- Peran manusia yang mengarahkan agen mungkin lebih penting daripada desain sistem itu sendiri
- Kesimpulannya, terhadap pertanyaan “apakah memasukkan banyak agen akan mempercepat pengembangan?”,
contoh ini menunjukkan bahwa kolaborasi manusia-agen tunggal bisa menjadi pendekatan yang lebih realistis dan efisien
4 komentar
Saya kurang paham, jadi ingin bertanya:
blog Simonyang muncul di pendapat-pendapat Hacker News itu blog seperti apa sampai sering sekali disebut...?Alasan mengapa tulisan blog yang diunggah Simon Willison sering disebut di Hacker News mungkin karena,
Ini tampaknya blog yang menempati peringkat 1 di antara blog paling populer di Hacker News pada 2025. Selain reputasinya yang memang besar, jumlah artikel yang dipublikasikan juga cukup banyak, jadi dari sudut pandang pengguna Hacker News pada umumnya, ini mungkin blog yang paling sering dikunjungi dan karena itu secara alami dianggap sebagai tolok ukur.
Opini Hacker News
Menurut saya ini adalah demo browser pembuat kode yang jauh lebih baik daripada FastRender milik Cursor
Jauh lebih kecil, sekitar 20 ribu baris Rust, hanya memakai library sistem untuk rendering gambar dan teks, dan kodenya juga mudah dibaca
Misalnya, jika melihat kode implementasi flexbox, strukturnya jelas
Saya juga mengunggah tangkapan layar saat merender blog saya; CSS gradient dan ikon SVG ditangani dengan baik, tetapi PNG gagal
Saya kira browser perender HTML+CSS adalah tugas yang sempurna untuk mendemonstrasikan agen paralel, jadi mengejutkan bahwa ini ternyata bisa dilakukan hanya dengan satu agen coding
Yang penting bukan sekadar memakai banyak token, melainkan cara memanfaatkan agen secara efektif
Saya sendiri sering membuat beberapa proyek lalu membiarkannya begitu saja setelah beberapa hari. Tanpa umpan balik, agen hanya melakukan apa yang diperintahkan, jadi jika arahnya salah, agen justru akan menggali lubang lebih dalam
Bahkan jika Claude melenceng ke arah yang aneh, dengan struktur agen yang tepat ia bisa dipulihkan kembali
Saat ini saya sedang bereksperimen dengan memisahkan agen evaluator, peneliti, dan implementer
Dengan sistem skor, saya membuat mereka memperluas tes atau menyelidiki penyebab kegagalan, lalu membuang commit jika tidak ada perbaikan
Struktur seperti ini jauh lebih menguntungkan untuk pengendalian kualitas kode
Di zaman ketika kode murah dan bisa dibuang, workflow itu sendiri harus berubah
Ini terasa seperti kisah 'David vs Goliath' di mana 1 orang + 1 agen mengalahkan browser senilai 5 juta dolar dengan 1,6 juta LOC
AI masih merupakan kotak hitam, jadi semua orang sedang bereksperimen sambil mencari arah
Baru lewat satu bulan sejak 2026 dimulai, dan menarik membayangkan eksperimen seperti apa yang akan muncul ke depan
Akan seru jika Simon meninjau ulang thread prediksi HN 2026 secara berkala
Ia menetapkan batas 3 hari, dengan aturan harus mendukung X11/Windows/macOS hanya memakai library bawaan OS, tanpa crate pihak ketiga Rust
Selesai dalam sekitar 20 ribu LOC, dengan 14 ribu baris untuk engine dan 6 ribu baris untuk kode dukungan platform
Ia telah merilis source code dan binary
Sekarang jauh lebih efisien berkat test suite yang bisa dibaca mesin
Dulu perilaku IE pada dasarnya adalah standarnya, tetapi sekarang Google, Apple, dan lainnya ikut berkontribusi pada standardisasi sehingga jauh lebih baik
Terlepas dari fungsinya, saya penasaran seperti apa audit keamanan untuk codebase seperti ini
Rust memang membantu, tetapi saya ragu jaminan dari bahasa saja sudah cukup
Rust hanya mencegah kesalahan memori dasar, tetapi tidak mencegah hal seperti akses file lokal
Karena tidak ada engine JS, kebocoran data memang lebih sulit, tetapi jika diaudit sepertinya akan ditemukan beberapa kerentanan serius
Komunitas sudah lama menunggu browserBench, dan saya senang ini akhirnya dimulai
Browser adalah salah satu perangkat lunak paling kompleks, jadi upaya seperti ini akan menjadi tolok ukur untuk menilai batas kemampuan
Sulit membayangkan browser bisa dibuat hanya dengan 20 ribu baris
zlib saja sudah 12 ribu baris, jadi rasanya seperti ada sesuatu yang hilang
Saya penasaran apakah ini hanya memanggil render bawaan OS
Library apa saja yang digunakan dijelaskan di README
Saat saya menjalankannya, rendering-nya terasa cukup membingungkan
Warna link dan garis bawahnya tidak konsisten, dan di Windows tombol back tidak berfungsi
Meski begitu, halaman utama HN dan blog Simon dirender cukup baik
Tujuannya adalah mewujudkan fitur serupa dengan LOC yang lebih sedikit
Karena tidak ada stylesheet bawaan, warna link tidak seragam
Di Windows 11 tombol back berfungsi. Kalau Anda memakai Windows 10, mungkin itu penyebabnya
Merender blog Simon tampaknya akan menjadi target acuan bagi browser AI
Tetapi untuk saat ini, ini masih lebih mirip renderer daripada browser sungguhan
Akan lebih mengesankan jika AI membantu implementasi API dalam proyek seperti Servo
Meski begitu, ini lebih baik daripada upaya Cursor, dan fakta bahwa 'bisa dikompilasi' setidaknya merupakan kemajuan minimal
Saya penasaran berapa lama jadinya jika dikerjakan sendirian
Untuk memahami bantuan dari agen, saya ingin tahu seberapa dalam keahlian yang masuk ke dalam panduan tersebut
Saya tahu Rust, tetapi tidak tahu X11, macOS, atau Windows API, jadi mungkin bahkan sulit untuk mulai
Namun saya punya banyak pengalaman dalam testing, infrastruktur, dan desain, dan itu membantu saat berkolaborasi dengan agen
proyek ini diperkirakan setara dengan 4,58 person-year dan 610 ribu dolar menurut standar tahun 2000,
atau 5,6 tahun dan 1,38 juta dolar menurut standar tahun 2025
Yang membuat tulisan ini menarik bukan hasil akhirnya, melainkan fokusnya pada proses pembuatan dan batasan-batasan
Kebanyakan tulisan berfokus pada hasil atau penulisnya, tetapi yang ini memberi wawasan yang berpusat pada proses
Karena itu, saya merasa lebih bermakna untuk menggali bagian mana yang benar-benar sulit dan proses apa yang salah
Pekerjaan yang mengesankan
Saya penasaran bagaimana cara mengimplementasikan accessibility tanpa dependensi Rust
Di Windows/macOS ini bisa dilakukan dengan UI Automation dan NSAccessibility, tetapi di X11 ada beberapa pilihan: