Satu orang + satu agen = membangun browser 20K baris kode dari nol

(emsh.cat)

7 poin oleh GN⁺ 2026-01-29 | 4 komentar | Bagikan ke WhatsApp

Browser yang dapat merender HTML dan CSS berhasil diimplementasikan langsung dalam Rust hanya dalam 3 hari oleh satu orang dan satu agen LLM
Proyek ini selesai dengan sekitar 20.150 baris kode, mencakup fitur dasar seperti scroll, tombol kembali, dan mode headless
Dirancang agar berjalan di Windows, macOS, dan Linux tanpa library Rust eksternal
Proses pengembangan dilakukan melalui kolaborasi dengan agen Codex; manusia menangani koordinasi dan verifikasi, sementara agen menulis kode
Pada akhirnya, ini menjadi contoh yang menunjukkan bahwa kombinasi "satu orang + satu agen" lebih efisien daripada banyak agen

Gambaran proyek

Tujuannya adalah membuat browser dasar yang dapat merender HTML dan CSS sepenuhnya dari nol
- JavaScript tidak didukung
- Pengembang memulainya “untuk bersenang-senang”, lalu mengerjakannya bersama agen LLM (Codex)
Ditetapkan sejumlah batasan seperti selesai dalam 3 hari, tanpa dependensi Rust eksternal, dan dukungan untuk 3 OS utama
Browser ini memiliki rendering engine sendiri, serta mencakup fitur screenshot, klik tautan, dan pengujian regresi

Hari 1 – implementasi awal

Dimulai dari rendering “Hello World”, lalu ditambahkan penanganan tag bertingkat dan fitur screenshot
Spesifikasi HTML/CSS didefinisikan, dan fitur perbandingan gambar diperkenalkan untuk pengujian E2E
Hanya dalam sehari, proyek ini sudah mampu mengambil situs web dengan X11 dan cURL lalu merendernya
- Codebase mencapai sekitar 7.500 baris, dengan setiap file dijaga tetap di bawah 1.000 baris

Hari 2 – perluasan fitur

Untuk mengatasi masalah jendela yang terbuka saat pengujian, ditambahkan mode --headless
Perubahan ukuran jendela, kompatibilitas, performa, dan rendering font ditingkatkan
Alur kerja dilakukan dengan membagikan screenshot situs web lalu meminta Codex mereproduksinya
- Sebagian besar kode ditulis oleh agen, sementara manusia bertugas meninjau dan menyetujui

Hari 3~4 – penyelesaian dan dukungan lintas platform

Ditambahkan fitur penting browser seperti scroll, log debug, dan tombol kembali
Dukungan macOS dan Windows diimplementasikan dan lolos pengujian
Integrasi CI dan build rilis diselesaikan, dengan total waktu pengembangan sekitar 72 jam

Hasil dan statistik kode

Codebase akhir terdiri dari sekitar 20.150 baris dalam 72 file
File-file utama mencakup modul layout, style, platform, browser, dan lainnya
Cargo.lock kosong, artinya program dapat dijalankan sepenuhnya secara mandiri tanpa paket Rust eksternal
Binary hasil build CI dan source code dapat langsung diunduh dari GitHub
- https://github.com/embedding-shapes/one-agent-one-browser/releases

Pelajaran utama

Kombinasi satu orang + satu agen lebih efisien daripada menggunakan ribuan agen
Satu agen yang menangani satu codebase dalam waktu lama dapat menghasilkan kemajuan nyata
Ada potensi untuk diperluas ke bentuk di mana beberapa orang masing-masing memiliki agennya sendiri
Memperlambat laju justru bisa menghasilkan hasil yang lebih cepat dan lebih baik
Peran manusia yang mengarahkan agen mungkin lebih penting daripada desain sistem itu sendiri

Kesimpulannya, terhadap pertanyaan “apakah memasukkan banyak agen akan mempercepat pengembangan?”,
contoh ini menunjukkan bahwa kolaborasi manusia-agen tunggal bisa menjadi pendekatan yang lebih realistis dan efisien

4 komentar

pkj3186 2026-01-29

Saya kurang paham, jadi ingin bertanya: blog Simon yang muncul di pendapat-pendapat Hacker News itu blog seperti apa sampai sering sekali disebut...?

laeyoung 2026-01-29

Alasan mengapa tulisan blog yang diunggah Simon Willison sering disebut di Hacker News mungkin karena,

Mungkin karena dia menulis banyak artikel terkait AI dengan baik dan cepat. Saat menguji performa AI, ada juga gambar "pelikan mengendarai sepeda" yang sering dibuat, dan sepertinya orang ini yang pertama kali melakukannya (https://simonwillison.net/search/?q=pelican)
Dia juga orang yang membuat Django, jadi punya tingkat pengenalan yang tinggi.

qyurila 2026-01-29

Ini tampaknya blog yang menempati peringkat 1 di antara blog paling populer di Hacker News pada 2025. Selain reputasinya yang memang besar, jumlah artikel yang dipublikasikan juga cukup banyak, jadi dari sudut pandang pengguna Hacker News pada umumnya, ini mungkin blog yang paling sering dikunjungi dan karena itu secara alami dianggap sebagai tolok ukur.

GN⁺ 2026-01-29

Opini Hacker News

Menurut saya ini adalah demo browser pembuat kode yang jauh lebih baik daripada FastRender milik Cursor
Jauh lebih kecil, sekitar 20 ribu baris Rust, hanya memakai library sistem untuk rendering gambar dan teks, dan kodenya juga mudah dibaca
Misalnya, jika melihat kode implementasi flexbox, strukturnya jelas
Saya juga mengunggah tangkapan layar saat merender blog saya; CSS gradient dan ikon SVG ditangani dengan baik, tetapi PNG gagal
Saya kira browser perender HTML+CSS adalah tugas yang sempurna untuk mendemonstrasikan agen paralel, jadi mengejutkan bahwa ini ternyata bisa dilakukan hanya dengan satu agen coding
- Dari sudut pandang engineering, menurut saya desainnya jauh lebih matang daripada browser buatan Cursor
  Yang penting bukan sekadar memakai banyak token, melainkan cara memanfaatkan agen secara efektif
  Saya sendiri sering membuat beberapa proyek lalu membiarkannya begitu saja setelah beberapa hari. Tanpa umpan balik, agen hanya melakukan apa yang diperintahkan, jadi jika arahnya salah, agen justru akan menggali lubang lebih dalam
- Saya rasa kolaborasi manusia dan agen adalah hal yang membuat perbedaan besar
  Bahkan jika Claude melenceng ke arah yang aneh, dengan struktur agen yang tepat ia bisa dipulihkan kembali
  Saat ini saya sedang bereksperimen dengan memisahkan agen evaluator, peneliti, dan implementer
  Dengan sistem skor, saya membuat mereka memperluas tes atau menyelidiki penyebab kegagalan, lalu membuang commit jika tidak ada perbaikan
  Struktur seperti ini jauh lebih menguntungkan untuk pengendalian kualitas kode
  Di zaman ketika kode murah dan bisa dibuang, workflow itu sendiri harus berubah
- Mengesankan bahwa embedding-shapes benar-benar merakitnya sendiri secara manual
  Ini terasa seperti kisah 'David vs Goliath' di mana 1 orang + 1 agen mengalahkan browser senilai 5 juta dolar dengan 1,6 juta LOC
  AI masih merupakan kotak hitam, jadi semua orang sedang bereksperimen sambil mencari arah
  Baru lewat satu bulan sejak 2026 dimulai, dan menarik membayangkan eksperimen seperti apa yang akan muncul ke depan
  Akan seru jika Simon meninjau ulang thread prediksi HN 2026 secara berkala
Ia menetapkan batas 3 hari, dengan aturan harus mendukung X11/Windows/macOS hanya memakai library bawaan OS, tanpa crate pihak ketiga Rust
Selesai dalam sekitar 20 ribu LOC, dengan 14 ribu baris untuk engine dan 6 ribu baris untuk kode dukungan platform
Ia telah merilis source code dan binary
- Saat saya berkontribusi ke KHTML/konqueror 20 tahun lalu, bahkan hanya mengimplementasikan rendering dasar saja butuh waktu berbulan-bulan
  Sekarang jauh lebih efisien berkat test suite yang bisa dibaca mesin
  Dulu perilaku IE pada dasarnya adalah standarnya, tetapi sekarang Google, Apple, dan lainnya ikut berkontribusi pada standardisasi sehingga jauh lebih baik
- Penasaran model apa yang dipakai dan berapa biaya token-nya
- Batasan-batasannya sangat bagus
Terlepas dari fungsinya, saya penasaran seperti apa audit keamanan untuk codebase seperti ini
Rust memang membantu, tetapi saya ragu jaminan dari bahasa saja sudah cukup
- Keamanan sama sekali tidak dipertimbangkan. Membuka situs web sembarang tanpa sandbox itu berbahaya
  Rust hanya mencegah kesalahan memori dasar, tetapi tidak mencegah hal seperti akses file lokal
  Karena tidak ada engine JS, kebocoran data memang lebih sulit, tetapi jika diaudit sepertinya akan ditemukan beberapa kerentanan serius
Komunitas sudah lama menunggu browserBench, dan saya senang ini akhirnya dimulai
Browser adalah salah satu perangkat lunak paling kompleks, jadi upaya seperti ini akan menjadi tolok ukur untuk menilai batas kemampuan
Sulit membayangkan browser bisa dibuat hanya dengan 20 ribu baris
zlib saja sudah 12 ribu baris, jadi rasanya seperti ada sesuatu yang hilang
Saya penasaran apakah ini hanya memanggil render bawaan OS
- Di Linux, ia menautkan 78 dynamic library untuk X11, glib, format grafis, enkripsi, dan lain-lain
- Tidak ada dependensi Rust, hanya memakai framework bawaan OS
  Library apa saja yang digunakan dijelaskan di README
Saat saya menjalankannya, rendering-nya terasa cukup membingungkan
Warna link dan garis bawahnya tidak konsisten, dan di Windows tombol back tidak berfungsi
Meski begitu, halaman utama HN dan blog Simon dirender cukup baik
- Browser ini bukan produk mandiri, melainkan proyek respons terhadap tulisan scaling-agents dari Cursor
  Tujuannya adalah mewujudkan fitur serupa dengan LOC yang lebih sedikit
  Karena tidak ada stylesheet bawaan, warna link tidak seragam
  Di Windows 11 tombol back berfungsi. Kalau Anda memakai Windows 10, mungkin itu penyebabnya
Merender blog Simon tampaknya akan menjadi target acuan bagi browser AI
Tetapi untuk saat ini, ini masih lebih mirip renderer daripada browser sungguhan
Akan lebih mengesankan jika AI membantu implementasi API dalam proyek seperti Servo
- Setuju. Ini belum cukup untuk disebut browser, bahkan HTML dasar pun belum bisa dirender dengan baik dan sering crash
  Meski begitu, ini lebih baik daripada upaya Cursor, dan fakta bahwa 'bisa dikompilasi' setidaknya merupakan kemajuan minimal
Saya penasaran berapa lama jadinya jika dikerjakan sendirian
Untuk memahami bantuan dari agen, saya ingin tahu seberapa dalam keahlian yang masuk ke dalam panduan tersebut
- Jika sendirian, mungkin memang tidak akan mungkin
  Saya tahu Rust, tetapi tidak tahu X11, macOS, atau Windows API, jadi mungkin bahkan sulit untuk mulai
  Namun saya punya banyak pengalaman dalam testing, infrastruktur, dan desain, dan itu membantu saat berkolaborasi dengan agen
- Setelah dihitung dengan alat sloccount,
  proyek ini diperkirakan setara dengan 4,58 person-year dan 610 ribu dolar menurut standar tahun 2000,
  atau 5,6 tahun dan 1,38 juta dolar menurut standar tahun 2025
Yang membuat tulisan ini menarik bukan hasil akhirnya, melainkan fokusnya pada proses pembuatan dan batasan-batasan
Kebanyakan tulisan berfokus pada hasil atau penulisnya, tetapi yang ini memberi wawasan yang berpusat pada proses
- Sebagai orang yang juga pernah menulis tentang Cursor, saya makin sulit memahami definisi "sukses" versi mereka
  Karena itu, saya merasa lebih bermakna untuk menggali bagian mana yang benar-benar sulit dan proses apa yang salah
Pekerjaan yang mengesankan
Saya penasaran bagaimana cara mengimplementasikan accessibility tanpa dependensi Rust
Di Windows/macOS ini bisa dilakukan dengan UI Automation dan NSAccessibility, tetapi di X11 ada beberapa pilihan:
1. mengimplementasikan AT-SPI baru lewat D-Bus, atau
2. memakai library C D-Bus yang sudah ada, atau
3. menggunakan GTK atau Qt