9 poin oleh GN⁺ 2025-07-14 | 2 komentar | Bagikan ke WhatsApp
  • BrowserOS adalah alternatif open-source berfokus privasi untuk Perplexity Comet, sebuah browser agentic yang menjalankan agen AI secara lokal
  • Dibangun dari fork Chromium, sehingga mendukung semua ekstensi Chrome yang sudah ada, dengan ciri utama data pengguna hanya disimpan secara lokal
  • Dapat terhubung dengan berbagai penyedia AI seperti OpenAI, Anthropic, Ollama, serta dapat menggunakan API key pribadi atau model lokal
  • Dilengkapi alat produktivitas modern seperti highlighter native, bookmarker berbasis ChatGPT, pencarian semantik, dan pemblokiran iklan berbasis AI juga akan segera hadir
  • Berbeda dari browser lama, data tidak dikirim ke perusahaan pencarian/iklan, dan AI menjalankan workflow otomatis secara lokal

Ikhtisar BrowserOS

  • BrowserOS adalah browser agen open-source yang menyediakan lingkungan tempat agen AI berjalan langsung di komputer pengguna
  • Berlandaskan filosofi privasi lebih dulu, dengan penggunaan API key atau model lokal seperti Ollama agar data tidak bocor ke luar
  • Karena berbasis fork Chromium, antarmuka penggunanya sama seperti Chrome dan semua ekstensi Chrome dapat berjalan

Fitur utama

  • Agen AI & eksekusi lokal

    • Di dalam browser, agen AI berjalan langsung secara lokal, menangani tugas berulang dan workflow otomatis
    • Dengan integrasi Ollama, model bahasa besar dapat dijalankan di komputer sendiri alih-alih di cloud, sehingga privasi data terjamin
  • Alat produktivitas

    • Mendukung alat produktivitas bawaan browser seperti highlighter dan bookmark ChatGPT
    • Dengan pencarian semantik, data browser seperti riwayat/bookmark dapat ditemukan dengan cepat
  • Pemblokiran iklan dan MCP Store (segera hadir)

    • Pemblokiran iklan berbasis AI (segera hadir), direncanakan menjadi alternatif setelah uBlock Origin diblokir di Chrome
    • Di MCP (Multi Command Package) Store (segera hadir), MCP populer dapat dipasang dengan satu klik lalu langsung digunakan dari bilah browser
  • Open-source dan berpusat pada komunitas

    • 100% open-source dengan lisensi AGPL-3.0, menjamin transparansi kode dan perilaku
    • Sangat mendorong partisipasi dan kontribusi komunitas

Contoh penggunaan utama

  • Otomatisasi pekerjaan yang berulang dan membosankan: penjadwalan rapat, pengisian formulir, dan tugas berulang ditangani otomatis oleh AI
  • Deep research: menjelajah web untuk membuat laporan ringkasan dan mengumpulkan informasi secara efisien tanpa pengelolaan tab manual
  • Pemindaian konten SNS: otomatis menyaring dan merangkum postingan penting dari LinkedIn, Twitter, dan lainnya

Perbandingan dengan browser lain

  • Chrome: tidak banyak berubah selama 10 tahun dan belum memiliki fitur AI/otomatisasi/MCP
  • Brave: strategi tersebar pada kripto/pencarian/VPN sehingga tidak fokus pada browser AI
  • Arc/Dia: bersifat tertutup dan bukan open-source, sehingga tidak ada alternatif jika dihentikan
  • Perplexity Comet: berpusat pada perusahaan pencarian/iklan, data pengguna dikirim ke server, sedangkan BrowserOS menyimpan semua data hanya secara lokal

Instalasi dan memulai

  • Mendukung unduhan untuk macOS dan Windows
  • Impor data Chrome (opsional)
  • Hubungkan penyedia AI (OpenAI, Anthropic, Ollama, dll.)
  • Bisa langsung mulai otomatisasi agen

Lisensi

  • Menggunakan lisensi open-source AGPL-3.0

2 komentar

 
luiseok 2025-07-14

https://id.news.hada.io/topic?id=21581
Terasa familier, ternyata itu Nxtscape yang cuma ganti nama.

 
GN⁺ 2025-07-14
Komentar Hacker News
  • Contoh pembelian pasta gigi yang ditunjukkan dalam demo justru memperlihatkan betapa sulitnya tugas-tugas seperti ini; istilah "pasta gigi" sendiri terlalu ambigu, jadi pada akhirnya sistem hanya memilih secara acak dari daftar yang sangat besar. Untuk beberapa tugas, tindakan sebelumnya bisa memberi panduan, tetapi sering kali tidak demikian; misalnya, kalau pasta gigi yang sebelumnya dibeli sedang habis, sistem tidak tahu harus bagaimana. Jadi saya ragu apakah contoh seperti ini benar-benar menghemat waktu; toh pada akhirnya hasilnya tetap harus diperiksa, jadi seperti bekerja dua kali. Menurut saya ini juga alasan sistem seperti Alexa dulu gagal memberikan pengalaman belanja yang diharapkan Amazon. Akan lebih baik kalau ditunjukkan contoh yang lebih kompleks tetapi jelas menghemat waktu dan punya lebih sedikit kasus gagal, atau malah fokus pada bagaimana memulihkan diri dari kasus gagal. Apakah akan disediakan UI yang sesuai untuk masalah tertentu, atau semuanya diselesaikan lewat chat? Menurut saya seluruh dunia ini sama sekali tidak mudah. Semoga berhasil untuk semuanya.
    • Betul sekali; seluruh bidang agentic browser memang masih di tahap awal. Kami juga baru saja mulai, dan sedang mencoba menemukan use-case niche yang benar-benar bernilai. Ada pekerjaan berulang dan membosankan yang jelas bisa menghemat waktu; misalnya penjual pihak ketiga di Walmart yang berkali-kali setiap hari memeriksa harga pesaing lalu menyesuaikan harga produknya. Hal seperti ini bisa dengan mudah diotomatisasi dengan agentic browser.
    • Menurut saya sistem seperti ini juga harus bisa menjalankan tugas sesuai selera estetika tiap pengguna, tetapi kalau begitu rasanya bisa menjadi mimpi buruk dari sisi keamanan.
  • Saya sudah memasang Nxtscape, tetapi tidak tahu kalau nama produknya sudah diganti. Saat saya menjalankan BrowserOS, saya kaget karena UI-nya sama persis dan bahkan jendela chat dengan emoji rubahnya juga sama. Sejujurnya saya lebih suka nama lamanya. Saya menduga namanya diganti karena alasan hukum.<br>Saya coba memintanya merangkum komentar di artikel Arstechnica, tetapi awalnya saya cuma mendapat jawaban, "tidak bisa merangkum karena komentarnya tidak disertakan". Baru setelah saya menyuruhnya mengklik langsung tautan "comments", ia mulai membaca komentarnya dengan benar. Sebagai catatan, halaman komentar itu total ada 3 halaman, dan selama lebih dari 20 menit ia melakukan sekitar 100 aksi—termasuk banyak aksi scroll yang sangat spesifik sejauh 1074 piksel—namun saya masih menunggu ringkasannya dalam status "Validating task completion..."<br>Secara kemampuan terlihat kuat, tetapi terlalu merepotkan dan lambat sehingga terasa tidak praktis untuk dipakai sungguhan.<br>Sebagai perbandingan, karena Nxtscape juga terpasang, saya mencoba eksperimen yang sama di sana dan tugasnya selesai lebih cepat dengan aksi yang lebih sedikit. Saya tidak tahu apakah itu kebetulan atau karena logika internal yang berbeda.<br>Selain itu ada ekstensi Chrome yang memungkinkan saya memakai kata sandi iCloud di Chrome, tetapi itu tidak berfungsi di Nxtscape maupun BrowserOS. Kalau saya tetap harus terus membuka password manager secara manual, saya tidak berniat memakai browser seperti ini, dan saya juga tidak berencana mengganti password manager saya.
    • Kami mengganti namanya untuk mencegah masalah, dan nama sebelumnya juga cukup sulit diucapkan. Terima kasih atas masukannya; akan menyenangkan kalau bisa lanjut berdiskusi di Discord(https://discord.gg/YKwjt5vuKr)! Tim kami melakukan deployment setiap hari dan sedang memperbaiki produk dengan sangat cepat, dan agent-nya juga akan jauh lebih baik dalam beberapa hari ke depan. Kami juga akan memeriksa soal ekstensi kata sandi iCloud; tujuannya adalah membuat onboarding dan pengelolaan kata sandi jadi jauh lebih mudah.
  • Kalau ini browser yang mengutamakan privasi, saya penasaran kenapa tidak memakai Firefox. Firefox jauh lebih cocok untuk tujuan ini dan secara default juga merupakan opsi yang lebih baik. Tor Browser, Mullvad Browser, LibreWolf, dan browser web yang mengutamakan keamanan/privasi lainnya semuanya berbasis engine Firefox. Dan menurut saya keberagaman "engine browser web" itu sangat penting. Kalau kita hanya memakai engine milik perusahaan tech besar, pada akhirnya konsumen yang akan sangat dirugikan dan inovasi juga akan terhambat. Kita perlu lebih banyak mendukung browser independen seperti Firefox.
    • Itu keputusan yang sangat sulit. Saya sudah berbicara dengan orang-orang yang pernah membuat browser di atas webkit, dan mereka bilang butuh hampir 2 tahun hanya untuk memperbaiki bug acak dan masalah kompatibilitas situs. Mungkin engine firefox/gecko memang lebih baik daripada webkit, tetapi kesimpulannya tetap sama: kalau memakai engine selain chromium, akan ada pekerjaan tambahan yang sangat besar untuk kompatibilitas situs web dan dukungan ekstensi. Kami juga cuma startup beranggotakan 2 orang, dan codebase chromium jauh lebih mudah dibangun sebagai titik awal, jadi itulah yang kami pilih. Selain itu, seperti Brave, browser yang fokus pada privasi juga tetap bisa dibuat di atas chromium. Terutama di era agentic browser, ada begitu banyak hal terkait privasi yang bisa langsung diperbaiki—misalnya mengirim data sensitif ke layanan seperti Perplexity Comet demi pendapatan iklan itu sangat buruk. Dukungan local LLM atau memungkinkan pengguna memakai API key mereka sendiri jauh lebih penting.
    • Saya juga punya pertanyaan yang sama. Kalau arahnya privasi, saya penasaran kenapa memakai chromium.
  • Saya membaca pernyataan, "kami langsung mem-patch source code C++ Chrome sehingga mendapatkan keamanan yang sama dengan Google Chrome". Kalau begitu, saya penasaran apakah setiap kali Chromium diperbarui kalian harus membuat build sendiri lagi, karena kadang ada patch dengan commit message yang tampaknya biasa saja padahal sebenarnya terkait kerentanan serius dan baru dipublikasikan sebagai CVE setelah 90 hari.
    • Pertanyaan bagus; sejauh ini kami terus membuat build berdasarkan versi rilis Chromium yang juga menjadi basis Google Chrome.
  • Menurut saya akan lebih baik kalau ini disediakan bukan sebagai browser mandiri, melainkan dalam bentuk ekstensi browser.
    • Sebenarnya kami juga awalnya ingin membuatnya sebagai ekstensi browser.<br>Tetapi untuk membuat agent copilot yang bagus, menurut kami berbagai perubahan di level Chromium C++ itu wajib. Misalnya, Chromium memiliki accessibility tree untuk semua situs web, tetapi itu tidak bisa diakses lewat chrome extension API. Akses langsung ke accessibility tree sangat meningkatkan performa agent. Selain itu kami juga menambahkan berbagai kemampuan di level C++ agar agent bisa berinteraksi dengan situs web, seperti aksi click atau indeks elemen. Kalau hal-hal ini dilakukan di JS, hasilnya 20-40 kali lebih lambat.
    • Kami juga berpikir persis seperti itu; untuk mengimplementasikan fitur agentic, menurut saya tidak perlu sampai membutuhkan keseluruhan browser. Bahkan dalam batas izin yang terbatas pun, ekstensi browser saja sudah cukup. Google juga sering merilis patch zero-day secara langsung, dan jelas ada fitur-fitur yang Google tidak masukkan ke Chromium. Karena itu saya tidak bisa mempercayai fork open-source acak sebagai browser utama saya. Saya merekomendasikan ekstensi browser AI Web Agent rtrvr.ai(https://rtrvr.ai), yang sudah diimplementasikan agar sesuai dengan workflow pengguna.
    • Saat nanobrowser disebut di sini, saya juga langsung terpikir hal yang sama.
    • https://github.com/nanobrowser/nanobrowser layak dicoba.
  • Ini proyek yang mirip dengan nanobrowser, yang merupakan chrome extension: https://github.com/nanobrowser/nanobrowser
    • Dari melihat cepat halaman proyeknya, tampaknya ia menggunakan API key LLM eksternal, sedangkan proyek yang diperkenalkan di postingan asli ini terlihat menjalankan LLM secara lokal dengan memakai transformer.js.
    • Kalau fitur seperti ini memang sudah bisa diimplementasikan sebagai ekstensi, saya penasaran kenapa harus membuatnya dengan mem-fork software yang sudah ada. Saya penasaran apakah ada kemampuan yang benar-benar hanya bisa dilakukan browserOS dan tidak ada di nanobrowser, dan perbedaan apa yang benar-benar penting untuk diperhatikan.
    • Terima kasih sudah menyebutkannya.
  • Ada pernyataan, "<i>setelah Chrome memblokir uBlock Origin, kami juga sedang membuat pemblokir iklan berbasis LLM</i>". Tapi kalau ini fork Chromium, bukankah uBlock Origin bisa dipakai ulang begitu saja?
    • Chromium akan menghapus API Manifest V2, dan tidak ada fork yang benar-benar ingin terus mempertahankannya. Bahkan Brave juga membuat pemblokir iklan bawaannya sendiri. Pertanyaan sebenarnya adalah, 'kenapa tidak mem-fork Firefox saja dan malah memilih Chromium, padahal Firefox sudah menyediakan semuanya?'
  • Saya penasaran roadmap untuk Linux, karena saya tidak punya Mac atau Windows.
    • Kami sadar soal itu, dan dukungannya direncanakan tersedia pada awal minggu depan. Kami masih tim beranggotakan 2 orang, jadi benar-benar banyak yang harus dikerjakan.
  • Saya ingin melihat AI benar-benar menggerakkan kursor mouse, mengklik, dan menampilkan input keyboard langsung di layar secara real time, seperti interaksi manusia sungguhan dalam tutorial software. Saat ini ketika AI mengganti halaman dan UI berubah-ubah dengan cepat, tampilannya terasa tersentak-sentak sehingga sulit mengikuti alurnya. Kurang ada petunjuk tentang apa yang perlu diperhatikan, jadi rasanya seperti hanya menonton screen recording. Meski begitu, rasanya akan ada use-case yang berguna di area seperti mcp/browser automation, jadi saya menantikan perkembangannya.
    • Ini masukan yang sangat berguna, terima kasih!<br>Kami akan melihat apakah gerakan kursor juga bisa ditambahkan, dan input keyboard saat ini memang sudah dibuat agar tampak seperti manusia sungguhan, tetapi sepertinya masih bisa diperbaiki agar terlihat lebih lambat.
    • Menurut saya yang benar-benar saya inginkan adalah caretaker ai.
  • Selamat!<br>Saya penasaran bagaimana proyek ini akan dibuat berkelanjutan dari sisi finansial, pengembangan, dan maintenance.
    • Terima kasih!<br>Pada dasarnya kami akan menempuh jalur yang sama seperti proyek open-source lainnya, yaitu dengan menjual lisensi untuk versi Enterprise dari browser ini.
    • Dugaan saya, ini mungkin hanya aplikasi electron atau chromium wrapper yang dipasangi ollama wrapper (toh ada banyak library open-source gratis yang bisa mengendalikan browser).