Comet - Web Agent dan browser dari Perplexity
(perplexity.ai)Comet: browser baru buatan Perplexity
Sudah sedikit lama sejak dirilis, tetapi saya menulis ini setelah mencobanya usai lolos dari daftar tunggu.
Gambaran inti
Comet adalah browser AI yang dikembangkan oleh Perplexity, dirancang untuk memaksimalkan fokus dan alur kerja pengguna serta mengubah rasa ingin tahu menjadi eksekusi.
Fitur dan karakteristik utama
-
Pencarian terintegrasi AI, konteks instan, otomatisasi situs
- Bisa langsung melakukan ringkasan, belanja, penjadwalan, dan riset dari browser
-
Comet Assistant
- Mengotomatiskan tugas berulang seperti klik, mengetik, submit, dan autocomplete
-
Mengotomatiskan pekerjaan yang kompleks
- Mendukung seluruh proses belanja, dari perbandingan produk hingga pembayaran
-
Manajemen terpadu
- Integrasi email dan kalender (Gmail, Google Calendar)
- Briefing jadwal, email, hingga penjadwalan agenda bisa diselesaikan di dalam browser
-
Pengalaman yang dipersonalisasi
- Mempelajari pola penggunaan untuk otomatis merapikan tab dan insight
-
Menemukan jawaban langsung dari aktivitas saya
- Mendukung pencarian pada data pribadi seperti riwayat, video, dan dokumen
-
Smart action dan fitur fokus per tab
- Fitur @tab memberikan jawaban real-time yang sesuai dengan tab yang sedang terbuka
Contoh penggunaan
Perplexity juga memposting tambahan contoh penggunaan di Linkedin
https://www.linkedin.com/company/perplexity-ai/posts/?feedView=all
Opini pribadi setelah memakai layanan ini
Teknologi
- Berbentuk browser Chromium + Perplexity + Web Agent
- Kueri bahasa alami -> ekstraksi intent/slot -> pemetaan Semantic DOM -> konversi aksi -> eksekusi event (web Tool) -> parsing hasil dan praproses -> tampaknya berstruktur ReAct
- Comet mengambil screenshot sehingga status pekerjaan saat ini bisa dipahami, tetapi masih perlu konfirmasi tambahan apakah analisisnya menggunakan vision model
Kasus uji
(1) Menulis email
- Menggunakan situs email Google dengan tepat untuk menulis email
- Agent memilih untuk tidak benar-benar mengirim, melainkan menyimpannya sebagai draf
(2) Mencari rute di Naver Map + rekomendasi restoran sekitar
- Setelah membuka halaman web Naver Map, saya memintanya mencari rute dari Seoul Station ke Jamsil, dan ia menemukan rute itu dengan memanfaatkan layanan Naver Map secara tepat (seperti manusia)
- Untuk mencari restoran sekitar, ia tidak memakai Naver Map melainkan Search Tool bawaan Perplexity
(3) Crawling Open AI Platform Pricing
- Setahu saya Open AI Platform menggunakan Remix, dan sebagian harga API tersembunyi dalam bentuk toggle
- Saya secara eksplisit meminta Comet membuka toggle tersebut, memeriksa harga semua API, lalu memberikan hasilnya dalam Markdown, dan hasilnya cukup baik
- Namun, tetap diperlukan prompt engineering agar informasi yang diekstrak benar-benar akurat
- Saya juga memintanya memeriksa halaman API Anthropic, tetapi karena layout halaman (divider) ambigu, ia tidak bisa mem-parsing kebijakan API yang kompleks secara akurat. Meski begitu, harga API dasarnya berhasil diekstrak dengan tepat.
Opini pribadi
- Saat mengembangkan browsing agent, tampaknya ada banyak hal yang perlu dipertimbangkan seperti konteks, rendering, dan lain-lain; saya penasaran bagaimana mereka menyelesaikannya.
- Secara teknis ada faktor wow, tetapi dari sudut pandang produk rasanya masih agak ambigu.
- Mungkin tiap orang berbeda, tetapi bagi saya belum jelas kenapa saya harus memakai produk ini, kenapa saya perlu membayar untuk menggunakan Comet, dan masalah apa milik saya sebagai pelanggan yang benar-benar bisa diselesaikannya. Dengan kata lain, value proposition-nya belum terasa jelas bagi saya. Saat ini kesannya masih sebatas, "Oh! Menarik, ternyata ini bisa ya, nanti kalau teringat saya coba beberapa kali lagi."
- Memang Perplexity sudah menunjukkan contoh penggunaan, tetapi saya tetap bertanya, "Apakah ini benar-benar masalah yang perlu diselesaikan dengan Agent? (Kalau saya kerjakan sendiri malah lebih cepat)" dan "Apakah masalah nyatanya benar-benar sudah terselesaikan semuanya?"
- Saya menduga ini mungkin karena browser posisinya lebih dekat ke infrastruktur, jadi kesan seperti ini muncul
- Karena browser berbasis AI Agent bisa dibilang format baru, saya rasa yang penting adalah menunjukkan dengan baik kepada pelanggan bahwa "Anda punya masalah seperti ini, dan Comet benar-benar bisa menyelesaikannya dengan tuntas."
- Sepertinya saya perlu terus memperhatikannya sambil memakainya lebih lama. Saya juga jadi berpikir bagaimana masalah dari sisi produk ini bisa diselesaikan.
UI
Ini adalah analisis pribadi saya. (Saya sedang mengerjakannya dengan tujuan membuat versi reverse-designed...,)
https://www.figma.com/deck/Gky9ZDEqZKdJfG4RWoNYdf
4 komentar
Saat Anda mencobanya, apakah ada batas penggunaan kueri untuk agen Comet tersebut? Atau karena masih masa uji coba, kuerinya tidak terlalu dibatasi seperti alat lain? Saya ingat sepertinya ada yang seperti pro-max, jadi saya penasaran dan ingin bertanya.
Saya saat ini berlangganan Pro. Mungkin karena saya menggunakannya agak sedikit, tetapi sejauh ini saya belum pernah terkena limit di Perplexity, termasuk Comet. Rasanya lebih longgar dari yang saya kira.
Paket langganannya tidak menyediakan rate limit, jadi saya juga tidak bisa memastikannya.
Untuk sementara, sepertinya rilis beta diberikan berbeda dengan Pro Max.
https://perplexity.ai/help-center/en/…
Ini kesan pribadi saya, tetapi seperti yang Anda katakan, mungkin karena masih masa pengujian, kuerinya tampak tidak berpengaruh. Saya juga sudah memastikan bahwa pekerjaan tetap berjalan bahkan saat menjalankan 12 browser virtual secara paralel sekaligus. Ini cukup mengejutkan.
Terima kasih, saya membacanya dengan baik.
Agak disayangkan karena tampaknya memang seperti yang sudah diperkirakan..
Saya setuju dengan itu.
Contoh:) ketika diminta membaca halaman berita Naver dan merangkum kecenderungan nada tiap surat kabar terkait negosiasi tarif, ia menjawab dengan mengarang nada surat kabar yang sebenarnya tidak dibaca, berdasarkan "prasangka yang sudah dipelajari sebelumnya tentang kecenderungan masing-masing media".