21 poin oleh GN⁺ 2025-08-07 | 1 komentar | Bagikan ke WhatsApp
  • Agen berbasis LLM yang ada umumnya berstruktur 'agen dangkal (shallow)' yang sekadar memanggil tool berulang kali, tetapi Deep Agents adalah agen AI yang terencana dan terstruktur yang mampu menyelesaikan tugas kompleks dan jangka panjang secara mendalam
  • Agen-agen terbaru seperti Deep Research, Manus, Claude Code mengimplementasikan 'agen mendalam' yang memungkinkan eksplorasi topik yang lebih dalam dan pengelolaan konteks
    • Prompt sistem yang detail, tool perencanaan, sub-agen, dan pemanfaatan sistem file adalah inti dari 'agen mendalam'
  • LangChain merilis paket open-source deepagents agar siapa pun dapat dengan mudah membuat deep agent yang sesuai dengan vertical (domain) mereka sendiri
    • Mendukung konfigurasi prompt, tool, dan sub-agen kustom, serta menyediakan framework serbaguna yang dapat diterapkan di berbagai bidang seperti riset dan pengembangan

Keterbatasan agen LLM yang ada dan karakteristik Deep Agents

  • Agen tradisional: LLM berputar dalam loop dan hanya memanggil tool → hanya cocok untuk konteks pendek dan tugas jangka pendek yang sederhana
  • Deep Agents: dapat secara mandiri memecah, merencanakan, melacak, dan berkolaborasi untuk tujuan jangka panjang maupun tugas yang kompleks

Empat elemen yang membentuk Deep Agents

  1. Prompt sistem yang detail

    • Seperti pada contoh representatif seperti Claude Code, digunakan prompt yang menjelaskan secara rinci cara penggunaan tool dan contoh perilaku
    • Instruksi kompleks dan contoh few-shot mendorong pemikiran serta eksekusi yang lebih 'mendalam'
  2. Tool perencanaan (Planning)

    • Bahkan tanpa fungsi nyata, tool perencanaan seperti 'daftar To-Do' dimasukkan ke dalam rutinitas untuk menjaga pengelolaan konteks dan kemampuan eksekusi
    • Meski no-op (tidak melakukan apa pun), tetap memberi efek penyediaan konteks di dalam prompt
  3. Sub-agen (Sub Agents)

    • Membuat dan membagi sub-agen untuk tiap sub-tugas, lalu masing-masing agen bekerja secara terpisah sebelum hasilnya digabungkan
    • Masalah besar atau kompleks dapat ditangani dengan struktur paralel dan pembagian kerja
  4. Sistem file

    • Tidak hanya untuk pekerjaan file nyata, tetapi juga dimanfaatkan sebagai penyimpanan catatan dan konteks
    • Banyak agen dan sub-agen berbagi sistem file untuk kolaborasi dan mempertahankan konteks jangka panjang

Framework Deep Agents dari LangChain: deepagents

  • Paket Python open-source (pip install deepagents), mendukung pengaturan prompt, tool, dan sub-agen kustom
    • Prompt sistem yang terinspirasi dari Claude Code, lalu dimodifikasi agar lebih umum
    • Tool perencanaan daftar ToDo no-op (sama seperti Claude Code)
    • Mendukung pembuatan sub-agen dan penetapan kustom
    • Sistem file virtual berbasis konsep LangGraph (menggunakan status agen)
  • Menyediakan contoh agen deep research, sehingga agen yang terspesialisasi untuk vertical tertentu dapat dibuat dengan mudah

Contoh penggunaan dan nilainya

  • Dioptimalkan untuk pekerjaan AI jangka panjang dan kompleks seperti riset dan pengembangan, pembuatan kode, riset, serta otomatisasi yang kompleks
  • Perancangan konteks yang detail dan struktur pembagian kerja memungkinkan hasil yang lebih mendalam
  • Siapa pun dapat membangun 'deep agent' yang sesuai dengan domainnya—menunjukkan tahap berikutnya dalam pemanfaatan AI

1 komentar

 
GN⁺ 2025-08-07
Opini Hacker News
  • Saya penulisnya. Belakangan ini saya terkesan dengan bagaimana serangkaian agen seperti claude code, manus, dan deep research sangat bagus dalam menjalankan tugas dengan rentang waktu yang panjang. Pada dasarnya, di dalamnya LLM berputar dalam loop sambil memanggil tool. Namun, kalau dilakukan begitu saja tanpa pemikiran matang, muncul masalah bahwa LLM tidak mampu menyelesaikan tugas yang kompleks atau panjang dengan baik. Jadi saya jadi penasaran bagaimana agen-agen lain bisa melakukannya. Hal-hal yang saya temukan secara umum adalah sebagai berikut. 1) menggunakan tool perencanaan 2) menggunakan sub-agen 3) menggunakan struktur yang mengalihkan konteks seperti file system 4) merancang system prompt secara detail (prompt engineering masih tetap penting) Masing-masing sebenarnya adalah metode yang sudah ada sebelumnya, tetapi bukan pendekatan yang umum dipakai secara luas saat benar-benar mengembangkan agen. Menurut saya, kombinasi inilah justru insight yang penting. Masukan sangat saya sambut

  • Setelah memikirkan berbagai pendapat, saya setuju bahwa konsep deep agents pada akhirnya juga tidak jauh berbeda dari kombinasi agent + tool. Menurut saya, poin intinya adalah sebagai berikut. 1) untuk pengetahuan dasar perlu memakai LLM yang bagus 2) prompt yang bisa membimbing LLM dengan benar itu penting (agar bisa dijadikan agen) 3) fungsi yang tidak memerlukan penilaian terpisah diimplementasikan sebagai tool 4) ketika alur agent+tool menjadi kompleks, pecah per domain menjadi sub-agen dengan prompt yang terfokus dan jumlah tool yang sedikit

    • Pada akhirnya sepertinya ini akan berkembang menjadi model "koordinator" di mana agen tingkat atas memilih apa yang harus dilakukan dan mendistribusikan agen mana yang cocok untuk tugas itu. Struktur ini bisa berlanjut secara rekursif (misalnya: ada agen untuk tiap produk, lalu agen itu bercabang lagi menjadi agen yang menangani pekerjaan frontend/backend). Dalam struktur seperti ini, agen yang benar-benar menjalankan pekerjaan cukup fokus pada konteks dan tool yang terbatas, sementara agen tingkat atas hanya perlu memahami apa saja yang bisa dilakukan sub-agen
  • Saya rasa deep agents = agen dengan tambahan perencanaan + kombinasi tool agen, jadi pada akhirnya mirip dengan agen yang sudah ada. Agak disayangkan karena LangChain terlihat selalu membungkus konsep sederhana menjadi rumit dan membuat istilah atau konsep baru secara tidak perlu untuk promosi. Tentu saja, kalau ingin menjual lebih banyak LangSmith mungkin memang tidak terhindarkan

    • Dulu saya pernah melakukan konsultasi seperti ini. Tidak bisa dibilang sepenuhnya sama persis, tetapi secara esensial ini trik yang umum. Mengemas sesuatu yang biasa saja seperti pertunjukan, membuat istilah dan klasifikasi sendiri, lalu menjualnya. Langkah berikutnya adalah membanjiri SEO dengan konsep buatan sendiri. Tinggal menumpang pada kata kunci populer seperti deep * dan agent… kalau memikirkan hal seperti ini, rasanya lingkungan perusahaan memang menguras jiwa pada level yang mendasar
  • Hasilnya kurang lebih seperti yang saya harapkan. Sekarang makin jelas bahwa menulis MCP server sendiri sudah tidak terlalu efektif, jadi situasinya membutuhkan cara baru yang bisa cepat mengikuti arus utama. Membuat agen sendiri seperti gemini atau claude code sedang jadi tren belakangan ini. Hambatan masuknya rendah, ada tingkat kegunaan tertentu, tidak butuh keahlian AI yang sangat dalam, dan juga mudah dipromosikan. Mirip pendekatan “cursor for X”, tapi malah bisa diproduktisasi lebih cepat. Sepertinya akan muncul sangat banyak coding agent yang dibuat seperti ini, tetapi sejauh ini saya masih merasa belum ada yang benar-benar baru. Meski begitu, saya melihat positif bahwa kalau bisa mulai secepat ini, secara intuitif nilai klon claude code yang dibuat seadanya akan segera mendekati nol

  • Saya terus mengikuti dan menganalisis kode repo ini https://github.com/ghuntley/claude-code-source-code-deobfuscation Penulisnya melakukan reverse engineering pada Claude Code dan menjelaskan arsitekturnya dengan baik. Saya mengganti tautannya ke repo yang lebih baik

    • Bisa jelaskan ini menunjukkan apa? Saya cuma melihat readme yang sangat besar dan system command saja
  • Saya sedang membuat agent cli+library serbaguna dengan rust: https://github.com/fdietze/alors Masih sangat awal dalam pengembangan, tetapi saya sudah memakainya bahkan untuk mengembangkan ini sendiri. Masukan sangat diterima

  • Menurut saya, Junie dari Jetbrains adalah yang pertama menulis fitur to do list dengan kualitas sangat tinggi, dan itu yang paling saya suka. Sejak berubah menjadi berbayar saya sudah tidak memakainya lagi, tetapi saat itu Junie lambat dan hati-hati. Cursor terus menimpa file yang sebenarnya tidak bermasalah, sementara Claude terasa berada di tengah-tengah

    • Cursor juga menyediakan UI khusus untuk todo list dan mendorong agen untuk menggunakannya (UX-nya sendiri bagus, tetapi file terpisahnya tidak bisa dilihat langsung). kiro dari amazon memakai pendekatan mengelola tugas yang harus dilakukan sekaligus spesifikasi di tasks.md. Karena tool semakin banyak, tinggal pilih yang paling cocok untuk Anda
  • Bagian yang paling menarik justru sepenuhnya tersembunyi. Kuncinya adalah bagaimana mengelola tool call mulai dari parsing sampai eksekusi

  • Memisahkan konteks dengan sub agent adalah titik inovasi yang benar-benar penting. Sisanya cuma langgraph react agent

    • Ini memang bernilai, tetapi sebenarnya bukan ide yang benar-benar baru
  • Saya penasaran apakah ada informasi lebih lanjut tentang bagian bahwa tool todo list itu no-op. Saya ingin tahu persis bagaimana cara kerjanya

    • Kalau ingin melihat langsung di kode, Sketch agent yang kami buat memanfaatkan tool TODO list seperti ini: https://github.com/boldsoftware/sketch/blob/main/claudetool/todo.go Membuat agen memakai ini relatif mudah. Sebagian besar pekerjaan justru ada pada membuatnya terlihat di UI
    • Pertanyaan saya juga sama. Saya kurang paham maksudnya. Tetapi ini jelas terlihat sebagai alasan Claude Code unggul
    • Menurut saya ini cuma fungsi concat sederhana. Teknik prompt yang benar-benar berguna pada praktiknya kebanyakan memang implementasinya sederhana. Justru makin mengejutkan bahwa ide sesederhana TODO bisa melangkah sejauh itu! (Dalam lingkungan yang serius, framework agent memang sulit. Misalnya: kombinasi dan setting yang tepat benar-benar susah, dan pada sisi infrastruktur ada banyak hal yang perlu ditangani seperti multi-tenancy, multi-threading, streaming, pembatalan, dan lain-lain). Saya sepenuhnya setuju bahwa TODO list itu penting. Hal seperti kompetisi analisis log keamanan dari louie.ai juga menjadi jauh lebih cepat berkat metode ini. Ini mencegah CoT rusak hanya dalam beberapa giliran. Momen aha yang menarik adalah bahwa nested todo (A.2.i...) bagus untuk digunakan, tetapi dari sudut pandang LLM semuanya tetap dilinearkan, jadi bisa diproses tanpa kesulitan. Sebagai pengganti claude code, kami secara internal mengelolanya dengan prompt rencana seperti ini: https://github.com/graphistry/louie-py/blob/main/ai/prompts/PLAN.md
    • Yang dicatat ke konteks hanya fakta bahwa tool call pernah terjadi. Data todo list itu sendiri tidak diambil kembali
    • Menurut pemahaman saya, anggap saja ini semacam prompt untuk menulis TODO list