36 poin oleh GN⁺ 12 hari lalu | Belum ada komentar. | Bagikan ke WhatsApp
  • Di Claude Platform, strategi advisor kini diperkenalkan secara resmi — pola yang menggabungkan Opus sebagai advisor dan Sonnet atau Haiku sebagai executor untuk menerapkan kemampuan penalaran yang mendekati level Opus pada agen sambil menekan biaya
  • Saat Sonnet digabungkan dengan advisor Opus, skor SWE-bench Multilingual meningkat 2,7 poin persentase dibanding saat Sonnet menjalankan tugas sendirian, dan biaya per tugas agen turun 11,9%
  • Kombinasi Haiku + advisor Opus mencatat 41,2% pada BrowseComp, lebih dari dua kali lipat Haiku saja (19,7%), dengan biaya 85% lebih rendah dibanding Sonnet saja
  • Jika tool advisor_20260301 dideklarasikan dalam permintaan Messages API, handoff model selesai dalam satu permintaan /v1/messages tanpa request bolak-balik tambahan atau pengelolaan konteks terpisah
  • Token advisor ditagih dengan tarif model advisor, dan token executor ditagih dengan tarif model executor, sehingga pelacakan dan kontrol biaya dimungkinkan

Ringkasan strategi advisor

  • Sonnet atau Haiku bertindak sebagai executor yang menjalankan tugas dari awal sampai akhir, termasuk pemanggilan tool, membaca hasil, dan pekerjaan berulang
  • Ketika executor mencapai keputusan yang sulit diselesaikan secara masuk akal, ia meminta panduan ke Opus, dan Opus merujuk konteks bersama untuk mengembalikan salah satu dari rencana, revisi, atau sinyal penghentian
  • Advisor (Opus) tidak memanggil tool secara langsung maupun menghasilkan output yang berhadapan dengan pengguna, dan hanya memberikan panduan kepada executor
  • Struktur ini merupakan kebalikan dari pola sub-agent tradisional, di mana model orkestrator besar memecah pekerjaan dan mendelegasikannya ke model worker kecil; pendekatan ini bekerja tanpa worker pool atau logika orkestrasi terpisah
  • Penalaran tingkat frontier hanya diterapkan saat executor membutuhkannya, sementara bagian eksekusi lainnya tetap berada pada biaya model executor

Hasil evaluasi performa

  • Kombinasi Sonnet + advisor Opus menunjukkan peningkatan 2,7 poin persentase di SWE-bench Multilingual dibanding Sonnet saja, dengan biaya per tugas agen turun 11,9%
  • Pada benchmark BrowseComp dan Terminal-Bench 2.0, skor juga meningkat dibanding Sonnet saja, sementara biaya per tugas menurun
  • Haiku + advisor Opus: skor BrowseComp 41,2% — lebih dari dua kali lipat Haiku saja (19,7%)
    • Skornya 29% lebih rendah dibanding Sonnet saja, tetapi biaya per tugas 85% lebih rendah
    • Menambahkan advisor memang meningkatkan biaya dibanding Haiku saja, tetapi biaya gabungannya tetap jauh lebih rendah daripada Sonnet

Cara menggunakan Advisor Tool

  • Jika advisor_20260301 dideklarasikan dalam permintaan Messages API, handoff model selesai dalam satu permintaan /v1/messages — tidak perlu request bolak-balik tambahan atau pengelolaan konteks
  • Model executor menentukan sendiri kapan harus memanggil advisor, lalu konteks yang telah dikurasi dikirim ke model advisor dan rencana dikembalikan
  • Dengan parameter max_uses, Anda dapat menetapkan batas maksimum jumlah pemanggilan advisor per permintaan
  • Token advisor dilaporkan terpisah dalam blok usage sehingga pengeluaran per tier dapat dilacak
  • Dapat digunakan bersama tool yang sudah ada (pencarian web, eksekusi kode, dll.) dalam loop yang sama
response = client.messages.create(  
    model="claude-sonnet-4-6",  # executor  
    tools=[  
        {  
            "type": "advisor_20260301",  
            "name": "advisor",  
            "model": "claude-opus-4-6",  
            "max_uses": 3,  
        },  
        # ... your other tools  
    ],  
    messages=[...]  
)  

Struktur harga

  • Token advisor ditagih dengan tarif model advisor (Opus), sedangkan token executor ditagih dengan tarif model executor (Sonnet/Haiku)
  • Advisor hanya menghasilkan rencana singkat (biasanya 400~700 token teks), dan output keseluruhan diproses executor dengan harga lebih rendah, sehingga biaya total tetap jauh lebih rendah dibanding menjalankan model advisor saja

Umpan balik pengguna

  • ML engineer Eve Legal: "Haiku 4.5 secara dinamis memperluas kecerdasannya dengan merujuk ke Opus 4.6 sesuai kompleksitas, mencapai kualitas setara model frontier dengan biaya 5 kali lebih rendah"
  • CEO Bolt: "Membuat keputusan arsitektur yang lebih baik pada tugas kompleks, dan tidak ada overhead pada tugas sederhana — perbedaannya sangat jelas pada lintasan perencanaan dan eksekusi"
  • CTO Genspark: "Ada peningkatan yang jelas pada giliran agen, pemanggilan tool, dan skor keseluruhan — hasilnya lebih baik daripada planning tool buatan internal kami"

Memulai

  • Saat ini tersedia dalam versi beta di Claude Platform
  • Prosedur memulai:
    1. Tambahkan header fitur beta: anthropic-beta: advisor-tool-2026-03-01
    2. Tambahkan advisor_20260301 ke permintaan Messages API
    3. Sesuaikan system prompt dengan use case Anda
  • Disarankan membandingkan tiga konfigurasi dengan eval suite yang ada: Sonnet saja / Sonnet + advisor Opus / Opus saja

Belum ada komentar.

Belum ada komentar.