- Di Claude Platform, strategi advisor kini diperkenalkan secara resmi — pola yang menggabungkan Opus sebagai advisor dan Sonnet atau Haiku sebagai executor untuk menerapkan kemampuan penalaran yang mendekati level Opus pada agen sambil menekan biaya
- Saat Sonnet digabungkan dengan advisor Opus, skor SWE-bench Multilingual meningkat 2,7 poin persentase dibanding saat Sonnet menjalankan tugas sendirian, dan biaya per tugas agen turun 11,9%
- Kombinasi Haiku + advisor Opus mencatat 41,2% pada BrowseComp, lebih dari dua kali lipat Haiku saja (19,7%), dengan biaya 85% lebih rendah dibanding Sonnet saja
- Jika tool
advisor_20260301 dideklarasikan dalam permintaan Messages API, handoff model selesai dalam satu permintaan /v1/messages tanpa request bolak-balik tambahan atau pengelolaan konteks terpisah
- Token advisor ditagih dengan tarif model advisor, dan token executor ditagih dengan tarif model executor, sehingga pelacakan dan kontrol biaya dimungkinkan
Ringkasan strategi advisor
- Sonnet atau Haiku bertindak sebagai executor yang menjalankan tugas dari awal sampai akhir, termasuk pemanggilan tool, membaca hasil, dan pekerjaan berulang
- Ketika executor mencapai keputusan yang sulit diselesaikan secara masuk akal, ia meminta panduan ke Opus, dan Opus merujuk konteks bersama untuk mengembalikan salah satu dari rencana, revisi, atau sinyal penghentian
- Advisor (Opus) tidak memanggil tool secara langsung maupun menghasilkan output yang berhadapan dengan pengguna, dan hanya memberikan panduan kepada executor
- Struktur ini merupakan kebalikan dari pola sub-agent tradisional, di mana model orkestrator besar memecah pekerjaan dan mendelegasikannya ke model worker kecil; pendekatan ini bekerja tanpa worker pool atau logika orkestrasi terpisah
- Penalaran tingkat frontier hanya diterapkan saat executor membutuhkannya, sementara bagian eksekusi lainnya tetap berada pada biaya model executor
Hasil evaluasi performa
- Kombinasi Sonnet + advisor Opus menunjukkan peningkatan 2,7 poin persentase di SWE-bench Multilingual dibanding Sonnet saja, dengan biaya per tugas agen turun 11,9%
- Pada benchmark BrowseComp dan Terminal-Bench 2.0, skor juga meningkat dibanding Sonnet saja, sementara biaya per tugas menurun
- Haiku + advisor Opus: skor BrowseComp 41,2% — lebih dari dua kali lipat Haiku saja (19,7%)
- Skornya 29% lebih rendah dibanding Sonnet saja, tetapi biaya per tugas 85% lebih rendah
- Menambahkan advisor memang meningkatkan biaya dibanding Haiku saja, tetapi biaya gabungannya tetap jauh lebih rendah daripada Sonnet
Cara menggunakan Advisor Tool
- Jika
advisor_20260301 dideklarasikan dalam permintaan Messages API, handoff model selesai dalam satu permintaan /v1/messages — tidak perlu request bolak-balik tambahan atau pengelolaan konteks
- Model executor menentukan sendiri kapan harus memanggil advisor, lalu konteks yang telah dikurasi dikirim ke model advisor dan rencana dikembalikan
- Dengan parameter
max_uses, Anda dapat menetapkan batas maksimum jumlah pemanggilan advisor per permintaan
- Token advisor dilaporkan terpisah dalam blok usage sehingga pengeluaran per tier dapat dilacak
- Dapat digunakan bersama tool yang sudah ada (pencarian web, eksekusi kode, dll.) dalam loop yang sama
response = client.messages.create(
model="claude-sonnet-4-6", # executor
tools=[
{
"type": "advisor_20260301",
"name": "advisor",
"model": "claude-opus-4-6",
"max_uses": 3,
},
# ... your other tools
],
messages=[...]
)
Struktur harga
- Token advisor ditagih dengan tarif model advisor (Opus), sedangkan token executor ditagih dengan tarif model executor (Sonnet/Haiku)
- Advisor hanya menghasilkan rencana singkat (biasanya 400~700 token teks), dan output keseluruhan diproses executor dengan harga lebih rendah, sehingga biaya total tetap jauh lebih rendah dibanding menjalankan model advisor saja
Umpan balik pengguna
- ML engineer Eve Legal: "Haiku 4.5 secara dinamis memperluas kecerdasannya dengan merujuk ke Opus 4.6 sesuai kompleksitas, mencapai kualitas setara model frontier dengan biaya 5 kali lebih rendah"
- CEO Bolt: "Membuat keputusan arsitektur yang lebih baik pada tugas kompleks, dan tidak ada overhead pada tugas sederhana — perbedaannya sangat jelas pada lintasan perencanaan dan eksekusi"
- CTO Genspark: "Ada peningkatan yang jelas pada giliran agen, pemanggilan tool, dan skor keseluruhan — hasilnya lebih baik daripada planning tool buatan internal kami"
Memulai
- Saat ini tersedia dalam versi beta di Claude Platform
- Prosedur memulai:
- Tambahkan header fitur beta:
anthropic-beta: advisor-tool-2026-03-01
- Tambahkan
advisor_20260301 ke permintaan Messages API
- Sesuaikan system prompt dengan use case Anda
- Disarankan membandingkan tiga konfigurasi dengan eval suite yang ada: Sonnet saja / Sonnet + advisor Opus / Opus saja
Belum ada komentar.