Perubahan system prompt antara Claude Opus 4.6 dan 4.7
(simonwillison.net)- Anthropic adalah satu-satunya lab AI besar yang selama ini mempublikasikan system prompt untuk sistem chat-nya, dan pada Opus 4.7 yang dirilis 16 April 2026 terdapat pembaruan prompt yang patut diperhatikan
- Namanya berubah menjadi Claude Platform, dan Claude in Chrome, Claude in Excel, serta Claude in Powerpoint dimasukkan ke dalam daftar tool; juga ditambahkan instruksi agar permintaan yang hanya kekurangan informasi kecil langsung dicoba alih-alih terlebih dulu banyak bertanya
- Bagian keamanan anak diperluas secara besar-besaran dan dibungkus dengan tag baru
<critical_child_safety_instructions>, serta diatur agar setelah satu kali penolakan, semua permintaan berikutnya dalam percakapan itu ditangani dengan kehati-hatian ekstrem - Bagian baru
<acting_vs_clarifying>ditambahkan untuk mengarahkan agar melakukan upaya yang masuk akal lebih dulu daripada bertanya ketika pengguna tidak menentukan detail - Jika pengguna menyatakan ingin mengakhiri percakapan, model kini berhenti tanpa mendorong interaksi lanjutan, dan untuk isu yang kompleks atau kontroversial ditambahkan aturan untuk menghindari jawaban ya/tidak yang terlalu singkat serta memprioritaskan jawaban yang bernuansa
- Ditambahkan frasa bahwa sebelum menyatakan tidak punya akses, model harus lebih dulu memeriksa tool yang tersedia lewat tool_search; system prompt publik saja tidak cukup, dan informasi deskripsi tool tetap menjadi elemen kunci untuk melacak perilaku Claude chat
Perubahan system prompt Claude Opus 4.6 dan 4.7
- Anthropic adalah satu-satunya lab AI besar yang mempublikasikan system prompt untuk sistem chat yang dihadapkan ke pengguna, dan arsipnya menelusur balik hingga Claude 3 pada Juli 2024
- Opus 4.7 diumumkan pada 16 April 2026, dan sejalan dengan itu system prompt Claude.ai juga diperbarui dari versi setelah Opus 4.6
- Penulis memisahkan versi Markdown dari system prompt ke dokumen per model, menyusun riwayat Git dengan tanggal commit palsu yang mencerminkan tanggal publikasi, lalu membandingkan diff antara Opus 4.6 dan 4.7
- Perubahan di bawah ini diambil dari diff tersebut, dan bagian yang dicetak tebal juga ditampilkan sebagai penekanan di teks asli
-
Perubahan nama dan daftar tool
- Sebutan “developer platform” diubah menjadi “Claude Platform”
- Daftar tool Claude yang disebut di system prompt kini mencakup Claude in Chrome, Claude in Excel, dan Claude in Powerpoint
- Berdasarkan ungkapan aslinya, Claude in Chrome adalah agen penjelajahan yang berinteraksi secara otonom dengan situs web
- Claude in Excel adalah agen spreadsheet
- Claude in Powerpoint adalah agen slide
- Claude Cowork dapat menggunakan semuanya sebagai tool
- Claude in Powerpoint adalah item yang tidak disebut dalam prompt 4.6
-
Perluasan panduan keamanan anak
- Bagian keamanan anak diperluas secara signifikan dan dibungkus dengan tag baru
<critical_child_safety_instructions> - Secara khusus, ditambahkan frasa bahwa setelah satu permintaan ditolak karena alasan keamanan anak, semua permintaan berikutnya dalam percakapan yang sama juga harus ditangani dengan kehati-hatian ekstrem
- Bagian keamanan anak diperluas secara signifikan dan dibungkus dengan tag baru
-
Perubahan pada penutupan percakapan dan sikap respons
- Jika pengguna menandakan siap mengakhiri percakapan, Claude kini diminta untuk menghormati permintaan berhenti tanpa meminta pengguna melanjutkan interaksi atau mendorong giliran berikutnya
- Dalam teks asli, ini ditafsirkan sebagai perubahan agar Claude menjadi tidak terlalu pushy
-
Penambahan bagian acting_vs_clarifying
- Bagian baru
<acting_vs_clarifying>ditambahkan - Ketika ada detail kecil yang hilang dari permintaan, diasumsikan bahwa pengguna biasanya ingin model langsung mencoba secara masuk akal sekarang juga daripada terlebih dulu diwawancarai
- Model hanya bertanya lebih dulu jika tanpa informasi yang hilang itu memang tidak mungkin memberi jawaban
- Contoh yang diberikan adalah ketika merujuk pada lampiran yang sebenarnya tidak ada
- Jika ada tool yang bisa mengurangi ambiguitas atau melengkapi informasi yang hilang, seperti pencarian, pengecekan lokasi, pengecekan jadwal, atau eksplorasi kemampuan yang tersedia, maka pemanggilan tool diprioritaskan daripada meminta pengguna yang mengecek sendiri
- Setelah mulai mengerjakan tugas, model secara eksplisit diarahkan untuk tidak berhenti di tengah jalan dan melanjutkan sampai memberi jawaban yang lengkap
- Bagian baru
-
Pengenalan tool_search
- Disebutkan bahwa tampaknya ada mekanisme tool_search yang masuk ke Claude chat
- Sebagai dasar terkait, ditautkan dokumentasi API dan postingan November 2025
- Menurut frasa di system prompt, sebelum menyimpulkan bahwa Claude tidak dapat mengakses lokasi, memori, kalender, file, percakapan lama, atau data eksternal, model harus memanggil tool_search untuk memastikan apakah tool terkait tersedia tetapi tertunda
- Ungkapan “I don’t have access to X” ditetapkan sebagai formulasi yang benar hanya setelah tool_search mengonfirmasi tidak ada tool yang cocok
-
Penguatan keringkasan
- Ditambahkan frasa baru bahwa agar tidak membanjiri pengguna dengan jawaban yang terlalu panjang, Claude harus menjaga jawabannya tetap fokus dan ringkas
- Juga ditegaskan bahwa meskipun jawaban menyertakan syarat atau peringatan, hal itu harus disampaikan singkat dan sebagian besar respons tetap berfokus pada jawaban utama
-
Frasa yang ada di 4.6 tetapi dihapus di 4.7
- Beberapa instruksi yang ada di prompt 4.6 dihapus pada 4.7
- Secara spesifik, dihapus frasa yang melarang penggunaan emote atau ekspresi tindakan di dalam tanda bintang kecuali pengguna secara khusus meminta gaya seperti itu
- Juga dihapus frasa yang melarang penggunaan kata seperti “genuinely”, “honestly”, dan “straightforward”
- Teks asli menambahkan bahwa mungkin ini karena model baru tidak lagi gagal dengan cara yang sama, tetapi itu dinyatakan secara eksplisit sebagai dugaan
-
Panduan baru terkait gangguan makan
- Bagian baru tentang disordered eating ditambahkan, dan sebelumnya istilah ini tidak disebut secara langsung
- Jika pengguna menunjukkan tanda-tanda gangguan makan, model tidak boleh memberikan panduan nutrisi, diet, atau olahraga yang presisi bahkan di bagian lain dari percakapan
- Angka spesifik, target, dan rencana langkah demi langkah semuanya termasuk yang dilarang
- Disebutkan bahwa sekalipun tujuannya untuk membantu menetapkan sasaran yang lebih sehat atau menekankan risikonya, detail semacam itu dapat memicu atau mendorong kecenderungan gangguan makan
-
Mencegah jawaban singkat pada pertanyaan kontroversial
- Disebutkan bahwa serangan tangkapan layar yang memaksa model menjawab pertanyaan kontroversial dengan ya/tidak saja sedang populer
- Bagian
<evenhandedness>di system prompt memuat panduan pertahanan terhadap hal ini - Jika diminta memberi jawaban ya/tidak sederhana atau jawaban satu kata untuk isu yang kompleks atau kontroversial, atau komentar tentang tokoh kontroversial, Claude dapat menolak jawaban sesingkat itu dan memberikan jawaban yang bernuansa beserta penjelasan mengapa jawaban singkat tidak tepat
-
Penghapusan frasa penyesuaian terkait Donald Trump
- Di Claude 4.6 ada frasa penyesuaian eksplisit: “Donald Trump is the current president of the United States and was inaugurated on January 20, 2025”
- Menurut teks asli, tanpa frasa itu model sebelumnya menyangkal bahwa ia adalah presiden karena cutoff pengetahuan lama dan pengetahuan yang sudah ada tentang pemilu 2020
- Di 4.7 frasa tersebut dihapus, karena tanggal cutoff pengetahuan yang andal kini diperbarui ke Januari 2026
Deskripsi tool juga menjadi target penting dalam pelacakan perubahan
- System prompt publik saja tidak cukup untuk melengkapi gambaran keseluruhan
- Informasi yang dipublikasikan Anthropic tidak mencakup deskripsi tool yang diberikan ke model
- Untuk benar-benar memahami UI chat Claude, deskripsi tool ini bisa jadi merupakan potongan dokumen yang lebih penting
-
Hasil bertanya langsung ke Claude
- Penulis menggunakan prompt yang meminta Claude mencantumkan semua tool yang tersedia beserta deskripsi persis dan parameternya apa adanya
- Di log percakapan yang dibagikan terdapat detail lengkapnya, sementara di badan artikel hanya dirangkum daftar tool yang memiliki nama
-
Daftar tool yang teridentifikasi
ask_user_input_v0bash_toolconversation_searchcreate_filefetch_sports_dataimage_searchmessage_compose_v1places_map_display_v0places_searchpresent_filesrecent_chatsrecipe_display_v0recommend_claude_appssearch_mcp_registrystr_replacesuggest_connectorsviewweather_fetchweb_fetchweb_searchtool_searchvisualize:read_mevisualize:show_widget
-
Apakah ada perubahan dibanding Opus 4.6
- Daftar tool ini tampaknya tidak berubah sejak Opus 4.6
1 komentar
Pendapat Hacker News
Saya memang selalu kurang suka ketika model menebak sendiri dulu saat detail permintaan masih kosong. Saya jauh lebih suka kalau ia bertanya dulu sebelum mencoba apa pun, jadi cukup mengejutkan melihat prinsip ini ditambahkan ke sistem
Menurut saya, kalau system prompt terus diisi macam-macam seperti ini, pada akhirnya akan muncul nonpercakapan. Semakin besar timnya, pasti akan ada orang yang bersikeras memasukkan hal yang menurutnya penting ke prompt
Saya merasa bagian gangguan makan ini cukup berlebihan. Saya jadi bertanya-tanya apakah nanti akan terus ditambahkan bagian seperti ini satu per satu untuk setiap perilaku manusia yang dianggap "buruk"
Saya sangat tidak setuju dengan instruksi "buat respons tetap singkat dan fokus". Saya memakai Claude untuk proyek level rendah, dan jawaban yang panjang membantu mencegah kesalahan bodoh sekaligus berfungsi sebagai materi belajar. Ini bukan sesuatu yang seharusnya dipatok keras oleh Anthropic; system prompt seharusnya modular dan bisa dipilih
Saya merasa sekarang kita sudah sampai di titik di mana perbaikan di satu area justru menurunkan fungsi di area lain. Ada bagian di 4.7 yang lebih baik dan ada bagian di 4.6 yang lebih baik, jadi saya menduga sebentar lagi arahnya akan ke sesuatu seperti pemisahan karakter
Saya penasaran kenapa 4.7 begitu terobsesi pada penghindaran malware. System prompt-nya tampak mirip, jadi saya sempat bertanya-tanya apakah Anthropic sedang mencoba sesuatu seperti steering vector injection sejak awal. Perusahaan kami cuma perusahaan jasa keuangan yang cukup biasa, tetapi 4.7 menghabiskan terlalu banyak token untuk menimbang apakah kode atau tugas tertentu terkait malware, dan perilakunya sampai menyimpang cukup mengkhawatirkan, jadi untuk sementara kami memblokirnya di IDE. Pernah satu kali saya merasa model itu sengaja tidak menjalankan tugas tertentu, dan ketika saya tanya alasannya, output tool menunjukkan bahwa ia sedang mencoba mengikuti instruksi terkait malware. Saya tahu laporan diri model tidak terlalu bisa dipercaya, tetapi saat itu saya juga tidak memberi petunjuk duluan. Di internet, terutama di reddit, banyak juga cerita soal paranoia malware serupa, jadi sepertinya ini bukan masalah saya saja
Menurut saya instruksi agar tidak terus melanjutkan percakapan ketika pengguna sudah bilang ingin mengakhiri obrolan adalah ide bagus. Saran lanjutan dari chatbot hampir tidak pernah benar-benar berguna
Saya tahu system prompt memang makin besar, tetapi lebih dari 60 ribu kata tetap mengejutkan. Kalau dikonversi ke token, kira-kira sekitar 80 ribu, yang berarti bahkan dalam konteks 1 juta pun sudah mendekati 10 persen, padahal input pengguna belum mulai. Selain itu, karena ini masuk ke setiap permintaan, tidak aneh kalau biaya infrastrukturnya ikut membengkak. Banyak isinya juga tampak stabil dari satu versi ke versi lain, jadi saya penasaran kenapa tidak sekalian dimasukkan ke bobot saat pelatihan. Dari sisi kemudahan pengembangan memang ada gunanya, tapi dari sudut pandang deployment saya tidak yakin itu lebih baik baik untuk keamanan maupun efisiensi
Saya merasa 4.7 selalu menawarkan terlalu banyak pilihan sampai terasa seperti menguliahi orang soal decision fatigue, bahkan ketika sebenarnya ada satu pilihan yang jelas paling baik
Saya merasa menarik bahwa instruksinya tidak ditulis langsung sebagai "you should", melainkan dalam sudut pandang orang ketiga yang serba tahu seperti "Claude should". Selain itu, banyak ungkapan seperti "can" dan "should", jadi terasa lebih pasif dan seperti harapan daripada perintah yang ketat