Perubahan system prompt antara Claude Opus 4.6 dan 4.7

(simonwillison.net)

6 poin oleh GN⁺ 2026-04-20 | 1 komentar | Bagikan ke WhatsApp

Anthropic adalah satu-satunya lab AI besar yang selama ini mempublikasikan system prompt untuk sistem chat-nya, dan pada Opus 4.7 yang dirilis 16 April 2026 terdapat pembaruan prompt yang patut diperhatikan
Namanya berubah menjadi Claude Platform, dan Claude in Chrome, Claude in Excel, serta Claude in Powerpoint dimasukkan ke dalam daftar tool; juga ditambahkan instruksi agar permintaan yang hanya kekurangan informasi kecil langsung dicoba alih-alih terlebih dulu banyak bertanya
Bagian keamanan anak diperluas secara besar-besaran dan dibungkus dengan tag baru <critical_child_safety_instructions>, serta diatur agar setelah satu kali penolakan, semua permintaan berikutnya dalam percakapan itu ditangani dengan kehati-hatian ekstrem
Bagian baru <acting_vs_clarifying> ditambahkan untuk mengarahkan agar melakukan upaya yang masuk akal lebih dulu daripada bertanya ketika pengguna tidak menentukan detail
Jika pengguna menyatakan ingin mengakhiri percakapan, model kini berhenti tanpa mendorong interaksi lanjutan, dan untuk isu yang kompleks atau kontroversial ditambahkan aturan untuk menghindari jawaban ya/tidak yang terlalu singkat serta memprioritaskan jawaban yang bernuansa
Ditambahkan frasa bahwa sebelum menyatakan tidak punya akses, model harus lebih dulu memeriksa tool yang tersedia lewat tool_search; system prompt publik saja tidak cukup, dan informasi deskripsi tool tetap menjadi elemen kunci untuk melacak perilaku Claude chat

Perubahan system prompt Claude Opus 4.6 dan 4.7

Anthropic adalah satu-satunya lab AI besar yang mempublikasikan system prompt untuk sistem chat yang dihadapkan ke pengguna, dan arsipnya menelusur balik hingga Claude 3 pada Juli 2024
Opus 4.7 diumumkan pada 16 April 2026, dan sejalan dengan itu system prompt Claude.ai juga diperbarui dari versi setelah Opus 4.6
Penulis memisahkan versi Markdown dari system prompt ke dokumen per model, menyusun riwayat Git dengan tanggal commit palsu yang mencerminkan tanggal publikasi, lalu membandingkan diff antara Opus 4.6 dan 4.7
Perubahan di bawah ini diambil dari diff tersebut, dan bagian yang dicetak tebal juga ditampilkan sebagai penekanan di teks asli
Perubahan nama dan daftar tool
- Sebutan “developer platform” diubah menjadi “Claude Platform”
- Daftar tool Claude yang disebut di system prompt kini mencakup Claude in Chrome, Claude in Excel, dan Claude in Powerpoint
  - Berdasarkan ungkapan aslinya, Claude in Chrome adalah agen penjelajahan yang berinteraksi secara otonom dengan situs web
  - Claude in Excel adalah agen spreadsheet
  - Claude in Powerpoint adalah agen slide
  - Claude Cowork dapat menggunakan semuanya sebagai tool
- Claude in Powerpoint adalah item yang tidak disebut dalam prompt 4.6
Perluasan panduan keamanan anak
- Bagian keamanan anak diperluas secara signifikan dan dibungkus dengan tag baru <critical_child_safety_instructions>
- Secara khusus, ditambahkan frasa bahwa setelah satu permintaan ditolak karena alasan keamanan anak, semua permintaan berikutnya dalam percakapan yang sama juga harus ditangani dengan kehati-hatian ekstrem
Perubahan pada penutupan percakapan dan sikap respons
- Jika pengguna menandakan siap mengakhiri percakapan, Claude kini diminta untuk menghormati permintaan berhenti tanpa meminta pengguna melanjutkan interaksi atau mendorong giliran berikutnya
- Dalam teks asli, ini ditafsirkan sebagai perubahan agar Claude menjadi tidak terlalu pushy
Penambahan bagian acting_vs_clarifying
- Bagian baru <acting_vs_clarifying> ditambahkan
- Ketika ada detail kecil yang hilang dari permintaan, diasumsikan bahwa pengguna biasanya ingin model langsung mencoba secara masuk akal sekarang juga daripada terlebih dulu diwawancarai
- Model hanya bertanya lebih dulu jika tanpa informasi yang hilang itu memang tidak mungkin memberi jawaban
  - Contoh yang diberikan adalah ketika merujuk pada lampiran yang sebenarnya tidak ada
- Jika ada tool yang bisa mengurangi ambiguitas atau melengkapi informasi yang hilang, seperti pencarian, pengecekan lokasi, pengecekan jadwal, atau eksplorasi kemampuan yang tersedia, maka pemanggilan tool diprioritaskan daripada meminta pengguna yang mengecek sendiri
- Setelah mulai mengerjakan tugas, model secara eksplisit diarahkan untuk tidak berhenti di tengah jalan dan melanjutkan sampai memberi jawaban yang lengkap
Pengenalan tool_search
- Disebutkan bahwa tampaknya ada mekanisme tool_search yang masuk ke Claude chat
- Sebagai dasar terkait, ditautkan dokumentasi API dan postingan November 2025
- Menurut frasa di system prompt, sebelum menyimpulkan bahwa Claude tidak dapat mengakses lokasi, memori, kalender, file, percakapan lama, atau data eksternal, model harus memanggil tool_search untuk memastikan apakah tool terkait tersedia tetapi tertunda
- Ungkapan “I don’t have access to X” ditetapkan sebagai formulasi yang benar hanya setelah tool_search mengonfirmasi tidak ada tool yang cocok
Penguatan keringkasan
- Ditambahkan frasa baru bahwa agar tidak membanjiri pengguna dengan jawaban yang terlalu panjang, Claude harus menjaga jawabannya tetap fokus dan ringkas
- Juga ditegaskan bahwa meskipun jawaban menyertakan syarat atau peringatan, hal itu harus disampaikan singkat dan sebagian besar respons tetap berfokus pada jawaban utama
Frasa yang ada di 4.6 tetapi dihapus di 4.7
- Beberapa instruksi yang ada di prompt 4.6 dihapus pada 4.7
- Secara spesifik, dihapus frasa yang melarang penggunaan emote atau ekspresi tindakan di dalam tanda bintang kecuali pengguna secara khusus meminta gaya seperti itu
- Juga dihapus frasa yang melarang penggunaan kata seperti “genuinely”, “honestly”, dan “straightforward”
- Teks asli menambahkan bahwa mungkin ini karena model baru tidak lagi gagal dengan cara yang sama, tetapi itu dinyatakan secara eksplisit sebagai dugaan
Panduan baru terkait gangguan makan
- Bagian baru tentang disordered eating ditambahkan, dan sebelumnya istilah ini tidak disebut secara langsung
- Jika pengguna menunjukkan tanda-tanda gangguan makan, model tidak boleh memberikan panduan nutrisi, diet, atau olahraga yang presisi bahkan di bagian lain dari percakapan
- Angka spesifik, target, dan rencana langkah demi langkah semuanya termasuk yang dilarang
- Disebutkan bahwa sekalipun tujuannya untuk membantu menetapkan sasaran yang lebih sehat atau menekankan risikonya, detail semacam itu dapat memicu atau mendorong kecenderungan gangguan makan
Mencegah jawaban singkat pada pertanyaan kontroversial
- Disebutkan bahwa serangan tangkapan layar yang memaksa model menjawab pertanyaan kontroversial dengan ya/tidak saja sedang populer
- Bagian <evenhandedness> di system prompt memuat panduan pertahanan terhadap hal ini
- Jika diminta memberi jawaban ya/tidak sederhana atau jawaban satu kata untuk isu yang kompleks atau kontroversial, atau komentar tentang tokoh kontroversial, Claude dapat menolak jawaban sesingkat itu dan memberikan jawaban yang bernuansa beserta penjelasan mengapa jawaban singkat tidak tepat
Penghapusan frasa penyesuaian terkait Donald Trump
- Di Claude 4.6 ada frasa penyesuaian eksplisit: “Donald Trump is the current president of the United States and was inaugurated on January 20, 2025”
- Menurut teks asli, tanpa frasa itu model sebelumnya menyangkal bahwa ia adalah presiden karena cutoff pengetahuan lama dan pengetahuan yang sudah ada tentang pemilu 2020
- Di 4.7 frasa tersebut dihapus, karena tanggal cutoff pengetahuan yang andal kini diperbarui ke Januari 2026

Deskripsi tool juga menjadi target penting dalam pelacakan perubahan

System prompt publik saja tidak cukup untuk melengkapi gambaran keseluruhan
Informasi yang dipublikasikan Anthropic tidak mencakup deskripsi tool yang diberikan ke model
Untuk benar-benar memahami UI chat Claude, deskripsi tool ini bisa jadi merupakan potongan dokumen yang lebih penting
Hasil bertanya langsung ke Claude
- Penulis menggunakan prompt yang meminta Claude mencantumkan semua tool yang tersedia beserta deskripsi persis dan parameternya apa adanya
- Di log percakapan yang dibagikan terdapat detail lengkapnya, sementara di badan artikel hanya dirangkum daftar tool yang memiliki nama
Daftar tool yang teridentifikasi
- ask_user_input_v0
- bash_tool
- conversation_search
- create_file
- fetch_sports_data
- image_search
- message_compose_v1
- places_map_display_v0
- places_search
- present_files
- recent_chats
- recipe_display_v0
- recommend_claude_apps
- search_mcp_registry
- str_replace
- suggest_connectors
- view
- weather_fetch
- web_fetch
- web_search
- tool_search
- visualize:read_me
- visualize:show_widget
Apakah ada perubahan dibanding Opus 4.6
- Daftar tool ini tampaknya tidak berubah sejak Opus 4.6

1 komentar

GN⁺ 2026-04-20

Pendapat Hacker News

Saya memang selalu kurang suka ketika model menebak sendiri dulu saat detail permintaan masih kosong. Saya jauh lebih suka kalau ia bertanya dulu sebelum mencoba apa pun, jadi cukup mengejutkan melihat prinsip ini ditambahkan ke sistem
- Saya bahkan memakai tahap wawancara wajib. Model harus mewawancarai saya, membuat berkas interview yang memuat semuanya, lalu setelah itu menyertakan berkas itu juga sebagai artefak dalam berkas plan. Dengan begitu, niat awal tidak hilang di dalam riwayat chat
- Belakangan saya mulai menambahkan frasa seperti "kalau tidak tahu, jangan berasumsi, tanyakan" ke prompt saya. Hasilnya, pekerjaan untuk membatalkan atau menyuruh ulang di belakang hari cukup berkurang. Saya juga menyuruhnya menjelaskan dulu apa yang akan dilakukan dan meminta persetujuan saya, karena agen lain pernah membuat kesalahan. Memang agak merepotkan, tapi kalau disuruh menjelaskan, memperbaiki kesalahan, dan mengulang sampai sampai pada kesimpulan yang benar, kualitas output jauh lebih baik
- Saya penasaran apakah ini mungkin karena optimasi metrik yang terlihat bagus di permukaan. Jika ambiguitas di awal diungkap lewat pertanyaan, sesi bisa berakhir lebih cepat, dan itu mungkin tampak buruk di statistik penggunaan. Tapi bagi saya, yang lebih buruk adalah baru sadar di akhir saat meninjau hasil besar bahwa spesifikasinya ternyata fatal karena ada bagian penting yang kosong. Salah satu alasan terbesar saya sekarang bisa memakai alat seperti ini dengan cara yang lebih malas dibanding dulu adalah karena ia membantu mengerjakan pekerjaan awal bersama saya, dan pada akhirnya percakapan itu sendiri adalah inti utamanya
- Saya dulu tidak paham kenapa ia terus berusaha memberi jawaban one-shot, dan ternyata alasannya memang ada di system prompt. Itu juga menjelaskan kenapa perilaku ini tidak berubah meski sudah saya utak-atik habis-habisan dari sisi prompt "sistem" milik pengguna
- Biasanya saya harus mengingatkan sampai sekitar lima kali agar ia berperilaku kebalikan dari ini. Kalau tidak, model akan mengambil keputusan yang tidak saya inginkan atau bahkan merugikan proyek. Kalau kecenderungan seperti ini masuk juga ke Claude Code, rasanya bakal cukup berat. Karena itu saya biasanya secara eksplisit meminta pertanyaan lanjutan, terutama yang memberi beberapa opsi, tetapi instruksi itu sering diabaikan sehingga hasilnya buruk atau bahkan berbahaya
Menurut saya, kalau system prompt terus diisi macam-macam seperti ini, pada akhirnya akan muncul nonpercakapan. Semakin besar timnya, pasti akan ada orang yang bersikeras memasukkan hal yang menurutnya penting ke prompt
Saya merasa bagian gangguan makan ini cukup berlebihan. Saya jadi bertanya-tanya apakah nanti akan terus ditambahkan bagian seperti ini satu per satu untuk setiap perilaku manusia yang dianggap "buruk"
- Menurut saya masih lebih baik kalau tetap ada di system prompt. Setidaknya sekarang masih agak terlihat apa yang sedang disensor, tetapi kalau nanti ini diserap ke dalam model lewat post-training, akan jauh lebih sulit memahami kenapa pertanyaan seperti "berapa kalori 100g pasta" bisa dijawab dengan "informasi itu tidak bisa saya berikan"
- Buat saya ini mirip dengan teks keselamatan yang dibesar-besarkan dan ditempel di mana-mana. Bedanya, bahkan lebih buruk dari peringatan seperti "jangan sandarkan tangga ke kabel listrik tegangan tinggi", karena manusia bisa mengabaikannya sesuai konteks, sedangkan Claude tidak bisa. Dilihat secara baik, ini menjengkelkan; dilihat secara buruk, ini membatasi kegunaan alatnya
- Menurut saya bagian itu adalah tambahan yang masuk akal. Dalam praktiknya, kalau kita mendorong obsesi kalori atau pengaturan diet yang terlalu rinci pada orang yang benar-benar punya gangguan makan, situasinya bisa memburuk. Saran yang aman untuk pengguna rata-rata bisa berbahaya bagi orang lain, jadi saya rasa frasa ini sendiri tidak akan memicu penolakan berlebihan
- Kalau dilihat dari sudut lain, saya merasa semua pengguna Claude sekarang seperti membayar pajak tambahan pada setiap permintaan
- Kalau valuasi perusahaan sudah mencapai ratusan miliar dolar, wajar kalau banyak orang mulai siap menggugat. Tanda-tandanya sudah terlihat, jadi menghabiskan 50 juta dolar untuk tim yang menyaring konten yang bisa menimbulkan masalah menjadi pilihan yang sangat masuk akal
Saya sangat tidak setuju dengan instruksi "buat respons tetap singkat dan fokus". Saya memakai Claude untuk proyek level rendah, dan jawaban yang panjang membantu mencegah kesalahan bodoh sekaligus berfungsi sebagai materi belajar. Ini bukan sesuatu yang seharusnya dipatok keras oleh Anthropic; system prompt seharusnya modular dan bisa dipilih
- Saya setuju. System prompt sepanjang ini pada akhirnya dirancang untuk pengguna penyebut persekutuan terkecil, jadi bagi orang yang ingin menggali lebih dalam, ini terasa seperti nerf yang menurunkan performa
- Saya juga setuju, dan untuk pekerjaan level rendah saya sarankan menjalankan tes secepat mungkin, lalu memverifikasi sendiri informasi yang didapat selama proses belajar agar pemahaman dasarnya benar-benar terbentuk
Saya merasa sekarang kita sudah sampai di titik di mana perbaikan di satu area justru menurunkan fungsi di area lain. Ada bagian di 4.7 yang lebih baik dan ada bagian di 4.6 yang lebih baik, jadi saya menduga sebentar lagi arahnya akan ke sesuatu seperti pemisahan karakter
Saya penasaran kenapa 4.7 begitu terobsesi pada penghindaran malware. System prompt-nya tampak mirip, jadi saya sempat bertanya-tanya apakah Anthropic sedang mencoba sesuatu seperti steering vector injection sejak awal. Perusahaan kami cuma perusahaan jasa keuangan yang cukup biasa, tetapi 4.7 menghabiskan terlalu banyak token untuk menimbang apakah kode atau tugas tertentu terkait malware, dan perilakunya sampai menyimpang cukup mengkhawatirkan, jadi untuk sementara kami memblokirnya di IDE. Pernah satu kali saya merasa model itu sengaja tidak menjalankan tugas tertentu, dan ketika saya tanya alasannya, output tool menunjukkan bahwa ia sedang mencoba mengikuti instruksi terkait malware. Saya tahu laporan diri model tidak terlalu bisa dipercaya, tetapi saat itu saya juga tidak memberi petunjuk duluan. Di internet, terutama di reddit, banyak juga cerita soal paranoia malware serupa, jadi sepertinya ini bukan masalah saya saja
- Menurut saya penting diingat bahwa dokumen ini adalah system prompt untuk chat. Claude Code kemungkinan memakai prompt yang jauh berbeda, dan mungkin punya lebih banyak kalimat penolakan terkait malware. Alat coding lain juga akan memakai API sambil menambahkan prompt mereka sendiri, jadi lebih mungkin lagi demikian, dan lagi kali ini tampaknya seperti base model baru sehingga perubahan itu bisa saja memang berasal dari modelnya sendiri
- Menurut saya jangan sampai kita meremehkan skala masalah malware saat ini. Setiap hari muncul landing page palsu di tempat seperti playcode.io yang menyamar sebagai shell script atau halaman instalasi Claude code, lalu orang-orang menghabiskan banyak uang di Google Ads agar halaman itu muncul paling atas. Desainnya hampir sama persis, jadi risiko mengklik halaman yang salah saat instalasi selalu ada. Google jelas tidak bisa memverifikasi semua shell script, jadi ini masalah yang nyata
- Saya merasa pemasaran Anthropic terlalu menjual citra bahwa modelnya bisa membuat malware yang sangat canggih. Jadi saya menduga ketakutan seperti ini akan meresap ke semua langkah berikutnya. Ada juga sinisme bahwa mereka memainkan drama "AI hacker menakutkan", lalu satu-dua bulan lagi seperti biasa akan pindah ke topik lain
- Saya mulai merasakan paranoia malware seperti ini juga di 4.6. Melihat Boris juga tampak terkejut mendengar cerita itu di kolom komentar, saya jadi merasa ini mungkin bug
- Dugaan saya alasannya adalah karena model sekarang terlalu pandai dalam menulis perangkat lunak. Jika sampai membantu seseorang menyebarkan malware, dan malware itu bahkan memakai Claude sendiri untuk memodifikasi diri serta bertahan hidup, maka setelah itu hampir mustahil untuk mengendalikannya kembali
Menurut saya instruksi agar tidak terus melanjutkan percakapan ketika pengguna sudah bilang ingin mengakhiri obrolan adalah ide bagus. Saran lanjutan dari chatbot hampir tidak pernah benar-benar berguna
Saya tahu system prompt memang makin besar, tetapi lebih dari 60 ribu kata tetap mengejutkan. Kalau dikonversi ke token, kira-kira sekitar 80 ribu, yang berarti bahkan dalam konteks 1 juta pun sudah mendekati 10 persen, padahal input pengguna belum mulai. Selain itu, karena ini masuk ke setiap permintaan, tidak aneh kalau biaya infrastrukturnya ikut membengkak. Banyak isinya juga tampak stabil dari satu versi ke versi lain, jadi saya penasaran kenapa tidak sekalian dimasukkan ke bobot saat pelatihan. Dari sisi kemudahan pengembangan memang ada gunanya, tapi dari sudut pandang deployment saya tidak yakin itu lebih baik baik untuk keamanan maupun efisiensi
- Buat saya, fakta bahwa hal seperti ini bisa bekerja sama sekali justru yang mengejutkan. Pada bulan Januari tahun ini, saat membuat otomasi AI di startup, system prompt 1000 kata saja sudah cukup membuat model mulai melewatkan sebagian aturan. Bahkan instruksi sederhana seperti "jangan pernah lakukan X" kadang tetap dilanggar
- Menurut saya, ungkapan "semuanya dihitung ulang dari awal di setiap permintaan" tidak sepenuhnya akurat. Biasanya itu dihitung sekali lalu dimasukkan ke K/V prefix cache untuk dipakai ulang seperti state awal, dan setelah itu pemrosesan lebih berfokus pada input baru. Meski begitu, dari sisi attention, token-token itu tetap bersaing di sana
- Dugaan saya mungkin karena mereka ingin bisa melakukan hotfix setelah rilis, jadi tidak menanamkan semuanya sepenuhnya ke bobot. Meski begitu, saya tetap bertanya-tanya apakah sebanyak itu benar-benar perlu terus diperbaiki pascarilis, dan rasanya dokumen ini lebih panjang daripada banyak novel
- Saya rasa karena di dalam dokumen ada bagian markdown yang berbeda-beda untuk tiap model, panjang efektifnya mungkin sebenarnya sekitar 3000~4000 kata
- Saya penasaran apakah Claude Code atau harness di atasnya punya struktur yang menambahkan system prompt mereka sendiri di atas system prompt Opus
Saya merasa 4.7 selalu menawarkan terlalu banyak pilihan sampai terasa seperti menguliahi orang soal decision fatigue, bahkan ketika sebenarnya ada satu pilihan yang jelas paling baik
- Saya pikir kelelahan mengambil keputusan ini mungkin merupakan produk sampingan yang dipelajari dari RLHF, dan itu cukup mengecewakan
Saya merasa menarik bahwa instruksinya tidak ditulis langsung sebagai "you should", melainkan dalam sudut pandang orang ketiga yang serba tahu seperti "Claude should". Selain itu, banyak ungkapan seperti "can" dan "should", jadi terasa lebih pasif dan seperti harapan daripada perintah yang ketat
- Menurut saya, "Claude" membuat subjeknya lebih jelas daripada "you". Tidak perlu memaksa attention menebak siapa pelakunya. Lagi pula, dari sisi Anthropic tampaknya mereka menganggap alignment berbasis aturan tidak terlalu berhasil, dan dokumen yang disebut soul document itu juga kabarnya ditulis "seolah-olah sedang menuliskan pada anak cara bertindak di dunia". System prompt-nya tampaknya mengikuti filosofi serupa
- Saya juga merasa itu menarik. Kalau begitu, mungkin saat kita menulis instruksi sendiri seharusnya kita juga memakai gaya yang serupa, tetapi kenyataannya kebanyakan orang masih menulis dengan pola seperti "You", "There is ...", atau "Never do ...". Anthropic tampak menanamkan identitas Claude sangat dalam ke modelnya, jadi saya juga penasaran apa yang terjadi kalau model diberi identitas lain seperti "kamu adalah Bob si tukang ledeng yang memberi saran soal desain sistem suplai air rumah sakit". Apakah saat itu ia tetap akan menerima narasi tentang Claude sebagai aturan untuk dirinya sendiri, saya tidak tahu
- Pemahaman saya, Anthropic melihat model bukan sebagai entitas yang punya kepribadian, melainkan sebagai simulasi dari pengalaman suatu keberadaan abstrak bernama Claude

Perubahan system prompt antara Claude Opus 4.6 dan 4.7

Perubahan system prompt Claude Opus 4.6 dan 4.7

Perubahan nama dan daftar tool

Perluasan panduan keamanan anak

Perubahan pada penutupan percakapan dan sikap respons

Penambahan bagian acting_vs_clarifying

Pengenalan tool_search

Penguatan keringkasan

Frasa yang ada di 4.6 tetapi dihapus di 4.7

Panduan baru terkait gangguan makan

Mencegah jawaban singkat pada pertanyaan kontroversial

Penghapusan frasa penyesuaian terkait Donald Trump

Deskripsi tool juga menjadi target penting dalam pelacakan perubahan

Hasil bertanya langsung ke Claude

Daftar tool yang teridentifikasi

Apakah ada perubahan dibanding Opus 4.6

Bacaan terkait

1 komentar

Pendapat Hacker News