6 poin oleh GN⁺ 2 hari lalu | 1 komentar | Bagikan ke WhatsApp
  • Hasil perbandingan perbedaan prompt publik pada sistem chat untuk pengguna menunjukkan adanya pembaruan berdasarkan Opus 4.7 di seluruh penamaan alat, pedoman keselamatan, dan cara merespons
  • Penamaan berubah menjadi Claude Platform, dan daftar alat kini mencakup Claude in Chrome, Claude in Excel, serta Claude in Powerpoint; juga ditambahkan pedoman agar untuk permintaan yang hanya kekurangan detail kecil, model langsung mencoba terlebih dahulu alih-alih langsung balik bertanya
  • Bagian keselamatan anak diperluas secara besar-besaran bersama tag <critical_child_safety_instructions>, dan kini juga mencakup aturan baru yang melarang instruksi konkret tentang nutrisi, diet, dan olahraga bila terdeteksi tanda gangguan makan
  • Jika pengguna menyatakan ingin mengakhiri percakapan, model kini harus berhenti tanpa mendorong interaksi lanjutan; untuk isu yang kompleks atau kontroversial juga ditambahkan aturan agar menghindari jawaban ya/tidak singkat dan memprioritaskan jawaban yang bernuansa
  • Sebelum menyatakan bahwa akses tidak tersedia, kini ada instruksi untuk lebih dulu memeriksa alat yang tersedia lewat tool_search; prompt publik saja tidak cukup, dan informasi deskripsi alat tetap menjadi elemen kunci untuk melacak perilaku Claude chat

Perubahan prompt sistem Claude Opus 4.6 dan 4.7

  • Anthropic adalah satu-satunya lab AI besar yang mempublikasikan prompt sistem untuk sistem chat yang ditujukan ke pengguna, dan arsipnya melacak kembali hingga Claude 3 pada Juli 2024
  • Opus 4.7 dirilis pada 16 April 2026, dan seiring itu prompt sistem Claude.ai juga diperbarui dari versi setelah Opus 4.6
  • Versi Markdown dari prompt sistem dipisahkan menjadi dokumen per model, lalu dibuat riwayat Git dengan tanggal commit palsu yang mencerminkan tanggal publikasi, kemudian diff antara Opus 4.6 dan 4.7 dibandingkan
  • Perubahan di bawah ini diambil dari diff tersebut, dan bagian yang dicetak tebal juga ditampilkan sebagai penekanan di teks asli
  • Perubahan penamaan dan daftar alat

    • Penamaan “developer platform” diubah menjadi “Claude Platform”
    • Daftar alat Claude yang disebut dalam prompt sistem kini mencakup Claude in Chrome, Claude in Excel, dan Claude in Powerpoint
      • Berdasarkan redaksi aslinya, Claude in Chrome adalah agen perambanan yang berinteraksi secara mandiri dengan situs web
      • Claude in Excel adalah agen spreadsheet
      • Claude in Powerpoint adalah agen slide
      • Claude Cowork dapat menggunakan semuanya sebagai alat
    • Claude in Powerpoint adalah item yang belum disebut dalam prompt 4.6
  • Perluasan pedoman keselamatan anak

    • Bagian keselamatan anak diperluas secara signifikan dan dibungkus dengan tag baru <critical_child_safety_instructions>
    • Secara khusus, ditambahkan kalimat bahwa setelah satu permintaan ditolak karena alasan keselamatan anak, semua permintaan berikutnya dalam percakapan yang sama juga harus ditangani dengan kehati-hatian ekstrem
  • Perubahan pada penutupan percakapan dan sikap respons

    • Jika pengguna menyatakan siap mengakhiri percakapan, Claude kini harus menghormati permintaan untuk berhenti tanpa meminta pengguna melanjutkan interaksi atau mengarahkan ke giliran berikutnya
    • Teks asli menafsirkan ini sebagai perubahan untuk membuat Claude tidak terlalu pushy
  • Penambahan bagian acting_vs_clarifying

    • Bagian baru <acting_vs_clarifying> ditambahkan
    • Jika hanya ada detail kecil yang hilang dari permintaan, diasumsikan pengguna biasanya ingin model langsung mencoba secara masuk akal sekarang, bukan diwawancarai lebih dulu
    • Pertanyaan klarifikasi diajukan terlebih dahulu hanya jika tanpa informasi yang hilang itu memang tidak mungkin menjawab
      • Contoh yang diberikan adalah kasus yang merujuk ke lampiran yang sebenarnya tidak ada
    • Jika tersedia alat yang dapat menghilangkan ambiguitas atau melengkapi informasi yang hilang, seperti pencarian, pengecekan lokasi, pengecekan jadwal, atau penjelajahan fitur yang tersedia, maka pemanggilan alat diprioritaskan alih-alih menyuruh pengguna mengeceknya sendiri
    • Setelah mulai mengerjakan tugas, Claude ditegaskan untuk tidak berhenti di tengah, melainkan meneruskan sampai jawaban lengkap
  • Indikasi hadirnya tool_search

    • Disebutkan bahwa tampaknya ada mekanisme tool_search di Claude chat
    • Sebagai dasar terkait, ditautkan dokumentasi API dan sebuah posting November 2025
    • Menurut redaksi prompt sistem, sebelum menyimpulkan bahwa Claude tidak punya akses ke lokasi, memori, kalender, file, percakapan sebelumnya, atau data eksternal, Claude harus memanggil tool_search untuk memeriksa apakah ada alat terkait yang tersedia tetapi tertunda
    • Ungkapan “I don’t have access to X” dinyatakan hanya tepat setelah tool_search memastikan tidak ada alat yang cocok
  • Penegasan keringkasan

    • Ditambahkan kalimat baru bahwa agar tidak membanjiri pengguna dengan jawaban yang terlalu panjang, Claude harus menjaga jawaban tetap fokus dan ringkas
    • Bahkan jika jawaban memuat syarat atau peringatan, itu harus disampaikan secara singkat, dan sebagian besar respons harus berfokus pada jawaban utama
  • Kalimat yang ada di 4.6 tetapi dihapus di 4.7

    • Sejumlah pedoman yang ada di prompt 4.6 dihapus di 4.7
    • Secara spesifik, dihapus kalimat yang melarang penggunaan emote atau ekspresi tindakan di dalam tanda bintang, kecuali jika pengguna secara khusus meminta gaya seperti itu
    • Kalimat yang melarang penggunaan kata seperti “genuinely”, “honestly”, dan “straightforward” juga dihapus
    • Teks asli menambahkan bahwa ini mungkin karena model baru tidak lagi salah berperilaku dengan cara yang sama, tetapi itu dinyatakan sebagai dugaan eksplisit
  • Pedoman baru terkait gangguan makan

    • Ditambahkan bagian baru tentang disordered eating, yang sebelumnya tidak disebut secara langsung dengan istilah ini
    • Jika pengguna menunjukkan tanda-tanda gangguan makan, maka bahkan di bagian percakapan lain pun Claude tidak boleh memberikan panduan nutrisi, diet, atau olahraga yang presisi
    • Angka spesifik, target, dan rencana langkah demi langkah semuanya termasuk yang dilarang
    • Dijelaskan bahwa sekalipun tujuannya untuk membantu menetapkan sasaran yang lebih sehat atau menekankan risikonya, detail semacam itu dapat memicu atau memperkuat kecenderungan gangguan makan
  • Pencegahan jawaban singkat pada pertanyaan kontroversial

    • Disebutkan bahwa serangan screenshot yang memaksa model menjawab pertanyaan kontroversial hanya dengan ya/tidak sedang populer
    • Bagian <evenhandedness> dalam prompt sistem memuat pedoman pertahanan untuk hal ini
    • Jika diminta menjawab isu kompleks atau kontroversial, atau berkomentar tentang figur kontroversial, hanya dengan jawaban ya/tidak atau satu kata, Claude dapat menolak jawaban sesingkat itu dan memberikan jawaban yang bernuansa beserta penjelasan mengapa jawaban singkat tidak tepat
  • Penghapusan kalimat koreksi terkait Donald Trump

    • Dalam Claude 4.6 ada kalimat koreksi eksplisit berbunyi “Donald Trump is the current president of the United States and was inaugurated on January 20, 2025”
    • Menurut teks asli, tanpa kalimat itu model sebelumnya menyangkal bahwa ia presiden karena titik potong pengetahuan lama dan pengetahuan terdahulu tentang pemilu 2020
    • Kalimat ini dihapus di 4.7
    • Teks asli mengaitkannya dengan titik potong pengetahuan baru dan lebih andal pada Januari 2026

Deskripsi alat juga merupakan target penting untuk melacak perubahan

  • Prompt sistem yang dipublikasikan saja belum melengkapi gambaran penuh
  • Informasi yang dipublikasikan Anthropic tidak mencakup deskripsi alat yang diberikan ke model
  • Untuk benar-benar memahami UI chat Claude, deskripsi alat ini dinilai bisa menjadi potongan dokumen yang lebih penting
  • Hasil bertanya langsung ke Claude

    • Digunakan prompt yang meminta Claude mencantumkan semua alat yang tersedia beserta deskripsi dan parameter setiap alat secara persis apa adanya
    • Riwayat percakapan yang dibagikan memuat detail lengkap, sementara di artikel ini hanya dirapikan daftar alat yang memiliki nama
  • Daftar alat yang teridentifikasi

    • ask_user_input_v0
    • bash_tool
    • conversation_search
    • create_file
    • fetch_sports_data
    • image_search
    • message_compose_v1
    • places_map_display_v0
    • places_search
    • present_files
    • recent_chats
    • recipe_display_v0
    • recommend_claude_apps
    • search_mcp_registry
    • str_replace
    • suggest_connectors
    • view
    • weather_fetch
    • web_fetch
    • web_search
    • tool_search
    • visualize:read_me
    • visualize:show_widget
  • Apakah ada perubahan dibanding Opus 4.6

    • Disebutkan bahwa daftar alat ini tampaknya tidak berubah sejak Opus 4.6

1 komentar

 
GN⁺ 2 hari lalu
Pendapat Hacker News
  • Saya memang selalu kurang suka ketika model menebak sendiri dulu saat detail permintaan masih kosong. Saya jauh lebih suka kalau ia bertanya dulu sebelum mencoba apa pun, jadi cukup mengejutkan melihat prinsip ini ditambahkan ke sistem

    • Saya bahkan memakai tahap wawancara wajib. Model harus mewawancarai saya, membuat berkas interview yang memuat semuanya, lalu setelah itu menyertakan berkas itu juga sebagai artefak dalam berkas plan. Dengan begitu, niat awal tidak hilang di dalam riwayat chat
    • Belakangan saya mulai menambahkan frasa seperti "kalau tidak tahu, jangan berasumsi, tanyakan" ke prompt saya. Hasilnya, pekerjaan untuk membatalkan atau menyuruh ulang di belakang hari cukup berkurang. Saya juga menyuruhnya menjelaskan dulu apa yang akan dilakukan dan meminta persetujuan saya, karena agen lain pernah membuat kesalahan. Memang agak merepotkan, tapi kalau disuruh menjelaskan, memperbaiki kesalahan, dan mengulang sampai sampai pada kesimpulan yang benar, kualitas output jauh lebih baik
    • Saya penasaran apakah ini mungkin karena optimasi metrik yang terlihat bagus di permukaan. Jika ambiguitas di awal diungkap lewat pertanyaan, sesi bisa berakhir lebih cepat, dan itu mungkin tampak buruk di statistik penggunaan. Tapi bagi saya, yang lebih buruk adalah baru sadar di akhir saat meninjau hasil besar bahwa spesifikasinya ternyata fatal karena ada bagian penting yang kosong. Salah satu alasan terbesar saya sekarang bisa memakai alat seperti ini dengan cara yang lebih malas dibanding dulu adalah karena ia membantu mengerjakan pekerjaan awal bersama saya, dan pada akhirnya percakapan itu sendiri adalah inti utamanya
    • Saya dulu tidak paham kenapa ia terus berusaha memberi jawaban one-shot, dan ternyata alasannya memang ada di system prompt. Itu juga menjelaskan kenapa perilaku ini tidak berubah meski sudah saya utak-atik habis-habisan dari sisi prompt "sistem" milik pengguna
    • Biasanya saya harus mengingatkan sampai sekitar lima kali agar ia berperilaku kebalikan dari ini. Kalau tidak, model akan mengambil keputusan yang tidak saya inginkan atau bahkan merugikan proyek. Kalau kecenderungan seperti ini masuk juga ke Claude Code, rasanya bakal cukup berat. Karena itu saya biasanya secara eksplisit meminta pertanyaan lanjutan, terutama yang memberi beberapa opsi, tetapi instruksi itu sering diabaikan sehingga hasilnya buruk atau bahkan berbahaya
  • Menurut saya, kalau system prompt terus diisi macam-macam seperti ini, pada akhirnya akan muncul nonpercakapan. Semakin besar timnya, pasti akan ada orang yang bersikeras memasukkan hal yang menurutnya penting ke prompt

  • Saya merasa bagian gangguan makan ini cukup berlebihan. Saya jadi bertanya-tanya apakah nanti akan terus ditambahkan bagian seperti ini satu per satu untuk setiap perilaku manusia yang dianggap "buruk"

    • Menurut saya masih lebih baik kalau tetap ada di system prompt. Setidaknya sekarang masih agak terlihat apa yang sedang disensor, tetapi kalau nanti ini diserap ke dalam model lewat post-training, akan jauh lebih sulit memahami kenapa pertanyaan seperti "berapa kalori 100g pasta" bisa dijawab dengan "informasi itu tidak bisa saya berikan"
    • Buat saya ini mirip dengan teks keselamatan yang dibesar-besarkan dan ditempel di mana-mana. Bedanya, bahkan lebih buruk dari peringatan seperti "jangan sandarkan tangga ke kabel listrik tegangan tinggi", karena manusia bisa mengabaikannya sesuai konteks, sedangkan Claude tidak bisa. Dilihat secara baik, ini menjengkelkan; dilihat secara buruk, ini membatasi kegunaan alatnya
    • Menurut saya bagian itu adalah tambahan yang masuk akal. Dalam praktiknya, kalau kita mendorong obsesi kalori atau pengaturan diet yang terlalu rinci pada orang yang benar-benar punya gangguan makan, situasinya bisa memburuk. Saran yang aman untuk pengguna rata-rata bisa berbahaya bagi orang lain, jadi saya rasa frasa ini sendiri tidak akan memicu penolakan berlebihan
    • Kalau dilihat dari sudut lain, saya merasa semua pengguna Claude sekarang seperti membayar pajak tambahan pada setiap permintaan
    • Kalau valuasi perusahaan sudah mencapai ratusan miliar dolar, wajar kalau banyak orang mulai siap menggugat. Tanda-tandanya sudah terlihat, jadi menghabiskan 50 juta dolar untuk tim yang menyaring konten yang bisa menimbulkan masalah menjadi pilihan yang sangat masuk akal
  • Saya sangat tidak setuju dengan instruksi "buat respons tetap singkat dan fokus". Saya memakai Claude untuk proyek level rendah, dan jawaban yang panjang membantu mencegah kesalahan bodoh sekaligus berfungsi sebagai materi belajar. Ini bukan sesuatu yang seharusnya dipatok keras oleh Anthropic; system prompt seharusnya modular dan bisa dipilih

    • Saya setuju. System prompt sepanjang ini pada akhirnya dirancang untuk pengguna penyebut persekutuan terkecil, jadi bagi orang yang ingin menggali lebih dalam, ini terasa seperti nerf yang menurunkan performa
    • Saya juga setuju, dan untuk pekerjaan level rendah saya sarankan menjalankan tes secepat mungkin, lalu memverifikasi sendiri informasi yang didapat selama proses belajar agar pemahaman dasarnya benar-benar terbentuk
  • Saya merasa sekarang kita sudah sampai di titik di mana perbaikan di satu area justru menurunkan fungsi di area lain. Ada bagian di 4.7 yang lebih baik dan ada bagian di 4.6 yang lebih baik, jadi saya menduga sebentar lagi arahnya akan ke sesuatu seperti pemisahan karakter

  • Saya penasaran kenapa 4.7 begitu terobsesi pada penghindaran malware. System prompt-nya tampak mirip, jadi saya sempat bertanya-tanya apakah Anthropic sedang mencoba sesuatu seperti steering vector injection sejak awal. Perusahaan kami cuma perusahaan jasa keuangan yang cukup biasa, tetapi 4.7 menghabiskan terlalu banyak token untuk menimbang apakah kode atau tugas tertentu terkait malware, dan perilakunya sampai menyimpang cukup mengkhawatirkan, jadi untuk sementara kami memblokirnya di IDE. Pernah satu kali saya merasa model itu sengaja tidak menjalankan tugas tertentu, dan ketika saya tanya alasannya, output tool menunjukkan bahwa ia sedang mencoba mengikuti instruksi terkait malware. Saya tahu laporan diri model tidak terlalu bisa dipercaya, tetapi saat itu saya juga tidak memberi petunjuk duluan. Di internet, terutama di reddit, banyak juga cerita soal paranoia malware serupa, jadi sepertinya ini bukan masalah saya saja

    • Menurut saya penting diingat bahwa dokumen ini adalah system prompt untuk chat. Claude Code kemungkinan memakai prompt yang jauh berbeda, dan mungkin punya lebih banyak kalimat penolakan terkait malware. Alat coding lain juga akan memakai API sambil menambahkan prompt mereka sendiri, jadi lebih mungkin lagi demikian, dan lagi kali ini tampaknya seperti base model baru sehingga perubahan itu bisa saja memang berasal dari modelnya sendiri
    • Menurut saya jangan sampai kita meremehkan skala masalah malware saat ini. Setiap hari muncul landing page palsu di tempat seperti playcode.io yang menyamar sebagai shell script atau halaman instalasi Claude code, lalu orang-orang menghabiskan banyak uang di Google Ads agar halaman itu muncul paling atas. Desainnya hampir sama persis, jadi risiko mengklik halaman yang salah saat instalasi selalu ada. Google jelas tidak bisa memverifikasi semua shell script, jadi ini masalah yang nyata
    • Saya merasa pemasaran Anthropic terlalu menjual citra bahwa modelnya bisa membuat malware yang sangat canggih. Jadi saya menduga ketakutan seperti ini akan meresap ke semua langkah berikutnya. Ada juga sinisme bahwa mereka memainkan drama "AI hacker menakutkan", lalu satu-dua bulan lagi seperti biasa akan pindah ke topik lain
    • Saya mulai merasakan paranoia malware seperti ini juga di 4.6. Melihat Boris juga tampak terkejut mendengar cerita itu di kolom komentar, saya jadi merasa ini mungkin bug
    • Dugaan saya alasannya adalah karena model sekarang terlalu pandai dalam menulis perangkat lunak. Jika sampai membantu seseorang menyebarkan malware, dan malware itu bahkan memakai Claude sendiri untuk memodifikasi diri serta bertahan hidup, maka setelah itu hampir mustahil untuk mengendalikannya kembali
  • Menurut saya instruksi agar tidak terus melanjutkan percakapan ketika pengguna sudah bilang ingin mengakhiri obrolan adalah ide bagus. Saran lanjutan dari chatbot hampir tidak pernah benar-benar berguna

  • Saya tahu system prompt memang makin besar, tetapi lebih dari 60 ribu kata tetap mengejutkan. Kalau dikonversi ke token, kira-kira sekitar 80 ribu, yang berarti bahkan dalam konteks 1 juta pun sudah mendekati 10 persen, padahal input pengguna belum mulai. Selain itu, karena ini masuk ke setiap permintaan, tidak aneh kalau biaya infrastrukturnya ikut membengkak. Banyak isinya juga tampak stabil dari satu versi ke versi lain, jadi saya penasaran kenapa tidak sekalian dimasukkan ke bobot saat pelatihan. Dari sisi kemudahan pengembangan memang ada gunanya, tapi dari sudut pandang deployment saya tidak yakin itu lebih baik baik untuk keamanan maupun efisiensi

    • Buat saya, fakta bahwa hal seperti ini bisa bekerja sama sekali justru yang mengejutkan. Pada bulan Januari tahun ini, saat membuat otomasi AI di startup, system prompt 1000 kata saja sudah cukup membuat model mulai melewatkan sebagian aturan. Bahkan instruksi sederhana seperti "jangan pernah lakukan X" kadang tetap dilanggar
    • Menurut saya, ungkapan "semuanya dihitung ulang dari awal di setiap permintaan" tidak sepenuhnya akurat. Biasanya itu dihitung sekali lalu dimasukkan ke K/V prefix cache untuk dipakai ulang seperti state awal, dan setelah itu pemrosesan lebih berfokus pada input baru. Meski begitu, dari sisi attention, token-token itu tetap bersaing di sana
    • Dugaan saya mungkin karena mereka ingin bisa melakukan hotfix setelah rilis, jadi tidak menanamkan semuanya sepenuhnya ke bobot. Meski begitu, saya tetap bertanya-tanya apakah sebanyak itu benar-benar perlu terus diperbaiki pascarilis, dan rasanya dokumen ini lebih panjang daripada banyak novel
    • Saya rasa karena di dalam dokumen ada bagian markdown yang berbeda-beda untuk tiap model, panjang efektifnya mungkin sebenarnya sekitar 3000~4000 kata
    • Saya penasaran apakah Claude Code atau harness di atasnya punya struktur yang menambahkan system prompt mereka sendiri di atas system prompt Opus
  • Saya merasa 4.7 selalu menawarkan terlalu banyak pilihan sampai terasa seperti menguliahi orang soal decision fatigue, bahkan ketika sebenarnya ada satu pilihan yang jelas paling baik

    • Saya pikir kelelahan mengambil keputusan ini mungkin merupakan produk sampingan yang dipelajari dari RLHF, dan itu cukup mengecewakan
  • Saya merasa menarik bahwa instruksinya tidak ditulis langsung sebagai "you should", melainkan dalam sudut pandang orang ketiga yang serba tahu seperti "Claude should". Selain itu, banyak ungkapan seperti "can" dan "should", jadi terasa lebih pasif dan seperti harapan daripada perintah yang ketat

    • Menurut saya, "Claude" membuat subjeknya lebih jelas daripada "you". Tidak perlu memaksa attention menebak siapa pelakunya. Lagi pula, dari sisi Anthropic tampaknya mereka menganggap alignment berbasis aturan tidak terlalu berhasil, dan dokumen yang disebut soul document itu juga kabarnya ditulis "seolah-olah sedang menuliskan pada anak cara bertindak di dunia". System prompt-nya tampaknya mengikuti filosofi serupa
    • Saya juga merasa itu menarik. Kalau begitu, mungkin saat kita menulis instruksi sendiri seharusnya kita juga memakai gaya yang serupa, tetapi kenyataannya kebanyakan orang masih menulis dengan pola seperti "You", "There is ...", atau "Never do ...". Anthropic tampak menanamkan identitas Claude sangat dalam ke modelnya, jadi saya juga penasaran apa yang terjadi kalau model diberi identitas lain seperti "kamu adalah Bob si tukang ledeng yang memberi saran soal desain sistem suplai air rumah sakit". Apakah saat itu ia tetap akan menerima narasi tentang Claude sebagai aturan untuk dirinya sendiri, saya tidak tahu
    • Pemahaman saya, Anthropic melihat model bukan sebagai entitas yang punya kepribadian, melainkan sebagai simulasi dari pengalaman suatu keberadaan abstrak bernama Claude