- Sebuah spesifikasi yang merangkum fungsi teknis yang harus dimiliki website yang baik tanpa bergantung pada platform, mencakup dari
<title> hingga llms.txt
- Ditujukan untuk manusia dan agen, dengan referensi ke standar web modern seperti WHATWG, W3C, IETF RFCs, WCAG, dan MDN
- Baik diterapkan melalui WordPress, Next.js, aplikasi Django, maupun HTML murni, spesifikasinya sendiri tetap sama, dan juga mencakup petunjuk implementasi
- Topik keseluruhan dibagi ke dalam 10 area seperti Foundations, SEO, Accessibility, Security, dan Performance, serta dipetakan ke standar yang diterima luas
- Menyediakan server MCP publik, Agent Skill,
/llms.txt, dan respons Markdown agar agen dan operator dapat memanfaatkannya untuk alur audit, pembelajaran, dan peningkatan
Spesifikasi independen platform untuk website yang baik
- The Website Specification adalah spesifikasi yang merangkum fungsi teknis yang harus dimiliki website yang baik tanpa bergantung pada platform, mencakup dari
<title> hingga /.well-known/security.txt, kesesuaian WCAG, dan llms.txt
- Ditujukan untuk manusia maupun agen, dan tiap topik terhubung ke sumber standar web modern seperti WHATWG, W3C, IETF RFCs, WCAG, MDN
- Baik dideploy dengan WordPress, Drupal, TYPO3, Next.js, Astro, Hugo, aplikasi Django, maupun HTML murni, spesifikasinya sendiri tetap sama, sementara petunjuk implementasi menyusul setelahnya
- Semua halaman memiliki tautan Edit on GitHub, menerima PR, dan tiap halaman menampilkan sumber rujukannya
-
Area yang dibahas
- Seluruh topik dibagi ke dalam 10 area yang dipetakan ke standar yang diterima luas
- Foundations: 14 item yang membahas HTML, head, dan elemen dasar dokumen
- SEO: 13 item yang mencakup elemen visibilitas pencarian seperti
robots.txt, sitemap, canonical, dan structured data
- Accessibility: 20 item yang menyajikan aturan berbasis WCAG agar pengguna dengan berbagai kemampuan dapat menggunakan situs
- Security: 12 item yang membahas header, transmisi, dan kebijakan untuk melindungi pengunjung dengan aman
- Well-Known URIs: 9 item yang merangkum jalur standar yang disepakati di bawah
/.well-known/
- Agent Readiness: 18 item yang membahas elemen agar agen AI dan crawler dapat membaca situs
- Performance: 19 item yang mencakup Core Web Vitals, caching, gambar, font, dan perilaku jaringan
- Privacy: 6 item yang membahas persetujuan, sinyal, dan penghormatan terhadap pilihan pengunjung
- Resilience: 5 item yang membahas kegagalan yang anggun seperti halaman error, offline, dan pengalihan
- Internationalisation: 12 item yang membahas bahasa, locale, arah teks, dan konten terjemahan
Cara penggunaan untuk agen dan operator situs
- Seluruh spesifikasi disediakan melalui server MCP publik yang hanya-baca dan tidak memerlukan autentikasi
- Telah dipublikasikan Agent Skill yang menjelaskan kapan dan bagaimana agen yang kompatibel harus menggunakan spesifikasi ini
- Setiap URL spesifikasi menyediakan Markdown per halaman melalui
/llms.txt dan Accept: text/markdown
- Contoh konfigurasi server MCP adalah sebagai berikut
{
"mcpServers": {
"specification-website": {
"transport": "http",
"url": "https://mcp.specification.website/mcp"
}
}
}
-
Alur penggunaan
- Audit: Telusuri checklist dan periksa tiap item dengan pertanyaan “apakah situs melakukan ini — ya/tidak”
- Learn: Pada tiap item, lihat apa itu, mengapa itu penting, dan bagaimana cara mengimplementasikannya
- Improve: Jika menemukan bagian yang kurang, fakta yang usang, atau topik yang hilang, Anda dapat membuka PR dengan menyertakan sumber
1 komentar
Pendapat Hacker News
Agent Readiness kemungkinan besar akan menjadi sesuatu yang terasa memalukan seiring waktu, seperti "Web 4.0 Blockchain Integration"
Bukan karena agen akan menjadi tidak berarti, tetapi karena bahkan jika itu menjadi penting, bila situs harus memberikan penanganan pengecualian khusus untuk agen, itu justru merusak tujuan aslinya
Pada akhirnya ini kemungkinan akan dipakai oleh pelaku jahat untuk membuat apa yang dilihat agen berbeda dari apa yang dilihat manusia, jadi tampaknya akan sengaja diabaikan
Sekarang semua hal di website adalah komponen. Bahkan satu dropdown sederhana dengan daftar terbatas punya loader sendiri dan mengirim 10 permintaan fetch tanpa alasan. Ini bukan hiperbola, lihat saja web Instagram dan Facebook
Lupakan semua spesifikasi seperti ini, saya cuma ingin HTML asli yang tidak diobfusikasi oleh hal-hal seperti React yang terus bersikeras bahwa framework JS baru akan mengubah segalanya
Web pada dasarnya adalah lingkungan yang bermusuhan, dan saya menganggap banyak pihak yang mengoperasikan website itu sendiri sebagai pelaku jahat. Membuat apa yang dilihat manusia berbeda dari apa yang dilihat agen akan sengaja digunakan website, sama seperti yang dulu mereka lakukan terhadap mesin pencari
Alasan "Agent Readiness" tidak akan bertahan lama adalah karena operator situs akan segera sadar bahwa agen pada dasarnya adalah otomatisasi akses. Itu adalah sesuatu yang selama ini mereka lawan, dan itu mengancam kemampuan mereka untuk memonetisasi
Namun saya ragu itu benar-benar akan terjadi. Masalah pelaku jahat sudah lama memungkinkan hal seperti itu. Misalnya, memberikan konten kepada crawler mesin pencari yang berbeda dari apa yang muncul setelah pengguna mengklik. Kalau saya ingat benar, dulu Google pernah memberi penalti pada situs seperti itu
https://frontendchecklist.io/rules
Manusia menginginkan website yang enak dilihat, dan HTML murni pun bisa mewujudkan itu. Agen bahkan tidak membutuhkan itu; idealnya mereka cukup melihat isi halaman dalam Markdown saja
Kenapa tidak punya versi agen? Itu menghemat waktu dan uang baik bagi agen klien maupun host website
Akan bagus jika ada standar seperti llms.txt untuk menyatakan, "agen sebaiknya mengunjungi mirror ini sebagai versi Markdown mentah dari apa yang dilihat manusia"
Sebagian dari agent readiness situs ini termasuk SEO untuk AI. Sebaliknya, untuk situs yang tidak ingin dicrawl AI, itu juga bisa berfungsi sebagai kebalikannya
Akan bagus jika ada praktik terbaik untuk area seperti form login. Misalnya, memakai nama field input standar yang dikenali password manager, menonaktifkan autocomplete dan auto-capitalization pada field login, memakai HTML5 input type yang benar untuk email, menghindari form yang membuat pengguna hanya bisa memasukkan email lalu harus klik lagi untuk memasukkan kata sandi, mengikuti NIST SP 800-53 dengan menghindari autentikasi dua faktor lewat SMS atau perubahan kata sandi berkala serta aturan komposisi yang sewenang-wenang, dan sebagainya
Terlalu banyak juga situs yang tidak otomatis memberi fokus pada form yang hanya punya satu input
https://adamsilver.io/blog/form-design-from-zero-to-hero-all...
Sejak itu dia juga menulis banyak artikel baru, dan ini mungkin salah satu sumber UX terbaik di web
Sebelum pengguna dikirimkan, kita tidak tahu apakah pengguna itu memakai kata sandi atau memakai metode lain
https://frontendchecklist.io/rules/html/input-types
Saya sangat suka situs ini saat membuat komponen UI dari nol
https://component.gallery/
Situs itu menautkan ke komponen dari berbagai design system, dan banyak di antaranya juga memuat panduan mendalam tentang aksesibilitas, internasionalisasi, dan sebagainya. Contoh dengan dokumentasi yang sangat bagus antara lain Lightning Design System milik Salesforce dan Stacks milik StackOverflow
https://www.lightningdesignsystem.com/2e1ef8501/p/99642e-car...
https://stackoverflow.design/system/forms/checkbox
Akibatnya, kebanyakan website tidak menganggapnya prioritas atau bahkan tidak sadar bahwa itu sesuatu yang perlu dipertimbangkan, dan hasilnya ya kondisi seperti sekarang
Saya selalu menduga ada alasan kenapa situs beralih ke pola ini. Misalnya, mungkin lebih baik untuk pertahanan terhadap bot. Penasaran apakah ada yang tahu lebih banyak
Sekilas hampir semuanya terlihat seperti hasil buatan AI, jadi cara penyampaiannya mungkin tidak akan terlalu efektif. Meski begitu, kalau membaca beberapa butirnya, selain bagian Agent, sisanya menyampaikan hygiene web yang solid dengan cukup jelas, jadi menurutku masih layak dibagikan ke pengembang web yang baru mulai berkembang
Namun, ironisnya situs itu sendiri bahkan tidak menerapkan praktik yang mereka sebut "wajib"
https://validator.w3.org/nu/?doc=https%3A%2F%2Fspecification...
Aku tidak paham tujuan situs web ini. Dipromosikan sebagai spesifikasi, tapi spesifikasi tentang apa sebenarnya juga tidak jelas
Semua butirnya menjadikan "sumber kebenaran" lain sebagai rujukan
"Saya lelah harus menunjuk ke enam sumber untuk mendukung satu rekomendasi. HTML adalah WHATWG, aksesibilitas adalah WCAG, header adalah IETF, structured data adalah schema.org, sisanya adalah MDN, web.dev, dan Google Search Central.
Tidak ada satu spesifikasi yang tunggal, tegas pendapatnya, dan netral terhadap platform tentang apa yang sebenarnya harus dilakukan situs web modern.
Jadi saya menulisnya."
[1] https://www.linkedin.com/posts/jdevalk_the-website-specifica...
Aku penasaran seberapa umum hal-hal di sini. /.well-known/change-password memang bagus kalau ada, tapi melihat https://news.ycombinator.com/.well-known/change-password dan google.com/.well-known/change-password, tampaknya itu belum diimplementasikan
Aku belum pernah dengar itu benar-benar dipakai
URL Google ada di https://accounts.google.com/.well-known/change-password, bukan di domain utamanya
Ini kelihatan seperti keluar dari pabrik sampah. "SEO", "Agent-readiness". Justru itulah hal-hal yang tidak seharusnya dilakukan situs web yang baik
Dan tentu saja, ini dibuat oleh seorang "pakar" Wordpress "SEO" sekaligus investor individu yang memakai Claude LLM. Orang yang membangun kekayaan dengan merusak internet yang kita cintai lewat sampah iklan sekarang mencoba merusak sisa yang ada dengan sampah LLM
Menggolongkan "stable URLs" sebagai "agent readiness" terlihat seperti sinyal bahwa penulis lebih peduli pada AI daripada manusia. Domain ini akan kumasukkan ke daftar blokir. Sudah kelihatan akan membuat pencarian informasi pengembangan web jadi lebih buruk
"Ini bukan framework. Ini bukan panduan. Ini spesifikasi — apa yang wajib, apa yang direkomendasikan, dan apa yang harus dihindari."
Sulit menilai seberapa banyak situs ini merupakan sampah LLM, tapi beberapa kalimat jelas terlihat seperti itu
https://specification.website/llms-full.txt
Pertama, tag warna kecil seperti required, optional, recommended
Kedua, konten dengan panjang gila yang tidak akan dibaca siapa pun
Ketiga, pengembangan ide lemah yang dipaksakan secara menyakitkan sampai detail terkecil
Aku sempat berpikir untuk membuat hal seperti ini sendiri, tapi ketika ini ditempel ke chat agen mana pun, ternyata bekerja sangat baik
Barusan aku memakai model lokal(Qwen3.6 27B / pi) untuk membuat daftar standar penting yang hilang di situs Hugo lama, lalu membuat daftar pekerjaan dan menyuruhnya menanganinya satu per satu, sambil membiarkan tiap perubahan untuk kutinjau
Bahkan favicon yang hilang pun dibuatkan dengan memotong simbol dari logo, dan hasilnya lumayan bagus
pi. Kesan tanpa beban dari prompt agen/sistem yang pendek memang enak, tapi kalau disuruh mengerjakan tugas acak begitu saja, sepertinya akan cukup sering muncul waktu tunggu dan jalan buntuAku membuka situs itu di MacBook dan penggunaan CPU langsung melewati 50%
Cukup ironis mengingat ini adalah spesifikasi tentang seperti apa seharusnya sebuah situs web
Beberapa isinya cukup bagus, tapi aku harap menstandarkan semuanya menjadi checklist 128 butir tidak membuat orang takut membangun situs web
Spesifikasi favoritku adalah spesifikasi yang dihalusinasikan. Harus dibilang bagus, mungkin?
Sudah tidak sabar menunggu alternatif ISO yang digerakkan agen atau mesin slot yang dijalankan LLM