4 poin oleh GN⁺ 3 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • Sebuah spesifikasi yang merangkum fungsi teknis yang harus dimiliki website yang baik tanpa bergantung pada platform, mencakup dari <title> hingga llms.txt
  • Ditujukan untuk manusia dan agen, dengan referensi ke standar web modern seperti WHATWG, W3C, IETF RFCs, WCAG, dan MDN
  • Baik diterapkan melalui WordPress, Next.js, aplikasi Django, maupun HTML murni, spesifikasinya sendiri tetap sama, dan juga mencakup petunjuk implementasi
  • Topik keseluruhan dibagi ke dalam 10 area seperti Foundations, SEO, Accessibility, Security, dan Performance, serta dipetakan ke standar yang diterima luas
  • Menyediakan server MCP publik, Agent Skill, /llms.txt, dan respons Markdown agar agen dan operator dapat memanfaatkannya untuk alur audit, pembelajaran, dan peningkatan

Spesifikasi independen platform untuk website yang baik

  • The Website Specification adalah spesifikasi yang merangkum fungsi teknis yang harus dimiliki website yang baik tanpa bergantung pada platform, mencakup dari <title> hingga /.well-known/security.txt, kesesuaian WCAG, dan llms.txt
  • Ditujukan untuk manusia maupun agen, dan tiap topik terhubung ke sumber standar web modern seperti WHATWG, W3C, IETF RFCs, WCAG, MDN
  • Baik dideploy dengan WordPress, Drupal, TYPO3, Next.js, Astro, Hugo, aplikasi Django, maupun HTML murni, spesifikasinya sendiri tetap sama, sementara petunjuk implementasi menyusul setelahnya
  • Semua halaman memiliki tautan Edit on GitHub, menerima PR, dan tiap halaman menampilkan sumber rujukannya
  • Area yang dibahas

    • Seluruh topik dibagi ke dalam 10 area yang dipetakan ke standar yang diterima luas
    • Foundations: 14 item yang membahas HTML, head, dan elemen dasar dokumen
    • SEO: 13 item yang mencakup elemen visibilitas pencarian seperti robots.txt, sitemap, canonical, dan structured data
    • Accessibility: 20 item yang menyajikan aturan berbasis WCAG agar pengguna dengan berbagai kemampuan dapat menggunakan situs
    • Security: 12 item yang membahas header, transmisi, dan kebijakan untuk melindungi pengunjung dengan aman
    • Well-Known URIs: 9 item yang merangkum jalur standar yang disepakati di bawah /.well-known/
    • Agent Readiness: 18 item yang membahas elemen agar agen AI dan crawler dapat membaca situs
    • Performance: 19 item yang mencakup Core Web Vitals, caching, gambar, font, dan perilaku jaringan
    • Privacy: 6 item yang membahas persetujuan, sinyal, dan penghormatan terhadap pilihan pengunjung
    • Resilience: 5 item yang membahas kegagalan yang anggun seperti halaman error, offline, dan pengalihan
    • Internationalisation: 12 item yang membahas bahasa, locale, arah teks, dan konten terjemahan

Cara penggunaan untuk agen dan operator situs

  • Seluruh spesifikasi disediakan melalui server MCP publik yang hanya-baca dan tidak memerlukan autentikasi
  • Telah dipublikasikan Agent Skill yang menjelaskan kapan dan bagaimana agen yang kompatibel harus menggunakan spesifikasi ini
  • Setiap URL spesifikasi menyediakan Markdown per halaman melalui /llms.txt dan Accept: text/markdown
  • Contoh konfigurasi server MCP adalah sebagai berikut
{  
  "mcpServers": {  
    "specification-website": {  
      "transport": "http",  
      "url": "https://mcp.specification.website/mcp";  
    }  
  }  
}  
  • Alur penggunaan

    • Audit: Telusuri checklist dan periksa tiap item dengan pertanyaan “apakah situs melakukan ini — ya/tidak”
    • Learn: Pada tiap item, lihat apa itu, mengapa itu penting, dan bagaimana cara mengimplementasikannya
    • Improve: Jika menemukan bagian yang kurang, fakta yang usang, atau topik yang hilang, Anda dapat membuka PR dengan menyertakan sumber

1 komentar

 
GN⁺ 3 jam lalu
Pendapat Hacker News
  • Agent Readiness kemungkinan besar akan menjadi sesuatu yang terasa memalukan seiring waktu, seperti "Web 4.0 Blockchain Integration"
    Bukan karena agen akan menjadi tidak berarti, tetapi karena bahkan jika itu menjadi penting, bila situs harus memberikan penanganan pengecualian khusus untuk agen, itu justru merusak tujuan aslinya
    Pada akhirnya ini kemungkinan akan dipakai oleh pelaku jahat untuk membuat apa yang dilihat agen berbeda dari apa yang dilihat manusia, jadi tampaknya akan sengaja diabaikan

    • Saya ingin kembali ke era 2000-an. Waktu itu standar dasarnya hanyalah HTML murni dan sedikit CSS, dan hanya dengan stylesheet bawaan browser pun kita sudah mendapat layout yang nyaris responsif, teks yang mudah dibaca, dan GUI yang ramah pengguna
      Sekarang semua hal di website adalah komponen. Bahkan satu dropdown sederhana dengan daftar terbatas punya loader sendiri dan mengirim 10 permintaan fetch tanpa alasan. Ini bukan hiperbola, lihat saja web Instagram dan Facebook
      Lupakan semua spesifikasi seperti ini, saya cuma ingin HTML asli yang tidak diobfusikasi oleh hal-hal seperti React yang terus bersikeras bahwa framework JS baru akan mengubah segalanya
    • Awalnya saya mau membantah, tetapi setelah dipikir lebih jauh saya setuju dengan kesimpulannya. Hanya saja alasannya sedikit berbeda
      Web pada dasarnya adalah lingkungan yang bermusuhan, dan saya menganggap banyak pihak yang mengoperasikan website itu sendiri sebagai pelaku jahat. Membuat apa yang dilihat manusia berbeda dari apa yang dilihat agen akan sengaja digunakan website, sama seperti yang dulu mereka lakukan terhadap mesin pencari
      Alasan "Agent Readiness" tidak akan bertahan lama adalah karena operator situs akan segera sadar bahwa agen pada dasarnya adalah otomatisasi akses. Itu adalah sesuatu yang selama ini mereka lawan, dan itu mengancam kemampuan mereka untuk memonetisasi
    • Melihat website yang kini begitu bengkak dan penuh iklan, saya berharap ada juga versi teks murni untuk manusia. Biarkan agen yang menangani kerumitan versi untuk manusia
      Namun saya ragu itu benar-benar akan terjadi. Masalah pelaku jahat sudah lama memungkinkan hal seperti itu. Misalnya, memberikan konten kepada crawler mesin pencari yang berbeda dari apa yang muncul setelah pengguna mengklik. Kalau saya ingat benar, dulu Google pernah memberi penalti pada situs seperti itu
    • Ide umum situs ini cukup bagus, tetapi kalau Anda tidak suka omong kosong AI/blockchain, checklist seperti ini cukup umum. Favorit saya selama beberapa tahun adalah yang ini
      https://frontendchecklist.io/rules
    • Agent readiness tampak seperti tahap yang sepenuhnya berguna. Di website saya orang tidak memakai blockchain, tetapi AI dipakai, dan AI tidak perlu menggunakan website seperti manusia
      Manusia menginginkan website yang enak dilihat, dan HTML murni pun bisa mewujudkan itu. Agen bahkan tidak membutuhkan itu; idealnya mereka cukup melihat isi halaman dalam Markdown saja
      Kenapa tidak punya versi agen? Itu menghemat waktu dan uang baik bagi agen klien maupun host website
      Akan bagus jika ada standar seperti llms.txt untuk menyatakan, "agen sebaiknya mengunjungi mirror ini sebagai versi Markdown mentah dari apa yang dilihat manusia"
      Sebagian dari agent readiness situs ini termasuk SEO untuk AI. Sebaliknya, untuk situs yang tidak ingin dicrawl AI, itu juga bisa berfungsi sebagai kebalikannya
  • Akan bagus jika ada praktik terbaik untuk area seperti form login. Misalnya, memakai nama field input standar yang dikenali password manager, menonaktifkan autocomplete dan auto-capitalization pada field login, memakai HTML5 input type yang benar untuk email, menghindari form yang membuat pengguna hanya bisa memasukkan email lalu harus klik lagi untuk memasukkan kata sandi, mengikuti NIST SP 800-53 dengan menghindari autentikasi dua faktor lewat SMS atau perubahan kata sandi berkala serta aturan komposisi yang sewenang-wenang, dan sebagainya
    Terlalu banyak juga situs yang tidak otomatis memberi fokus pada form yang hanya punya satu input

    • Cukup menyenangkan membaca praktik terbaik form di blog Adam Silver
      https://adamsilver.io/blog/form-design-from-zero-to-hero-all...
      Sejak itu dia juga menulis banyak artikel baru, dan ini mungkin salah satu sumber UX terbaik di web
    • Meminta email login dikirim lebih dulu sebelum field kata sandi ditampilkan sebenarnya hampir merupakan kebutuhan, jika sistem autentikasinya bukan sesuatu yang sepele
      Sebelum pengguna dikirimkan, kita tidak tahu apakah pengguna itu memakai kata sandi atau memakai metode lain
    • Saya sudah memakai frontendchecklist selama bertahun-tahun, dan di sana ada kumpulan aturan serta praktik terbaik jenis ini. Sayangnya belakangan situsnya tampaknya bergeser ke arah menerima ai-readiness, tetapi aturannya masih tetap ada
      https://frontendchecklist.io/rules/html/input-types
      Saya sangat suka situs ini saat membuat komponen UI dari nol
      https://component.gallery/
      Situs itu menautkan ke komponen dari berbagai design system, dan banyak di antaranya juga memuat panduan mendalam tentang aksesibilitas, internasionalisasi, dan sebagainya. Contoh dengan dokumentasi yang sangat bagus antara lain Lightning Design System milik Salesforce dan Stacks milik StackOverflow
      https://www.lightningdesignsystem.com/2e1ef8501/p/99642e-car...
      https://stackoverflow.design/system/forms/checkbox
    • Tidak memberi auto-focus pada form yang hanya punya satu input adalah contoh bagaimana web stack mengharapkan setiap website mengimplementasikan sendiri fitur yang dulu merupakan bawaan toolkit UI native
      Akibatnya, kebanyakan website tidak menganggapnya prioritas atau bahkan tidak sadar bahwa itu sesuatu yang perlu dipertimbangkan, dan hasilnya ya kondisi seperti sekarang
    • Form login yang meminta email saja duluan tampaknya semakin sering muncul, terutama di situs perusahaan teknologi besar. Saya pribadi juga kesal dengan itu
      Saya selalu menduga ada alasan kenapa situs beralih ke pola ini. Misalnya, mungkin lebih baik untuk pertahanan terhadap bot. Penasaran apakah ada yang tahu lebih banyak
  • Sekilas hampir semuanya terlihat seperti hasil buatan AI, jadi cara penyampaiannya mungkin tidak akan terlalu efektif. Meski begitu, kalau membaca beberapa butirnya, selain bagian Agent, sisanya menyampaikan hygiene web yang solid dengan cukup jelas, jadi menurutku masih layak dibagikan ke pengembang web yang baru mulai berkembang
    Namun, ironisnya situs itu sendiri bahkan tidak menerapkan praktik yang mereka sebut "wajib"

    • "Compression (gzip, brotli, zstd): required" dan "cache-control: required"? Dari awal sampai akhir ini sampah AI
  • https://validator.w3.org/nu/?doc=https%3A%2F%2Fspecification...
    Aku tidak paham tujuan situs web ini. Dipromosikan sebagai spesifikasi, tapi spesifikasi tentang apa sebenarnya juga tidak jelas
    Semua butirnya menjadikan "sumber kebenaran" lain sebagai rujukan

    • Ini kumpulan best practice, dan sebagai checklist yang bisa dilihat di satu tempat, ada nilainya
    • Aku melihat ini diposting di LinkedIn[1], dan penulisnya menulis begini
      "Saya lelah harus menunjuk ke enam sumber untuk mendukung satu rekomendasi. HTML adalah WHATWG, aksesibilitas adalah WCAG, header adalah IETF, structured data adalah schema.org, sisanya adalah MDN, web.dev, dan Google Search Central.
      Tidak ada satu spesifikasi yang tunggal, tegas pendapatnya, dan netral terhadap platform tentang apa yang sebenarnya harus dilakukan situs web modern.
      Jadi saya menulisnya."
      [1] https://www.linkedin.com/posts/jdevalk_the-website-specifica...
  • Aku penasaran seberapa umum hal-hal di sini. /.well-known/change-password memang bagus kalau ada, tapi melihat https://news.ycombinator.com/.well-known/change-password dan google.com/.well-known/change-password, tampaknya itu belum diimplementasikan

  • Ini kelihatan seperti keluar dari pabrik sampah. "SEO", "Agent-readiness". Justru itulah hal-hal yang tidak seharusnya dilakukan situs web yang baik
    Dan tentu saja, ini dibuat oleh seorang "pakar" Wordpress "SEO" sekaligus investor individu yang memakai Claude LLM. Orang yang membangun kekayaan dengan merusak internet yang kita cintai lewat sampah iklan sekarang mencoba merusak sisa yang ada dengan sampah LLM

    • Tanda hubung panjang dan pola kalimat seperti "bukan X melainkan Y", serta konten yang berulang, bagiku hampir menandakan ini dibuat oleh AI
      Menggolongkan "stable URLs" sebagai "agent readiness" terlihat seperti sinyal bahwa penulis lebih peduli pada AI daripada manusia. Domain ini akan kumasukkan ke daftar blokir. Sudah kelihatan akan membuat pencarian informasi pengembangan web jadi lebih buruk
    • Di halaman about(https://specification.website/about/) tertulis begini
      "Ini bukan framework. Ini bukan panduan. Ini spesifikasi — apa yang wajib, apa yang direkomendasikan, dan apa yang harus dihindari."
      Sulit menilai seberapa banyak situs ini merupakan sampah LLM, tapi beberapa kalimat jelas terlihat seperti itu
    • Ini tampak seperti sampah AI murni. Aku memakai https://tropes.fyi/vetter
    • Spesifikasi satu halaman penuh adalah semacam poster utama pengembangan web sampah AI belakangan ini
      https://specification.website/llms-full.txt
    • Bagiku juga alarm sampahnya menyala
      Pertama, tag warna kecil seperti required, optional, recommended
      Kedua, konten dengan panjang gila yang tidak akan dibaca siapa pun
      Ketiga, pengembangan ide lemah yang dipaksakan secara menyakitkan sampai detail terkecil
  • Aku sempat berpikir untuk membuat hal seperti ini sendiri, tapi ketika ini ditempel ke chat agen mana pun, ternyata bekerja sangat baik
    Barusan aku memakai model lokal(Qwen3.6 27B / pi) untuk membuat daftar standar penting yang hilang di situs Hugo lama, lalu membuat daftar pekerjaan dan menyuruhnya menanganinya satu per satu, sambil membiarkan tiap perubahan untuk kutinjau
    Bahkan favicon yang hilang pun dibuatkan dengan memotong simbol dari logo, dan hasilnya lumayan bagus

    • Penasaran seberapa jauh kamu sudah mencoba pi. Kesan tanpa beban dari prompt agen/sistem yang pendek memang enak, tapi kalau disuruh mengerjakan tugas acak begitu saja, sepertinya akan cukup sering muncul waktu tunggu dan jalan buntu
  • Aku membuka situs itu di MacBook dan penggunaan CPU langsung melewati 50%
    Cukup ironis mengingat ini adalah spesifikasi tentang seperti apa seharusnya sebuah situs web

    • Di sini aku tidak melihat gejala yang sama. Sebaiknya cek apa yang terjadi di sisi pengguna
  • Beberapa isinya cukup bagus, tapi aku harap menstandarkan semuanya menjadi checklist 128 butir tidak membuat orang takut membangun situs web

  • Spesifikasi favoritku adalah spesifikasi yang dihalusinasikan. Harus dibilang bagus, mungkin?
    Sudah tidak sabar menunggu alternatif ISO yang digerakkan agen atau mesin slot yang dijalankan LLM