56 poin oleh xguru 2026-03-16 | 8 komentar | Bagikan ke WhatsApp
  • Parser konten yang menghapus komentar, sidebar, header, dan footer yang tidak perlu dari halaman web lalu mengekstrak hanya isi utama yang telah dibersihkan ke HTML/Markdown
  • Untuk video YouTube, percakapan dapat diekstrak dengan dipisahkan berdasarkan pembicara (mulai 0.12.0)
  • Dikembangkan untuk Obsidian Web Clipper, tetapi dapat digunakan di berbagai lingkungan seperti browser dan Node.js
  • Dirancang sebagai pengganti Mozilla Readability untuk memberikan pemrosesan yang lebih fleksibel dan keluaran yang konsisten
    • Meminimalkan penghapusan elemen yang tidak pasti
    • Mendukung keluaran terstandarisasi seperti catatan kaki, rumus, dan blok kode
    • Mendeteksi elemen yang tidak perlu melalui analisis gaya seluler
    • Secara otomatis mengekstrak lebih banyak metadata, termasuk metadata schema.org
  • Mendukung antarmuka CLI, sehingga parsing HTML dan URL dapat dilakukan langsung dari terminal
  • Lisensi MIT

8 komentar

 
xguru 2026-03-16

Defuddle - HTML-to-Markdown open source pengganti Readability
Sekitar 10 bulan lalu ini juga pernah diposting sekali, dan kali ini ditambahkan fitur untuk mengekstrak percakapan dari video YouTube dengan pemisahan pembicara.
Selain itu, selama ini juga telah ditambahkan banyak fitur seperti ekstraksi asinkron untuk URL X, ekstraksi artikel, dukungan aplikasi Substack, penambahan CLI, serta dukungan URL GitHub.

 
tested 2026-03-16

Andai tautan internal GeekNews bisa otomatis diberi judul...

 
xguru 2026-03-16

Saya sudah memperbaikinya. Mulai sekarang, komentar yang ditambahkan akan otomatis dikonversi judulnya.

 
tested 2026-03-16

Wow, terima kasih.

 
crawler 2026-03-16

Wah, ternyata bisa langsung seperti ini ya. Saya juga pernah merasa tidak nyaman, harusnya saya sampaikan saja waktu itu.

 
shakespeares 2026-03-16

Markdown-nya diekstrak agak kurang konsisten. Sepertinya hasilnya hanya bagus untuk halaman web yang SEO-nya diterapkan dengan sangat baik. Benarkah?

 
dbs0829 2026-03-16

Saat dipadukan dengan Claude Code, ini benar-benar sangat bagus.