- Alat yang andal untuk mengubah HTML menjadi Markdown yang bersih dan mudah dibaca
- Mendukung format yang kompleks, serta memungkinkan kontrol penuh atas proses konversi melalui opsi kustom dan plugin
- Dapat digunakan melalui pustaka Golang atau perintah CLI, atau dicoba langsung lewat demo online maupun REST API
Fitur utama
- Bold & Italic: Mendukung teks tebal dan miring bahkan di dalam kata
- List: Mendukung nesting daftar berurutan dan tidak berurutan secara sempurna
- Blockquote: Dapat memuat elemen lain di dalam kutipan, serta mendukung kutipan bertingkat dengan mulus
- Inline Code & Code Block: Menangani backtick dan blok kode multi-baris dengan benar untuk mempertahankan struktur kode
- Link & Image: Memformat tautan multi-baris dengan benar, dan menambahkan escape untuk baris kosong
- Smart Escaping: Melakukan escape karakter khusus hanya saat diperlukan untuk mencegah rendering Markdown yang tidak diinginkan
- Remove/Keep HTML: Memberikan opsi untuk menghapus atau mempertahankan tag HTML tertentu
- Plugin: Dapat dengan mudah memperluas plugin, atau membuat plugin kustom untuk meningkatkan fungsionalitas
- Jika memerlukan logika kustom, Anda dapat menulis dan mendaftarkan kodenya
- Jika tidak menyukai pengaturan default, Anda dapat menggunakan
PriorityEarly agar logika dijalankan lebih dulu daripada yang lain
Converter dapat digunakan di beberapa goroutine dan menggunakan mutex secara internal
1 komentar
Komentar Hacker News
Dengan API gratis dari Jina.ai, Anda bisa mengambil URL dan mendapatkan dokumen Markdown tanpa autentikasi atau API key
Penasaran apakah alat berlisensi MIT ini bisa menjadi alternatif untuk p2k, Instapaper, dan sejenisnya agar bisa dibaca di Kindle
Saya menggunakan library ini di fungsi Lambda untuk mengubah URL menjadi Markdown lalu menyimpannya ke S3
Berguna untuk memberikan data halaman web ke LLM
Akan bagus jika alat ini memiliki fitur deduplikasi n-gram
Dengan Urlbox, Anda bisa mendapatkan screenshot halaman web yang akurat sekaligus Markdown
Berguna untuk membangun aplikasi LLM dan AI menggunakan RedditToMarkdown dan urltomarkdown.com
Saya sedang mencari library serupa untuk digunakan di aplikasi Kotlin/Spring
Salah satu kesulitan saat menggunakan alat ini adalah menangani code block dengan syntax highlighting