5 poin oleh GN⁺ 2024-10-22 | 1 komentar | Bagikan ke WhatsApp
  • Alat untuk mengonversi situs web menjadi ePub
  • Mengekstrak daftar halaman HTML dari situs web lalu mengompilasikannya menjadi buku ePub sehingga dapat diimpor ke eReader pilihan
  • Pengguna tingkat lanjut yang dapat menulis JavaScript dapat menambahkan definisi parser tambahan untuk menyesuaikan parsing situs

Situs yang didukung

  • Novel Update
  • Wuxia World
  • Sebagian besar situs dari awesome-read-the-docs
  • Situs kustom yang menggunakan elemen UL/OL sebagai daftar isi, atau memakai regular expression pada teks tautan, atau menggunakan query selector
  • Aplikasi web kustom yang menggunakan elemen judul (header) yang telah ditentukan sebelumnya dan tombol berikutnya yang dapat diklik

Ringkasan GN⁺

  • Epublifier adalah alat yang mengubah konten situs web ke format ePub agar mudah dibaca di eReader
  • Alat ini terutama mendukung situs seperti Novel Update dan Wuxia World, dan pengguna tingkat lanjut dapat menyesuaikan parsing melalui JavaScript
  • Alat ini berguna bagi pengguna yang ingin membaca konten web secara offline, dan alat dengan fungsi serupa termasuk Calibre

1 komentar

 
GN⁺ 2024-10-22
Pendapat Hacker News
  • Calibre mendukung banyak situs
  • Ekstensi ini berupaya menjelaskan apa yang membedakannya dari scraper lain
    • Ditujukan untuk membuat EPub dari situs web tempat scraper tradisional tidak bekerja dengan baik
    • Scraper baris perintah umum dan ekstensi lain hanya berfungsi pada situs yang sudah didefinisikan sebelumnya
    • Mungkin memerlukan pengaturan yang rumit atau kode
    • Beberapa situs menggunakan JavaScript untuk menghasilkan atau mengambil teks secara dinamis
    • Karena berjalan di browser, kemungkinan untuk terdeteksi dan diblokir lebih rendah
    • Bukan untuk penggunaan berulang atau pekerjaan latar belakang
    • Menyediakan UI agar scraping dapat dilakukan dengan mudah tanpa pengaturan untuk situs tersebut
    • Tidak bisa diharapkan memberi performa lebih baik pada situs yang sudah ditangani program/ekstensi lain
    • Dibuat karena tidak terikat pada situs tertentu
  • Hal menarik dari program ini adalah UI untuk mengekstrak konten dari situs apa pun
  • Akan sangat bagus jika bisa menangani situs yang semua bagiannya tersembunyi di balik accordion
  • Sedang membuat sesuatu yang mirip
    • Sedang mengembangkan scraper web dan parser ePub untuk blog, web novel, dan sebagainya
    • Juga sedang mengembangkan aplikasi pendamping PWA untuk membaca offline
  • Kadang ingin mendapatkan esai Paul Graham dalam bentuk ePub
  • Pernah membuat versi sederhana yang menyimpan file ePub di sistem file server
    • Menggunakan Postlight Parser untuk menyediakan tampilan dokumen web yang disederhanakan
  • Alat ini luar biasa
    • Masa-masa menyimpan cache banyak halaman web untuk perjalanan offline telah berlalu
  • Penasaran apakah mendukung fanfiction.net
  • Akan senang menjalankannya pada situs web yang sarat dokumentasi seperti AWS, VueJS, MDN, w3schools, realpython, betterstack