Marker - Open source untuk mengonversi PDF ke Markdown

xguru · 2023-12-04T10:04:01+09:00

Mengonversi PDF, EPUB, dan MOBI ke Markdown Lebih dari 10x lebih cepat dan lebih akurat dibandingkan Nougat buatan Facebook Research Dioptimalkan untuk format buku dan makalah Menghapus header, footer, dan artefak lainnya Sebagian besar rumus dikonversi ke LaTeX Blok kode dan tabel diformat Mendukung banyak bahasa

(github.com/VikParuchuri)

37 poin oleh xguru 2023-12-04 | 6 komentar | Bagikan ke WhatsApp

Mengonversi PDF, EPUB, dan MOBI ke Markdown
Lebih dari 10x lebih cepat dan lebih akurat dibandingkan Nougat buatan Facebook Research
Dioptimalkan untuk format buku dan makalah
Menghapus header, footer, dan artefak lainnya
Sebagian besar rumus dikonversi ke LaTeX
Blok kode dan tabel diformat
Mendukung banyak bahasa

6 komentar

bus710 2023-12-05

Waduh….
Sepertinya cobaan sedang menghampiri para penerbit berbahasa Inggris.
Beberapa penerbit yang berfokus pada teknologi bahkan ada yang langsung memberikan file PDF saat membeli buku, jadi saya penasaran bagaimana mereka akan menyikapinya.

hero512 2023-12-04

Apakah PDF-nya harus sudah melalui OCR?? Sepertinya harus langsung saya coba.

limc132 2023-12-04

Kalau hanya melihat readme, sepertinya ini juga menjalankan pekerjaan OCR... mungkin saya salah membacanya...

hero512 2023-12-04

Ya.. memakai ungkapan yang agak sulit dipahami bagi orang yang tidak jago bahasa Inggris
Ekstrak teks, OCR jika perlu??

say8425 2023-12-04

Ini bekerja paling baik pada PDF digital yang tidak memerlukan banyak OCR. Ini dioptimalkan untuk kecepatan, dan OCR terbatas digunakan untuk memperbaiki kesalahan.

Karena fokusnya pada kecepatan, kemungkinan besar ini kurang cocok untuk PDF yang memerlukan OCR dalam jumlah besar.
Bisa dibilang OCR-nya memang ada, tetapi tidak bisa dijamin.

Hanya bahasa yang mirip dengan bahasa Inggris (Spanyol, Prancis, Jerman, Rusia, dll.) yang didukung. Bahasa dengan set karakter berbeda (Tionghoa, Jepang, Korea, dll.) tidak didukung.

Selain itu, CJK juga tidak didukung.

hero512 2023-12-04

Terima kasih!

Marker - Open source untuk mengonversi PDF ke Markdown

Bacaan terkait

6 komentar