pdfsandwich - alat untuk membuat file PDF dengan gambar dan OCR dalam format sandwich
(tobias-elze.de)<p>- PDF "sandwich": file PDF yang hanya berisi gambar lalu diproses dengan OCR sehingga teks disisipkan secara tak terlihat di belakang gambar pada tiap halaman<br />
→ teks dapat dicari serta dipilih untuk disalin<br />
- Digunakan untuk OCR buku atau majalah hasil pindaian sebagai alat baris perintah<br />
→ juga mendukung teks multikolom <br />
- tesseract + unpaper + convert + ghostscript <br />
→ mendukung semua bahasa yang didukung tesseract (termasuk bahasa Korea)<br />
- Linux/Mac. Mendukung pemrosesan paralel pada sistem multiprosesor </p>
Belum ada komentar.