- Panduan mengedit isi teks PDF: tanpa alat komersial seperti Adobe Acrobat
- Panduan utama untuk pengguna Mac: menyebutkan alat yang juga tersedia di sebagian besar distribusi Linux
- Penyimpanan data teks terkompresi dalam PDF: dekompresi menggunakan alat baris perintah
qpdf
- Memeriksa data teks setelah dekompresi: melihatnya di editor teks, dalam keadaan terikat pada encoding dan font tertentu
- Kompleksitas encoding teks di PDF: berbagai kemungkinan encoding, termasuk encoding kustom yang tertanam di file itu sendiri
- Mengekstrak informasi encoding: menggunakan alat baris perintah
pdffonts
- Contoh cara mengidentifikasi font yang terkait dengan encoding tertanam dan menemukan tabel encoding tertanam untuk font tersebut
- Tabel encoding: memetakan titik encoding kustom ke titik Unicode
- Mengubah tabel dengan Python: mengonversi tabel menjadi dictionary serta menulis fungsi encoding dan decoding
- Mengganti teks asli dengan fungsi-fungsi tersebut: memungkinkan penggantian teks asli dengan teks pengganti yang dikodekan memakai encoding kustom
1 komentar
Opini Hacker News