2 poin oleh GN⁺ 2023-09-05 | 1 komentar | Bagikan ke WhatsApp
  • Panduan mengedit isi teks PDF: tanpa alat komersial seperti Adobe Acrobat
  • Panduan utama untuk pengguna Mac: menyebutkan alat yang juga tersedia di sebagian besar distribusi Linux
  • Penyimpanan data teks terkompresi dalam PDF: dekompresi menggunakan alat baris perintah qpdf
  • Memeriksa data teks setelah dekompresi: melihatnya di editor teks, dalam keadaan terikat pada encoding dan font tertentu
  • Kompleksitas encoding teks di PDF: berbagai kemungkinan encoding, termasuk encoding kustom yang tertanam di file itu sendiri
  • Mengekstrak informasi encoding: menggunakan alat baris perintah pdffonts
  • Contoh cara mengidentifikasi font yang terkait dengan encoding tertanam dan menemukan tabel encoding tertanam untuk font tersebut
  • Tabel encoding: memetakan titik encoding kustom ke titik Unicode
  • Mengubah tabel dengan Python: mengonversi tabel menjadi dictionary serta menulis fungsi encoding dan decoding
  • Mengganti teks asli dengan fungsi-fungsi tersebut: memungkinkan penggantian teks asli dengan teks pengganti yang dikodekan memakai encoding kustom

1 komentar

 
GN⁺ 2023-09-05
Opini Hacker News
  • Spesifikasi PDF itu kompleks dan mendukung berbagai fitur, termasuk mode blend layer seperti di Photoshop serta konten tambahan yang memodifikasi isi sebelumnya.
  • PDF mencakup enkripsi berbasis kata sandi dengan kata sandi "owner" dan "user" yang berbeda, serta opsi untuk mencegah pencetakan atau penyalinan teks.
  • Meski sifatnya kompleks, PDF bukan format biner yang tak bisa disentuh, melainkan graf objek dari berbagai jenis yang dijelaskan dengan baik dalam spesifikasi resminya.
  • Alat seperti mutool dapat digunakan untuk mengubah PDF menjadi versi tanpa data terkompresi, sehingga lebih mudah dipahami dan dimodifikasi.
  • PDF mendukung beragam fitur seperti objek 3D, JavaScript, film dari objek Flash yang disematkan, anotasi tak terlihat, dan widget yang menggunakan subset XHTML dan CSS.
  • Namun, PDF pada dasarnya adalah format deskripsi halaman dan merepresentasikan tampilan halaman, bukan struktur dokumen. Karena itu, yang disarankan adalah mengedit dokumen asal pembuat PDF tersebut.
  • PDF terutama ditujukan untuk menampilkan atau mencetak isi secara sempurna, sehingga lebih mirip format gambar yang menghabiskan lebih sedikit byte daripada gambar sebenarnya.
  • Alat seperti qpdf dan RUPS dapat digunakan untuk memahami struktur PDF dan memodifikasinya.
  • Firefox menyediakan cara mudah untuk menandatangani PDF.
  • Spesifikasi PDF sangat luas dan kompleks, dan bahkan setelah mempelajarinya selama bertahun-tahun, Anda mungkin masih merasa baru menggores permukaannya saja.