- Dokumen PDF direpresentasikan sebagai struktur data mirip JSON sehingga mudah digunakan
→ Nested list, dictionary, primitive, dll.
- Membuat PDF dari nol
→ Membuat Page, PageLayout
→ Membuat Paragraph, Image, Shape, Barcode, Chart, Emoji, List, Table, Form, dll.
- Mengubah PDF yang sudah ada
→ Mengekstrak dan mengubah metadata
→ Mengekstrak teks/gambar
→ Mengubah gambar
→ Menambahkan Annotation (Note, Link, dll.)
→ Menambahkan teks/tabel/daftar
→ Menggunakan pengelola tata letak halaman
1 komentar
Beberapa hari lalu ada juga layanan yang mengubah paper menjadi HTML,
Titik krusialnya adalah urutan membaca teks pada multi-column, cakupan gambar, dan sebagainya.
Dengan layanan seperti ini, serialisasi paper tampaknya akan makin matang dan layanan ringkasan juga sepertinya segera bermunculan haha