9 poin oleh xguru 2021-09-17 | 3 komentar | Bagikan ke WhatsApp
<p>- Menggunakan machine learning untuk membaca isi PDF, LaTeX, dan PubMed Central XML lalu mengubahnya menjadi HTML <br /> - Bertujuan meningkatkan aksesibilitas <br /> - Prototipe eksperimental dari Semantic Scholar, mesin pencari materi riset berbasis AI <br /> - Saat ini hanya melakukan caching pada gambar/konten yang diekstrak, dan digunakan untuk memberikan layanan lebih cepat hanya kepada orang yang mengunggah dokumen yang sama. File yang diunggah tidak disimpan <br /> - Keterbatasan<br /> → Tabel diekstrak sebagai gambar <br /> → Konten matematika memiliki akurasi rendah atau hampir tidak terekstrak <br /> → Pemrosesan LaTeX/PubMed mungkin memiliki sebagian fungsi yang kurang dibanding PDF <br /> - Ke depannya ada rencana menambahkan fitur aksesibilitas ke Semantic Scholar </p>

3 komentar

 
v08zbv8fvlkjasdflkj 2021-09-23
<p>Masalah saat mengonversi PDF ke format lain (epub juga bagus) adalah tabel dan rumus yang tertera di atas; kalau rumusnya tidak ditangani dengan baik, saya kurang paham apa keunggulannya. <br /> --<br /> Melihat demonya, sepertinya cukup layak dipakai.</p>
 
indigo6 2021-09-18
<p>Sepertinya memang akan lebih nyaman, tetapi saya rasa ada juga orang yang tidak ingin makalah mereka diubah ke format HTML. Rasanya akan bagus kalau pemegang hak bisa melakukan opt-out terhadap konversi semacam ini...<br /> <br /> Dulu sekali (benar-benar sudah lama sekali ya, hiks hiks) saya pernah menulis makalah dengan LaTex dan merasakan kepuasan yang luar biasa. Isinya sih berantakan, tetapi hasil render-nya begitu rapi dan indah sampai perasaan yang saya rasakan waktu itu masih saya ingat. Saat melihat TeX, saya sempat berpikir "Knuth itu dewa, benar-benar dewa..." Bagaimanapun juga, tiba-tiba saya terpikir bahwa selain isi karya yang ditulis seseorang itu penting, pasti ada juga orang-orang yang menganggap format makalah dan detail penyampaiannya sama pentingnya.</p>
 
xguru 2021-09-17
<p>Setelah melihat-lihat galerinya, kualitasnya tampaknya cukup layak dipakai.<br /> https://papertohtml.org/gallery<br /> <br /> Jadi terpikir, akan lebih nyaman kalau hal seperti ini diterapkan di Google Scholar?</p>