Paper to HTML - Mengubah makalah menjadi HTML yang lebih mudah dibaca
(papertohtml.org)<p>- Menggunakan machine learning untuk membaca isi PDF, LaTeX, dan PubMed Central XML lalu mengubahnya menjadi HTML <br />
- Bertujuan meningkatkan aksesibilitas <br />
- Prototipe eksperimental dari Semantic Scholar, mesin pencari materi riset berbasis AI <br />
- Saat ini hanya melakukan caching pada gambar/konten yang diekstrak, dan digunakan untuk memberikan layanan lebih cepat hanya kepada orang yang mengunggah dokumen yang sama. File yang diunggah tidak disimpan <br />
- Keterbatasan<br />
→ Tabel diekstrak sebagai gambar <br />
→ Konten matematika memiliki akurasi rendah atau hampir tidak terekstrak <br />
→ Pemrosesan LaTeX/PubMed mungkin memiliki sebagian fungsi yang kurang dibanding PDF <br />
- Ke depannya ada rencana menambahkan fitur aksesibilitas ke Semantic Scholar </p>
3 komentar