14 poin oleh GN⁺ 2023-12-22 | 1 komentar | Bagikan ke WhatsApp

Akses yang setara terhadap riset ilmiah

  • arXiv sedang berupaya agar semua pengguna, termasuk penyandang disabilitas, dapat mengakses riset ilmiah secara setara.
  • Sejak 18 Desember 2023, arXiv membuat versi format HTML untuk semua makalah yang dikirim dalam TeX/LaTeX (hanya untuk makalah yang dikirim setelah 1 Desember dan jika konversi HTML berhasil).

Penambahan format HTML

  • HTML bukan pengganti PDF, melainkan format tambahan yang disediakan untuk pengguna arXiv.
  • Saat mengirimkan makalah, pengirim juga memiliki kesempatan untuk meninjau versi HTML seperti halnya PDF.
  • Saat membuka halaman abstrak makalah, pengguna dapat melihat tautan untuk membaca makalah HTML tepat di bawah tautan PDF.

Peningkatan aksesibilitas bagi ilmuwan penyandang disabilitas

  • Ada permintaan untuk menyediakan makalah dalam format HTML karena ilmuwan penyandang disabilitas menghadapi hambatan saat mengakses riset.
  • Makalah dalam format HTML dapat dibaca dengan lebih mudah dan akurat melalui teknologi seperti screen reader, sehingga membantu peneliti dengan gangguan penglihatan, low vision, disleksia, dan lainnya.

Tahap eksperimental konversi HTML

  • Saat ini, konversi HTML masih berada pada tahap eksperimental, dan pekerjaan terus dilakukan untuk meningkatkan akurasinya.
  • Tidak semua makalah dapat dikonversi ke HTML dengan akurat, tetapi fitur ini ingin segera disediakan secepat mungkin bagi peneliti yang membutuhkannya untuk aksesibilitas.
  • Untuk kiriman yang gagal dikonversi ke HTML, arXiv tidak akan memblokir atau menahannya, tetapi berharap para penulis meninjau versi HTML dengan saksama.

Ucapan terima kasih untuk proyek HTML

  • arXiv menyampaikan terima kasih atas HTML eksperimental ini, yang merupakan langkah besar untuk membuat sains dapat diakses oleh semua orang.
  • Terima kasih juga disampaikan kepada semua pihak yang berkolaborasi dalam pilot proyek makalah HTML arXiv, termasuk LaTeX Project dan tim LaTeXML dari NIST.
  • Bagi pengguna yang akrab dengan ar5iv, proyek kolaborasi arXivLabs, penyediaan HTML ini berarti proyek berpengaruh tersebut sepenuhnya diintegrasikan secara internal.
  • Tujuan akhirnya adalah melakukan backfill terhadap seluruh korpus arXiv agar semua makalah memiliki versi HTML, tetapi untuk saat ini fitur ini hanya tersedia untuk makalah baru.
  • arXiv juga berterima kasih kepada semua pengguna yang telah menulis laporan bug untuk proyek makalah HTML ini; tim saat ini sedang menganalisis laporan-laporan tersebut dan berencana melakukan perbaikan pertama pada tahun baru.

Opini GN⁺

  • Penyediaan format HTML oleh arXiv merupakan kemajuan penting dalam meningkatkan aksesibilitas riset, dan akan sangat membantu terutama bagi ilmuwan penyandang disabilitas.
  • Perubahan ini akan berkontribusi pada pengurangan hambatan teknis di dalam komunitas ilmiah dan meningkatkan inklusivitas riset.
  • Meskipun masih berada pada tahap eksperimental, keputusan arXiv untuk segera menyediakan fitur ini menunjukkan sikap positif yang memprioritaskan kebutuhan para peneliti.

1 komentar

 
GN⁺ 2023-12-22
Opini Hacker News
  • Artikel ini tidak menautkan contoh HTML, tetapi ada tautan acak di sini: tautan contoh HTML arXiv. Keren karena mendukung mode gelap. Tombol togelnya tidak terlihat, tetapi dirender mengikuti mode sistem. Sepertinya aksesibilitas arXiv di perangkat seluler akan meningkat pesat.
    • Setelah 30 tahun sejak HTML diciptakan untuk mendukung aksesibilitas dan kolaborasi bagi riset dan akademia, Gedung Putih merilis pedoman aksesibilitas baru. Ini adalah kebijakan resmi baru pertama yang diumumkan dalam HTML, bukan PDF. tautan pedoman aksesibilitas Gedung Putih
    • Jika ingin mendapatkan informasi tentang makalah AI/ML penting terbaru di arXiv, coba lihat Emergent Mind. Situs ini memeriksa penyebutan makalah arXiv di media sosial (Hacker News, Reddit, X, YouTube, GitHub, dll.), lalu memberi peringkat berdasarkan aktivitas media sosial dan waktu publikasi makalah. Untuk tiap makalah, situs ini membuat ringkasan dengan GPT-4 dan menyediakan tautan ke diskusi media sosial, referensi makalah, dan makalah terkait. Ini masih situs baru dan belum banyak dibagikan. Masukan atau permintaan untuk perbaikan sangat diterima.
    • Jika ada makalah yang tidak memiliki tautan HTML di sidebar, saya penasaran bagaimana cara mengetahui alasan makalah itu tidak dirender sebagai HTML dan bagaimana cara memperbaikinya.
    • Menurut saya akan bagus jika pengirim diberi kesempatan untuk mengunggah versi HTML mereka sendiri bersama versi PDF, alih-alih hanya bergantung pada proses konversi otomatis.
      • Jika ada yang menghubungi soal masalah pada versi HTML makalah, penulis bisa frustrasi karena tidak ada cara untuk memperbaikinya selain berharap perubahan pada PDF akan memengaruhi pembuatan HTML. Jauh lebih mudah memperbaiki masalah format langsung di PDF.
      • Akan menarik juga jika eksperimen untuk format alternatif makalah diizinkan. Misalnya, makalah yang menyertakan sandbox untuk mencoba bahasa pemrograman yang sedang dibahas, atau makalah tentang kalkulus multivariabel yang memungkinkan interaksi dengan plot 3D dari suatu fungsi.
    • Selalu bertaruh pada web adalah keputusan yang sangat bagus.
    • Alat yang digunakan untuk layanan ini adalah arXiv-readability. Saya sertakan tautannya agar menghemat beberapa klik.
    • PDF jauh lebih unggul daripada HTML dalam merender dokumen teks. Dan bedanya cukup besar. Ini sudah memungkinkan 10 tahun lalu, bahkan 15-20 tahun lalu. Alasan ini belum terjadi bukan sekadar inersia. LaTeX dan PDF jauh lebih unggul dalam perenderan teks, dan format statis berguna bagi orang-orang setelahnya karena mengunci keadaan tetap seiring waktu. Tidak seperti sifat HTML yang secara inheren cair. Dan sekali lagi, kualitas rendernya tidak bisa dibandingkan, dan itu menyampaikan sinyal kualitas, baik secara sadar maupun tidak sadar.
    • Saya harap arXiv tidak berhenti menyediakan makalah dalam format PDF. Saya juga lebih suka membaca PDF bahkan di komputer.
    • Saat membuka PDF besar (lebih dari 100MB, umum pada makalah ML yang berfokus pada pembuatan gambar beresolusi tinggi) di arXiv, tidak ada yang dirender selain bilah pemuatan, dan waktu muatnya cukup lama, lebih dari 10 detik. Saya penasaran apa penyebab jeda ini. Apakah masalah jaringan, atau Chrome memang sangat lambat dalam merender PDF besar? Apakah PDF harus diunduh sepenuhnya sebelum mulai dirender? Bagaimanapun, jeda ini adalah satu-satunya keluhan saya terhadap arXiv, dan dokumen HTML yang dirender secara bertahap dengan teks yang langsung dimuat akan menjadi peningkatan besar.