elbird - paket wrapping R untuk kiwi, penganalisis morfologi bahasa Korea (github.com)
(github.com/mrchypark)elbird secara pribadi adalah paket yang menjadi tujuan akhir dari kiwigo yang sebelumnya saya rilis.
Di R, paket penganalisis morfologi yang ada saat ini pada dasarnya terbagi antara KoNLP (berbasis Java, saat ini * sudah diturunkan dari CRAN) dan RcppMecab (berbasis mecab, cepat, tidak memulihkan teks asli), ditambah beberapa paket lainnya.
Saat KoNLP masih menjadi arus utama, kesulitan memasang JDK dan kondisi bahwa paket tersebut kini tidak ada di CRAN saling bertemu, sehingga saya telah berupaya untuk mengunggah paket penganalisis morfologi baru ke CRAN yang mudah dipasang dan terus dipelihara.
Di tengah proses itu, saya mengetahui kiwi yang sedang dikembangkan dalam C++ dengan portabilitas yang sangat baik.
Setelah waktu yang lama, akhirnya saya bisa membuat paket R dengan membungkus fungsi-fungsi C++ tersebut, dan menyelesaikan pendaftarannya di CRAN.
Saat ini versi 0.1.1 sudah terdaftar, dan saya berencana segera memperbaruinya ke 0.1.2.
Fitur yang sudah diimplementasikan saat ini berada pada tingkat yang memungkinkan penggunaan dasar, dan setelah semua fitur kiwi diimplementasikan, saya berencana melakukan penyesuaian agar selaras dengan versi kiwi.
Di README ada contoh kode penggunaan dasar, dan fitur-fitur untuk digunakan bersama tidytext, paket analisis teks yang terkenal di ekosistem R, juga telah dipertimbangkan.
Mohon banyak perhatian dan minatnya.
* CRAN: repositori paket resmi R. Tempat ini adalah repositori terkelola yang melalui pengujian otomatis dan peninjauan administrator, serta menerapkan kebijakan evergreen (jika pengujian gagal maka pendaftaran dibatalkan), sehingga memerlukan pemeliharaan yang konsisten.
1 komentar
Saya masih kurang berpengalaman dalam pengembangan dan kompilasi C++, jadi saya sangat membutuhkan banyak bantuan terkait hal itu.
Jika ada yang bisa memberikan saran, mohon cek tab issue.