15 poin oleh hongminhee 2021-10-09 | 13 komentar | Bagikan ke WhatsApp

Halo. Setelah membuat akun di GeekNews, selama ini saya hanya menjadi pembaca setia, tetapi ketika Hari Hangeul tiba, saya jadi teringat tabel 《Perbandingan Istilah Ilmu Komputer Korea·Tiongkok·Jepang》 yang saya buat awal tahun ini, jadi saya membagikannya di Show GN.

Seperti halnya di bidang profesional lain, belakangan ini demi kemudahan banyak istilah ilmu komputer yang tidak lagi memakai terjemahan yang sudah lama mapan, melainkan langsung menggunakan bahasa Inggris sebagai kata serapan. Misalnya, sekarang orang juga sering mengatakan dan menulis “value” begitu saja alih-alih “nilai”.

Bagaimanapun juga, dalam bahasa Korea sudah ada banyak terjemahan istilah ilmu komputer yang bagus dan telah mapan sejak puluhan tahun lalu. Lalu saya mengetahui bahwa cukup banyak di antaranya juga digunakan bersama dengan Jepang atau Taiwan, yang sama-sama berada dalam lingkup budaya Hanzi, sehingga saya membuat tabel perbandingan ini sekadar untuk bersenang-senang. Karena bertepatan dengan Hari Hangeul, saya rasa akan menyenangkan jika Anda sempat melihatnya.

Kode sumbernya ada di < https://github.com/dahlia/cjk-compsci-terms >. Setiap istilah disusun sebagai berkas YAML menurut kategorinya di dalam direktori tables/, jadi PR untuk menambahkan istilah atau memperbaiki kesalahan juga sangat diterima.

Terima kasih sudah membaca!

13 komentar

 
dhsung 2021-10-10

Saya ada pertanyaan.

Setelah melihat penulisan bahasa Mandarin dan Jepang di YAML, saya mendapati bahwa digunakan penulisan hanja yang dipakai di Korea, lalu di bawahnya melalui term dicantumkan bentuk aksara tradisional, sederhana, dan singkatan gaya Jepang.

Saya penasaran, dengan maksud apa ini dikembangkan.

Sebagai contoh, untuk Source Code,

Disebutkan bahwa di Tiongkok daratan (zh-CN) digunakan ungkapan beraksara Tionghoa ala hanja Korea seperti "源代碼" dan "源程序",

namun jika melihat bahwa di term penulisan sederhananya justru ditulis dengan benar, rasanya terlihat tidak konsisten.

Sebagai referensi, untuk Source Code,

di Tiongkok daratan yang umum digunakan adalah 源代码, 源码, dan 源程序,

di Taiwan digunakan 原始碼 dan 原始程式碼,

dan saya dengar di Hong Kong digunakan 原始碼 dan 源碼.

Lalu, untuk Computer,

di Tiongkok daratan, istilah resminya adalah "电子计算机", dan di banyak buku serta dokumen, penulisan untuk Computer menggunakan "计算机",

namun karena pengaruh Taiwan dan Hong Kong, orang-orang juga cukup sering mencampuradukkan penggunaan "电脑".

Referensi 1: https://zh.wikipedia.org/wiki/…

Referensi 2: 电脑吧 https://tieba.baidu.com/f?kw=%B5%E7%C4%D4&fr=ala0&tpl=5

Pojok CPU di JD.com: https://pcdiy.jd.com/

Pojok laptop di JD.com: https://list.jd.com/list.html?cat=670,671,672

Karena itu, untuk bagian ini tampaknya ada banyak hal yang perlu dipastikan, termasuk apakah akan berfokus pada penulisan resmi pemerintah.

Karena penulisan yang digunakan di dunia berbahasa Tionghoa berbeda-beda, dan frekuensi penggunaannya juga berbeda tergantung orang yang memakainya, tampaknya akan ada banyak hal yang perlu dipertimbangkan.

 
hongminhee 2021-10-10

Terima kasih atas masukan berharga Anda.

Pertama-tama, jika Anda memeriksa halaman yang diterbitkan di web terlebih dahulu, Anda akan bisa memastikan bahwa di antara istilah Mandarin Tiongkok daratan tidak ada entri yang ditampilkan dengan penulisan hanja gaya Korea alih-alih karakter sederhana. Karena hanya field term dalam data YAML yang benar-benar ditampilkan di layar, seperti yang Anda katakan, hanya pada term saya menuliskannya dengan bentuk penulisan yang digunakan di masing-masing wilayah (namun, untuk bahasa Korea, ditulis dengan hanja gaya Korea alih-alih Hangul).

Kalau begitu, string bergaya Kangxi Dictionary yang ditulis di bagian atas itu apa? Itu hanyalah pengenal grup arbitrer untuk mengikat kata-kata sekerabat antarbahasa yang berbeda (atau dialek) di dalam data. Karena sifatnya arbitrer, sebenarnya tidak harus berupa hanzi; angka atau hash pun bisa dipakai. Namun, misalnya, bahasa Jepang 「科学」 dan Mandarin Taiwan 「科學」 harus ditampilkan sebagai satu kelompok kata sekerabat yang terhubung, sehingga keduanya harus berbagi pengenal grup yang sama. Demikian pula, bahasa Korea "keompyuteo" dan bahasa Jepang 「コンピュータ」 juga harus diikat dengan pengenal grup yang sama.

Sebenarnya pengenal itu bisa saja dibuat sebagai string arbitrer tak bermakna seperti 「foobar」, tetapi saya pikir demi kemudahan pengelolaan akan lebih praktis jika isinya tetap terlihat dan dibuat menurut aturan yang konsisten. Karena itu, aturan yang paling mudah terpikir adalah menuliskan kata serapan dari bahasa Inggris dengan alfabet Latin, dan kata berbasis hanzi dengan hanzi. Namun, karena penulisan hanzi sendiri bisa bermacam-macam, beberapa bentuk varian dan karakter alternatif perlu dinormalisasi (karena ini pengenal grup, tentu harus disatukan), dan dalam proses ini karakter sederhana Tiongkok maupun shinjitai Jepang secara alami gugur dari kandidat. Alasannya, cukup banyak kasus di mana karakter yang berbeda digabungkan karena pelafalannya sama menurut bacaan setempat, sehingga tidak cocok untuk normalisasi (kehilangan informasi klasifikasi). Karena itu, pilihannya mau tidak mau terbatas pada tradisional Hong Kong, bentuk baku Taiwan, hanja gaya Korea, dan sejenisnya; lalu saya memilih gaya Kangxi Dictionary sebagai acuan karena dapat dianggap tidak membawa konotasi yang terkait dengan rezim politik mana pun yang masih ada saat ini.

Isi di atas sebenarnya sudah tertulis di file CONTRIBUTING.md dalam repositori. Bagian-bagian lainnya juga tertulis di sana, jadi silakan merujuknya jika berkenan.

Memahami secara luas kata mana yang paling sering dipakai di antara beberapa kata dengan makna yang sama dalam suatu komunitas bahasa—yakni distribusi kosakata—adalah pekerjaan yang menuntut biaya dan waktu terlalu besar jika diteliti oleh seorang individu yang bukan peneliti spesialis. Jika ada penelitian terdahulu yang meneliti distribusi penggunaan istilah di kalangan orang yang berkecimpung dalam riset ilmu komputer atau pengembangan perangkat lunak, saya juga ingin sekali memanfaatkannya secara aktif. Namun, jika memang tidak ada penelitian semacam itu, maka bagi saya bantuan dari berbagai kontributor, khususnya usulan dari penutur asli masing-masing bahasa, benar-benar sangat dibutuhkan. Tentu saja, karena sampai sekarang saya menelitinya sendirian, mau tidak mau saya banyak bertumpu pada sumber seperti Wikipedia bahasa Mandarin atau Baidu Baike.

Untuk contoh-contoh konkret yang Anda sebutkan, sepertinya akan lebih cepat tercermin jika Anda mengirimkan pull request.

Terima kasih telah membaca komentar panjang ini.

 
dhsung 2021-10-10

Jika Anda merujuk pada English-Chinese Glossary of IT Terms yang diterbitkan oleh pemerintah Hong Kong, itu akan membantu merapikan istilah yang digunakan di Hong Kong.

https://ogcio.gov.hk/en/our_work/…

 
alstjr7375 2021-10-09

Keren sekali :D

 
kunggom 2021-10-09

Terima kasih atas rangkuman yang bagus.

Kalau nanti ada kesempatan, saya juga ingin melihat materi tentang istilah komputasi di Korea Utara. Saya tidak tahu apakah Pusat Data Korea Utara di Kementerian Unifikasi memiliki materi yang sesuai.

 
dhsung 2021-10-10

Sudah ada di situs Kementerian Unifikasi.

Perbandingan istilah TI Korea Selatan dan Korea Utara: https://nkinfo.unikorea.go.kr/nkp/term/skNkItTerm.do

 
hongminhee 2021-10-09

Kalau membongkar sesuatu seperti Red Star, distribusi Linux dari Korea Utara, rasanya mungkin bisa menemukan beberapa materi. Sepertinya di dalamnya juga ada Joseonmal Daesajeon… Nanti kalau sempat, saya akan coba menambahkan bahasa Korea Utara juga!

 
dhsung 2021-10-10

Perbandingan istilah IT Korea Selatan dan Korea Utara: https://nkinfo.unikorea.go.kr/nkp/term/skNkItTerm.do

Sepertinya ini bisa ditambahkan dengan cepat jika di-scrape.

 
kunggom 2021-10-10

Kalau diperhatikan, ternyata mereka menyediakan seluruh isinya dalam file berformat xls, jadi bahkan tidak perlu melakukan scraping.

 
luavis 2021-10-09

Sebaiknya ko dipisahkan menjadi ko-kr dan ko-kp, lalu ditambahkan istilah komputasi Korea Utara.

 
hongminhee 2021-10-09

Saya kira kalau dibungkus dengan <> seperti di Markdown, batas URL akan dikenali, tapi ternyata tidak. 😅 Tautan repositorinya ada di sini: https://github.com/dahlia/cjk-compsci-terms

 
xguru 2021-10-09

Saya harus mengerjakan dukungan Markdown, tetapi sampai sekarang masih belum bisa, huhu.

Saya sudah mengeditnya dengan hanya menambahkan spasi di depan dan belakang agar URL bisa diklik.

Tapi ini benar-benar sebuah Show yang sangat cocok untuk Hari Hangeul. Saya akan menikmatinya!

 
hongminhee 2021-10-09

Terima kasih juga sudah memperbaiki isi artikelnya!