Penerjemah AI Korea-Inggris/Inggris-Korea Dodari
(github.com/vEduardovich)Terjemahan AI Korea-Inggris dan Inggris-Korea tanpa batas dapat dilakukan di komputer Anda sendiri.
- Kualitasnya lebih baik dibandingkan terjemahan mesin biasa.
- Dapat menerjemahkan file txt dan epub.
- Hasil keluaran berupa dua jenis file: file teks terjemahan (teks asli) dan file teks terjemahan. Jika hasil terjemahan terasa janggal, Anda bisa langsung membandingkannya dengan teks asli.
- Sangat mudah digunakan. Cukup seret file yang perlu diterjemahkan lalu klik tombol jalankan terjemahan. Sistem akan secara otomatis menerjemahkannya bolak-balik Korea↔Inggris.
- Dapat diganti dengan model AI lain. Saat ini menggunakan NHNDQ yang memiliki rasio harga-kinerja yang baik.
14 komentar
Halo, saya tidak sengaja menutup cmd saat proses instalasi. Setelah itu, meskipun foldernya dihapus dan saya instal ulang, proses instalasinya tidak berjalan. Apakah ada cara untuk mengatasinya?T_T
Tentu. Harus kita selesaikan.
Tapi pertama-tama kita perlu tahu dulu kondisinya, tepatnya bagaimana masalahnya terjadi.
https://github.com/vEduardovich/dodari/issues
Di GitHub Dodari di atas, setelah menekan tombol
new issuedan membuat issue baru,bisakah Anda menjelaskan sedikit lebih detail tentang apa yang tidak berjalan, misalnya dengan screenshot atau situasinya?
Saya pasti akan menyelesaikannya
Wah, luar biasa.
Saya memang sedang menggunakan DeepL, tetapi saya akan membandingkannya sambil memeriksanya pelan-pelan.
Khususnya, saya ingin segera membandingkan teks-teks sastra berbahasa Inggris.
Bagian yang Anda sampaikan itulah yang saat ini paling saya rasakan sebagai kekurangan terbesar.
Model yang sekarang digunakan di Dodari adalah model NHNDQ, yaitu model terjemahan multibahasa 200 bahasa bernama
facebook-nllbyang di-fine-tuning secara khusus untuk bahasa Korea. Namun meski lebih baik daripada Google Translate, kualitasnya masih jauh di bawah DeepL.Saat mencoba berbagai model sebagai solusi, saya sempat menjalankan model
yanolja-eeve, yang disebut tier 0 untuk bahasa Korea, dan hasilnya sangat mengejutkan karena bagus sekali. Berdasarkan pengalaman saya, rasanya kualitasnya mencapai sekitar 80~90% dari DeepL.Namun, untuk menggunakan model ini, VRAM komputer pengguna harus di atas 23. Selain itu, karena kecepatan terjemahannya menjadi puluhan kali lebih lambat, teknologi
vllmperlu diterapkan untuk akselerasi. Dengan begitu kecepatannya memang bisa meningkat cukup banyak, tetapi OS Linux menjadi keharusan. Artinya, hanya "developer yang mengoperasikan 4090 dan OS Linux" yang bisa mencoba menjalankan model Yanolja.Ini bagian yang sedang saya pikirkan sekarang. Sangat disayangkan.
Perlu penjelasan lebih lanjut lagi?
Model induk NHNDQ adalah
facebook-nllb, model terjemahan multibahasa untuk 200 bahasa.Karena itu, kadang ia mengeluarkan bahasa aneh seperti dari alien.
Karena tampaknya nama produk itu diambil dari nama panggilan
Dodori, tokoh utama dalam insiden Prigate, dengan memanfaatkan fakta bahwa kualitas terjemahan bahasa Koreanya masih sedikit kurang baik, saya merasa tidak mungkin untuk tidak menyinggung kesalahan penggunaan penerjemah legendaris “必要韓紙” yang muncul dari insiden tersebut.Perlukah? Ada sejarah sedih seperti ini..
Sepertinya ada kejadian yang cukup rumit. Saya tetap kurang paham meski sudah membacanya, huhu.
Nama Dodari dibuat melalui percakapan dengan model mixtral-7bx8.
Awalnya AI merekomendasikan nama
Eoneodari, tetapi saya merasa perlu citra yang jelas dan mudah digambar, jadi iseng saya bertanya bagaimana kalauDodari. Saya sendiri juga merasa itu agak nyeleneh.Namun AI menjawab bahwa Dodari sangat bagus karena berarti "jembatan yang membantu". Itu penafsiran yang sama sekali tidak terpikirkan oleh saya, jadi saya merasa itu segar. Begitulah nama Dodari lahir.
Ini kejadian yang sudah cukup lama, tetapi pada saat itu di komunitas internet Korea ini adalah kasus yang lumayan terkenal.
Kalau diringkas secara garis besar, kurang lebih seperti ini.
Dodorimengunggah pengumuman bahwa akan mengadakan pembelian bersama CD musik Jepang edisi terbatas seharga 70.000 wonDodorimengusirnya dari kafe dan masalah pun membesarDodoridengan klaim sebagai email yang ia tukar dengan perusahaan Jepang, terungkap kesalahan penggunaan mesin penerjemah yang konyol seperti “必要韓紙”, sehingga kasus ini menjadi terkenal juga di kalangan luarDodoriadalah orang yang bisa dibilang sangat parah dalam kebiasaan berbohong, dan sebagian besar riwayat pribadinya yang ia unggah di internet dipenuhi dengan kesombongan dan kebohongan yang tidak masuk akalNgomong-ngomong, model bahasa besar kadang mengeluarkan penafsiran yang benar-benar tidak terduga, dan saya sendiri juga sesekali pernah mengalaminya ketika hasilnya terdengar masuk akal.
Sepertinya fenomena ketika dalam percakapan dengan orang lain kita jadi menyadari hal-hal yang sebelumnya tidak sempat terpikirkan sendirian, sekarang juga kita alami dalam percakapan dengan mesin.
Astaga. Tapi sepertinya tidak sampai ditangkap ya.
Secara pribadi, chatGPT itu terasa seperti anak baik-baik jadi kurang seru, sedangkan Mixtral mungkin karena tidak disensor, percakapannya jadi sangat menarik.
Menurut isi wiki, dia bahkan sempat dituntut lalu entah memohon-mohon sampai diberi keringanan dan kasusnya begitu saja berlalu. Saat dituntut, statusnya adalah petugas layanan publik alternatif.
Saya sendiri belum pernah mencoba langsung local LLM karena keterbatasan performa PC pribadi. Sejauh ini saya hanya memakai GPT-4, tetapi saya jadi kepikiran untuk berlangganan tambahan Claude-3.
Mulai dari menjalankan model Huggingface hingga menyiapkan
venv. Karena ini contoh yang lengkap sampai implementasi layanan web, sangat membantu. Terima kasih sudah membagikannyaSaya sangat senang bisa membantu. Justru saya yang lebih berterima kasih.