40 poin oleh tominam2 2024-04-13 | 14 komentar | Bagikan ke WhatsApp

Terjemahan AI Korea-Inggris dan Inggris-Korea tanpa batas dapat dilakukan di komputer Anda sendiri.

  1. Kualitasnya lebih baik dibandingkan terjemahan mesin biasa.
  2. Dapat menerjemahkan file txt dan epub.
  3. Hasil keluaran berupa dua jenis file: file teks terjemahan (teks asli) dan file teks terjemahan. Jika hasil terjemahan terasa janggal, Anda bisa langsung membandingkannya dengan teks asli.
  4. Sangat mudah digunakan. Cukup seret file yang perlu diterjemahkan lalu klik tombol jalankan terjemahan. Sistem akan secara otomatis menerjemahkannya bolak-balik Korea↔Inggris.
  5. Dapat diganti dengan model AI lain. Saat ini menggunakan NHNDQ yang memiliki rasio harga-kinerja yang baik.

14 komentar

 
upkit2 2024-04-16

Halo, saya tidak sengaja menutup cmd saat proses instalasi. Setelah itu, meskipun foldernya dihapus dan saya instal ulang, proses instalasinya tidak berjalan. Apakah ada cara untuk mengatasinya?T_T

 
tominam2 2024-04-17

Tentu. Harus kita selesaikan.
Tapi pertama-tama kita perlu tahu dulu kondisinya, tepatnya bagaimana masalahnya terjadi.

https://github.com/vEduardovich/dodari/issues
Di GitHub Dodari di atas, setelah menekan tombol new issue dan membuat issue baru,

bisakah Anda menjelaskan sedikit lebih detail tentang apa yang tidak berjalan, misalnya dengan screenshot atau situasinya?
Saya pasti akan menyelesaikannya

 
illuza 2024-04-15

Wah, luar biasa.
Saya memang sedang menggunakan DeepL, tetapi saya akan membandingkannya sambil memeriksanya pelan-pelan.
Khususnya, saya ingin segera membandingkan teks-teks sastra berbahasa Inggris.

 
tominam2 2024-04-15

Bagian yang Anda sampaikan itulah yang saat ini paling saya rasakan sebagai kekurangan terbesar.
Model yang sekarang digunakan di Dodari adalah model NHNDQ, yaitu model terjemahan multibahasa 200 bahasa bernama facebook-nllb yang di-fine-tuning secara khusus untuk bahasa Korea. Namun meski lebih baik daripada Google Translate, kualitasnya masih jauh di bawah DeepL.

Saat mencoba berbagai model sebagai solusi, saya sempat menjalankan model yanolja-eeve, yang disebut tier 0 untuk bahasa Korea, dan hasilnya sangat mengejutkan karena bagus sekali. Berdasarkan pengalaman saya, rasanya kualitasnya mencapai sekitar 80~90% dari DeepL.

Namun, untuk menggunakan model ini, VRAM komputer pengguna harus di atas 23. Selain itu, karena kecepatan terjemahannya menjadi puluhan kali lebih lambat, teknologi vllm perlu diterapkan untuk akselerasi. Dengan begitu kecepatannya memang bisa meningkat cukup banyak, tetapi OS Linux menjadi keharusan. Artinya, hanya "developer yang mengoperasikan 4090 dan OS Linux" yang bisa mencoba menjalankan model Yanolja.

Ini bagian yang sedang saya pikirkan sekarang. Sangat disayangkan.

 
kunggom 2024-04-15

Perlu penjelasan lebih lanjut lagi?

 
tominam2 2024-04-15

Model induk NHNDQ adalah facebook-nllb, model terjemahan multibahasa untuk 200 bahasa.
Karena itu, kadang ia mengeluarkan bahasa aneh seperti dari alien.

 
kunggom 2024-04-15

Karena tampaknya nama produk itu diambil dari nama panggilan Dodori, tokoh utama dalam insiden Prigate, dengan memanfaatkan fakta bahwa kualitas terjemahan bahasa Koreanya masih sedikit kurang baik, saya merasa tidak mungkin untuk tidak menyinggung kesalahan penggunaan penerjemah legendaris “必要韓紙” yang muncul dari insiden tersebut.

 
roxie 2025-06-14

Perlukah? Ada sejarah sedih seperti ini..

 
tominam2 2024-04-15

Sepertinya ada kejadian yang cukup rumit. Saya tetap kurang paham meski sudah membacanya, huhu.

Nama Dodari dibuat melalui percakapan dengan model mixtral-7bx8.
Awalnya AI merekomendasikan nama Eoneodari, tetapi saya merasa perlu citra yang jelas dan mudah digambar, jadi iseng saya bertanya bagaimana kalau Dodari. Saya sendiri juga merasa itu agak nyeleneh.

Namun AI menjawab bahwa Dodari sangat bagus karena berarti "jembatan yang membantu". Itu penafsiran yang sama sekali tidak terpikirkan oleh saya, jadi saya merasa itu segar. Begitulah nama Dodari lahir.

 
kunggom 2024-04-15

Ini kejadian yang sudah cukup lama, tetapi pada saat itu di komunitas internet Korea ini adalah kasus yang lumayan terkenal.
Kalau diringkas secara garis besar, kurang lebih seperti ini.

  1. Pengelola sebuah kafe Naver bernama Dodori mengunggah pengumuman bahwa akan mengadakan pembelian bersama CD musik Jepang edisi terbatas seharga 70.000 won
  2. Setelah itu, daftar peserta pembelian bersama gelombang pertama diunggah, tetapi nama dan alamatnya terlihat agak aneh sehingga orang-orang mulai curiga
  3. Seorang anggota kafe mengungkap bahwa CD tersebut sebenarnya bukan edisi terbatas dan harganya juga hanya di kisaran 30.000 won, lalu ketika ia mempersoalkannya Dodori mengusirnya dari kafe dan masalah pun membesar
  4. Dalam isi email yang dipublikasikan Dodori dengan klaim sebagai email yang ia tukar dengan perusahaan Jepang, terungkap kesalahan penggunaan mesin penerjemah yang konyol seperti “必要韓紙”, sehingga kasus ini menjadi terkenal juga di kalangan luar
  5. Belakangan terungkap bahwa Dodori adalah orang yang bisa dibilang sangat parah dalam kebiasaan berbohong, dan sebagian besar riwayat pribadinya yang ia unggah di internet dipenuhi dengan kesombongan dan kebohongan yang tidak masuk akal

Ngomong-ngomong, model bahasa besar kadang mengeluarkan penafsiran yang benar-benar tidak terduga, dan saya sendiri juga sesekali pernah mengalaminya ketika hasilnya terdengar masuk akal.
Sepertinya fenomena ketika dalam percakapan dengan orang lain kita jadi menyadari hal-hal yang sebelumnya tidak sempat terpikirkan sendirian, sekarang juga kita alami dalam percakapan dengan mesin.

 
tominam2 2024-04-15

Astaga. Tapi sepertinya tidak sampai ditangkap ya.
Secara pribadi, chatGPT itu terasa seperti anak baik-baik jadi kurang seru, sedangkan Mixtral mungkin karena tidak disensor, percakapannya jadi sangat menarik.

 
kunggom 2024-04-15

Menurut isi wiki, dia bahkan sempat dituntut lalu entah memohon-mohon sampai diberi keringanan dan kasusnya begitu saja berlalu. Saat dituntut, statusnya adalah petugas layanan publik alternatif.

Saya sendiri belum pernah mencoba langsung local LLM karena keterbatasan performa PC pribadi. Sejauh ini saya hanya memakai GPT-4, tetapi saya jadi kepikiran untuk berlangganan tambahan Claude-3.

 
savvykang 2024-04-14

Mulai dari menjalankan model Huggingface hingga menyiapkan venv. Karena ini contoh yang lengkap sampai implementasi layanan web, sangat membantu. Terima kasih sudah membagikannya

 
tominam2 2024-04-14

Saya sangat senang bisa membantu. Justru saya yang lebih berterima kasih.