Aplikasi penerjemah layar/suara yang saya buat untuk main visual novel
(github.com/tchinso)Saya hanyalah otaku biasa yang suka visual novel.
Katanya dulu ada masa ketika orang menerjemahkan dengan EasyTrans atau AralTrans.
Belakangan saya dengar sekarang orang bisa menjalankan penerjemah OCR dengan MORT,
namun setelah saya coba sendiri, pengaturan dan fiturnya terlalu banyak dan rumit,
dan yang paling penting, tingkat pengenalan layarnya sangat buruk.
Untuk terjemahannya juga, DeepL sering error kalau tidak memasukkan API key,
dan karena belakangan AI lokal juga makin bagus, saya jadi berpikir,
bagaimana kalau memasukkan model AI OCR lokal dan
model terjemahan AI lokal?
Akhirnya saya buat sendiri.
Lalu sambil membuatnya, saya juga berpikir bukankah akan bagus kalau ada fitur
yang bisa mengenali suara lalu menerjemahkannya?
Karena skalanya makin lama makin besar,
akhirnya saya membuat aplikasi yang bisa mengenali layar/suara dan menerjemahkannya dalam satu aplikasi.
Bahasanya hanya mendukung bahasa Jepang (karena tujuan awalnya memang untuk visual novel...).
Untuk terjemahan pengenalan layar,
setelah area sementara didaftarkan sebagai area tetap, cukup klik tombol terjemahkan berulang kali,
maka hasil terjemahan akan ditampilkan sebagai overlay.
Untuk pengenalan suara, jika file audio dimasukkan secara utuh, aplikasi akan membuat transkrip lalu menampilkannya di overlay.
Proses membuatnya tidak mudah.
Saya kuliah di jurusan yang sama sekali tidak berhubungan dengan pemrograman dan bekerja di pekerjaan yang juga tidak ada hubungannya,
dan pengalaman saya dengan program paling hanya sempat menyentuh DevC++ saat pelajaran TIK di SMA, sampai if/while, itu saja yang saya ingat.
Saya ingin menunjukkan kepada kalian bahwa dengan GPT-5.5, hal seperti ini pun bisa dibuat.
Jumlah token yang digunakan sekitar 720 juta token.
Mohon banyak masukan dari teman-teman GN!
Belum ada komentar.