Dalam meeting berbahasa Inggris, tentu saja orang yang lebih nyaman berbahasa Inggris punya keuntungan. Terutama dalam meeting, timing untuk berbicara sangat penting; seandainya saya sudah menyusun semuanya dengan sempurna di kepala, kalau bahasa Inggris bukan bahasa ibu saya, saya jadi nge-freeze lalu akhirnya menyerah untuk berbicara.
Saya mulai membuat produk ini karena merasa masalah ini bisa diselesaikan dengan LLM yang sangat kuat dalam kemampuan berbahasa.
Produk ini adalah aplikasi desktop terpisah yang dapat menampilkan satu jendela transparan di atas alat rapat jarak jauh seperti Zoom, Google Meet, Teams, dan lainnya.
Produk ini menyediakan fitur-fitur utama berikut.
- Saat meeting berlangsung, aplikasi mendeteksi ucapan orang lain dan input mikrofon saya, lalu mentranskripsikan ucapan lawan bicara secara real-time dan menerjemahkannya dengan cepat.
- Jika saat meeting lawan bicara tampaknya mengajukan pertanyaan kepada saya, aplikasi akan mendeteksinya secara otomatis lalu membuat dan menampilkan jawaban yang sesuai.
- Jika saat meeting saya tidak langsung terpikir bagaimana mengungkapkan kalimat atau kata tertentu dalam bahasa Inggris, saya bisa mengetiknya dan menerima ekspresi bahasa Inggris dengan sangat cepat.
- Setelah meeting selesai, berdasarkan isi meeting, aplikasi memberikan feedback dan analisis menyeluruh atas kalimat-kalimat yang saya ucapkan, lalu me-rephrase semuanya menjadi ungkapan yang kemungkinan besar benar-benar dipakai penutur asli dan menyajikannya dalam bentuk laporan.
Bagian yang paling saya fokuskan dan upayakan secara teknis adalah mendapatkan respons secepat mungkin. Sebagus apa pun performanya, dalam meeting yang berlangsung serba cepat, kalau lewat lebih dari 2 detik saja, informasinya jadi tidak lagi bermakna.
Performa LLM sendiri sudah cukup baik untuk membantu bahasa Inggris, tetapi kecepatan generasi token sangat bervariasi antar model, dan saya benar-benar menghabiskan banyak waktu untuk menyeimbangkan hal ini. Model fondasi yang saya uji jumlahnya lebih dari puluhan, dan saat ini saya terus mengoptimalkan dengan mencari kombinasi model fondasi yang tepat untuk tiap tujuan.
Hasilnya, bukan hanya untuk terjemahan tetapi juga untuk bagian seperti saran ekspresi, saya bisa memanfaatkan LLM sepenuhnya sambil tetap mendapatkan hasil berkualitas dengan kecepatan respons yang nyaris real-time.
Selama 3 bulan, saya melakukan chat KakaoTalk dan wawancara video 1:1 setiap hari dengan 150 alpha tester, lalu sedikit demi sedikit memperbaiki produk ini setiap minggu, dan akhirnya kini resmi diluncurkan.
Selama bertahun-tahun saya hanya jadi silent reader GeekNews dan menerima notifikasi lewat Slack, jadi sekarang saat akhirnya menulis postingan sendiri saya agak gugup.. Kalau Anda tertarik dengan produk ini, saya akan sangat berterima kasih jika Anda melihatnya melalui tautan di bawah dan memberikan feedback lewat komentar; itu akan sangat membantu.
Anda bisa mencobanya secara gratis tanpa mendaftarkan kartu kredit.
https://trysmooth.ai
Belum ada komentar.