- Editor dokumen berbasis suara yang menggabungkan pengenalan suara dan perintah bahasa alami
- Saat pengguna mengatakan seperti "tolong ubah menjadi daftar" atau "tolong tambahkan kutipan inline di halaman 86 buku ini", perintah tersebut akan dijalankan
- Perangkat lunak pengenalan suara masih menawarkan pengalaman yang tidak nyaman dan rapuh
- Perangkat lunak saling bersaing dalam akurasi, tetapi tidak menangani sifat rapuh dari teks yang dihasilkan
- Pengguna harus mempelajari perintah khusus, dan itu masih belum memadai sebagai pengganti keyboard
- Cara Aqua Voice menyelesaikannya
- Aqua dapat menuliskan ucapan pengguna apa adanya, menjalankan perintah, atau menyempurnakan apa yang diucapkan menjadi tulisan sesuai maksud pengguna
- Jika pengguna tergagap atau mengucapkan kalimat beberapa kali, Aqua hanya memilih versi final untuk diubah menjadi teks
- Visi dan teknologi Aqua Voice
- Bertujuan menghadirkan pengalaman pengenalan suara yang lebih alami dan pengalaman menulis AI yang kolaboratif
- Menyediakan layanan berbasis streaming yang terus terhubung dengan model secara real-time
- Enam model bekerja sama untuk menerjemahkan, menafsirkan, dan menulis ulang dokumen sesuai intent
- Menggunakan transkripsi MoE(Mixture of Experts) untuk meningkatkan akurasi secara real-time
1 komentar
Opini Hacker News
Keren! Beberapa masukan:
Seperti yang dikatakan orang lain, kerja bagus.
Saya mengalami cedera terkait RSI pada 94/95 dan sejak itu memakai pengenalan suara. Saya ingin solusi yang membuat saya bisa lepas dari Windows. Saya ingin solusi yang memungkinkan dikte dengan mudah di Firefox, Thunderbird, dan VS Code. Yang paling penting adalah fitur pengeditan/manipulasi teks yang oleh Nuance disebut 'Select-and-Say'. Bisa melakukan edit kecil, mengganti kalimat dengan dikte baru, dan hal-hal seperti itu membuat penggunaan suara jauh lebih mudah daripada sekadar dikte yang ditangkap seperti kebanyakan aplikasi whisper.
Saya menginginkan sesuatu seperti ini untuk input data. Sering kali tangan saya penuh saat mengukur sesuatu dan saya perlu membuat catatan. Bisakah ini menghasilkan/memformat data berbentuk tabel?
Ini benar-benar hebat. Saya berharap seseorang membuat ini:
Perangkat lunak dikte sangat penting di industri medis. Semua dokter menggunakannya, dan sesuatu seperti solusi Anda bisa membuat pekerjaan mereka jauh lebih efisien. Apakah Anda sudah menjajaki segmen pasar ini?
Ini luar biasa! Sangat memuaskan untuk digunakan, dan kombinasi transkripsi + niat tampaknya punya potensi yang sangat besar.
Saya ingin memakai ini untuk mendikte surat pasien dan semacamnya. Apakah model lokal/kepatuhan HIPAA masih jauh?
Selamat atas peluncurannya!
Sebagai sesama orang neurodivergen yang jauh lebih baik bekerja dengan teks daripada suara, saya sangat menyukai ide ini. Satu-satunya masukan saya adalah... saya ingin menjalankan ini dengan kontrol yang lebih besar. Saya sudah menjalankan LLM secara lokal (misalnya LM Studio), dan juga bisa menjalankan hal seperti whisper. Saya paham bahwa membuatnya open source (atau membuat source code-nya tersedia) mungkin bertentangan dengan upaya komersialisasi. Namun mungkin ada beberapa opsi seperti Red Hat, di mana penggunaan bisnis dikenai biaya sementara penggunaan pribadi bisa gratis jika dijalankan secara lokal.
Di satu sisi, Anda punya keunggulan first-mover yang kuat di area yang bisa memberi manfaat dan dipakai banyak orang, tetapi seseorang mungkin bisa menghadirkan kompetisi dengan merangkai beberapa lapisan keluaran dari beberapa LLM (proyek seperti itu sering kali open source, walau kadang kurang 'matang'). Jika Anda menawarkan kesepakatan yang bagus, mungkin ada peluang sukses besar. Semoga berhasil!
Ini keren, mungkin saya akan berlangganan—saya hanya perlu mengurangi langganan lain saya—akhir-akhir ini terlalu banyak produk AI menggoda.
Ini tidak dijelaskan secara eksplisit, tetapi saya ingin tahu data apa yang dikirim ke cloud — saya berasumsi rekaman suara lengkap. Atau apakah STT dilakukan di perangkat? Juga, apa kebijakan privasi/retensi Anda untuk data ini? Demo yang hebat dan produk yang keren!