13 poin oleh xguru 2023-11-07 | 4 komentar | Bagikan ke WhatsApp
  • Mengimplementasikan layanan seperti "Be My Eyes" dengan AI, yang menghubungkan penyandang tunanetra dengan relawan untuk membacakan layar
  • Web app yang melihat video melalui backend multimodal dan menjelaskan apa yang terlihat secara real-time
  • Menjalankan model multimodal open source BakLLaVA-1 dari SkunkworksAI dengan llama.cpp, dan mengeluarkan suara melalui Web Speech API

4 komentar

 
botplaysdice 2023-11-08

Wah, kalau melihat hal seperti ini saya bangga menjadi seorang engineer. Sepertinya ini akan sangat membantu para tunanetra.

 
hi098123 2023-11-08

Ada juga aplikasi bernama 'Sullivan Plus' yang digunakan YouTuber One Shot Hansol.
Sepertinya aplikasi itu bukan hanya mengenali teks, tetapi juga memahami ciri-ciri objek.
https://youtu.be/EAKGU-uW6Ek
https://www.mysullivan.org/

 
hero512 2023-11-07

Kabar seperti ini benar-benar menyenangkan, haha. Putri saya penyandang tunanetra soalnya.