1 poin oleh GN⁺ 2023-09-26 | 1 komentar | Bagikan ke WhatsApp
  • OpenAI memperkenalkan fitur suara dan gambar baru ke ChatGPT
  • Fitur-fitur baru ini menyediakan antarmuka yang lebih intuitif, seperti memungkinkan pengguna melakukan percakapan suara atau menunjukkan gambar kepada ChatGPT
  • Pengguna dapat memanfaatkan fitur-fitur ini dengan berbagai cara, seperti memotret landmark untuk melakukan percakapan secara real time, atau memotret kulkas dan pantry untuk menentukan menu makan malam
  • Akan diluncurkan kepada pengguna Plus dan Enterprise dalam dua minggu ke depan; fitur suara tersedia di iOS dan Android, sementara fitur gambar tersedia di semua platform
  • Fitur suara baru ditenagai oleh model text-to-speech yang dapat menghasilkan audio mirip manusia hanya dari teks dan beberapa detik sampel suara
  • Fitur suara dikembangkan bekerja sama dengan pengisi suara profesional, dan menggunakan Whisper, sistem pengenalan suara open source milik OpenAI, untuk mengubah kata-kata yang diucapkan menjadi teks
  • Fitur pemahaman gambar ditenagai oleh GPT-3.5 dan GPT-4, yang menerapkan kemampuan penalaran bahasa pada beragam gambar
  • OpenAI meluncurkan fitur-fitur ini secara bertahap untuk memastikan penggunaan yang aman dan bermanfaat, serta mempersiapkan pengguna menghadapi sistem masa depan yang lebih kuat
  • Teknologi suara baru ini membawa potensi risiko bagi pelaku jahat yang meniru tokoh publik atau melakukan penipuan
  • Model berbasis visi juga menghadirkan tantangan baru, misalnya halusinasi tentang orang atau masalah ketika mengandalkan interpretasi gambar model di area berisiko tinggi
  • OpenAI mengambil langkah-langkah untuk menghormati privasi individu dengan membatasi kemampuan ChatGPT dalam menganalisis dan membuat pernyataan langsung tentang orang
  • OpenAI secara terbuka mengungkap keterbatasan model, terutama menekankan keterbatasannya dalam riset dan bahasa dengan sistem tulisan non-Romawi
  • Pengguna Plus dan Enterprise akan dapat mencoba fitur suara dan gambar dalam dua minggu ke depan, sementara kelompok pengguna lain termasuk pengembang akan menyusul segera

1 komentar

 
GN⁺ 2023-09-26
Opini Hacker News
  • Fitur suara dan gambar baru di ChatGPT punya potensi, tetapi jeda waktu antara kueri dan respons menimbulkan kekhawatiran.
  • Teknologi ini dapat digunakan untuk perancangan robot, yang bisa mengarah pada robot serbaguna yang melakukan pekerjaan sederhana.
  • Perkembangan ChatGPT dapat membuat banyak startup yang ingin membangun kemampuan multimodal menjadi bingung.
  • Ada kekecewaan atas dihapusnya fitur penelusuran web tanpa pengumuman yang memadai.
  • Fitur baru ini dapat digunakan untuk memakai pengenalan gambar berbasis AI yang tangguh pada antarmuka pengguna aplikasi dan menghasilkan kode otomatisasi pengujian yang dapat dijalankan.
  • Pengalaman pengguna yang paling intuitif tampaknya adalah chat teks, tetapi interaksi dengan gambar juga menarik.
  • Penambahan dukungan gambar dapat disalahgunakan oleh siswa untuk mendapatkan jawaban pekerjaan rumah.
  • Ada kritik bahwa komunikasi OpenAI tentang fitur baru dan peluncurannya kurang memadai.
  • Fitur baru ini dapat mengurangi kompleksitas dan latensi dalam mengintegrasikan berbagai layanan AI pada proyek hobi.
  • Ada kritik bahwa ChatGPT tetap berada dalam mode "demo keren" dan tidak sepenuhnya memanfaatkan potensinya, seperti menggunakan suara untuk menjelaskan program.