Mulai memperkenalkan fitur suara dan gambar baru di ChatGPT

(openai.com)

1 poin oleh GN⁺ 2023-09-26 | 1 komentar | Bagikan ke WhatsApp

OpenAI memperkenalkan fitur suara dan gambar baru ke ChatGPT
Fitur-fitur baru ini menyediakan antarmuka yang lebih intuitif, seperti memungkinkan pengguna melakukan percakapan suara atau menunjukkan gambar kepada ChatGPT
Pengguna dapat memanfaatkan fitur-fitur ini dengan berbagai cara, seperti memotret landmark untuk melakukan percakapan secara real time, atau memotret kulkas dan pantry untuk menentukan menu makan malam
Akan diluncurkan kepada pengguna Plus dan Enterprise dalam dua minggu ke depan; fitur suara tersedia di iOS dan Android, sementara fitur gambar tersedia di semua platform
Fitur suara baru ditenagai oleh model text-to-speech yang dapat menghasilkan audio mirip manusia hanya dari teks dan beberapa detik sampel suara
Fitur suara dikembangkan bekerja sama dengan pengisi suara profesional, dan menggunakan Whisper, sistem pengenalan suara open source milik OpenAI, untuk mengubah kata-kata yang diucapkan menjadi teks
Fitur pemahaman gambar ditenagai oleh GPT-3.5 dan GPT-4, yang menerapkan kemampuan penalaran bahasa pada beragam gambar
OpenAI meluncurkan fitur-fitur ini secara bertahap untuk memastikan penggunaan yang aman dan bermanfaat, serta mempersiapkan pengguna menghadapi sistem masa depan yang lebih kuat
Teknologi suara baru ini membawa potensi risiko bagi pelaku jahat yang meniru tokoh publik atau melakukan penipuan
Model berbasis visi juga menghadirkan tantangan baru, misalnya halusinasi tentang orang atau masalah ketika mengandalkan interpretasi gambar model di area berisiko tinggi
OpenAI mengambil langkah-langkah untuk menghormati privasi individu dengan membatasi kemampuan ChatGPT dalam menganalisis dan membuat pernyataan langsung tentang orang
OpenAI secara terbuka mengungkap keterbatasan model, terutama menekankan keterbatasannya dalam riset dan bahasa dengan sistem tulisan non-Romawi
Pengguna Plus dan Enterprise akan dapat mencoba fitur suara dan gambar dalam dua minggu ke depan, sementara kelompok pengguna lain termasuk pengembang akan menyusul segera

1 komentar

GN⁺ 2023-09-26

Opini Hacker News

Fitur suara dan gambar baru di ChatGPT punya potensi, tetapi jeda waktu antara kueri dan respons menimbulkan kekhawatiran.
Teknologi ini dapat digunakan untuk perancangan robot, yang bisa mengarah pada robot serbaguna yang melakukan pekerjaan sederhana.
Perkembangan ChatGPT dapat membuat banyak startup yang ingin membangun kemampuan multimodal menjadi bingung.
Ada kekecewaan atas dihapusnya fitur penelusuran web tanpa pengumuman yang memadai.
Fitur baru ini dapat digunakan untuk memakai pengenalan gambar berbasis AI yang tangguh pada antarmuka pengguna aplikasi dan menghasilkan kode otomatisasi pengujian yang dapat dijalankan.
Pengalaman pengguna yang paling intuitif tampaknya adalah chat teks, tetapi interaksi dengan gambar juga menarik.
Penambahan dukungan gambar dapat disalahgunakan oleh siswa untuk mendapatkan jawaban pekerjaan rumah.
Ada kritik bahwa komunikasi OpenAI tentang fitur baru dan peluncurannya kurang memadai.
Fitur baru ini dapat mengurangi kompleksitas dan latensi dalam mengintegrasikan berbagai layanan AI pada proyek hobi.
Ada kritik bahwa ChatGPT tetap berada dalam mode "demo keren" dan tidak sepenuhnya memanfaatkan potensinya, seperti menggunakan suara untuk menjelaskan program.

Mulai memperkenalkan fitur suara dan gambar baru di ChatGPT

Bacaan terkait

1 komentar

Opini Hacker News