- Fitur suara dan gambar baru telah diluncurkan untuk ChatGPT.
- Kini dimungkinkan untuk bercakap-cakap secara alami melalui suara dan mengajukan pertanyaan dengan melampirkan gambar.
- Suara diubah menjadi teks melalui Whisper, dan jawaban diubah menjadi suara pengisi profesional berdasarkan model TTS baru.
- Model TTS baru ini dapat mereproduksi suara seseorang secara persis hanya dengan sampel suara berdurasi beberapa detik.
- Model ini juga digunakan untuk fitur terjemahan podcast Spotify, yang menerjemahkan ke berbagai bahasa sambil tetap menggunakan suara podcaster tersebut.
- Beberapa gambar dapat dilampirkan sekaligus, dan sistem dapat mengenali secara rinci tidak hanya teks dalam gambar, tetapi juga objek.
- Pengguna dapat menanyakan cara menggunakan alat atau perangkat, atau berdiskusi tentang resep berdasarkan bahan makanan di dalam kulkas.
- Selain itu, kini juga dimungkinkan untuk menganalisis grafik atau menyelesaikan soal matematika.
- Di aplikasi seluler, pengguna dapat menggunakan alat gambar agar sistem berfokus pada bagian tertentu dari gambar.
- Demi keamanan dan perlindungan privasi, kemampuan untuk menganalisis atau membicarakan orang sangat dibatasi.
- Fitur ini akan lebih dulu tersedia bagi pengguna Plus dan Enterprise dalam dua minggu ke depan.
- Fitur suara hanya berfungsi di iOS dan Android, sedangkan fitur lampiran gambar dapat digunakan di semua platform.
4 komentar
Skynet is coming...
Sepertinya OS seperti di film her akan menjadi mungkin.
Saat GPT-4 pertama kali dirilis sempat muncul sebentar, tapi tetap saja sangat menakjubkan bahwa ini bukan sekadar mengenali gambar, melainkan memahaminya.
Di contohnya ada bagian yang menanyakan cara menyesuaikan sadel sepeda,
dan ini terlihat bukan sekadar pengenalan gambar, melainkan seperti melihat buku petunjuk lalu mencarikan alat yang sesuai...
Awalnya saya pikir perlu langganan Plus, tapi kalau begini ceritanya jadi agak berbeda ya... jadi makin penasaran.
Ringkasan AI dari thread HN