ChatGPT Images 2.0
(openai.com)- Informasi isi spesifik terkait fitur pembuatan gambar tidak disediakan
- Fitur, perubahan, dan metrik performa ChatGPT Images 2.0 semuanya tidak dapat dikonfirmasi
- Tidak ada informasi eksplisit tentang cara dukungan, target pengguna, harga, atau cakupan peluncuran
- Penjelasan terkait contoh gambar, struktur model, dan pengaman juga tidak disediakan
- Berdasarkan materi yang diberikan saja, fakta inti selain judul tidak dapat diringkas
Tidak ada isi
4 komentar
Penalaran dimasukkan ke dalam gambar, jadi hasilnya benar-benar gila.
Saya cuma melemparkan keyword sederhana terkait bisnis baru,
namun ia sampai menalar pesan inti/pain point lalu meleburkannya ke landing page.
Bahkan mengambil mentah-mentah warna brand, tone pesan brand, sampai model dari situs yang sebelumnya diminta sebagai referensi itu sudah jadi hal dasar.
Melihat bahasa Korea pun sama sekali tidak rusak, sepertinya ke depan potensi pemanfaatannya bakal luar biasa besar..
Sekarang perkembangan AI benar-benar mulai terasa makin menakutkan.
Luar biasa. Saat Nanobanana keluar pun saya sudah terkejut, tapi ini jadi lebih bagus lagi. Sepertinya karena ada persaingan, perkembangannya jadi cepat.
Oh.. pemrosesan teks sebelumnya terasa seperti Nano Banana, tapi kali ini sepertinya mereka benar-benar serius.
Semua teks dalam tulisan pengenalan dibuat menjadi gambar.
Seluruh tulisannya bisa dilihat sambil menggulir gambar.
Tulisan tangan di tengah cukup mengesankan
Komentar Hacker News
gpt-image-2saya membuat "gambar bergaya Where's Waldo yang menampilkan rakun memegang radio ham", dan kodenya ada di sini. Hasilnya adalah gambar ini, tetapi saya sendiri tidak yakin apakah rakun itu benar-benar sedang memegang radio ham. Memang untuk tes ala Where's Waldo seperti ini, saya biasanya tidak punya kesabaran untuk terus mencarinya sampai ketemugpt-2-image highada di sini; model ini menghasilkan gaya yang lebih kreatif dan tampak lebih orisinal, tetapi logika gayanya diterapkan per baris, bukan berdasarkan angka, beberapa Pokémon salah, font-nya juga salah, dan bagian bawahnya pun tidak berbentuk persegi. Hasil yang cukup anehgemini-3.1-flash-image-preview, biayanya 2.520 token, sekitar $0.151 per gambar, sedangkan dengangpt-image-2untuk gambar 3840x2160 biayanya 13.342 token, sekitar $0.4. Jadi model ini lebih dari 2x lebih mahal daripada Geminigpt-image-1.5dari OpenAI dan NB2 dari Google cukup berimbang di situs perbandingan saya. Dalam evaluasi yang berfokus pada kepatuhan prompt, keduanya menunjukkan tingkat keberhasilan sekitar 70% untuk kriteria generasi dan penyuntingan, sementara kualitas visual selalu sedikit lebih unggul di pihak Gemini. Meski begitu,gpt-image-1.5adalah lompatan besar untuk OpenAI dan menghilangkan banyak masalah lama seperti yang dulu disebut "piss filter". Grafik perbandingannya bisa dilihat untuk edit di sini dan generasi di sini. Berdasarkan pembaruan,gpt-image-2berhasil melewati bintang 9 sudut yang selama ini disebut model killer dalam set tes, dan pada benchmark text-to-image berhasil menjawab 12 dari 15 prompt dengan benar, unggul 1 poin dari model terbaik sebelumnya. Namun, prompt coral snake dengan urutan warna yang ketat, D20 dengan 20 bilangan prima pertama tertulis di tiap sisi, dan planet berbentuk bumi datar dengan manusia meluber ke tepi masih tetap gagal. Perbandingan lengkap ada di All Models, dan jika hanya model utama, ada di siniGPT-Image-2. Makalah terkait ada di sini, dan saya sendiri membuat detektor gambar AI on-device dengan menggabungkan keduanya