- Membandingkan 3 model dengan prompt yang sama dari sisi akurasi terhadap subjek, akurasi gaya, koherensi, dan etika (Ethics)
Fotografi: Manusia
- Saat ini, di bidang fotografi, Midjourney masih memimpin, tetapi Firefly 2 berada tepat di belakangnya dengan selisih tipis
- Jika menginginkan headshot yang kurang distilisasi dan lebih natural, ke depannya Firefly 2 layak dipertimbangkan
- Untuk keperluan fotografi, sebaiknya tidak menggunakan DALL-E 3
Fotografi: Manusia bergaya
- Belakangan ini banyak dibuat gambar manusia yang lebih stilistis
- Prompt seperti ini kemungkinan agak bias karena secara khusus disesuaikan untuk Midjourney
- Namun, ada beberapa poin utama:
- Midjourney bekerja paling baik saat diberi prompt yang lebih kompleks, dan menunjukkan koherensi yang kuat
- Midjourney unggul dalam menghasilkan kombinasi media, komposisi, dan pencahayaan yang kompleks
- DALL-E tampaknya kesulitan mengintegrasikan pencahayaan untuk orang berkulit berwarna, sehingga akurasi hasil menurun
- Firefly menghasilkan keluaran yang paling beragam ketika keberagaman tidak diminta secara eksplisit
- Jika digunakan sebagai pengganti fotografi yang lebih kreatif, baik Firefly maupun DALL-E 3 bisa kesulitan mencapai tingkat kualitas dan koherensi yang diinginkan
Fotografi: Objek
- Saya menilai Midjourney secara keseluruhan menghasilkan koherensi objek yang paling realistis
- Firefly dan DALL-E memang mulai mengejar, tetapi preferensi gaya pada model-model ini tanpa diragukan akan memengaruhi hasil
Ilustrasi
- Dari sisi ilustrasi, semuanya telah membuat kemajuan yang cukup besar, tetapi untuk mendapatkan hasil yang nuanced, Midjourney masih menjadi pilihan terbaik
- Namun, sebaiknya tetap bereksperimen dengan beberapa model dan menyesuaikannya dengan gaya unik Anda sendiri
Tipografi
- Kemampuan menghasilkan kata yang akurat baru benar-benar dimungkinkan belakangan ini
- Dari semua pengujian yang dilakukan, hanya DALL-E 3 yang merender kata secara setia sebagai entitas yang utuh
- Dalam kasus khusus ini, katanya adalah "desain", dan konsistensinya terjaga secara konsisten di semua eksperimen
Kesimpulan
- Lanskapnya jelas sedang berubah, tetapi poin utama yang ingin saya tekankan adalah:
- Adobe jelas sedang memperkecil kesenjangan di bidang fotografi dan menjadi pesaing yang kuat
- DALL-E 3 adalah satu-satunya generator yang dapat menghasilkan tipografi dengan cukup baik (kecuali Ideogram)
- DALL-E 3 unggul dalam pembuatan ilustrasi, dan ketika digabungkan dengan kemampuan menghasilkan kata, saya rasa ia berpotensi menjadi "generator gambar untuk clipart" dari sisi skala dan gaya yang tergeneralisasi
- Cocok untuk gambar dasar atau pembuatan gambar di tengah aktivitas lain (melalui ChatGPT), tetapi tampaknya belum akan segera menjadi alat desain yang sangat canggih
- Midjourney terus menghasilkan foto yang paling realistis dan koheren.
- Dalam hal kontrol kreatif, Midjourney tidak tertandingi
2 komentar
Kenapa
StableDiffusiondihapus?Karena Midjourney?
Saat saya mencoba DALL-E 3, saya sangat takjub karena ia bisa menampilkan teks dengan jelas.
Tapi sepertinya untuk sekarang kualitasnya masih yang terbaik di Midjourney.