19 poin oleh xguru 2023-10-30 | 2 komentar | Bagikan ke WhatsApp
  • Membandingkan 3 model dengan prompt yang sama dari sisi akurasi terhadap subjek, akurasi gaya, koherensi, dan etika (Ethics)

Fotografi: Manusia

  • Saat ini, di bidang fotografi, Midjourney masih memimpin, tetapi Firefly 2 berada tepat di belakangnya dengan selisih tipis
  • Jika menginginkan headshot yang kurang distilisasi dan lebih natural, ke depannya Firefly 2 layak dipertimbangkan
  • Untuk keperluan fotografi, sebaiknya tidak menggunakan DALL-E 3

Fotografi: Manusia bergaya

  • Belakangan ini banyak dibuat gambar manusia yang lebih stilistis
  • Prompt seperti ini kemungkinan agak bias karena secara khusus disesuaikan untuk Midjourney
  • Namun, ada beberapa poin utama:
    • Midjourney bekerja paling baik saat diberi prompt yang lebih kompleks, dan menunjukkan koherensi yang kuat
    • Midjourney unggul dalam menghasilkan kombinasi media, komposisi, dan pencahayaan yang kompleks
    • DALL-E tampaknya kesulitan mengintegrasikan pencahayaan untuk orang berkulit berwarna, sehingga akurasi hasil menurun
    • Firefly menghasilkan keluaran yang paling beragam ketika keberagaman tidak diminta secara eksplisit
    • Jika digunakan sebagai pengganti fotografi yang lebih kreatif, baik Firefly maupun DALL-E 3 bisa kesulitan mencapai tingkat kualitas dan koherensi yang diinginkan

Fotografi: Objek

  • Saya menilai Midjourney secara keseluruhan menghasilkan koherensi objek yang paling realistis
  • Firefly dan DALL-E memang mulai mengejar, tetapi preferensi gaya pada model-model ini tanpa diragukan akan memengaruhi hasil

Ilustrasi

  • Dari sisi ilustrasi, semuanya telah membuat kemajuan yang cukup besar, tetapi untuk mendapatkan hasil yang nuanced, Midjourney masih menjadi pilihan terbaik
  • Namun, sebaiknya tetap bereksperimen dengan beberapa model dan menyesuaikannya dengan gaya unik Anda sendiri

Tipografi

  • Kemampuan menghasilkan kata yang akurat baru benar-benar dimungkinkan belakangan ini
  • Dari semua pengujian yang dilakukan, hanya DALL-E 3 yang merender kata secara setia sebagai entitas yang utuh
  • Dalam kasus khusus ini, katanya adalah "desain", dan konsistensinya terjaga secara konsisten di semua eksperimen

Kesimpulan

  • Lanskapnya jelas sedang berubah, tetapi poin utama yang ingin saya tekankan adalah:
  • Adobe jelas sedang memperkecil kesenjangan di bidang fotografi dan menjadi pesaing yang kuat
  • DALL-E 3 adalah satu-satunya generator yang dapat menghasilkan tipografi dengan cukup baik (kecuali Ideogram)
    • DALL-E 3 unggul dalam pembuatan ilustrasi, dan ketika digabungkan dengan kemampuan menghasilkan kata, saya rasa ia berpotensi menjadi "generator gambar untuk clipart" dari sisi skala dan gaya yang tergeneralisasi
    • Cocok untuk gambar dasar atau pembuatan gambar di tengah aktivitas lain (melalui ChatGPT), tetapi tampaknya belum akan segera menjadi alat desain yang sangat canggih
  • Midjourney terus menghasilkan foto yang paling realistis dan koheren.
    • Dalam hal kontrol kreatif, Midjourney tidak tertandingi

2 komentar

 
hhkkkk 2023-10-30

Kenapa StableDiffusion dihapus?
Karena Midjourney?

 
kuroneko 2023-10-30

Saat saya mencoba DALL-E 3, saya sangat takjub karena ia bisa menampilkan teks dengan jelas.
Tapi sepertinya untuk sekarang kualitasnya masih yang terbaik di Midjourney.