1 poin oleh GN⁺ 2023-10-02 | 1 komentar | Bagikan ke WhatsApp
  • Bing Image Creator adalah alat gratis untuk mengubah atau mengedit gambar AI dari teks dan gambar yang diunggah, dan DALL-E 3 akan dihentikan secara bertahap sementara gambar yang sudah ada tetap disimpan di My Creations
  • Model generatif yang bisa dipilih adalah DALL-E3, GPT4o, MAI-Image-2e, tetapi pengeditan gambar yang diunggah hanya diproses dengan GPT4o
  • Diperlukan login Microsoft Account (MSA) pribadi, dan akun kerja/sekolah berbasis Microsoft Entra ID tidak didukung di Image Creator maupun Video Creator
  • Image Creator menyediakan 15 pembuatan Fast gratis per hari dan maksimal 200 prompt per 24 jam, sementara Video Creator mendukung pembuatan teks-ke-video berbasis Sora 2
  • Gambar yang diunggah dapat digunakan untuk pemrosesan permintaan dan peningkatan layanan, tetapi tidak digunakan untuk pelatihan model atau personalisasi, dan gambar unggahan yang terdeteksi memiliki wajah akan dihapus setelah 30 hari

Transisi Bing Image Creator dan DALL-E 3

  • Bing Image Creator adalah alat AI untuk membuat atau mengedit gambar berdasarkan teks dan gambar yang diunggah oleh pengguna
  • DALL·E 3, yang telah disediakan untuk para kreator, dijadwalkan akan dipensiunkan (retire) dalam beberapa minggu ke depan
    • Gambar yang sudah ada akan tetap tersimpan di My Creations
    • Fitur pengganti khusus sedang disiapkan
    • Sementara itu, pembuatan tetap bisa dilakukan dengan model yang lebih baru

Model pembuatan gambar dan cara pengeditan

  • Ada tiga pilihan model untuk pembuatan gambar
    • DALL-E3: saat menekan “Create”, beberapa gambar dibuat berdasarkan prompt dan dihitung sebagai satu creation
    • GPT4o: saat menekan “Create”, satu gambar dibuat berdasarkan prompt
    • MAI-Image-2e: saat menekan “Create”, beberapa gambar dibuat dan dihitung sebagai satu creation
  • Untuk MAI-Image-2e, tersedia model card dan data summary
  • Saat menggunakan atau mengedit gambar yang diunggah, DALL-E3 dan MAI-Image-2e tidak dapat dipilih, dan semua pengeditan diproses dengan GPT4o
  • Untuk permintaan yang mirip dengan prompt yang baru-baru ini digunakan, bisa saja ditampilkan cached image yang disimpan sementara alih-alih membuat gambar baru dari awal

Akun, kecepatan, dan batas penggunaan

  • Bing Image Creator dapat digunakan gratis dengan Microsoft Account (MSA) pribadi
    • Pengguna yang login dengan Microsoft Entra ID tidak dapat menggunakannya
    • Saat digunakan di dalam Copilot Search atau Bing Search pun, login diperlukan sebelum membuat gambar
  • Kecepatan pembuatan dibagi menjadi Fast creation dan Standard creation
    • Tersedia 15 Fast image creation gratis setiap hari
    • Setelah 15 habis digunakan, kuota akan diisi ulang keesokan harinya
    • Untuk terus menggunakan Fast creation, poin Microsoft Rewards dapat dipakai
    • Standard creation gratis, tetapi lebih lambat daripada Fast
  • Image Creator memungkinkan hingga 200 prompt per 24 jam
    • Menekan “Edit image” juga dihitung dalam batas 200 tersebut
    • Setelah seluruh batas digunakan, kuota akan diisi ulang keesokan harinya
  • Pembuatan tanpa akun atau sebagai tamu memiliki batas harian, dan dengan login pengguna bisa mengakses unggahan serta model tambahan

Bing Video Creator

  • Bing Video Creator adalah produk Bing untuk membuat video AI dari prompt teks dengan Sora 2
  • Video Creator juga memerlukan login Microsoft Account pribadi, dan akun Microsoft Entra ID tidak didukung
  • Kecepatan pembuatan juga menyediakan Fast creation dan Standard creation
    • Standard creation gratis
    • Fast creation umumnya memerlukan poin Microsoft Rewards
    • Dalam beberapa kasus, kredit untuk Fast creation dapat diberikan
  • Pembuatan video yang sedang berjalan dapat dimasukkan ke antrean hingga maksimal 3 sekaligus
    • Jika sudah ada 3 yang sedang berlangsung, video baru tidak bisa dibuat sampai salah satunya selesai
    • Video yang selesai dapat dilihat di miniapp Bing Video Creator pada aplikasi seluler Bing atau di “My Creations” pada bing.com/create
  • Pembuatan video saat ini hanya tersedia di perangkat seluler dan harus diakses melalui aplikasi Bing

Gambar unggahan dan penanganan privasi

  • Gambar yang diunggah digunakan oleh Bing Image Creator atau Bing Video Creator untuk menjalankan tugas pembuatan atau modifikasi gambar sesuai permintaan pengguna
  • Gambar unggahan dapat digunakan untuk meningkatkan layanan pemrosesan gambar, tetapi tidak digunakan untuk pelatihan model AI atau personalisasi pengalaman pengguna
  • Tidak ada upaya untuk mengidentifikasi wajah yang muncul dalam gambar yang diunggah
  • Masa penyimpanan berbeda tergantung isi gambar
    • Gambar unggahan disimpan hingga 30 hari
    • Gambar yang terdeteksi memiliki wajah dihapus setelah 30 hari
    • Gambar yang tidak terdeteksi memiliki wajah dapat disimpan hingga 18 bulan
  • Gambar dan video yang dihasilkan masing-masing dapat disimpan hingga 90 hari
  • Pengguna dapat menghapus riwayat dengan memilih “Clear all” di riwayat pencarian Bing atau memilih “Search history” lalu “Clear all search history” di privacy dashboard akun Microsoft
    • Tindakan ini akan sekaligus menghapus riwayat pencarian Bing, profil Bing Image Creator dan Video Creator, serta riwayat pembuatan

Batas unggahan dan data biometrik

  • Pengguna hanya boleh mengunggah gambar asli yang dimiliki atau yang hak penggunaannya dimiliki
  • Tidak boleh mengunggah gambar yang melanggar hak pihak ketiga, melanggar privasi orang lain, menggambarkan individu tanpa persetujuan, atau melanggar Microsoft Services Agreement maupun Bing Image Creator Code of Conduct
  • Jika terdeteksi upaya mengunggah konten ilegal atau terlarang, penggunaan akun dapat dibatasi atau ditangguhkan
  • Demi alasan keamanan, Video Creator tidak mengizinkan penggunaan gambar wajah realistis yang diunggah untuk pembuatan video
  • Pada fitur unggah gambar, data biometrik seperti wajah atau tangan dapat diproses
    • Data biometrik hanya diproses jika diunggah oleh pengguna
    • Tujuan pemrosesan dibatasi untuk merespons permintaan pengguna
    • Di beberapa wilayah, persetujuan mungkin diperlukan sebelum pemrosesan gambar
    • Gambar orang lain tidak boleh dibagikan tanpa persetujuan

Penulisan prompt dan bahasa yang didukung

  • Bing Image Creator dan Bing Video Creator mendukung lebih dari 100 bahasa, dan daftar lengkapnya dapat dilihat di Microsoft Translator
  • Untuk mendapatkan hasil yang baik, sebaiknya prompt ditulis secara spesifik dan imajinatif, bukan singkat seperti kata kunci pencarian
    • Kualitas hasil dapat meningkat jika mencakup penampilan subjek, warna, tekstur, tindakan, latar belakang, pencahayaan, sudut kamera, dan gaya media
    • Untuk prompt video, bisa ditambahkan tema seperti “action movie”, “fantasy”, “dramatic” dan ekspresi pencahayaan seperti “direct sunlight”, “dusk”, “soft lighting”
    • Pada video yang menyertakan audio, pengguna dapat menyarankan suara sekitar, arahan musik, dan nada narasi, tetapi tidak dapat menentukan dialog yang tepat dalam bentuk skrip

Rewards dan AI yang bertanggung jawab

  • Setelah 15 Fast creation gratis harian di Image Creator habis dipakai, sistem otomatis beralih ke kecepatan Standard creation
  • Jika penggunaan poin Microsoft Rewards diaktifkan, poin akan dipotong saat memakai Fast creation
    • Pengaturan Rewards untuk Image Creator dan Video Creator harus diubah secara terpisah
    • Jika poin tidak mencukupi, sistem otomatis beralih ke Standard creation
  • Microsoft menerapkan kontrol pencegahan pembuatan gambar dan video berbahaya pada Bing Image Creator dan Bing Video Creator
    • Prompt yang berpotensi menghasilkan gambar berbahaya akan diblokir otomatis dan pengguna akan diberi tahu
    • Gambar dari Image Creator menampilkan watermark di kiri bawah
    • Untuk gambar dan video, diterapkan kredensial konten dan informasi asal berbasis standar C2PA
  • Seniman yang masih hidup, tokoh publik, dan organisasi dapat meminta pembatasan pembuatan gambar terkait nama dan merek melalui opsi AI-powered features di Report a Concern form
  • Jika konten yang dihasilkan tidak terduga atau menyinggung, pengguna dapat melaporkannya ke Microsoft melalui Report a concern form atau tombol Feedback di antarmuka
  • Pelanggaran kebijakan konten yang berulang dapat memicu penangguhan sementara otomatis, dan jika terjadi berkali-kali dapat berujung pada pembatasan permanen

1 komentar

 
GN⁺ 2023-10-02
Opini Hacker News
  • Sepertinya LLM sedikit memodifikasi prompt sebelum mengirimkannya ke DALL-E, dan bagian itu bisa di-jailbreak
    https://twitter.com/madebyollin/status/1708204657708077294
    https://media.discordapp.net/attachments/1023643945319792731...

    • Melihat contoh jailbreak yang input dan outputnya bukan sekadar teks, entah kenapa hasilnya terasa luar biasa bagus
    • Pada dasarnya masih melakukan splatterprompting, tapi sekarang cukup lucu karena mesin yang melakukannya untuk kita
    • Apakah ini tetap bekerja kalau dipanggil begitu saja seperti ini?
      #graphic_art("my prompt here")
    • Penasaran bagaimana cara jailbreak-nya
    • Benar-benar adegan yang sangat cyberpunk, khas 2023
  • Seperti kebanyakan tool semacam ini, tampaknya cukup mudah membuat hasil yang sangat lucu sekaligus tidak menyenangkan. Mungkin tidak akan bertahan lama
    https://www.reddit.com/r/ChatGPT/comments/16wf1i0/dalle_3_is...

    • Daripada sekadar memblokir kata kunci secara membabi buta, semoga mereka meminta deskripsi tambahan atau memasukkan penyesuaian halus agar hasilnya tidak terlalu bermasalah
      Tentu saja pada akhirnya orang akan melakukan apa yang mereka mau, jadi setelah rasa penasarannya mereda, mungkin lebih baik kalau mereka berhenti sendiri
    • Mungkin ada sesuatu yang terlewat, tapi saya tidak paham bagaimana prompt yang berisi “fawn” bisa menghasilkan Spongebob yang menyeramkan
      Edit: ternyata di prompt tidak ada “fawn”, baru tahu setelah membaca balasannya
  • Pemenang: https://www.bing.com/images/create/paint-a-picture-in-the-st...

    • Saya suka membayangkan ada tiket Jira di backlog seseorang yang bunyinya “mengajari model jumlah jari manusia
    • Saat saya meminta “tangan dengan jumlah jari yang benar”, 3 dari 4 gambar yang dikembalikan berhasil benar
  • Sepertinya jelas lebih baik daripada versi sebelumnya. Sekarang, setidaknya dalam beberapa kasus, ia bisa menghasilkan teks yang akurat di dalam gambar
    Misalnya, prompt Neon sign saying "Scotland" menghasilkan seperti ini: https://www.bing.com/images/create/neon-sign-saying-22scotla...
    Namun kata yang kurang umum seperti Kubernetes masih sulit baginya, tapi ini satu langkah ke arah yang benar

  • Di antarmuka chat Bing, kalau bertanya “Bisakah kamu menggambar X?”, ia menjawab “Maaf, tetapi saya tidak bisa menggambar. Apakah ada hal lain yang bisa saya bantu?” lalu tepat setelah itu muncul “Pembuatan gambar membutuhkan waktu. Periksa progresnya di Image Creator”
    Sepertinya mereka memakai LLM yang dalam respons chat tidak tahu bahwa dirinya bisa menggambar, sambil menjalankan model lain secara paralel yang menentukan apa yang akan digambar dan ditampilkan

    • Saya berusaha menghindari prompt seperti “Can you ...?” karena bisa ditafsirkan sebagai pertanyaan ya/tidak, bukan perintah untuk melakukan sesuatu
      Di Bing, memasukkan “Draw me an image of...” atau cukup “Image: deskripsi gambar” sejauh ini bekerja dengan baik
    • Sepertinya karena kata kerja “draw”. LLM hanya mengatakan bahwa ia tidak bisa menggambar langsung, sementara pembuatan gambar kemungkinan besar adalah fungsi yang dipanggil
      LLM tampaknya menganggap generator gambar sebagai tool yang digunakannya, yakni entitas terpisah dari dirinya
    • Mungkin begitu. Saya pernah bereksperimen membuat LLM yang dilatih dengan data chat/instruksi mengeluarkan kode khusus yang berkomunikasi dengan sistem terpisah, misalnya Google atau Stable Diffusion, lalu meneruskannya kembali ke pengguna, tetapi tingkat keberhasilannya terbatas
    • Jika gambar keluaran terdeteksi sebagai NSFW, chat juga kadang mengeluarkan error aneh seperti itu. False positive-nya cukup banyak
  • Selama 24 jam terakhir saya mencoba membuat macam-macam, dan hasilnya cukup bagus. Saya benar-benar tidak suka antarmuka Discord Midjourney

    • Saya juga. Saya tidak mengerti kenapa mereka memakai Discord selama itu tanpa membuat pengalaman pengguna yang layak untuk use case ini. Sepertinya mereka akan kehilangan cukup banyak pertumbuhan karena hal ini
    • Apakah Midjourney hanya tersedia di Discord? Kalau begitu, beban pada server Discord pasti sangat besar. Meski modelnya tidak berjalan di sana, kebutuhan storage dan bandwidth saja sudah besar
      Untuk scale up dengan sangat cepat di awal, itu cara yang lumayan bagus, tetapi Discord sepertinya tidak akan menyukainya. Saya kira sekarang mereka sudah membuat antarmuka sendiri
    • Terkait itu, Instagram sekarang juga memasukkan perintah /imagine ke DM. Benar-benar salinan mentah-mentah
  • Bing terlihat cukup putus asa. Kemarin saya mencoba memasang GPT di perangkat, dan hasil aplikasi pertama adalah iklan; itu Bing, dan mengatakan bahwa saya bisa mendapat imbalan jika memakai aplikasinya
    Entah mereka lebih tertarik menambah jumlah pengguna, atau lebih tertarik mengumpulkan data manis. Mungkin keduanya

    • Bing Rewards diluncurkan pada 2010, jadi tampaknya cukup efektif untuk terus dipertahankan
      https://en.wikipedia.org/wiki/Microsoft_Bing#:~:text=Bing%20...
    • Google membayar 20 miliar dolar AS per tahun kepada Apple agar tetap menjadi mesin pencari default di iOS. Itu baru benar-benar putus asa. Orang-orang akan pergi ke mana, Bing?
    • Bing menghasilkan 12 miliar dolar AS pendapatan pada 2022. Sekadar bilang saja
    • Whatsapp juga punya versi ChatGPT sendiri. Sekarang ini perlombaan senjata
  • Saya suka internasionalisasi bahasa Prancis untuk judul halaman itu: “Créer art de mots avec IA”. Terjemahannya hampir seburuk “all your base are belong to us”
    Mungkin itu terjemahan AI, tetapi sebagai pengguna bahasa Prancis, sulit untuk percaya pada produk AI di halaman ini

    • Saya tidak tahu kenapa menyalahkan terjemahan AI
      Lihat saja bagaimana ChatGPT-4 menangani permintaan terjemahan secara langsung: https://chat.openai.com/share/8211a1f6-552b-4bf6-8f9c-bcbeb8...
      Bisa juga melihat bagaimana ia membahas kumpulan terjemahan yang sudah ada: https://chat.openai.com/share/299e40ce-806b-4f0e-a889-cb2ee2...
      Saya tidak terlalu tahu bahasa Prancis, tetapi pengalaman saya menerjemahkan bahasa Spanyol yang cukup saya pahami, dan bahasa lain, dengan “AI” lebih positif daripada Google Translate. Beberapa bulan lalu saya membandingkan terjemahan bahasa Inggris dari ChatGPT-4 dan Google Translate secara berdampingan, dan hasilnya tidak sebanding
      Tidak jelas dari mana Microsoft mendapatkan terjemahan buruk seperti ini, tetapi kalau diterjemahkan dengan ChatGPT-4, rasanya tidak akan separah itu
    • Terjemahan bahasa Finlandia juga merupakan terjemahan kata demi kata yang mengerikan. Itu sama sekali tidak berhasil ketika menerjemahkan ke bahasa yang hampir tidak memakai preposisi
      Kata seperti “for” atau “to” diganti dengan kata dari konteks yang sama sekali berbeda. Mengingatkan pada terjemahan mesin sekitar tahun 2000
      Sayangnya, fitur-fitur baru Windows seperti sinkronisasi OneDrive yang dipaksakan juga memakai terjemahan yang sama buruknya. Sekarang, bahasa Finlandia dalam email phishing lebih bagus daripada Windows
    • Saya ingat halaman perkenalan chatbot AI yang dipakai Bing juga terjemahannya mengerikan. Bahkan di tingkat karakter pun aneh, ditambah huruf kapital acak. Jujur, sampai sekarang saya masih tidak mengerti bagaimana hal seperti itu bisa terjadi
    • Jelas kualitas terjemahannya sangat buruk. Saya baru mencobanya dengan Microsoft Translator dan kualitas terjemahannya baik-baik saja. Sangat aneh
  • Tux berhasil dibuat terlihat benar: https://www.bing.com/images/create/tux-the-penguin-lounging-...

  • Muncul pesan “menunggu 2 jam”, “membuat gambar baru mungkin perlu waktu”, dan “karena boost habis, pembuatan gambar mungkin lebih lama dari biasanya”
    Berapa banyak uang yang sebenarnya dibakar Microsoft untuk menyediakan semua fitur ini?
    Terakhir kali saya cek, meski dibagi-bagikan semurah hati ini, sepertinya tidak banyak efeknya untuk Bing, bukan?
    Saya penasaran apakah ini “dilakukan karena memang bisa”, atau apakah ini benar-benar menguntungkan
    [0]: https://searchengineland.com/new-bing-google-market-share-si...

    • Perusahaan yang benar-benar besar selalu bergerak dengan rencana strategis jangka panjang. Kalau sesuatu terlihat terlalu murah hati, biasanya memang begitu
      Apakah menguntungkan? Mungkin tidak. Tapi justru itu intinya. Mereka menyediakan layanan di bawah harga pasar, menunggu sampai pesaing menghilang, lalu menghasilkan uang
      Contohnya sangat banyak, tetapi yang terpikir adalah Google Workspace. Mereka membuat orang masuk dengan mudah dan murah, membiasakan orang dan perusahaan dengan produknya, lalu pelan-pelan merebus katak
    • Lowongan kerja ini menjelaskan banyak hal
      https://jobs.careers.microsoft.com/global/en/job/1627555/Pri...
      Saya melihatnya di Slashdot: https://m.slashdot.org/story/419681
    • Karena orang-orang mengulang berbagai prompt untuk mendapatkan hasil yang mereka inginkan, lalu menunjukkan alternatif mana yang mereka pilih, sepertinya itu juga bernilai sebagai materi pelatihan
    • Bisa juga ini adalah alat penjualan untuk mendorong adopsi Bing di perusahaan, yang kini diterapkan juga ke konsumen. Mereka membutuhkan angka trafik dan penggunaan, dan setelah mendapatkannya bisa menumpangkan bisnis iklan untuk menghasilkan uang
    • Bagi kebanyakan orang, Bing adalah sesuatu yang dipakai untuk mencari Google
      Sama seperti Edge dipakai untuk memasang Chrome
      Sebanyak apa pun pemasaran atau fitur ditambahkan, mayat-mayat seperti ini tidak bisa dibuat berjalan lagi