- Google merilis fitur pembuatan gambar melalui model Gemini 2.0 Flash sebagai pratinjau untuk pengembang
- Dengan perintah berbasis teks, pengguna dapat membuat, memodifikasi, dan mengedit sebagian gambar, serta kualitas visual dan rendering teks juga ditingkatkan
- Diperkenalkan berbagai kasus penggunaan seperti reskin produk, pembuatan SKU, dan pengeditan kolaboratif real-time
- Dapat langsung diuji melalui [Google AI Studio] dan [Vertex AI], dan batas penggunaan API juga telah ditingkatkan
Pratinjau fitur pembuatan gambar Gemini 2.0 Flash dirilis
- Berdasarkan masukan dari para pengembang, Google menyediakan fitur pembuatan gambar melalui model Gemini 2.0 Flash dalam versi pratinjau
- Pengguna dapat mengaksesnya melalui Google AI Studio atau Vertex AI
Peningkatan utama
- Kualitas visual ditingkatkan (dibandingkan versi eksperimen sebelumnya)
- Akurasi rendering teks ditingkatkan
- Tingkat pemblokiran oleh filter berkurang
Contoh fitur pembuatan gambar yang dapat dimanfaatkan
- Penggantian latar belakang gambar produk: foto produk yang ada dapat disusun ulang dengan berbagai latar dan lingkungan
- Pengeditan kolaboratif real-time: di aplikasi Gemini Co-Drawing, tersedia dukungan pengeditan gambar real-time oleh banyak pengguna
- Pengeditan interaktif hanya pada sebagian gambar: tanpa mengubah keseluruhan, hanya area tertentu yang dapat dimodifikasi melalui perintah percakapan
- Pembuatan SKU produk secara dinamis: dengan menggabungkan gambar dan teks, varian produk baru (warna, label, dll.) dapat dibuat otomatis
- Kolaborasi brainstorming dengan Gemini: melalui kombinasi teks + gambar, berbagai skenario seperti masakan, produk, dan perencanaan dapat diwujudkan
Contoh penggunaan API (Python)
from google import genai
from google.genai import types
client = genai.Client(api_key="GEMINI_API_KEY")
response = client.models.generate_content(
model="gemini-2.0-flash-preview-image-generation",
contents=("Show me how to bake a macaron with images."),
config=types.GenerateContentConfig(
response_modalities=["TEXT", "IMAGE"]
),
)
Rencana ke depan
- Google berencana terus memperluas fitur ini melalui kualitas yang lebih tinggi, penambahan fungsi, peningkatan kecepatan, dan perbaikan paket harga
- Untuk dokumentasi lebih lanjut, lihat panduan pembuatan gambar Gemini API
1 komentar
Komentar Hacker News