- Web Search: Mencari informasi terbaru di web dan mengembalikan URL kutipan
- File Search: Pencarian semantik/kata kunci dari daftar file yang diunggah
- Computer Use: Mengendalikan komputer dan menjalankan tugas
- Responses API: Antarmuka respons terpadu tingkat lanjut. Mendukung input teks/gambar dan dapat menggunakan fitur pencarian web/file serta CUA
- Agents SDK: Kerangka orkestrasi untuk pengembangan agen
- Sebagian pengembang/perusahaan yang memenuhi syarat dapat membantu meningkatkan model dengan membagikan prompt ke OpenAI
- Hingga akhir April tahun ini, tersedia penggunaan gratis sampai 1 juta token per hari untuk
gpt-4.5-preview, gpt-4o, o1, dan sampai 10 juta token untuk gpt-4o-mini, o1-mini, o3-mini
- Kelayakan dapat dicek di OpenAI Developer Dashboard
- Dapat mencari informasi langsung di web untuk memberikan informasi terbaru di ChatGPT
- Melalui Chat Completions API, model yang telah disesuaikan dan alat pencarian dapat digunakan secara langsung
- Cara penggunaan pencarian web di Chat Completions API
- Model selalu mencari informasi terbaru di web sebelum memberikan respons
- Jika ingin alat pencarian web (
web_search_preview) hanya digunakan saat diperlukan, harus beralih ke Responses API
- Model yang mendukung pencarian web
gpt-4o-search-preview
gpt-4o-mini-search-preview
- Memungkinkan model mencari informasi relevan dari file pengguna sebelum menghasilkan respons
- Tersedia di Responses API, dan mencari informasi dari basis pengetahuan file yang diunggah melalui pencarian semantik dan pencarian kata kunci
- Pemanfaatan Vector Store dan pencarian semantik
- Dengan membuat Vector Store dan mengunggah file, pengetahuan dasar model dapat diperluas
- Ini adalah alat yang dikelola OpenAI, sehingga pengguna tidak perlu mengimplementasikan kodenya sendiri
- Jika model menilai perlu, alat akan dipanggil otomatis untuk mencari informasi dari file dan membuat respons
- Cara penggunaan
- Pertama, perlu menyiapkan basis pengetahuan di Vector Store dan mengunggah file
- Setelah Vector Store dikonfigurasi, alat
file_search dapat ditambahkan ke daftar alat yang tersedia bagi model
- Saat ini pencarian hanya dapat dilakukan pada satu Vector Store dalam satu waktu (hanya satu ID Vector Store yang dapat digunakan)
- Berbasis model Computer-Using Agent (CUA) yang dapat menjalankan tugas di komputer pengguna
- Menggabungkan pemrosesan visual dan kemampuan penalaran tingkat lanjut dari GPT-4o untuk mengendalikan antarmuka komputer dan menjalankan tugas
- Disediakan melalui Responses API, dan tidak dapat digunakan di Chat Completions
- Saat ini masih versi beta, sehingga ada kemungkinan kerentanan atau kesalahan. Tidak disarankan digunakan pada lingkungan yang sepenuhnya terautentikasi atau untuk tugas penting
- Cara kerja
- Model mengirim perintah kerja komputer seperti klik(x, y) dan input(text)
- Kode pengguna menjalankan tindakan tersebut di lingkungan komputer atau browser dan mengembalikan tangkapan layar hasilnya
- Model memahami status lingkungan berdasarkan tangkapan layar dan mengusulkan tindakan berikutnya
- Melalui loop berkelanjutan, berbagai tugas seperti klik, input, dan scroll dapat diotomatisasi
- Contoh penggunaan: pemesanan penerbangan, pencarian produk, pengisian formulir
- Antarmuka model OpenAI yang paling maju
- Mendukung input teks dan gambar, serta menghasilkan output teks
- Menyediakan interaksi stateful yang memungkinkan output dari respons sebelumnya digunakan sebagai input berikutnya
- Kemampuan dapat diperluas
- Kemampuan model dapat diperluas melalui alat bawaan
- File Search – Dapat melakukan pencarian semantik dan kata kunci pada file yang diunggah
- Web Search – Dapat mencari informasi web terbaru
- Computer Use – Dapat mengendalikan antarmuka komputer dan menjalankan tugas otomatis
- Function Calling – Dapat mengakses sistem dan data eksternal
- Dapat memanggil fungsi Python dan berinteraksi dengan sistem eksternal
- Memungkinkan pengembangan aplikasi AI berbasis Agent dengan paket yang sederhana dan mudah digunakan tanpa abstraksi yang rumit
- Merupakan versi peningkatan level produksi dari platform eksperimen sebelumnya, Swarm
- Komponen utama (Primitive):
- Agents – Agen berbasis LLM dengan instruksi dan alat
- Handoffs – Mendelegasikan tugas tertentu ke agen lain
- Guardrails – Validasi dan penyaringan nilai input agen
- Integrasi Python dan fitur yang kuat
- Saat digunakan bersama Python, dapat membangun relasi antartool yang kuat dan mengimplementasikan workflow yang kompleks
- Termasuk fitur Tracing untuk visualisasi dan debugging
- Mendukung evaluasi, debugging, hingga fine-tuning model
- Fitur utama Agents SDK
- Prinsip desain
- Cukup kuat dari sisi kemampuan, namun dengan sedikit hal yang perlu dipelajari sehingga cepat dikuasai
- Memberikan performa yang baik secara default, dengan opsi pengaturan rinci bila diperlukan
- Fitur dasar
- Agent Loop: Loop bawaan yang otomatis menangani pemanggilan alat → pemrosesan hasil → pembuatan respons LLM → hingga selesai
- Desain Python-first: Dapat menghubungkan dan mengorkestrasi agen dengan langsung memanfaatkan fitur bahasa Python
- Handoffs: Dapat mendelegasikan dan mengoordinasikan tugas antar banyak agen
- Guardrails: Melakukan validasi input dan pengecekan paralel, serta dapat menghentikan proses lebih awal saat terjadi kesalahan
- Function Tools: Mengubah fungsi Python menjadi alat secara otomatis → sekaligus membuat dan memvalidasi skema secara otomatis
- Tracing: Dengan fitur tracing bawaan, workflow dapat divisualisasikan, di-debug, dievaluasi, dan ditingkatkan
Belum ada komentar.