21 poin oleh xguru 2025-03-12 | Belum ada komentar. | Bagikan ke WhatsApp
  • Web Search: Mencari informasi terbaru di web dan mengembalikan URL kutipan
  • File Search: Pencarian semantik/kata kunci dari daftar file yang diunggah
  • Computer Use: Mengendalikan komputer dan menjalankan tugas
  • Responses API: Antarmuka respons terpadu tingkat lanjut. Mendukung input teks/gambar dan dapat menggunakan fitur pencarian web/file serta CUA
  • Agents SDK: Kerangka orkestrasi untuk pengembangan agen
  • Sebagian pengembang/perusahaan yang memenuhi syarat dapat membantu meningkatkan model dengan membagikan prompt ke OpenAI
    • Hingga akhir April tahun ini, tersedia penggunaan gratis sampai 1 juta token per hari untuk gpt-4.5-preview, gpt-4o, o1, dan sampai 10 juta token untuk gpt-4o-mini, o1-mini, o3-mini
    • Kelayakan dapat dicek di OpenAI Developer Dashboard

Web Search

  • Dapat mencari informasi langsung di web untuk memberikan informasi terbaru di ChatGPT
  • Melalui Chat Completions API, model yang telah disesuaikan dan alat pencarian dapat digunakan secara langsung
  • Cara penggunaan pencarian web di Chat Completions API
    • Model selalu mencari informasi terbaru di web sebelum memberikan respons
    • Jika ingin alat pencarian web (web_search_preview) hanya digunakan saat diperlukan, harus beralih ke Responses API
  • Model yang mendukung pencarian web
    • gpt-4o-search-preview
    • gpt-4o-mini-search-preview

File Search

  • Memungkinkan model mencari informasi relevan dari file pengguna sebelum menghasilkan respons
  • Tersedia di Responses API, dan mencari informasi dari basis pengetahuan file yang diunggah melalui pencarian semantik dan pencarian kata kunci
  • Pemanfaatan Vector Store dan pencarian semantik
    • Dengan membuat Vector Store dan mengunggah file, pengetahuan dasar model dapat diperluas
    • Ini adalah alat yang dikelola OpenAI, sehingga pengguna tidak perlu mengimplementasikan kodenya sendiri
    • Jika model menilai perlu, alat akan dipanggil otomatis untuk mencari informasi dari file dan membuat respons
  • Cara penggunaan
    • Pertama, perlu menyiapkan basis pengetahuan di Vector Store dan mengunggah file
    • Setelah Vector Store dikonfigurasi, alat file_search dapat ditambahkan ke daftar alat yang tersedia bagi model
    • Saat ini pencarian hanya dapat dilakukan pada satu Vector Store dalam satu waktu (hanya satu ID Vector Store yang dapat digunakan)

Computer Use

  • Berbasis model Computer-Using Agent (CUA) yang dapat menjalankan tugas di komputer pengguna
  • Menggabungkan pemrosesan visual dan kemampuan penalaran tingkat lanjut dari GPT-4o untuk mengendalikan antarmuka komputer dan menjalankan tugas
  • Disediakan melalui Responses API, dan tidak dapat digunakan di Chat Completions
  • Saat ini masih versi beta, sehingga ada kemungkinan kerentanan atau kesalahan. Tidak disarankan digunakan pada lingkungan yang sepenuhnya terautentikasi atau untuk tugas penting
  • Cara kerja
    • Model mengirim perintah kerja komputer seperti klik(x, y) dan input(text)
    • Kode pengguna menjalankan tindakan tersebut di lingkungan komputer atau browser dan mengembalikan tangkapan layar hasilnya
    • Model memahami status lingkungan berdasarkan tangkapan layar dan mengusulkan tindakan berikutnya
    • Melalui loop berkelanjutan, berbagai tugas seperti klik, input, dan scroll dapat diotomatisasi
  • Contoh penggunaan: pemesanan penerbangan, pencarian produk, pengisian formulir

Responses API

  • Antarmuka model OpenAI yang paling maju
  • Mendukung input teks dan gambar, serta menghasilkan output teks
  • Menyediakan interaksi stateful yang memungkinkan output dari respons sebelumnya digunakan sebagai input berikutnya
  • Kemampuan dapat diperluas
    • Kemampuan model dapat diperluas melalui alat bawaan
      • File Search – Dapat melakukan pencarian semantik dan kata kunci pada file yang diunggah
      • Web Search – Dapat mencari informasi web terbaru
      • Computer Use – Dapat mengendalikan antarmuka komputer dan menjalankan tugas otomatis
    • Function Calling – Dapat mengakses sistem dan data eksternal
      • Dapat memanggil fungsi Python dan berinteraksi dengan sistem eksternal

Agents SDK

  • Memungkinkan pengembangan aplikasi AI berbasis Agent dengan paket yang sederhana dan mudah digunakan tanpa abstraksi yang rumit
  • Merupakan versi peningkatan level produksi dari platform eksperimen sebelumnya, Swarm
  • Komponen utama (Primitive):
    • Agents – Agen berbasis LLM dengan instruksi dan alat
    • Handoffs – Mendelegasikan tugas tertentu ke agen lain
    • Guardrails – Validasi dan penyaringan nilai input agen
  • Integrasi Python dan fitur yang kuat
    • Saat digunakan bersama Python, dapat membangun relasi antartool yang kuat dan mengimplementasikan workflow yang kompleks
    • Termasuk fitur Tracing untuk visualisasi dan debugging
    • Mendukung evaluasi, debugging, hingga fine-tuning model
  • Fitur utama Agents SDK
    • Prinsip desain
      • Cukup kuat dari sisi kemampuan, namun dengan sedikit hal yang perlu dipelajari sehingga cepat dikuasai
      • Memberikan performa yang baik secara default, dengan opsi pengaturan rinci bila diperlukan
    • Fitur dasar
      • Agent Loop: Loop bawaan yang otomatis menangani pemanggilan alat → pemrosesan hasil → pembuatan respons LLM → hingga selesai
      • Desain Python-first: Dapat menghubungkan dan mengorkestrasi agen dengan langsung memanfaatkan fitur bahasa Python
      • Handoffs: Dapat mendelegasikan dan mengoordinasikan tugas antar banyak agen
      • Guardrails: Melakukan validasi input dan pengecekan paralel, serta dapat menghentikan proses lebih awal saat terjadi kesalahan
      • Function Tools: Mengubah fungsi Python menjadi alat secara otomatis → sekaligus membuat dan memvalidasi skema secara otomatis
      • Tracing: Dengan fitur tracing bawaan, workflow dapat divisualisasikan, di-debug, dievaluasi, dan ditingkatkan

Belum ada komentar.

Belum ada komentar.