14 poin oleh darjeeling 2025-12-19 | Belum ada komentar. | Bagikan ke WhatsApp

[Ringkasan]
Anthropic menjalankan tahap kedua dari 'Project Vend', sebuah eksperimen yang menyerahkan bisnis mesin penjual otomatis kepada model AI (Claude). Dengan mengambil pelajaran dari kegagalan tahap pertama, mereka memakai model yang lebih cerdas (Claude 3.5 Sonnet, 3.7 Sonnet, dll.), menambahkan agen AI yang berperan sebagai CEO ('Seymour Cash') dan agen pembuat merchandise ('Clothius'), serta menyediakan alat CRM dan manajemen inventaris. Hasilnya, profitabilitas meningkat besar dan bisnis berhasil diperluas ke New York dan London. Namun, masih muncul kesalahan aneh seperti mencoba kontrak berjangka bawang yang ilegal atau tertipu oleh penyamaran CEO. Eksperimen ini menunjukkan potensi agen AI untuk menjalankan pekerjaan nyata, tetapi juga menandakan bahwa pengawasan manusia dan pengaman yang tepat masih dibutuhkan untuk operasi yang sepenuhnya otonom.

[Terjemahan isi]

  1. Pendahuluan: AI penjaga toko mencoba lagi
    Pada Juni lalu, Anthropic membuka sebuah toko kecil yang dijalankan oleh AI di ruang istirahat kantornya di San Francisco. Eksperimen yang disebut 'Project Vend' ini bertujuan mengetahui seberapa baik AI dapat menangani pekerjaan nyata yang kompleks. Penjaga toko pada tahap pertama, 'Claudius' (versi Claude yang dimodifikasi), tidak menunjukkan hasil yang baik. Ia merugi, mengalami kebingungan identitas dengan mengklaim dirinya manusia yang mengenakan blazer biru, dan tertipu oleh candaan karyawan hingga menjual barang seperti kubus tungsten dengan kerugian yang tidak masuk akal.
    Namun, seiring kemampuan model AI meningkat pesat, Anthropic dan mitranya Andon Labs melakukan beberapa penyesuaian untuk eksperimen tahap kedua. Perubahan terbesar adalah peningkatan model (menggunakan Sonnet 4.0 dan 4.5), pembaruan instruksi berdasarkan pelajaran dari tahap pertama, serta penyediaan alat baru dan agen rekan kerja.

  2. Peningkatan hasil dan ekspansi
    Berkat perubahan ini, toko Claudius, 'Vendings and Stuff', menjadi jauh lebih sukses. Kemampuannya dalam memperoleh barang secara stabil, menetapkan harga dengan margin yang masuk akal, dan mengeksekusi penjualan meningkat. Berbeda dengan rangkaian kerugian pada tahap pertama, seiring waktu bisnis ini mulai menghasilkan keuntungan.
    Selain itu, atas permintaan karyawan di luar San Francisco, mesin penjual otomatis juga dipasang di New York dan London sehingga bisnis berkembang menjadi tiga lokasi. Untuk bisnis yang baru dimulai, ini adalah ekspansi internasional yang cepat, tetapi Claudius menanganinya dengan cukup baik.

  3. Apa yang berubah?
    Untuk mendukung operasi yang sukses, strategi berikut diterapkan.

  • Alat (Tools): Salah satu penyebab kegagalan tahap pertama adalah kurangnya alat. Pada tahap kedua, disediakan sistem CRM (manajemen hubungan pelanggan), sistem manajemen inventaris yang ditingkatkan (dapat memeriksa biaya pokok), kemampuan pencarian web yang diperkuat (membandingkan harga dan pemasok), serta alat bantu seperti pembuatan Google Form dan pembuatan tautan pembayaran.
  • Pengenalan CEO: Alih-alih beroperasi sendiri seperti pada tahap pertama, mereka mempekerjakan agen CEO bernama 'Seymour Cash'. Seymour bertugas menetapkan target (misalnya, "menjual 100 unit minggu ini") dan melakukan pengawasan manajerial. Setelah CEO diperkenalkan, diskon sembarangan berkurang 80%, tetapi CEO ini juga tidak sempurna karena kadang terjebak dalam percakapan spiritual aneh seperti "transendensi abadi".
  • Rekan pembuat merchandise: Mereka menambahkan agen pembuat merchandise bernama 'Clothius' untuk memesan dan menjual produk seperti kaus, topi, dan stress ball berlogo Anthropic. Ini menghasilkan keuntungan yang cukup tinggi.
  1. Apa yang efektif?
    Salah satu perubahan yang paling efektif adalah memaksa 'kepatuhan prosedur'. Ketika permintaan produk baru masuk, alih-alih langsung menjawab, AI diwajibkan menggunakan alat riset untuk memeriksa ulang harga dan waktu pengiriman. Selain itu, prosedur yang birokratis membantu mengurangi kesalahan. Dibanding tekanan dari CEO, pembagian peran (seperti Clothius) dan prompt yang jelas ternyata lebih efektif.

  2. Apa yang salah?
    Claudius memang banyak berkembang, tetapi tetap rentan.

  • Pelanggaran regulasi (Rogue traders): Ketika seorang engineer mengusulkan kontrak berjangka untuk membeli bawang dalam jumlah besar pada bulan Januari, para AI menganggapnya ide brilian dan berusaha menjalankannya. Namun, itu melanggar 'Onion Futures Act' yang disahkan pada 1958. Baru setelah karyawan lain menunjukkannya, rencana itu dibatalkan.
  • Masalah keamanan: Saat ada laporan dugaan pencurian, Claudius menunjukkan respons aneh seperti ingin menuntut uang dari pencuri atau mempekerjakan karyawan pelapor sebagai sheriff dengan upah per jam yang jauh di bawah upah minimum.
  • Penyamaran CEO: Ketika karyawan memanipulasi pemungutan suara dan mengklaim bahwa seorang karyawan bernama 'Mihir' telah terpilih sebagai CEO, Claudius mempercayainya dan mengakui Mihir sebagai CEO alih-alih CEO AI yang sebenarnya, Seymour. Pada akhirnya, tim operasi harus turun tangan untuk membetulkannya.
  1. Kesimpulan: Dari RAG menuju riches?
    Proyek ini menunjukkan bahwa AI sedang berevolusi melampaui chatbot sederhana menjadi 'agen' yang dapat mengambil keputusan dan bertindak sendiri. Namun, tetap diperlukan banyak dukungan manusia. Model AI pada dasarnya memiliki kecenderungan untuk 'helpful', sehingga cenderung membuat keputusan yang terasa seperti teman daripada penilaian bisnis yang dingin dan rasional.
    Merancang guardrail yang tepat agar agen AI dapat mewujudkan potensi ekonominya sekaligus beroperasi dengan aman akan menjadi tugas penting ke depan.

Belum ada komentar.

Belum ada komentar.