Saat ini saya telah mengembangkan fitur yang menyediakan layanan pengumpulan berita/informasi dari 32 negara serta snapshot harian negara-negara utama (AS, Jepang, Inggris, Korea) dan pasar koin/futures melalui MCP (Model Context Protocol). Berdasarkan ini, saat ini saya sedang mengembangkan program investasi yang memungkinkan perilaku bebas mirip OpenClaw.
Ada dua hal yang sedang saya pikirkan.
-
Koeksistensi antara 'kebebasan' AI dan UI frontend
Sambil tetap menyediakan UI dan fitur yang sudah ditentukan seperti perangkat lunak konvensional, saya juga mengubah tiap fitur menjadi API agar IDE atau AI dapat memahaminya dan mengendalikannya secara sempurna. Pada akhirnya, saya berpikir pengembangan perangkat lunak di masa depan akan berfokus pada seberapa bebas AI dapat memperluas dan menjalankan fitur, yaitu pada 'kebebasan AI'. Saya ingin tahu pendapat kalian. -
Perubahan pengalaman pengguna: era "tolong lakukan ini"
Ke depannya, pengguna akan berharap mendapatkan hasil yang mereka inginkan hanya dengan perintah sederhana seperti "tolong lakukan ini". Bahkan untuk fungsi yang belum didefinisikan sebelumnya oleh pengembang, saya melihat AI perlu memenuhi kebutuhan pengguna dengan langsung menelusuri internet atau menulis kode. (Contoh: bahkan program hukum pun, jika pengguna menginginkannya, sampai pada tingkat membantu memesan tiket pesawat)
Jika teknologi harus memberikan kenyamanan maksimal kepada pengguna, sampai sejauh mana kita para pengembang perlu memikirkan 'ekstensibilitas terbuka' alih-alih 'fitur tertutup'? Munculnya agen seperti OpenClaw membuat saya semakin banyak memikirkan hal ini akhir-akhir ini.
5 komentar
Saya sedang menguji kasus nomor 1
Hasilnya, karena pengalaman kegagalan terus menumpuk, ia mulai menetapkan batasan pada dirinya sendiri.
Sebagai referensi, saya sedang berada pada tahap memanfaatkan halusinasi sebagai mesin penelusuran pass channel.
(a) memperluas lebih jauh fungsi aplikasi yang sudah ada
(b) memperluas fungsi dengan menggabungkan API dari berbagai layanan yang selama ini dikerjakan oleh 'manusia' dan sudah pernah dicoba
Untuk (a), saya masih belum cukup percaya untuk menyerahkan pada AI agar memperluas fungsi sesukanya.
Untuk (b), karena lebih terkontrol, setidaknya terasa sedikit lebih baik.
Namun, saya rasa "program hukum memesan tiket pesawat" jelas bukan hal yang tepat. Kalau begitu, itu sudah bukan lagi program hukum. Itu akan menjadi Her OS serbaguna. Sama seperti ada alasan mengapa organisasi dan tanggung jawab manusia dibagi-bagi, menurut saya pemrograman/arsitektur juga dibagi seperti itu karena ada alasannya. Gagasan untuk benar-benar memahami apa yang saya inginkan lalu menangani semua hal sesuai selera saya terasa mirip dengan pembicaraan tentang klon digital.
"Tolong lakukan ini" berarti seperti asisten pribadi yang sudah lama mengenal saya, sehingga saya tidak perlu menjelaskan secara konkret dan detail (seperti pendekatan spec-driven yang banyak dibicarakan sekarang). Namun, meskipun ia melalui proses memindai seluruh diri saya, mengumpulkan pengetahuan, dan mengingatnya, pada akhirnya tetap akan muncul kesalahan (di Her juga ada adegan pada pengaturan awal saat sistem memeriksa email pengguna dan semua datanya) -- yang penting adalah seberapa baik ia bisa menyadari dan menyaring kesalahan itu, atau mampu memperbaikinya, dan menurut saya kita masih jauh dari sana. Kalau Anda pernah menyuruh orang bekerja, Anda pasti tahu: bahkan orang yang sudah bekerja bersama 10 atau 20 tahun pun tidak selalu memahami niat saya dengan tepat, atau orang yang kurang peka terus saja tidak paham dan melakukan kesalahan... Kalau manusia saja seperti itu, saya rasa yang lebih dulu perlu dilakukan adalah mengangkat AI seperti momento, yang juga tidak memikul tanggung jawab, ke tingkat kemampuan seperti manusia.
Akan bagus jika bisa menuju ke arah ekstensi terbuka seperti yang Anda katakan, tetapi itu harus berupa AI asisten pribadi serbaguna (seperti yang ditulis orang lain di atas, agar pemanggang roti tidak melakukan pekerjaan lain), dan melalui interaksi dengan pengguna ia harus terus belajar tentang penggunanya. Saya tidak berharap mobil menulis laporan pajak. Pada manusia pun sama saja; kalau majikan memberi seorang karyawan tugas tertentu lalu dia malah mengerjakan hal lain juga, majikan mungkin bisa senang, tetapi kebanyakan justru akan merasa khawatir.
Dokumentasi yang jelas dan aksesibilitas yang dirancang dengan baik pada akhirnya akan menang. Tanpa perlu terlalu berfokus pada tingkat kebebasan AI, aksesibilitas yang dirancang dengan baik mudah dipahami baik oleh manusia maupun AI.
Tidak, prinsip hak akses minimum harus tetap dijaga. Saya ingin pemanggang roti saya hanya memanggang roti, bukan terhubung ke internet untuk merangkum berita lalu menjalankan Doom.
Secara filosofis, saya merekomendasikan teori extended mind dari Andy Clark. Ini akan memberi pemahaman yang mendalam tentang bagaimana LLM, yang sepenuhnya bergantung pada kesan meyakinkan, memperluas kognisinya melalui alat.
Secara praktis, OpenCode membuka semua bagian dari konfigurasi agen, jadi kemungkinan akan membantu.
Poin nomor 2 sudah menjadi kenyataan. Salah satu alat yang paling awal diberikan adalah code interpreter. Jadi, menurut saya, agen domain-spesifik pada akhirnya adalah pertarungan jangka pendek yang akan lenyap.
Untuk domain yang sedang Anda kerjakan sekarang, saya rasa akan lebih baik jika ML tradisional disediakan lewat MCP. Model bahasa sama sekali tidak unggul untuk analisis pola atau prediksi linear.
Sepertinya tidak perlu merancang simetri alat dengan berlandaskan UI manusia. Bagaimanapun, webMCP atau MCP otomatis berbasis GDI, di mana agen langsung menafsirkan dan mengendalikan UI itu sendiri, akan segera hadir. Karena kita harus memanfaatkan banyak sistem legacy yang ditujukan untuk manusia. Jika itu adalah agen berbasis LLM dengan native multimodal, pengembang tidak perlu repot-repot menerjemahkan GUI ke MCP. iOS, yang punya kendali kuat atas foundation GUI, mungkin bahkan mulai menerapkannya langsung di versi berikutnya.
Kalau begitu, nanti cukup instal aplikasi saham apa pun, lalu Anda bisa mendelegasikan investasi kepada agen.