"Kereta tanpa kuda" di era AI
(koomen.dev)- Membuat software dengan AI itu menyenangkan dan produktif, tetapi sebagian besar aplikasi AI tidak efisien karena hanya meniru cara lama seperti "kereta tanpa kuda (horseless carriage)"
- Asisten email AI di Gmail menghasilkan keluaran yang terlalu formal dan gagal memberikan pengalaman yang dipersonalisasi untuk pengguna
- Aplikasi AI yang benar-benar berguna seharusnya memungkinkan pengguna mengubah System Prompt agar bisa membuat agen yang dipersonalisasi
- Aplikasi ideal di era AI bukanlah yang meniru program lama, melainkan software native AI yang mengurangi pekerjaan berulang pengguna dan benar-benar meningkatkan produktivitas melalui otomatisasi
- Potensi sejati AI terletak pada otomatisasi pekerjaan sehari-hari agar pengguna bisa fokus pada hal-hal yang penting dan kreatif
Mengapa membuat software dengan AI lebih menyenangkan daripada memakai aplikasi yang dibuat dengan AI
- Baru-baru ini ada satu hal menarik yang saya sadari: dibanding memakai sebagian besar aplikasi berbasis AI, menggunakan AI untuk membuat software sendiri jauh lebih menyenangkan dan produktif
- Saat memakai AI sebagai alat pengembangan, saya hampir merasa bisa membuat apa pun yang dapat saya bayangkan dengan cepat
- Sebaliknya, banyak aplikasi AI hanya sekadar menempelkan fitur AI, tetapi secara nyata kurang berguna atau malah merepotkan
‘Kereta tanpa kuda’ di era AI
- Saat ini banyak aplikasi AI pada dasarnya masih mengikuti desain software gaya lama apa adanya
- Akibatnya, model kuat seperti LLM jadi berada dalam struktur yang membatasi secara tidak perlu
- Ini digambarkan sebagai “kereta tanpa kuda (horseless carriages)” di era AI
- Mirip dengan sejarah desain mobil awal yang masih mengikuti bentuk kereta kuda dan karena itu tidak efisien
Contoh aplikasi AI yang dirancang buruk: asisten AI Gmail
- Gmail baru-baru ini meluncurkan fitur pembuatan draf email menggunakan model Gemini
- Dalam contohnya, pengguna (penulis) meminta draf email untuk dikirim ke atasannya
> Prompt: minta draf email untuk atasan
- Draf yang dihasilkan Gemini memang sempurna secara tata bahasa, tetapi sama sekali berbeda dari gaya tulisan yang benar-benar akan dipakai penulis
- Gaya asli penulis: "hey garry, my daughter woke up with the flu so I won't make it in today"
- Hasil Gemini terlalu formal dan terasa tidak alami
- Akibatnya, ini justru memakan waktu lebih lama daripada menulis email sendiri
- Penulis menggambarkan fitur ini sebagai “seperti mengelola karyawan dengan performa rendah”
- Sangat mungkin jutaan pengguna Gmail mengalami hal serupa, lalu salah paham bahwa AI masih belum pandai menulis email
- Namun masalahnya bukan pada model Gemini itu sendiri, melainkan pada cara tim Gmail merancang aplikasinya
Contoh asisten email yang lebih baik
- Jika Gmail membuat asisten email dengan cara berikut, hasilnya akan jauh lebih praktis
Contoh agen pembaca email
-
Demo ini bekerja bukan dengan menulis email, tetapi dengan membaca dan memprosesnya
-
Alat yang digunakan:
labelEmail(label, color, priority): memberi label pada emailarchiveEmail(): mengarsipkan emaildraftReply(body): membuat draf balasan
-
Email di kotak masuk diurutkan seperti berikut:
- TechCrunch Weekly
- Gustaf Alströmer - founder intro?
- HackerNews Digest
- The Verge Updates
- Garry Tan - reschedule
- dan total 12 email
-
Setiap email secara otomatis diklasifikasikan dan diberi prioritas, sebagian dibuatkan draf balasan otomatis atau langsung diarsipkan otomatis
-
Tiap email diproses secara individual sesuai System Prompt yang didefinisikan pengguna
-
Pengguna bisa mengubah System Prompt secara langsung untuk mencerminkan logika pelabelan mereka sendiri
> Cara ini jauh lebih kuat, intuitif, dan produktif; jadi mengapa tim Gmail tidak merancangnya seperti ini?
- Inti masalahnya: “nada yang generik dan seragam”
- Salah satu masalah terbesar dari desain Gmail adalah gaya bahasa yang generik dan tanpa kepribadian
AI Slop: keluaran yang formal dan canggung
- Draf email yang dibuat Gemini di Gmail terlalu bertele-tele, terlalu formal, dan sama sekali berbeda dari gaya penulis
- Keluaran seperti ini justru bisa terlihat seperti email phishing
- Sebagian besar pengguna LLM pernah mengalami hal ini, dan untuk menghindarinya mereka secara alami mulai memakai strategi prompt hacking
- Contoh prompt:
> "let my boss garry know that my daughter woke up with the flu and that I won't be able to come in to the office today. Use no more than one line for the entire email body. Make it friendly but really concise. Don't worry about punctuation or capitalization. Sign off with “Pete” or “pete” and not “Best Regards, Pete” and certainly not “Love, Pete”"
- Contoh prompt:
- Kualitas hasilnya memang membaik, tetapi prompt menjadi terlalu panjang dan tidak efisien karena proses ini harus diulang setiap kali
- Solusi sederhananya: beri pengguna hak untuk mengubah System Prompt
Perbedaan antara System Prompt dan User Prompt
- Pada dasarnya, LLM adalah sistem yang memprediksi kata berikutnya berdasarkan kata-kata yang diberikan sebagai input (prompt)
- Semua input dan output berbentuk teks
- Demi penyederhanaan, tulisan ini hanya membahas antarmuka berbasis teks, walaupun pada praktiknya suara atau video juga bisa menjadi input/output
- OpenAI, Anthropic, dan lainnya mengadopsi struktur yang membagi prompt menjadi System Prompt dan User Prompt agar lebih sederhana
- System Prompt: mendefinisikan karakter dan cara bertindak agen (setara dengan fungsi)
- User Prompt: permintaan atau pertanyaan spesifik dari pengguna (setara dengan nilai input)
- Respons model: nilai output
> Contoh:
> - User Prompt: "Let my boss Garry know that my daughter woke up with the flu this morning and that I won't be able to come in to the office today."
> - Perkiraan System Prompt Gmail:
> - "You are a helpful email-writing assistant responsible for writing emails on behalf of a Gmail user. Follow the user’s instructions and use a formal, businessy tone and correct punctuation so that it’s obvious the user is smart and serious."
- Masalahnya, Gmail tidak membuka System Prompt ini kepada pengguna, dan juga tidak memberi hak untuk mengubahnya
System Prompt kustom milik Pete
-
Jika Gmail, alih-alih memakai System Prompt yang seragam, memberi hak kepada pengguna untuk menulisnya sendiri, hasilnya mungkin seperti ini:
> You're Pete, a 43 year old husband, father, programmer, and YC Partner.
> You're very busy and so is everyone you correspond with, so you do your best to keep your emails as short as possible and to the point. You avoid all unnecessary words and you often omit punctuation or leave misspellings unaddressed because it's not a big deal and you'd rather save the time. You prefer one-line emails.
> Do your best to be kind, and don't be so informal that it comes across as rude. -
Jika email dibuat dengan GPT berdasarkan System Prompt seperti ini, hasilnya bisa seperti berikut:
> Garry, my daughter has the flu. I can't come in today.
-
Hasil ini singkat, personal, dan sesuai dengan gaya asli pengguna
-
Keunggulan terbesarnya adalah System Prompt ini dapat digunakan ulang, sehingga semua email berikutnya juga mengikuti gaya yang sama
Serunya menulis prompt pengguna dan kemungkinannya
- Pengalaman mengajari LLM agar berpikir seperti saya, lalu langsung melihat hasilnya, terasa sangat intuitif dan menyenangkan
- Pengguna disarankan mencoba menulis “System Prompt milik saya sendiri” untuk mendefinisikan gaya bahasanya
- Contoh User Prompt:
> "Let my wife know I'll be home from work late and will miss dinner"
> "Write an email to comcast customer service explaining that they accidentally double billed you last month."
- Contoh User Prompt:
- Jika hasilnya bagus, berarti penjelasannya sudah cukup; jika belum, tinggal perbaiki isi prompt lalu ulangi
- Ini bahkan bisa lebih mudah daripada mengajari manusia, karena ada loop umpan balik yang cepat dan jujur
Mengapa sebagian besar aplikasi AI tidak mengekspos System Prompt?
- Per April 2025, sebagian besar aplikasi AI sengaja menyembunyikan System Prompt
- Penulis melihat ini sebagai perampasan hak dan kepribadian pengguna, dan berargumen bahwa demi hasil dan pengalaman penggunaan yang lebih baik, System Prompt harus dibuka untuk pengguna
Horseless Carriages: penerapan kuno terhadap teknologi baru
- Saat teknologi baru muncul, alat-alat awal sering gagal karena meniru mentah-mentah kerangka cara lama
- “Horseless Carriage” merujuk pada contoh mobil awal yang masih mengikuti desain kereta yang ditarik kuda
- Contoh: desain kereta uap Trevithick tahun 1803
- Desain itu mungkin tampak inovatif saat itu, tetapi dari sudut pandang sekarang struktur dasarnya tidak cocok untuk mobil
- Orang pada masa itu mungkin mencoba kendaraan seperti itu dan berpikir “kuda lebih baik daripada mesin” → sebelum mobil modern hadir, penilaian itu cukup masuk akal
- Penulis berpendapat bahwa aplikasi AI saat ini berada dalam situasi yang serupa
- Contoh: seperti fitur Gemini di Gmail, AI hanya ditempelkan ke UX yang sudah ketinggalan zaman
- Cara berpikir lama berhenti pada level “mari ganti kudanya dengan mesin”
- Sekarang pun banyak aplikasi AI mirip begitu: hanya menambahkan fitur AI ke aplikasi lama
Old World Thinking: batas desain software tradisional
- Dulu, untuk memanfaatkan komputer hanya ada dua cara:
- Memprogram sendiri
- Menggunakan program yang dibuat orang lain
- Karena pemrograman sulit, kebanyakan orang memilih cara kedua
- Karena itu, industri software berkembang dengan pemisahan peran yang jelas antara developer dan pengguna
- Developer: menentukan perilaku umum software
- Pengguna: memberikan input yang spesifik
- Pemisahan System/User Prompt pada LLM mencerminkan struktur ini apa adanya
- System Prompt = bagian developer
- User Prompt = bagian pengguna
- Namun email adalah ranah yang sangat personal, dan jika AI menulis email atas nama pengguna, maka AI harus mencerminkan gaya pribadi pengguna
- Dalam struktur lama, personalisasi sulit dilakukan kecuali pengguna menulis programnya sendiri
- Tetapi di era LLM, pengguna kini bisa menulis System Prompt sendiri
- Artinya, kita hidup di masa ketika cara kerja AI bisa dirancang tanpa perlu pemrograman
Kembalikan milik pengguna kepada pengguna
- Argumen penulis: ketika LLM bertindak atas nama saya, sayalah yang harus mengajarkan bagaimana caranya bertindak (System Prompt)
- Tentu, tidak semua pengguna ingin menulis Prompt dari nol
- Gmail bisa menghasilkan System Prompt dasar dengan melihat riwayat email pengguna
- Yang penting adalah prompt itu harus ditampilkan kepada pengguna dan bisa mereka ubah
- “Bagaimana dengan orang yang tidak bisa menulis prompt?” → mungkin awalnya begitu, tapi kebanyakan cepat belajar
- Kesuksesan ChatGPT membuktikannya
- Bagaimana dengan domain seperti akuntansi atau hukum yang bukan agen personal?
- Wajar jika System Prompt ditulis oleh ahli di bidang tersebut, tetapi para ahli itu sendiri juga ingin menyesuaikannya dengan konteks masing-masing
- Contoh: tim akuntansi YC memakai cara, aturan, dan kombinasi software yang khusus untuk YC
- Agen AI akuntansi yang generik sama sekali tidak berguna di YC
- Hampir semua tim akuntansi punya cara kerja sendiri, dan itulah sebabnya mereka lebih suka alat serbaguna seperti Excel
- Kesimpulannya: di sebagian besar aplikasi AI, System Prompt seharusnya ditulis dan dipelihara langsung oleh pengguna
> Aplikasi AI seharusnya bukan agen jadi pakai (agent), melainkan alat agar pengguna bisa membangun agen mereka sendiri (agent builder)
Kembalikan milik developer kepada developer
- Kalau begitu, apa yang harus dilakukan developer?
- Merancang UI builder agen yang khusus untuk domain tertentu (misalnya email, pembukuan, dan sebagainya)
- Menyediakan template dan pembantu pembuat prompt agar pengguna tidak harus menulis prompt dari nol
- Menyediakan antarmuka loop umpan balik agar pengguna bisa meninjau dan memperbaiki hasil agen
- Developer juga menyediakan alat agen (agent tools)
- Pengiriman draf email, pengiriman otomatis, pencarian email, koneksi API eksternal, dan lain-lain
- Alat-alat ini menjadi cara untuk mengendalikan cakupan tindakan dan keamanan agen
- Membatasi tindakan melalui alat yang ditulis dalam kode jauh lebih aman dan jelas daripada mencoba membatasinya lewat prompt teks
> Di masa depan, cara berpikir yang mengkhawatirkan prompt injection bisa jadi akan terdengar menggelikan
> → Membuat batas di dalam struktur teks adalah tanda abstraksi yang rapuh
> → Seluruh sistem perlu dipahami sebagai ruang pengguna dan dikendalikan lewat alat serta UI yang kuat
Nilai nyata dari agen yang “membaca” email
- Seperti yang disebut sebelumnya, System Prompt yang lebih baik pun tidak banyak menghemat waktu untuk menulis draf email dari nol
- Alasannya, email yang ditulis penulis memang sudah sangat pendek dan ringkas
- Artinya, panjang prompt pengguna ≒ panjang isi email
- Penulis sudah berkali-kali bereksperimen, dan dari situ merasakan bahwa AI generatif jauh lebih kuat untuk transformasi teks daripada sekadar generasi teks
- Karena itu, tujuan sebenarnya memakai LLM bukan untuk “menulis” email, melainkan untuk “membaca dan memproses” email
Demo agen pembaca email (berbasis gpt-4o-mini)
- Alat yang tersedia:
labelEmail(label, color, priority): memberi label emailarchiveEmail(): mengarsipkan email otomatisdraftReply(body): membuat draf balasan otomatis
- Agen ini membaca setiap email dan:
- menyaring spam dengan baik
- memberi label berdasarkan tingkat kepentingan
- merangkum atau membuat draf balasan
- mengarsipkan email yang tidak perlu secara otomatis
- Bahkan jika ditambah beberapa alat lagi, ia juga bisa:
- berhenti berlangganan
- menambahkan jadwal
- membayar tagihan secara otomatis
- Inilah yang seharusnya dilakukan klien email native AI:
→ mengotomatiskan pekerjaan berulang yang membosankan untuk menghemat waktu pengguna- Beberapa klien email seperti Superhuman dan Zero sudah dikembangkan ke arah ini
Makna software native AI
- Killer app sejati dari AI adalah membuat komputer mengerjakan hal-hal yang tidak ingin saya kerjakan sendiri
- Alasan penulis menyertakan demo dalam tulisan ini juga untuk menunjukkan bahwa LLM pada praktiknya sudah cukup mampu menangani pekerjaan-pekerjaan seperti ini
- Masalahnya bukan pada performa AI, melainkan pada desain aplikasi
> Yang dibuat tim Gmail adalah “aplikasi email dengan tambahan AI”
> → Bukan alat otomatisasi untuk pengguna, melainkan AI yang dipaksakan masuk ke antarmuka yang berpusat pada manusia
- Sebaliknya, aplikasi native AI seharusnya seperti ini:
- memaksimalkan leverage pengguna di domain tertentu
- contoh: klien email AI meminimalkan waktu untuk menangani email
- contoh: software akuntansi AI meminimalkan waktu pemrosesan akuntansi
Harapan terhadap era AI
- Semua pekerjaan berulang dan membosankan ditangani oleh agen
- Pengguna bisa fokus pada hal-hal yang penting
- Kita bisa lebih banyak melakukan hal yang kita kuasai dan sukai
> Itulah alasan penulis bersemangat terhadap masa depan AI
> Alat yang lebih baik, penggunaan waktu yang lebih baik, produktivitas yang lebih tinggi
2 komentar
> Aplikasi AI yang benar-benar berguna harus memungkinkan pengguna mengubah System Prompt agar bisa membuat agen yang dipersonalisasi
Tentu para pengembang yang membuat fitur ini juga tahu, tetapi selama jailbreak masih ada, ini tidak mudah.
Bahkan jika perubahan system prompt dikunci agar tidak bisa dilakukan, jailbreak tetap bisa terjadi, jadi membuka akses untuk mengubah system prompt adalah hal yang mustahil.
Bisa juga dipakai dengan murah untuk tujuan yang berbeda dari fungsi aslinya.
Pendapat Hacker News
Bersikap hati-hati terhadap penggunaan model bahasa untuk menulis pesan pribadi. Ini tidak memiliki kekhususan pengalaman atau pengetahuan individu
Merasa 90% fitur AI tidak berguna dan mahal
Gemini bertindak seperti asisten pribadi dan mengirim email atas nama pengguna
Tidak nyaman berkomunikasi dengan orang-orang yang tidak peduli pada tata bahasa dan ejaan
Widget interaktif yang terhubung dengan LLM terasa menyenangkan
Banyak orang mengira AI menulis dengan gaya yang mudah ditebak, tetapi kenyataannya tidak demikian
Menyukai demo interaktif yang berjalan secara real-time
AI tidak bisa mengetahui apa yang diinginkan pengguna, dan pengguna kesulitan mengekspresikan tujuan dengan jelas
Fitur AI yang paling berguna justru tidak mencolok
Tidak memahami penggunaan AI untuk menulis pesan atas nama seseorang