"Kereta tanpa kuda" di era AI

(koomen.dev)

21 poin oleh GN⁺ 2025-04-24 | 2 komentar | Bagikan ke WhatsApp

Membuat software dengan AI itu menyenangkan dan produktif, tetapi sebagian besar aplikasi AI tidak efisien karena hanya meniru cara lama seperti "kereta tanpa kuda (horseless carriage)"
Asisten email AI di Gmail menghasilkan keluaran yang terlalu formal dan gagal memberikan pengalaman yang dipersonalisasi untuk pengguna
Aplikasi AI yang benar-benar berguna seharusnya memungkinkan pengguna mengubah System Prompt agar bisa membuat agen yang dipersonalisasi
Aplikasi ideal di era AI bukanlah yang meniru program lama, melainkan software native AI yang mengurangi pekerjaan berulang pengguna dan benar-benar meningkatkan produktivitas melalui otomatisasi
Potensi sejati AI terletak pada otomatisasi pekerjaan sehari-hari agar pengguna bisa fokus pada hal-hal yang penting dan kreatif

Mengapa membuat software dengan AI lebih menyenangkan daripada memakai aplikasi yang dibuat dengan AI

Baru-baru ini ada satu hal menarik yang saya sadari: dibanding memakai sebagian besar aplikasi berbasis AI, menggunakan AI untuk membuat software sendiri jauh lebih menyenangkan dan produktif
Saat memakai AI sebagai alat pengembangan, saya hampir merasa bisa membuat apa pun yang dapat saya bayangkan dengan cepat
Sebaliknya, banyak aplikasi AI hanya sekadar menempelkan fitur AI, tetapi secara nyata kurang berguna atau malah merepotkan

‘Kereta tanpa kuda’ di era AI

Saat ini banyak aplikasi AI pada dasarnya masih mengikuti desain software gaya lama apa adanya
Akibatnya, model kuat seperti LLM jadi berada dalam struktur yang membatasi secara tidak perlu
Ini digambarkan sebagai “kereta tanpa kuda (horseless carriages)” di era AI
- Mirip dengan sejarah desain mobil awal yang masih mengikuti bentuk kereta kuda dan karena itu tidak efisien

Contoh aplikasi AI yang dirancang buruk: asisten AI Gmail

Gmail baru-baru ini meluncurkan fitur pembuatan draf email menggunakan model Gemini
Dalam contohnya, pengguna (penulis) meminta draf email untuk dikirim ke atasannya

> Prompt: minta draf email untuk atasan

Draf yang dihasilkan Gemini memang sempurna secara tata bahasa, tetapi sama sekali berbeda dari gaya tulisan yang benar-benar akan dipakai penulis
- Gaya asli penulis: "hey garry, my daughter woke up with the flu so I won't make it in today"
- Hasil Gemini terlalu formal dan terasa tidak alami
Akibatnya, ini justru memakan waktu lebih lama daripada menulis email sendiri
Penulis menggambarkan fitur ini sebagai “seperti mengelola karyawan dengan performa rendah”
Sangat mungkin jutaan pengguna Gmail mengalami hal serupa, lalu salah paham bahwa AI masih belum pandai menulis email
Namun masalahnya bukan pada model Gemini itu sendiri, melainkan pada cara tim Gmail merancang aplikasinya

Contoh asisten email yang lebih baik

Jika Gmail membuat asisten email dengan cara berikut, hasilnya akan jauh lebih praktis

Contoh agen pembaca email

Demo ini bekerja bukan dengan menulis email, tetapi dengan membaca dan memprosesnya
Alat yang digunakan:
- labelEmail(label, color, priority) : memberi label pada email
- archiveEmail() : mengarsipkan email
- draftReply(body) : membuat draf balasan
Email di kotak masuk diurutkan seperti berikut:
- TechCrunch Weekly
- Gustaf Alströmer - founder intro?
- HackerNews Digest
- The Verge Updates
- Garry Tan - reschedule
- dan total 12 email
Setiap email secara otomatis diklasifikasikan dan diberi prioritas, sebagian dibuatkan draf balasan otomatis atau langsung diarsipkan otomatis
Tiap email diproses secara individual sesuai System Prompt yang didefinisikan pengguna
Pengguna bisa mengubah System Prompt secara langsung untuk mencerminkan logika pelabelan mereka sendiri

> Cara ini jauh lebih kuat, intuitif, dan produktif; jadi mengapa tim Gmail tidak merancangnya seperti ini?

Inti masalahnya: “nada yang generik dan seragam”
- Salah satu masalah terbesar dari desain Gmail adalah gaya bahasa yang generik dan tanpa kepribadian

AI Slop: keluaran yang formal dan canggung

Draf email yang dibuat Gemini di Gmail terlalu bertele-tele, terlalu formal, dan sama sekali berbeda dari gaya penulis
Keluaran seperti ini justru bisa terlihat seperti email phishing
Sebagian besar pengguna LLM pernah mengalami hal ini, dan untuk menghindarinya mereka secara alami mulai memakai strategi prompt hacking
- Contoh prompt:
  > "let my boss garry know that my daughter woke up with the flu and that I won't be able to come in to the office today. Use no more than one line for the entire email body. Make it friendly but really concise. Don't worry about punctuation or capitalization. Sign off with “Pete” or “pete” and not “Best Regards, Pete” and certainly not “Love, Pete”"
Kualitas hasilnya memang membaik, tetapi prompt menjadi terlalu panjang dan tidak efisien karena proses ini harus diulang setiap kali
Solusi sederhananya: beri pengguna hak untuk mengubah System Prompt

Perbedaan antara System Prompt dan User Prompt

Pada dasarnya, LLM adalah sistem yang memprediksi kata berikutnya berdasarkan kata-kata yang diberikan sebagai input (prompt)
Semua input dan output berbentuk teks
- Demi penyederhanaan, tulisan ini hanya membahas antarmuka berbasis teks, walaupun pada praktiknya suara atau video juga bisa menjadi input/output
OpenAI, Anthropic, dan lainnya mengadopsi struktur yang membagi prompt menjadi System Prompt dan User Prompt agar lebih sederhana
- System Prompt: mendefinisikan karakter dan cara bertindak agen (setara dengan fungsi)
- User Prompt: permintaan atau pertanyaan spesifik dari pengguna (setara dengan nilai input)
- Respons model: nilai output

> Contoh:
> - User Prompt: "Let my boss Garry know that my daughter woke up with the flu this morning and that I won't be able to come in to the office today."
> - Perkiraan System Prompt Gmail:
> - "You are a helpful email-writing assistant responsible for writing emails on behalf of a Gmail user. Follow the user’s instructions and use a formal, businessy tone and correct punctuation so that it’s obvious the user is smart and serious."

Masalahnya, Gmail tidak membuka System Prompt ini kepada pengguna, dan juga tidak memberi hak untuk mengubahnya

System Prompt kustom milik Pete

Jika Gmail, alih-alih memakai System Prompt yang seragam, memberi hak kepada pengguna untuk menulisnya sendiri, hasilnya mungkin seperti ini:

> You're Pete, a 43 year old husband, father, programmer, and YC Partner.
> You're very busy and so is everyone you correspond with, so you do your best to keep your emails as short as possible and to the point. You avoid all unnecessary words and you often omit punctuation or leave misspellings unaddressed because it's not a big deal and you'd rather save the time. You prefer one-line emails.
> Do your best to be kind, and don't be so informal that it comes across as rude.
Jika email dibuat dengan GPT berdasarkan System Prompt seperti ini, hasilnya bisa seperti berikut:

> Garry, my daughter has the flu. I can't come in today.
Hasil ini singkat, personal, dan sesuai dengan gaya asli pengguna
Keunggulan terbesarnya adalah System Prompt ini dapat digunakan ulang, sehingga semua email berikutnya juga mengikuti gaya yang sama

Serunya menulis prompt pengguna dan kemungkinannya

Pengalaman mengajari LLM agar berpikir seperti saya, lalu langsung melihat hasilnya, terasa sangat intuitif dan menyenangkan
Pengguna disarankan mencoba menulis “System Prompt milik saya sendiri” untuk mendefinisikan gaya bahasanya
- Contoh User Prompt:
  > "Let my wife know I'll be home from work late and will miss dinner"
  > "Write an email to comcast customer service explaining that they accidentally double billed you last month."
Jika hasilnya bagus, berarti penjelasannya sudah cukup; jika belum, tinggal perbaiki isi prompt lalu ulangi
Ini bahkan bisa lebih mudah daripada mengajari manusia, karena ada loop umpan balik yang cepat dan jujur

Mengapa sebagian besar aplikasi AI tidak mengekspos System Prompt?

Per April 2025, sebagian besar aplikasi AI sengaja menyembunyikan System Prompt
- Tautan terkait: desain tertutup yang disengaja, disebutkan di X
Penulis melihat ini sebagai perampasan hak dan kepribadian pengguna, dan berargumen bahwa demi hasil dan pengalaman penggunaan yang lebih baik, System Prompt harus dibuka untuk pengguna

Horseless Carriages: penerapan kuno terhadap teknologi baru

Saat teknologi baru muncul, alat-alat awal sering gagal karena meniru mentah-mentah kerangka cara lama
“Horseless Carriage” merujuk pada contoh mobil awal yang masih mengikuti desain kereta yang ditarik kuda
- Contoh: desain kereta uap Trevithick tahun 1803
- Desain itu mungkin tampak inovatif saat itu, tetapi dari sudut pandang sekarang struktur dasarnya tidak cocok untuk mobil
Orang pada masa itu mungkin mencoba kendaraan seperti itu dan berpikir “kuda lebih baik daripada mesin” → sebelum mobil modern hadir, penilaian itu cukup masuk akal
Penulis berpendapat bahwa aplikasi AI saat ini berada dalam situasi yang serupa
- Contoh: seperti fitur Gemini di Gmail, AI hanya ditempelkan ke UX yang sudah ketinggalan zaman
Cara berpikir lama berhenti pada level “mari ganti kudanya dengan mesin”
- Sekarang pun banyak aplikasi AI mirip begitu: hanya menambahkan fitur AI ke aplikasi lama

Old World Thinking: batas desain software tradisional

Dulu, untuk memanfaatkan komputer hanya ada dua cara:
1. Memprogram sendiri
2. Menggunakan program yang dibuat orang lain
Karena pemrograman sulit, kebanyakan orang memilih cara kedua
Karena itu, industri software berkembang dengan pemisahan peran yang jelas antara developer dan pengguna
- Developer: menentukan perilaku umum software
- Pengguna: memberikan input yang spesifik
Pemisahan System/User Prompt pada LLM mencerminkan struktur ini apa adanya
- System Prompt = bagian developer
- User Prompt = bagian pengguna
Namun email adalah ranah yang sangat personal, dan jika AI menulis email atas nama pengguna, maka AI harus mencerminkan gaya pribadi pengguna
Dalam struktur lama, personalisasi sulit dilakukan kecuali pengguna menulis programnya sendiri
Tetapi di era LLM, pengguna kini bisa menulis System Prompt sendiri
- Artinya, kita hidup di masa ketika cara kerja AI bisa dirancang tanpa perlu pemrograman

Kembalikan milik pengguna kepada pengguna

Argumen penulis: ketika LLM bertindak atas nama saya, sayalah yang harus mengajarkan bagaimana caranya bertindak (System Prompt)
Tentu, tidak semua pengguna ingin menulis Prompt dari nol
- Gmail bisa menghasilkan System Prompt dasar dengan melihat riwayat email pengguna
- Yang penting adalah prompt itu harus ditampilkan kepada pengguna dan bisa mereka ubah
“Bagaimana dengan orang yang tidak bisa menulis prompt?” → mungkin awalnya begitu, tapi kebanyakan cepat belajar
- Kesuksesan ChatGPT membuktikannya
Bagaimana dengan domain seperti akuntansi atau hukum yang bukan agen personal?
- Wajar jika System Prompt ditulis oleh ahli di bidang tersebut, tetapi para ahli itu sendiri juga ingin menyesuaikannya dengan konteks masing-masing
Contoh: tim akuntansi YC memakai cara, aturan, dan kombinasi software yang khusus untuk YC
- Agen AI akuntansi yang generik sama sekali tidak berguna di YC
Hampir semua tim akuntansi punya cara kerja sendiri, dan itulah sebabnya mereka lebih suka alat serbaguna seperti Excel
Kesimpulannya: di sebagian besar aplikasi AI, System Prompt seharusnya ditulis dan dipelihara langsung oleh pengguna

> Aplikasi AI seharusnya bukan agen jadi pakai (agent), melainkan alat agar pengguna bisa membangun agen mereka sendiri (agent builder)

Kembalikan milik developer kepada developer

Kalau begitu, apa yang harus dilakukan developer?
- Merancang UI builder agen yang khusus untuk domain tertentu (misalnya email, pembukuan, dan sebagainya)
- Menyediakan template dan pembantu pembuat prompt agar pengguna tidak harus menulis prompt dari nol
- Menyediakan antarmuka loop umpan balik agar pengguna bisa meninjau dan memperbaiki hasil agen
Developer juga menyediakan alat agen (agent tools)
- Pengiriman draf email, pengiriman otomatis, pencarian email, koneksi API eksternal, dan lain-lain
Alat-alat ini menjadi cara untuk mengendalikan cakupan tindakan dan keamanan agen
- Membatasi tindakan melalui alat yang ditulis dalam kode jauh lebih aman dan jelas daripada mencoba membatasinya lewat prompt teks

> Di masa depan, cara berpikir yang mengkhawatirkan prompt injection bisa jadi akan terdengar menggelikan
> → Membuat batas di dalam struktur teks adalah tanda abstraksi yang rapuh
> → Seluruh sistem perlu dipahami sebagai ruang pengguna dan dikendalikan lewat alat serta UI yang kuat

Nilai nyata dari agen yang “membaca” email

Seperti yang disebut sebelumnya, System Prompt yang lebih baik pun tidak banyak menghemat waktu untuk menulis draf email dari nol
Alasannya, email yang ditulis penulis memang sudah sangat pendek dan ringkas
- Artinya, panjang prompt pengguna ≒ panjang isi email
Penulis sudah berkali-kali bereksperimen, dan dari situ merasakan bahwa AI generatif jauh lebih kuat untuk transformasi teks daripada sekadar generasi teks
Karena itu, tujuan sebenarnya memakai LLM bukan untuk “menulis” email, melainkan untuk “membaca dan memproses” email

Demo agen pembaca email (berbasis gpt-4o-mini)

Alat yang tersedia:
- labelEmail(label, color, priority) : memberi label email
- archiveEmail() : mengarsipkan email otomatis
- draftReply(body) : membuat draf balasan otomatis
Agen ini membaca setiap email dan:
- menyaring spam dengan baik
- memberi label berdasarkan tingkat kepentingan
- merangkum atau membuat draf balasan
- mengarsipkan email yang tidak perlu secara otomatis
Bahkan jika ditambah beberapa alat lagi, ia juga bisa:
- berhenti berlangganan
- menambahkan jadwal
- membayar tagihan secara otomatis
Inilah yang seharusnya dilakukan klien email native AI:
→ mengotomatiskan pekerjaan berulang yang membosankan untuk menghemat waktu pengguna
- Beberapa klien email seperti Superhuman dan Zero sudah dikembangkan ke arah ini

Makna software native AI

Killer app sejati dari AI adalah membuat komputer mengerjakan hal-hal yang tidak ingin saya kerjakan sendiri
Alasan penulis menyertakan demo dalam tulisan ini juga untuk menunjukkan bahwa LLM pada praktiknya sudah cukup mampu menangani pekerjaan-pekerjaan seperti ini
Masalahnya bukan pada performa AI, melainkan pada desain aplikasi

> Yang dibuat tim Gmail adalah “aplikasi email dengan tambahan AI”
> → Bukan alat otomatisasi untuk pengguna, melainkan AI yang dipaksakan masuk ke antarmuka yang berpusat pada manusia

Sebaliknya, aplikasi native AI seharusnya seperti ini:
- memaksimalkan leverage pengguna di domain tertentu
- contoh: klien email AI meminimalkan waktu untuk menangani email
- contoh: software akuntansi AI meminimalkan waktu pemrosesan akuntansi

Harapan terhadap era AI

Semua pekerjaan berulang dan membosankan ditangani oleh agen
Pengguna bisa fokus pada hal-hal yang penting
Kita bisa lebih banyak melakukan hal yang kita kuasai dan sukai

> Itulah alasan penulis bersemangat terhadap masa depan AI
> Alat yang lebih baik, penggunaan waktu yang lebih baik, produktivitas yang lebih tinggi

2 komentar

crawler 2025-04-24

> Aplikasi AI yang benar-benar berguna harus memungkinkan pengguna mengubah System Prompt agar bisa membuat agen yang dipersonalisasi

Tentu para pengembang yang membuat fitur ini juga tahu, tetapi selama jailbreak masih ada, ini tidak mudah.
Bahkan jika perubahan system prompt dikunci agar tidak bisa dilakukan, jailbreak tetap bisa terjadi, jadi membuka akses untuk mengubah system prompt adalah hal yang mustahil.
Bisa juga dipakai dengan murah untuk tujuan yang berbeda dari fungsi aslinya.

GN⁺ 2025-04-24

Pendapat Hacker News

Bersikap hati-hati terhadap penggunaan model bahasa untuk menulis pesan pribadi. Ini tidak memiliki kekhususan pengalaman atau pengetahuan individu
- Akan lebih mudah diterima jika model seperti Gemini dapat memahami penjelasan teknis masa lalu pengguna atau detail spesifik dari pekerjaannya
- Namun dalam kebanyakan kasus, ini tidak berbeda dari email yang bisa ditulis oleh seorang sekretaris pada tahun 1970-an
- Untuk menulis pesan pribadi, ringkasan tidak diperlukan, dan memperpanjang pesan pendek hanya menghasilkan kebisingan yang tidak bermakna
- Menggunakan AI untuk menulis pesan membuat batas penyampaian informasi menjadi kabur
Merasa 90% fitur AI tidak berguna dan mahal
- Sulit menemukan fitur AI yang berguna selain fitur AI untuk coding
- Fitur pelengkapan otomatis di Gmail atau iMessage sudah ada bahkan sebelum era LLM
- Belum pernah menggunakan fitur Gmail untuk membuat email terdengar lebih profesional
Gemini bertindak seperti asisten pribadi dan mengirim email atas nama pengguna
- Menulis pesan pribadi dengan AI bisa membuat lawan bicara merasa tidak nyaman
Tidak nyaman berkomunikasi dengan orang-orang yang tidak peduli pada tata bahasa dan ejaan
- Bukan menyalahkan orang yang salah mengeja, tetapi jika sebenarnya mampu namun tetap tidak peduli, itu menunjukkan ketidakpedulian terhadap lawan bicara
Widget interaktif yang terhubung dengan LLM terasa menyenangkan
- Tombol "ringkas email" di Gmail terasa tidak perlu
Banyak orang mengira AI menulis dengan gaya yang mudah ditebak, tetapi kenyataannya tidak demikian
- Ini bisa diterapkan bukan hanya pada teks, tetapi juga pada pembuatan gambar
- Orang bisa merasa tidak nyaman ketika menyadari bahwa AI dapat berbicara seperti manusia sungguhan
Menyukai demo interaktif yang berjalan secara real-time
- Dapat menganalisis gaya email untuk menulis draf
- Ini bisa berkembang menjadi cara di mana AI otomatis menulis email lalu pengguna menyetujuinya
AI tidak bisa mengetahui apa yang diinginkan pengguna, dan pengguna kesulitan mengekspresikan tujuan dengan jelas
- Jika AI menangani semuanya, pengguna jadi tidak berpikir secara mendalam, sehingga keahlian dan kemampuan memecahkan masalah menjadi terbatas
Fitur AI yang paling berguna justru tidak mencolok
- Asisten pelabelan email adalah contoh yang baik
- Fitur yang otomatis menafsirkan email "penjadwalan ulang" dan menyarankan perubahan jadwal terasa berguna
Tidak memahami penggunaan AI untuk menulis pesan atas nama seseorang
- Untuk pesan penting, menulisnya sendiri memiliki makna, dan itu merupakan ekspresi dari interaksi yang hidup