1 poin oleh k08200 4 jam lalu | Belum ada komentar. | Bagikan ke WhatsApp

Belakangan ini semua alat "email AI" bergerak ke arah yang sama. Mereka menaruh draf di setiap email, menempelkan lencana "AI menyarankan balasan", lalu menambahkan tombol kirim otomatis. Hasilnya? Inbox bukannya jadi lebih tenang, malah makin berisik. Seperti menumpuk layar di atas layar.

Saya membuatnya dengan pendekatan yang sepenuhnya berlawanan. Bukan menyerahkan inbox ke AI, melainkan menjadikan AI sebagai firewall yang menahan. Klorn hanya mengeluarkan satu klasifikasi untuk setiap email masuk dan tidak menampilkan sisanya.

Empat tahap — SILENT (hanya dicatat, tidak ditampilkan) / QUEUE (terlihat di antrean, tanpa notifikasi) / PUSH (benar-benar membangunkan) / AUTO (saat ini hanya klasifikasi, eksekusi sengaja belum dihubungkan).

Intinya — LLM tidak mengambil keputusan. Untuk setiap email, ia hanya memberi skor pada 4 angka (tingkat keyakinan, kepercayaan pengirim, bisa dibatalkan, tingkat urgensi), lalu aturan deterministik yang bisa dibaca manusia memetakan itu ke tahap. Karena itu, kebijakan bisa diaudit dan diuji tanpa model, dan bahkan jika LLM mati, fallback berbasis kata kunci tetap menghasilkan angka yang sama sehingga email mendesak tetap lolos.

Dan hal yang tidak bisa dibatalkan sama sekali tidak saya serahkan ke AI. Tiga hal — pengiriman, penghapusan permanen, dan penerusan ke luar — ditempatkan di belakang deterministic floor. Saat persetujuan, byte yang akan dikirim dibekukan sebagai receipt, dan saat eksekusi, jika berbeda satu byte saja maka throw. Jalur otonom bersifat fail-closed. Walaupun AI ngotot bilang "sudah terkirim", kalau byte-nya tidak cocok maka tidak akan keluar.

Bagian "AI itu sihir" juga saya ukur sendiri. Untuk tugas klasifikasi, model yang jauh lebih murah justru lebih akurat daripada GPT-4o. Untuk pekerjaan seperti ini, yang dibutuhkan bukan model jenius, melainkan konsistensi untuk membaca 4 sinyal yang sama dengan cara yang sama setiap saat (angka dan alasannya ada di tulisan di bawah).

Open source AGPLv3, bisa terhubung ke endpoint kompatibel OpenAI apa pun (dengan Ollama, email tidak keluar dari mesin saya). Sejujurnya ini masih PoC awal — sekitar 80% cocok pada 50 email nyata saya (sekali jalan, dengan baseline yang saya tetapkan), pengguna nyata masih saya sendiri, dan eksekusi AUTO sengaja dimatikan. Kalau dibesar-besarkan, komentar pertama pasti langsung menggigit.

Tulisan desain (seri dengan diskusi arsitektur dari para engineer):

Mengapa model murah mengalahkan GPT-4o: https://dev.to/k08200/…
Mengapa LLM hanya memberi skor dan tidak mengambil keputusan: https://dev.to/k08200/…
Deterministic floor untuk aksi yang tidak bisa dibatalkan: https://dev.to/k08200/…
Repo: https://github.com/k08200/klorn (docker-compose + setup LLM lokal). Demo masih dalam mode pengujian OAuth (100 orang), jadi self-host adalah cara tercepat.

Belum ada komentar.

Belum ada komentar.