15 poin oleh darjeeling 2026-02-24 | 1 komentar | Bagikan ke WhatsApp

Ringkasan utama

  • Ini adalah contoh pembangunan agen AI pribadi 'Stella' yang menggunakan framework OpenClaw untuk mengelola kalender, memantau email, dan mengendalikan smart home.
  • Membahas masalah benturan teknis ketika sistem pencegahan penyalahgunaan otomatis Google menganggap akses API oleh agen AI sebagai 'aktivitas tidak normal' lalu menangguhkan akun.
  • Stack utama: OpenClaw (Agent OS), Claude/Gemini (LLM), Mac Mini (server lokal), Home Assistant, Bland AI (antarmuka telepon).
  • Pelajaran: menekankan perlunya lapisan autentikasi dan model pembuktian identitas baru berupa 'Supervised Agent' untuk membedakan manusia dan bot di era agen AI.

Analisis mendalam (Deep Dive)

1. Prinsip desain dan implementasi agen

Penulis (Trond Wuellner) membangun Stella bukan sebagai chatbot sederhana, melainkan sebagai 'kru digital' yang terlibat erat dalam kehidupan keluarga. Sistem ini dibangun di atas framework OpenClaw dan memiliki karakteristik struktural berikut.

  • Persistensi dan memori: Bukan percakapan berbasis sesi semata, melainkan pengelolaan file terstruktur untuk ulang tahun keluarga, preferensi, jadwal sekolah, dan sebagainya. Di akhir setiap sesi, Stella menulis catatan ringkasan lalu membacanya kembali pada eksekusi berikutnya untuk mempertahankan memori jangka panjang.
  • Antarmuka multimodal: Melalui dashboard 'Stellascreen' berbasis Raspberry Pi, sistem menampilkan informasi secara visual, dan dengan sistem TTS/STT lokal yang memanfaatkan Apple Neural Engine, interaksi suara diwujudkan dengan latensi di bawah 1 detik.
  • Dynamic model routing: Untuk mengoptimalkan biaya operasional, penulis mengimplementasikan sendiri sistem routing yang menugaskan pekerjaan sederhana dan berulang seperti pengecekan email (Heartbeat) ke Gemini Flash Lite, sementara tugas yang memerlukan penalaran kompleks diarahkan ke Gemini 1.5 Pro atau Claude.
2. Insiden penangguhan akun Google dan batasan infrastruktur

Sepuluh hari setelah proyek berjalan, Google menangguhkan akun Stella. Kasus ini menunjukkan bahwa infrastruktur web modern tidak dirancang dengan asumsi adanya 'agen AI otonom'.

  • Cacat desain OAuth: Alur OAuth saat ini berasumsi bahwa ada manusia yang duduk di depan browser. Ketika AI memanggil API secara terprogram dan memproses data, tindakan itu bisa disalahartikan sebagai 'pembajakan akun' oleh sistem deteksi spam/botnet Google.
  • Tidak adanya model kepercayaan: Service Accounts ditujukan untuk komunikasi antarserver, dan tidak ada 'tingkat kepercayaan' atau pengaturan 'izin terawasi' khusus bagi agen AI yang menjalankan fungsi pengguna biasa.
  • Solusi: Penulis beralih dari akun Google ke AgentMail, layanan email khusus agen AI, dan membangun ulang sistem dengan cara menghindari struktur autentikasi yang rapuh, misalnya menggunakan URL iCal alih-alih OAuth.
3. Hambatan teknis selama proses pembangunan
  • Kompleksitas pipeline suara: Diperlukan proses debugging audio routing lebih dari 12 tahap, mulai dari deteksi wake word (OpenWakeWord), pengenalan suara (Whisper), pemrosesan LLM, hingga sintesis suara (TTS).
  • Masalah sinkronisasi status: Saat mengendalikan smart home melalui Home Assistant, penanganan pengecualian untuk kondisi perangkat offline atau kesalahan tipe data (seperti NaN) menjadi hal yang wajib.
  • Latensi: Untuk mengurangi ketergantungan pada API cloud, penulis memaksimalkan pemanfaatan Neural Engine pada Mac Mini lokal agar respons sistem tetap cepat.

1 komentar

 
darjeeling 2026-02-24

Saya memposting ini karena lucu bahwa orang yang menulisnya adalah karyawan Google.
Jika Anda membayar dan menggunakan Google Workspace, katanya tidak akan ada masalah besar.