- Apa yang akan terjadi jika ponsel selalu merekam apa yang kita katakan dan memprosesnya dengan AI? Saya mencobanya lebih dulu.
- Selalu merekam selama saya terjaga, kecuali saat tidur (kadang dimatikan dalam situasi yang tidak pantas). Ini adalah PoC dan masih sulit diterapkan secara nyata.
- Motivasi membuatnya adalah karena OpenAI merilis Whisper
Cara kerja
- Sepanjang hari, saya merekam ucapan dengan dua mikrofon, lalu di akhir hari memprosesnya dengan Whisper untuk mengubahnya menjadi teks
- Dari sini saya menyadari bahwa saya bisa membuat asisten digital tingkat dasar bergaya "Ok Google"
- Ada dua jenis informasi yang bisa diekstrak setiap hari
- Active: hal-hal yang secara sadar saya perintahkan kepada asisten
- Passive: semua informasi lain yang seharusnya dapat diekstrak tanpa saya perlu melakukan tindakan apa pun
Fungsi Active
- Untuk hal-hal yang harus diproses secara asinkron setiap malam, saya mengucapkannya dengan format
'KEYWORD COMMAND data END KEYWORD'
'Robert WEIGHT 60.1 end Robert': Robert adalah nama asistennya, dan end adalah kata kunci penutup
- Alasan tidak menggunakan "OK Google": fiturnya terbatas, saya tidak suka datanya pergi ke Google, dan itu memakai metode sinkron yang langsung diproses saat diucapkan
- Tentu saja, karena diproses secara asinkron, ada kekurangan berupa saya tidak bisa mengetahui hasilnya sebelum hari berakhir
Melihat hasil
- Setelah naik ke timbangan,
'Robert WEIGHT 62.8 end Robert'
- Setelah bangun tidur, membaca sleep tracker (Mi Band)
'Robert SLEEP 7 hours 14 minutes end Robert'
- Perangkat elektronik memang terhubung ke ponsel dan informasinya diteruskan, tetapi karena tidak ada cara untuk mengambilnya keluar, saya memanfaatkan asisten digital seperti Analog API
- Setelah makan,
'Robert LUNCH two toasts with a fried egg end Robert'
- Kalori dihitung lewat API eksternal berdasarkan makanan yang dikonsumsi setiap hari
- Setelah mendengarkan podcast,
'Robert NOTE the podcast talks about Morgan Housel's book the psychology of money end Robert'
- Semua memo dan ide disimpan
- Setelah mengisi bensin,
'Robert SPENT 250,000 on fuel end Robert'
- Riwayat pengeluaran harian disimpan
- Memang agak aneh berbicara seperti ini kepada diri sendiri, tetapi kelebihannya adalah saya tidak perlu mengangkat ponsel dan melakukan sesuatu
Panel kontrol
- Saya membuat dashboard untuk melihat semua informasi yang dimasukkan dengan cara ini
- Saya juga membuat My Journal agar apa yang saya lakukan hari ini tercatat otomatis
Informasi Passive - masih dikerjakan
- RELATIONSHIP THERMOMETER: termometer hubungan
- SENTIMENT ANALYSIS: analisis emosi
- TOTAL RECALL: mencari semua hal yang pernah dibicarakan tentang topik tertentu dan mencari apa yang saya pikirkan tentang topik itu pada waktu tertentu
Kesimpulan sementara
- Audio + konteks diperlukan
- Potensi yang bisa didapat dari ini sangat besar, baik secara positif maupun negatif
- Positif: memori sempurna, psikolog/pelatih pribadi, klon virtual diri saya
- Negatif: hal-hal seperti di atas berada di tangan orang lain
- Perbedaan antara utopia dan distopia adalah siapa yang bisa mengakses informasi tersebut
3 komentar
"Perbedaan antara utopia dan distopia adalah siapa yang bisa mengakses informasi itu." Kalimat yang bagus.
Menarik. Tampaknya cukup mungkin untuk benar-benar terwujud.
Seperti VLog, ini juga bisa menjadi konten untuk berbagi dan menunjukkan keseharian yang terkadang bersifat teladan.
Penulisnya langsung memposting di HN dan juga membalas komentar di sana https://news.ycombinator.com/item?id=33608437
Tautan AliExpress untuk mikrofon yang digunakan juga disertakan hehe
Whisper - sistem pengenalan suara multibahasa (ASR) yang dirilis open source oleh OpenAI