19 poin oleh xguru 2022-11-17 | 3 komentar | Bagikan ke WhatsApp
  • Apa yang akan terjadi jika ponsel selalu merekam apa yang kita katakan dan memprosesnya dengan AI? Saya mencobanya lebih dulu.
  • Selalu merekam selama saya terjaga, kecuali saat tidur (kadang dimatikan dalam situasi yang tidak pantas). Ini adalah PoC dan masih sulit diterapkan secara nyata.
  • Motivasi membuatnya adalah karena OpenAI merilis Whisper

Cara kerja

  • Sepanjang hari, saya merekam ucapan dengan dua mikrofon, lalu di akhir hari memprosesnya dengan Whisper untuk mengubahnya menjadi teks
  • Dari sini saya menyadari bahwa saya bisa membuat asisten digital tingkat dasar bergaya "Ok Google"
  • Ada dua jenis informasi yang bisa diekstrak setiap hari
    • Active: hal-hal yang secara sadar saya perintahkan kepada asisten
    • Passive: semua informasi lain yang seharusnya dapat diekstrak tanpa saya perlu melakukan tindakan apa pun

Fungsi Active

  • Untuk hal-hal yang harus diproses secara asinkron setiap malam, saya mengucapkannya dengan format 'KEYWORD COMMAND data END KEYWORD'
    • 'Robert WEIGHT 60.1 end Robert': Robert adalah nama asistennya, dan end adalah kata kunci penutup
    • Alasan tidak menggunakan "OK Google": fiturnya terbatas, saya tidak suka datanya pergi ke Google, dan itu memakai metode sinkron yang langsung diproses saat diucapkan
    • Tentu saja, karena diproses secara asinkron, ada kekurangan berupa saya tidak bisa mengetahui hasilnya sebelum hari berakhir

Melihat hasil

  • Setelah naik ke timbangan, 'Robert WEIGHT 62.8 end Robert'
  • Setelah bangun tidur, membaca sleep tracker (Mi Band) 'Robert SLEEP 7 hours 14 minutes end Robert'
    • Perangkat elektronik memang terhubung ke ponsel dan informasinya diteruskan, tetapi karena tidak ada cara untuk mengambilnya keluar, saya memanfaatkan asisten digital seperti Analog API
  • Setelah makan, 'Robert LUNCH two toasts with a fried egg end Robert'
    • Kalori dihitung lewat API eksternal berdasarkan makanan yang dikonsumsi setiap hari
  • Setelah mendengarkan podcast, 'Robert NOTE the podcast talks about Morgan Housel's book the psychology of money end Robert'
    • Semua memo dan ide disimpan
  • Setelah mengisi bensin, 'Robert SPENT 250,000 on fuel end Robert'
    • Riwayat pengeluaran harian disimpan
  • Memang agak aneh berbicara seperti ini kepada diri sendiri, tetapi kelebihannya adalah saya tidak perlu mengangkat ponsel dan melakukan sesuatu

Panel kontrol

  • Saya membuat dashboard untuk melihat semua informasi yang dimasukkan dengan cara ini
  • Saya juga membuat My Journal agar apa yang saya lakukan hari ini tercatat otomatis

Informasi Passive - masih dikerjakan

  • RELATIONSHIP THERMOMETER: termometer hubungan
  • SENTIMENT ANALYSIS: analisis emosi
  • TOTAL RECALL: mencari semua hal yang pernah dibicarakan tentang topik tertentu dan mencari apa yang saya pikirkan tentang topik itu pada waktu tertentu

Kesimpulan sementara

  • Audio + konteks diperlukan
  • Potensi yang bisa didapat dari ini sangat besar, baik secara positif maupun negatif
    • Positif: memori sempurna, psikolog/pelatih pribadi, klon virtual diri saya
    • Negatif: hal-hal seperti di atas berada di tangan orang lain
  • Perbedaan antara utopia dan distopia adalah siapa yang bisa mengakses informasi tersebut

3 komentar

 
budlebee 2022-11-17

"Perbedaan antara utopia dan distopia adalah siapa yang bisa mengakses informasi itu." Kalimat yang bagus.

 
nicewook 2022-11-17

Menarik. Tampaknya cukup mungkin untuk benar-benar terwujud.
Seperti VLog, ini juga bisa menjadi konten untuk berbagi dan menunjukkan keseharian yang terkadang bersifat teladan.

 
xguru 2022-11-17

Penulisnya langsung memposting di HN dan juga membalas komentar di sana https://news.ycombinator.com/item?id=33608437
Tautan AliExpress untuk mikrofon yang digunakan juga disertakan hehe

Whisper - sistem pengenalan suara multibahasa (ASR) yang dirilis open source oleh OpenAI