18 poin oleh GN⁺ 25 hari lalu | 1 komentar | Bagikan ke WhatsApp
  • Saat merapikan 1.351 foto keluarga yang ditemukan di rumah nenek, penulis membangun wiki pribadi berbasis MediaWiki untuk menata ingatan secara terstruktur
  • Dengan format wiki, ia menghubungkan foto, tokoh, dan peristiwa, lalu menyusun ulang sejarah keluarga dan kisah pribadinya dalam bentuk artikel
  • Setelah itu, ia bereksperimen menggabungkan berbagai jejak digital seperti Google Photos, riwayat lokasi, transaksi keuangan, dan data pengenalan musik dengan Claude Code dan model bahasa untuk membuat halaman secara otomatis
  • Dalam proses ini, model membantu memulihkan celah-celah ingatan dan menyusun ulang alur percakapan, perjalanan, serta persahabatan menjadi narasi berbasis data
  • Hasilnya berkembang menjadi proyek open source whoami.wiki, yang menawarkan kerangka agar individu dapat menjelajahi dan memiliki datanya sendiri seperti sebuah ensiklopedia

Awal proyek ensiklopedia pribadi

  • Saat pertama kali mengunjungi rumah nenek setelah pandemi, penulis menemukan 1.351 foto lama dan mulai menatanya
    • Foto-foto itu mencakup masa muda kakek-nenek hingga masa SMP penulis
    • Klasifikasi awal dilakukan berdasarkan atribut fisik seperti jenis film atau rasio foto
  • Ketika menata foto, fragmen-fragmen cerita dalam ingatan mulai muncul, tetapi urutan dan konteksnya belum jelas
    • Karena foto-foto itu berasal dari masa sebelum metadata EXIF umum digunakan, urutan waktunya sulit ditentukan
  • Saat menyusun ulang foto bersama nenek, penulis merekam kenangan lisan tentang pernikahan
    • Nama tokoh dan peristiwa dicatat, dan beberapa orang berhasil diidentifikasi sebagai kerabat saat masih muda
  • Catatan itu kemudian dirapikan dengan menjalankan MediaWiki secara lokal dan diedit dalam format seperti Wikipedia sungguhan
    • Halamannya disusun secara terstruktur dengan infobox, isi utama, caption foto, dan tautan antar tokoh
    • Hal-hal terkait seperti perubahan hukum, upacara, dan lokasi ditautkan ke halaman Wikipedia yang sebenarnya

Merekonstruksi ingatan lewat perangkat lunak wiki

  • Dalam dua hari, penulis berhasil merangkum latar historis foto-foto itu dalam bentuk artikel yang utuh
    • Ia merasakan bahwa perangkat lunak wiki adalah alat yang sangat kuat untuk melestarikan pengetahuan dan media
  • Selama beberapa bulan berikutnya, seluruh koleksi foto keluarga diperluas menjadi halaman-halaman wiki
    • Dengan saran dari komunitas r/genealogy, metode pencatatan sejarah lisan diperbaiki
    • Transkripsi suara dan model bahasa digunakan untuk meningkatkan efisiensi penyuntingan
  • Format wiki memudahkan penulis melihat hubungan antarperistiwa dan antartokoh
    • Misalnya, ia menemukan bahwa penyanyi di pernikahan kakek-neneknya adalah perawat yang kemudian membantu kelahirannya

Menggabungkan data digital dan model bahasa

  • Setelah itu proyek diperluas ke foto digital di Google Photos
    • Metadata EXIF memungkinkan pemanfaatan tanggal, waktu, dan informasi lokasi
  • Untuk 625 foto perjalanan keluarga tahun 2012, penulis meminta Claude Code membuat halaman wiki
    • Model menelusuri gambar dengan bantuan contact sheet yang dibuat menggunakan ImageMagick
    • Hanya dari informasi visual dan timestamp, model merekonstruksi lokasi dan aktivitas
    • Termasuk deskripsi rinci tentang moda transportasi, tempat yang dikunjungi, dan identifikasi orang
  • Penulis lalu menambahkan daftar anekdot pribadinya ke draf yang dihasilkan untuk menyempurnakan narasi

Eksperimen integrasi data majemuk

  • Lalu proyek diperluas menggunakan data perjalanan ke Mexico City tahun 2022
    • Sebanyak 291 foto, 343 video, serta riwayat lokasi Google Maps, perjalanan Uber, transaksi bank, dan riwayat Shazam digabungkan
  • Tugas utama yang dijalankan Claude Code
    1. Menganalisis silang transaksi bank dan data lokasi untuk mengidentifikasi restoran yang dikunjungi
    2. Menggunakan riwayat pembayaran tiket untuk mengenali tim dan nama kompetisi pertandingan sepak bola
    3. Memakai riwayat perjalanan Uber untuk mengetahui waktu dan lokasi perpindahan
    4. Menggunakan riwayat Shazam untuk mendeskripsikan genre musik di tiap lokasi
    5. Menemukan adegan bermain gitar saat makan malam dari frame video dan menyisipkannya ke halaman
  • Fitur MediaWiki seperti halaman diskusi, kategori, dan riwayat revisi tetap dimanfaatkan apa adanya
    • Setiap kali data baru ditambahkan, riwayat penyuntingan menumpuk seperti di wiki sungguhan

Menjadikan data pribadi sebagai ensiklopedia

  • Seiring waktu, model beralih menjadi pengisi celah ingatan
    • Dengan menganalisis silang berbagai sumber data, model memulihkan fakta-fakta yang sempat terlupakan
  • Arsip Facebook, Instagram, dan WhatsApp berisi sekitar 100 ribu pesan dan voice note dianalisis
    • Dari percakapan dengan teman, sistem mengekstrak alur persahabatan dan peristiwa hidup lalu menyusunnya menjadi halaman
    • Teman-temannya membaca halaman itu dan terlibat begitu dalam hingga melahap seluruh isinya
  • Melalui proses ini, proyek tersebut berkembang dari sekadar sejarah keluarga menjadi pembangunan ensiklopedia pribadi (personal encyclopedia)
    • Sebuah sistem pencatatan diri yang terstruktur, saling terhubung, dan berbasis data pun terbentuk

Proyek whoami.wiki dirilis

  • Berdasarkan pengalaman tersebut, whoami.wiki dirilis sebagai open source
    • Berbasis MediaWiki, dan dapat membuat halaman wiki secara otomatis dari data pribadi
    • Pengguna cukup menyediakan ekspor datanya sendiri, lalu model bahasa menyusun draf awal
    • Mendukung eksekusi lokal, kepemilikan data tetap di tangan pengguna, dan independensi model
  • Topik seperti pernikahan, teman, perjalanan, dan berbagai bagian kehidupan pribadi dapat dicatat dalam format yang sama seperti wiki publik
  • Pengalaman menjelajahi halaman yang telah jadi memberi kesenangan yang mengingatkan pada timeline Facebook awal
  • Yang lebih penting daripada teknologinya adalah penemuan kembali tentang manusia dan ingatan
    • Saat mendokumentasikan kehidupan neneknya, penulis kembali menyadari ketangguhan dan daya pulih yang dimilikinya
    • Saat menengok kembali relasi dengan teman-teman, ia memulihkan rasa syukur dan keterhubungan
  • Proyek ini masih berada pada tahap awal, dan siapa pun sudah bisa memulainya sendiri melalui dokumentasi instalasi
    • Data tetap dimiliki pengguna dan disimpan dalam struktur yang bisa dibaca model apa pun
    • Proyek terus diperbaiki berdasarkan masukan dari para kolaborator

1 komentar

 
GN⁺ 25 hari lalu
Komentar Hacker News
  • Proyek ini benar-benar keren dan terasa seperti cara yang menarik untuk melestarikan sejarah keluarga
    Tapi pada bagian yang melibatkan AI, aku merasa campur aduk secara emosional
    Rasanya agak pahit seperti kerajinan tangan tersingkir oleh pabrik, dan pada saat yang sama melihat AI menganalisis silang hingga riwayat bank, tiket, dan catatan musik terasa agak distopis
    Meski begitu, secara keseluruhan ini tetap upaya yang sangat mengesankan

    • Terima kasih :)
      Awalnya aku juga mengerjakan semua penyuntingan sendiri sambil merangkai bahan seperti seorang sejarawan
      Setelah itu aku mulai bereksperimen dengan agen, dan kecepatan kerjanya meningkat jauh, tapi aku tetap menghabiskan banyak waktu seperti seorang ‘kontributor wiki’ yang memikirkan apa yang harus dipertahankan dan dihapus
      Pada saat yang sama, pengalaman ini membuatku benar-benar sadar betapa pentingnya perlindungan data pribadi. Kita meninggalkan terlalu banyak jejak digital
    • Biasanya AI yang meniru manusia terasa mengganggu, tapi kali ini berbeda
      Seperti ‘sepeda untuk pikiran’ yang pernah dikatakan Steve Jobs, teknologi bekerja sebagai alat yang membantu pekerjaan manusia
      Sudah lama rasanya aku tidak melihat teknologi membantu kreasi yang manusiawi, dan itu membuatku kembali merasakan antusiasme lama
    • Aku juga berpikir mirip. Sebagai perangkat bingkai untuk membahas sejarah keluarga, ini luar biasa, tapi secara naluriah aku menolak ketika AI menjadi naratornya
      Tidak ada masalah moral saat LLM merapikan informasi, tapi terasa tidak nyaman ketika model milik perusahaan besar berbicara menggantikan narasi pribadi seseorang
    • Di sini AI terlihat hanya sebagai kolaborator
      Penulis menangani bagian yang menarik, AI menangani penyambungan data yang membosankan, dan menurutku pembagian peran seperti ini ideal
    • Reaksiku juga sama. Mencatat anggota keluarga dan peristiwa secara langsung itu sangat bagus, tapi kalau AI mengambil alih semuanya, daya tariknya hilang
      1. Sentuhan kurasi menghilang
      2. Subjektivitas dalam ingatan itu penting, tapi AI cenderung mencoba mengoreksinya
      3. Pada akhirnya jadinya hasil tanpa jiwa
  • Aku dan istriku setiap tahun saat tahun baru mengikat sekitar 50 lembar kertas menjadi buku catatan kecil
    Dijilid dengan kain pakaian usang, lalu dihias dengan benda kenangan seperti kotak korek api dari tempat perjalanan
    Kami menulis hal-hal yang dipelajari selama setahun, pertengkaran dan rekonsiliasi, resep masakan, pikiran, dan lainnya, lalu menyimpannya sebagai rekaman tahun itu
    Alasan kami menulis tangan alih-alih memakai alat AI adalah karena prosesnya sendiri merupakan ritual yang bermakna dan menyenangkan
    Membayangkan anak-anak akan membacanya nanti membuatnya terasa lebih indah

    • Aku juga melakukan hal serupa dengan mencetak foto lewat printer Instax lalu menempelkannya di buku harian
      Seperti buku resep lama yang penuh jejak tangan, buku dengan bekas cipratan cat terasa lebih menarik
    • Ini disebut commonplace book. Jillian Hess banyak meneliti hal terkait ini
    • Ide yang sangat keren, aku ingin mencobanya bersama istri dan anak-anakku
    • Menyentuh sekali, tapi sejujurnya kurasa aku tidak punya energi sebesar itu
  • Aku juga mulai mengerjakan hal seperti ini dalam bentuk buku cetak sungguhan
    Aku sedang membuat buku per tahun dengan ribuan foto yang ditata di Scribus
    Aku suka karena jejak diriku akan tetap ada secara fisik bahkan setelah aku meninggal
    Aku berencana menempelkan kartu SD di halaman depan agar video juga bisa disimpan bersama
    Aku juga mendapatkan printer Canon Selphy bekas dan mencetak foto di rumah. Warnanya memang tidak sempurna, tapi rasanya memuaskan melihatnya tergantung di dinding

    • Aku suka membuat zine. Cetak laser tahan lama bahkan di bawah sinar matahari, dan pensil ternyata yang paling awet
      Stapler 360 derajat adalah yang terbaik untuk penjilidan cepat
    • Aku melakukan sesuatu yang mirip lewat email. Saat anakku lahir, aku membuatkan alamat email agar keluarga bisa mengirim pesan dan foto untuknya
      Ini adalah proyek warisan digital agar dia bisa membacanya saat berusia 18 tahun
      Tulisan terkait ada di sini
    • Aku penasaran berapa biaya membuat bukunya. Kalau bikin sendiri memang murah, tapi akhir-akhir ini aku kekurangan waktu
    • Aku juga ingin mencobanya. Bisa berbagi template atau tips?
    • Katanya kartu SD tidak bertahan lama. Bagaimana kalau sebagian videonya disimpan sebagai flipbook?
  • Aku suka riset silsilah keluarga. Aku berhasil melacak leluhur yang datang ke Argentina sampai 10 generasi lalu (sekitar 250 tahun)
    Untuk garis Eropa jauh lebih sulit karena perang dan banyak dokumen yang hilang
    Belakangan ini aku sedang mengumpulkan cerita lama dari para tetua keluarga lewat pesan suara lalu merapikannya
    Sepertinya akan bagus jika disusun dalam format wiki bersama pohon keluarga buatan ayahku

    • Sepuluh generasi itu luar biasa. Aku jadi penasaran leluhurmu berasal dari negara mana
  • Setiap tahun istriku memilih foto dari akun bersama kami lalu menyusunnya menjadi buku 50 halaman
    Sampai sekarang sudah ada 12 tahun catatan tahunan, dan itu menjadi kenangan yang bisa dibalik dengan tangan
    Dia juga melakukan pekerjaan ini untuk orang lain, dan mendapat sambutan besar berkat sentuhan pribadi yang diberikannya

  • Proyeknya sendiri keren, tapi privasi penting saat memakai API LLM
    Aku tidak ingin menyerahkan fotoku ke model milik perusahaan Amerika

    • Ada alternatif seperti confer.to
    • Dibanding foto, yang lebih aku khawatirkan adalah riwayat bank
    • Penulis tampaknya tidak menganggap fotonya rahasia karena sudah mempublikasikannya di blog
    • Mungkin ada alternatif seperti PPQ.AI, OpenRouter.AI, atau Apple on-device AI
    • Kalau begitu, apakah kamu mau menyerahkannya pada LLM milik perusahaan China, Rusia, atau Eropa?
  • Kombinasi wawancara keluarga dan alur kerja LLM adalah contoh pemanfaatan yang sangat bagus
    Tapi mengekspor sampai riwayat lokasi Google Maps, Uber, transaksi bank, dan Shazam terasa sudah kelewatan
    Belakangan ini banyak proyek AI yang bilang “datanya ada di perangkatku”, tapi dalam praktiknya jalur perpindahan data sering tidak jelas
    Sepertinya pengguna belum cukup memahami trade-off tersebut

  • Meski dikatakan “default-nya privat”, pada praktiknya data tetap diunggah ke server perusahaan AI
    Jika LLM lokal tidak didukung, maka kalimat soal privasi harus dibuat lebih jelas

  • Aku merasa tidak nyaman pada bagian yang menyebut data Google Maps, Uber, bank, dan Shazam diberikan ke AI
    Proyeknya sendiri luar biasa, tapi menyerahkan data paling sensitif ke sebuah layanan itu berisiko
    Selalu ada kemungkinan bocor suatu hari nanti

    • Aku tidak merasa tidak nyaman. Hanya saja aku memang tidak tertarik pada obsesi data diri (quantified self) seperti itu
      Aku tertarik melestarikan cerita keluarga, tapi tidak tertarik pada analisis diri
  • Idenya bagus, tapi persoalannya adalah seberapa jauh hal-hal itu akan dibagikan
    Kalau hanya untuk dilihat sendiri, semuanya bisa dicatat, tapi saat dibaca bersama keluarga akan muncul cerita sensitif

    • Setuju. Apalagi semua itu diunggah ke server Anthropic
      Mencatat masa lalu keluarga yang gelap atau konflik bisa menjadi pelanggaran privasi
      Perang, penjara, masalah warisan, dan sebagainya, semuanya disimpan dengan ingatan dan emosi yang berbeda-beda oleh tiap orang
      Saat AI merangkainya, yang tersisa hanya ilusi objektivitas, dan itu bisa membuka kembali luka lama di dalam keluarga
      Pada akhirnya, menurutku ingatan memang semestinya punya siklus alami untuk dilupakan
      Orang-orang yang terlalu tenggelam dalam teknologi sering mengabaikan kerumitan manusiawi seperti ini
    • Pada akhirnya ini wiki milikku, jadi aku bebas melakukannya sesukaku