1 poin oleh GN⁺ 2024-11-14 | 1 komentar | Bagikan ke WhatsApp

Visualisasi 13 juta pengguna BlueSky

  • Perbandingan Twitter dan BlueSky

    • Twitter adalah platform besar dengan basis pengguna yang sangat luas dan beragam aspek.
    • Basis pengguna BlueSky meningkat tajam dalam beberapa bulan terakhir, terutama didorong oleh permusuhan yang terus berlanjut terhadap basis pengguna Twitter dan pelarangan Twitter di Brasil.
    • Dengan menggunakan data BlueSky, seluruh jaringan dapat divisualisasikan.
  • Pengumpulan data

    • BlueSky berbasis pada protokol AT dan dirancang agar data dapat di-host sendiri melalui personal data server (PDS).
    • Dalam proyek ini, event real-time dikumpulkan melalui WebSocket bsky.network dan disimpan ke dalam database SQLite.
  • Rendering graf

    • Merender graf dengan 13 juta node dan 500 juta edge adalah pekerjaan yang kompleks.
    • Graf divisualisasikan menggunakan algoritme force-directed layout, yang mirip dengan simulasi fisika.
    • Optimisasi Barnes-Hut digunakan untuk mengurangi kompleksitas komputasi.
  • Mesin Andromeda

    • Mesin multithread yang dikembangkan dengan Zig, dengan GUI dibuat menggunakan GTK4 dan OpenGL.
    • Terinspirasi dari Gephi dan makalah ForceAtlas2, dengan penekanan pada interaktivitas untuk visualisasi graf berskala besar.
  • Reduksi dimensi dengan UMAP

    • UMAP adalah salah satu algoritme yang menunjukkan performa sangat baik untuk visualisasi dua dimensi.
    • Embedding node digunakan sebagai input ke UMAP untuk menghasilkan visualisasi yang lebih baik.
    • Pada tahap akhir UMAP, graf force-directed digunakan untuk menyesuaikan jarak antar node.
  • Menambahkan warna

    • Warna ditambahkan dengan menerapkan algoritme clustering pada output UMAP.
    • Clustering k-means digunakan untuk menetapkan hue pada tiap cluster, lalu kecerahan disesuaikan berdasarkan jumlah follower setiap node.
  • Hasil dan rencana ke depan

    • Visualisasi ini dengan jelas menunjukkan kepadatan dan struktur cluster berskala besar.
    • Fitur yang direncanakan berikutnya adalah menambahkan sidebar yang menampilkan timeline akun yang sedang terlihat di layar.

1 komentar

 
GN⁺ 2024-11-14
Opini Hacker News
  • Kehilangan minat karena feed BSKY tidak aktif. Berpikir bahwa jejaring sosial baru harus ramai seperti Twitter awal
  • Bluesky dan atproto dirancang agar bisa di-hack. Komunitas membangun direktori yang dapat dicari untuk "Starter Packs" Bluesky
    • Dan Abramov memuji proyek ini dan menyebut bahwa perusahaan media sosial yang menutup API telah mengekang web publik
  • Bluesky sedang tumbuh pesat di bidang tertentu. Pindah dari Twitter ke Bluesky karena percakapan di Twitter sudah tidak bernilai, dan aktivitas belakangan ini meningkat
  • Memperkirakan Bluesky akan menjadi versi kiri dari "Truth Social". Menganggap akan sulit beralih menjadi merek global
  • Menilai API BlueSky sangat bagus. Seorang rekan membuat visualisasi berdasarkan API tersebut
  • Sebagai pengguna yang pindah ke Bluesky, merasa puas. Bluesky mirip Twitter tahun 2015 tetapi tanpa iklan atau growth hacking
  • Menilai visualisasi Bluesky efektif dalam menyampaikan informasi dan menarik secara visual
  • Menyukai bahwa domain bisa digunakan sebagai nama pengguna Bluesky. Verifikasi jadi lebih bermakna
  • Menilai BlueSky sedang berada dalam kondisi positif saat ini dan merekomendasikan untuk membuat akun
  • Meskipun matriks BlueSky tidak bisa langsung dimasukkan ke UMAP, embedding pengguna dapat diturunkan dengan teknik lain