4 poin oleh GN⁺ 2026-02-23 | 1 komentar | Bagikan ke WhatsApp
  • Arsip informasi open source yang menyusun data CIA World Factbook dari 1990 hingga 2025 agar bisa dicari dan dianalisis
  • Mencakup 281 negara dan wilayah, 36 edisi tahunan, serta lebih dari 1 juta field data
  • Menyediakan profil negara per tahun, data deret waktu, pencarian teks lengkap, serta analisis jaringan geografi, komunikasi, dan perdagangan
  • Termasuk alat analisis seperti dashboard berbasis wilayah COCOM, perbandingan indikator antarnegara, dan visualisasi tren global
  • Berdasarkan materi domain publik, dan merupakan proyek independen yang tidak terkait dengan CIA maupun pemerintah AS

Ikhtisar

  • Arsip data yang melestarikan dan menstrukturkan informasi geopolitik selama 36 tahun
    • Berdasarkan data yang di-parse dari CIA World Factbook asli
    • Mencakup 281 entitas, 36 edisi, 9.500 catatan negara-tahun, dan 1.061.341 field data
  • Semua data dapat dicari, dan perubahan laporan negara dari tahun ke tahun bisa dilacak

Komponen platform

  • Factbook Archive / Reference Library
    • Semua edisi dari 1990 hingga 2025 dapat diakses
    • Menampilkan data field asli apa adanya, dan memungkinkan pencarian perubahan antar tahun
  • Intelligence Analysis / Analytic Workspace
    • Workspace analitik yang disusun berdasarkan wilayah DoD Combatant Commands (COCOM)
    • Menyediakan peta warna (Choropleth), perbandingan deret waktu, dossier analisis per negara (format ICD 203), dan fitur perbandingan antarindikator

Fitur utama

  • Library: semua entitas diklasifikasikan berdasarkan jenis, termasuk bendera
  • Country Profile: melihat seluruh data field untuk tiap negara
  • Full-Text Search: pencarian kata kunci di lebih dari 1 juta field dengan sintaks Z39.58
  • Field Time Series: melacak tren 36 tahun dari field data tertentu
  • Factbook Quiz: kuis pengetahuan dunia dengan 4 mode
  • Factbook Export: membuat laporan negara siap cetak yang mencakup semua field

Alat analisis intelijen

  • Regional Dashboard: peta dunia yang menampilkan wilayah COCOM dan ibu kotanya
  • Timeline Map: memvisualisasikan data 36 tahun dalam bentuk animasi
  • Communications Analysis: menampilkan indikator penetrasi internet, seluler, dan broadband
  • Map Compare: membandingkan peta dua tahun secara sinkron
  • COCOM Region Detail: menampilkan indikator utama (KPI) per wilayah
  • Intelligence Dossier: dossier analisis per negara berdasarkan standar ICD 203
  • Global Rankings: mengurutkan peringkat negara berdasarkan indikator
  • Global Trends: tren indikator global di seluruh edisi
  • Compare Countries: membandingkan indikator antarnegara
  • Field Explorer: menjelajahi semua field data dan statistik cakupan
  • Change Detection: mendeteksi perubahan field dari tahun ke tahun
  • Dissolved States: informasi tentang negara dan wilayah yang sudah tidak ada lagi
  • Trade Networks: graf jaringan hubungan perdagangan
  • Organization Networks: graf hubungan keanggotaan organisasi internasional
  • Query Builder: membuat kueri analisis kustom
  • Text Diff: membandingkan teks antar tahun dan menyorot perubahan

Informasi proyek

  • Semua data dikumpulkan dari materi domain publik pemerintah AS (CIA World Factbook)
  • Tidak terkait dengan CIA maupun pemerintah AS
  • Analisis mengikuti standar analitik ICD 203
  • Sumber dan metodologi dipublikasikan melalui repositori GitHub

1 komentar

 
GN⁺ 2026-02-23
Komentar Hacker News
  • Sepertinya pemerintahan saat ini telah menghapus semua data internal CIA World Factbook, untuk mencegah upaya pemulihan di masa depan
    Akan sangat keren jika pemerintahan berikutnya membangun ulang dengan memanfaatkan data arsip ini
  • Beginilah seharusnya Show HN bekerja
    Seseorang mengunggah proyek, lalu komunitas menemukan bug secara real time, dan pembuatnya langsung memperbaikinya
    Masalah benturan kode negara FIPS dan ISO adalah contoh bagus bahwa bug langka seperti ini hanya bisa ditemukan dengan banyak pasang mata
    Sang pembuat juga mengesankan karena tidak defensif dan aktif menanggapi masukan
  • Ada repositori GitHub untuk siapa pun yang membutuhkan file JSON atau Markdown dari Factbook
    Dijelaskan sebagai “cache dataset profil negara dalam format asli CIA.gov (1:1)”
    Data detailnya bisa dilihat di cache.factbook.json
    • Terima kasih untuk tautannya! GitHub dan situs web saya juga memakai sumber ini
      Tetapi saya merasa perlu membuat data 1990~2025 menjadi database SQL agar bisa dikueri
  • Untuk pembuatnya: jika Anda sedang memperbaiki field database atau bug (misalnya kode negara), saya penasaran apakah versi itu juga bisa dibagikan
    Dataset ini sangat cocok untuk pengujian fitur GraphRAG
    Sepertinya juga bisa dipakai untuk membuat game simulasi dunia berbasis data nyata
    • Tentu bisa! Semua riwayat perubahan data saya kelola dalam log perubahan .txt
      Konten asli yang dirilis CIA tetap dipertahankan apa adanya, dan saya hanya merapikan noise formatting dalam proses parsing
      Selain itu, saya juga membuat tabel lookup yang memetakan kode FIPS 10-4, ISO Alpha-2/3, dan MasterCountryID agar bisa saling dihubungkan
      Materi ini juga akan saya tambahkan ke GitHub
  • Proyek yang keren. Tapi saya menemukan satu masalah
    Jika mengeklik entri “Germany” di Factbook 2002, selalu diarahkan ke halaman “Gambia”
    Saya tidak melihat gejala ini pada negara lain
    • Contoh lain, jika mencari “Nicaragua”, hasilnya terhubung ke halaman “Niger”
  • Versi 2025–2026 sudah bisa dibeli dan dibaca dari pihak luar, dan edisi 2026–2027 dijadwalkan rilis pada 7 April
    Tautan Amazon
    • Saya tidak tahu buku seperti ini benar-benar diterbitkan. Terima kasih sudah memberi tahu
    • Internet Archive memiliki edisi 2025–2026, jadi setelah dipindai akan ditambahkan ke OpenLibrary
    • Setelah dirilis, saya juga akan menambahkannya ke proyek saya. Terima kasih sudah berbagi informasinya
  • Tautan ini benar-benar luar biasa: halaman analisis riwayat perubahan
  • Proyek yang keren. Tapi sepertinya jumlah populasi dunia dihitung dua kali lipat
    Bisa dilihat di halaman analisis tren
    • Saya menemukan penyebabnya. Entitas “World” (sekitar 8 miliar orang) ikut dijumlahkan bersama negara-negara individual, sehingga totalnya menjadi dua kali lipat
      Terima kasih atas laporannya!
    • Saya sedang langsung memperbaikinya. Sepertinya karena sudah terlalu lama menatap ini, saya jadi melewatkannya. Terima kasih sudah memberi tahu
  • Apakah proyek ini merupakan arsip yang melestarikan layanan yang saat ini dihentikan oleh pemerintahan Gedung Putih?
    • Ya, tepat layanan itu
  • Ada bug pada grafik deret waktu. Perlu normalisasi (normalization) sebelum memvisualisasikan datanya
    Contoh: data langganan broadband tetap India
    • Saya menemukan masalahnya. Regex yang mem-parsing total tidak bisa menangani sufiks satuan (million/billion, dll.)
      Misalnya, “18.17 million” hanya dibaca sebagai 18.17 sehingga grafiknya tampak anjlok
      Saya menambahkan penanganan satuan untuk memperbaiki bug itu, dan baru saja selesai deploy
      Terima kasih sudah melaporkannya