- Arsip informasi open source yang menyusun data CIA World Factbook dari 1990 hingga 2025 agar bisa dicari dan dianalisis
- Mencakup 281 negara dan wilayah, 36 edisi tahunan, serta lebih dari 1 juta field data
- Menyediakan profil negara per tahun, data deret waktu, pencarian teks lengkap, serta analisis jaringan geografi, komunikasi, dan perdagangan
- Termasuk alat analisis seperti dashboard berbasis wilayah COCOM, perbandingan indikator antarnegara, dan visualisasi tren global
- Berdasarkan materi domain publik, dan merupakan proyek independen yang tidak terkait dengan CIA maupun pemerintah AS
Ikhtisar
- Arsip data yang melestarikan dan menstrukturkan informasi geopolitik selama 36 tahun
- Berdasarkan data yang di-parse dari CIA World Factbook asli
- Mencakup 281 entitas, 36 edisi, 9.500 catatan negara-tahun, dan 1.061.341 field data
- Semua data dapat dicari, dan perubahan laporan negara dari tahun ke tahun bisa dilacak
Komponen platform
- Factbook Archive / Reference Library
- Semua edisi dari 1990 hingga 2025 dapat diakses
- Menampilkan data field asli apa adanya, dan memungkinkan pencarian perubahan antar tahun
- Intelligence Analysis / Analytic Workspace
- Workspace analitik yang disusun berdasarkan wilayah DoD Combatant Commands (COCOM)
- Menyediakan peta warna (Choropleth), perbandingan deret waktu, dossier analisis per negara (format ICD 203), dan fitur perbandingan antarindikator
Fitur utama
- Library: semua entitas diklasifikasikan berdasarkan jenis, termasuk bendera
- Country Profile: melihat seluruh data field untuk tiap negara
- Full-Text Search: pencarian kata kunci di lebih dari 1 juta field dengan sintaks Z39.58
- Field Time Series: melacak tren 36 tahun dari field data tertentu
- Factbook Quiz: kuis pengetahuan dunia dengan 4 mode
- Factbook Export: membuat laporan negara siap cetak yang mencakup semua field
Alat analisis intelijen
- Regional Dashboard: peta dunia yang menampilkan wilayah COCOM dan ibu kotanya
- Timeline Map: memvisualisasikan data 36 tahun dalam bentuk animasi
- Communications Analysis: menampilkan indikator penetrasi internet, seluler, dan broadband
- Map Compare: membandingkan peta dua tahun secara sinkron
- COCOM Region Detail: menampilkan indikator utama (KPI) per wilayah
- Intelligence Dossier: dossier analisis per negara berdasarkan standar ICD 203
- Global Rankings: mengurutkan peringkat negara berdasarkan indikator
- Global Trends: tren indikator global di seluruh edisi
- Compare Countries: membandingkan indikator antarnegara
- Field Explorer: menjelajahi semua field data dan statistik cakupan
- Change Detection: mendeteksi perubahan field dari tahun ke tahun
- Dissolved States: informasi tentang negara dan wilayah yang sudah tidak ada lagi
- Trade Networks: graf jaringan hubungan perdagangan
- Organization Networks: graf hubungan keanggotaan organisasi internasional
- Query Builder: membuat kueri analisis kustom
- Text Diff: membandingkan teks antar tahun dan menyorot perubahan
Informasi proyek
- Semua data dikumpulkan dari materi domain publik pemerintah AS (CIA World Factbook)
- Tidak terkait dengan CIA maupun pemerintah AS
- Analisis mengikuti standar analitik ICD 203
- Sumber dan metodologi dipublikasikan melalui repositori GitHub
1 komentar
Komentar Hacker News
Akan sangat keren jika pemerintahan berikutnya membangun ulang dengan memanfaatkan data arsip ini
Seseorang mengunggah proyek, lalu komunitas menemukan bug secara real time, dan pembuatnya langsung memperbaikinya
Masalah benturan kode negara FIPS dan ISO adalah contoh bagus bahwa bug langka seperti ini hanya bisa ditemukan dengan banyak pasang mata
Sang pembuat juga mengesankan karena tidak defensif dan aktif menanggapi masukan
Dijelaskan sebagai “cache dataset profil negara dalam format asli CIA.gov (1:1)”
Data detailnya bisa dilihat di cache.factbook.json
Tetapi saya merasa perlu membuat data 1990~2025 menjadi database SQL agar bisa dikueri
Dataset ini sangat cocok untuk pengujian fitur GraphRAG
Sepertinya juga bisa dipakai untuk membuat game simulasi dunia berbasis data nyata
Konten asli yang dirilis CIA tetap dipertahankan apa adanya, dan saya hanya merapikan noise formatting dalam proses parsing
Selain itu, saya juga membuat tabel lookup yang memetakan kode FIPS 10-4, ISO Alpha-2/3, dan MasterCountryID agar bisa saling dihubungkan
Materi ini juga akan saya tambahkan ke GitHub
Jika mengeklik entri “Germany” di Factbook 2002, selalu diarahkan ke halaman “Gambia”
Saya tidak melihat gejala ini pada negara lain
Tautan Amazon
Bisa dilihat di halaman analisis tren
Terima kasih atas laporannya!
Contoh: data langganan broadband tetap India
Misalnya, “18.17 million” hanya dibaca sebagai 18.17 sehingga grafiknya tampak anjlok
Saya menambahkan penanganan satuan untuk memperbaiki bug itu, dan baru saja selesai deploy
Terima kasih sudah melaporkannya