7 poin oleh xguru 2020-03-02 | 1 komentar | Bagikan ke WhatsApp
  • Alat analisis investigasi data untuk jurnalisme investigatif yang dibuat oleh OCCRP, organisasi yang berfokus pada investigasi kejahatan terorganisasi dan korupsi

  • Pencarian silang terpadu untuk data terstruktur (DB) / tidak terstruktur (PDF, XLS, DOC, dll.)

  • Fitur pemisahan data dan manajemen akses. Mendukung berbagi yang fleksibel antar tim multinasional

  • Crawling berkelanjutan dari ratusan sumber data publik

  • Menyediakan analisis investigasi visual

  • Mendukung impor data

  • Dari HTML/XML, PDF, RTF, Epub hingga sebagian besar dokumen perkantoran (Doc, PPT)

  • Format tabel seperti XLS/CSV serta DBF, SQLite, Access

  • Email MIME RFC822, mailbox seperti Outlook PST/OLM, Mbox, Vcard

  • Zip, Rar, Tar, 7Zip, Gzip

  • JPEG, PNG, GIF, TIFF, SVG diekstraksi teksnya melalui OCR dengan Tesseract 4 atau Google Vision API

1 komentar

 
xguru 2020-03-02

OCCRP, pembuatnya, adalah organisasi seperti ini.

"OCCRP, media investigasi yang berfokus pada kejahatan terorganisasi dan korupsi" https://newstapa.org/article/_DNLi

Anda bisa mencobanya dengan data nyata di https://aleph.occrp.org/.

Video trailer yang dibuat OpenOil menjelaskan Aleph dengan mudah.

( OpenOil adalah perusahaan yang membuat kerangka data terbuka untuk mengelola sumber daya alam seperti gas, minyak, batu bara, dan lainnya di seluruh dunia. )

https://www.youtube.com/watch?v=bg96HcR_2Jc

Karena dibuat oleh organisasi investigasi yang khusus menangani "korupsi", model data dasarnya adalah "Follow the Money".

Alat ini sangat baik dalam melacak bagaimana uang mengalir antara perusahaan/orang tertentu.

Karena itu, jenis entitas dataset yang didukung secara bawaan adalah seperti berikut.

  • Airplane, Assessment, Asset, Bank Account, Company, Contract, Court case, Customs Declaration, Land, Legal Entity