32 poin oleh xguru 2024-02-14 | 3 komentar | Bagikan ke WhatsApp
  • Open-source yang menyimpan semua situs web agar bisa dilihat secara offline
  • Menyimpan HTML/JS/PDF/media dan lainnya dari URL yang ditambahkan langsung, riwayat kunjungan browser (melalui ekstensi), bookmark, RSS, Pocket/Pinboard, dll.
    • Bisa ditambahkan satu per satu atau dijadwalkan untuk diimpor secara berkala
  • Dapat dipasang di Linux, macOS, Windows (WSL2), atau dijalankan dengan Docker, lalu digunakan lewat alat CLI, aplikasi web, pustaka Python, atau perintah sekali jalan
  • Menyimpan snapshot URL dalam berbagai format redundan, serta mendeteksi semua konten yang termasuk dalam halaman untuk diekstrak ke folder
    • HTML/semua situs web: HTML+CSS+JS asli, HTML singlefile, screenshot PNG, PDF, WARC, judul, teks isi, favicon, headers, …
    • Media sosial/berita: isi artikel TXT, komentar, judul, simpanan, gambar, …
    • YouTube/SoundCloud/dll.: MP3/MP4, subtitle, metadata, thumbnail, …
    • Tautan Github/Gitlab/dll.: klon kode sumber GIT, README, gambar, …
  • Tidak memakai format khusus; menyimpan ke file/folder biasa dengan alat standar seperti Chrome, wget, yt-dlp, dll. Artinya, semua data tetap bisa dibaca tanpa ArchiveBox
  • Dapat mengirim URL yang disimpan ke archive.org untuk meminta penyimpanan terpisah (arsip ganda; bisa dinonaktifkan dalam mode lokal saja)

3 komentar

 
ninebow 2024-02-21

Belakangan ini sambil mencoba memakai Obsidian, saya juga menyimpan artikel sebagai markdown lewat plugin Instapaper -> Obsidian, tapi ternyata hasilnya sering tidak termuat dengan rapi.
Saya sempat menjalankan Go-Readability di AWS Lambda lalu berhenti karena malas mengurusnya, jadi sepertinya saya juga perlu mencari apakah ada yang bisa terintegrasi dengan baik dengan alat-alat seperti ini. Terima kasih!

 
galadbran 2024-02-17

Saya cenderung membaca lebih saksama ketika melihat kata kunci arsip. Berikut beberapa artikel GeekNews lama yang terkait.

 
galadbran 2024-02-17

Ah, tautan GeekNews milik Shori adalah https://id.news.hada.io/topic?id=577 .