ArchiveTeam menyelesaikan pengarsipan semua tautan pendek goo.gl
(tracker.archiveteam.org)- ArchiveTeam berhasil mengarsipkan semua tautan pendek goo.gl
- Siapa pun dapat berpartisipasi dalam proyek arsip melalui program pengarsipan virtual bernama ArchiveTeam Warrior
- Warrior ini dapat dijalankan di Windows, OS X, dan Linux tanpa risiko terpisah
- Pengguna dapat memilih proyek dan ikut berpartisipasi melalui pengaturan yang sederhana
- Menyediakan cara yang mudah dan intuitif untuk membantu kegiatan pengarsipan tanpa memerlukan keahlian khusus
Pengenalan ArchiveTeam Warrior
- ArchiveTeam Warrior adalah aplikasi virtual untuk pengarsipan yang dapat digunakan siapa saja dengan mudah
- Pengguna dapat menjalankan Warrior untuk mengunduh situs web dan lainnya, lalu ikut berpartisipasi dalam mengunggahnya ke arsip ArchiveTeam
- Warrior tidak menimbulkan risiko pada lingkungan komputer asli, dan hanya memanfaatkan bandwidth internet serta sedikit ruang disk
- Mendukung Windows, OS X, dan Linux, serta memerlukan program mesin virtual seperti VirtualBox dan VMware
Cara penggunaan dengan VirtualBox
- Unduh appliance Warrior (357MB)
- Di VirtualBox, klik menu File > Import Appliance lalu muat file yang sudah diunduh
- Saat mesin virtual dijalankan, pembaruan terbaru akan diterima secara otomatis, lalu akan diminta menggunakan peramban web
Proses setelah menjalankan Warrior
- Buka halaman Settings untuk memeriksanya
- Pilih nama pengguna agar progres ditampilkan di leaderboard
- Di tab All projects, pilih proyek yang diinginkan untuk diikuti, atau pilih ArchiveTeam’s Choice untuk berpartisipasi dalam proyek yang paling mendesak
Manfaat berpartisipasi
- Tanpa keahlian khusus atau proses yang rumit, siapa pun dapat dengan mudah berkontribusi pada aktivitas proyek arsip
- Rekam jejak aktivitas pengarsipan pengguna ditampilkan di leaderboard sehingga memberi motivasi dan efek kolaboratif
1 komentar
Komentar Hacker News
Setiap kali ArchiveTeam mengerjakan proyek seperti ini, saya benar-benar kagum. Beberapa tahun lalu, saat platform video tempat saya bekerja mengumumkan akan segera tutup, saya terhubung dengan seseorang dari ArchiveTeam dan mendengar bahwa mereka tertarik pada pekerjaan pelestarian data. Saya memberi sedikit saran kepadanya (informasi tentang endpoint server yang mungkin menyulitkan proses pengarsipan) dan meminjamkan beberapa instance EC2 saya untuk sementara. Karena server itu milik saya, saya bisa melihat apa yang terjadi: dalam 2 menit instance sudah sepenuhnya siap dan langsung mulai mengarsipkan video dengan cepat, dan setiap instance mengunduh video yang berbeda secara efisien tanpa duplikasi. Misi ArchiveTeam selalu bagus, tetapi efisiensi cara mereka mengeksekusinya benar-benar mengesankan.
Judulnya tidak akurat. Yang benar adalah Archiveteam.org, bukan Archive.org. The Internet Archive menyediakan ruang penyimpanan, tetapi pekerjaan pengarsipan yang sebenarnya dilakukan oleh anggota Archiveteam.
Ingin membagikan beberapa hal terkait: "Bergabung dalam perang melawan link rot" (tautan), beberapa thread diskusi HN tentang perubahan kebijakan goo.gl oleh Google (kumpulan tulisan terkait 2018~2025, di sini, di sini, di sini, di sini, di sini, di sini). Ada banyak diskusi yang beragam, semoga membantu.
Membagikan pembaruan terbaru dari Google: tautan pembaruan blog Google
Apakah ada yang mengarsipkan seluruh reddit atau twitter? Meskipun Terms mereka sudah diubah sehingga hal itu tidak diizinkan, saya penasaran.
Saya kurang paham halaman ini. Ada daftar dataset (mungkin?), dan ukurannya tampak besar sampai 91 TiB. Rasanya daftar tautan pendek Google dan URL tujuannya saja tidak mungkin butuh sampai 91 TiB. Apakah ada yang tahu cara kerjanya?
Saya senang bisa berkontribusi meski sedikit pada pengarsipan kali ini.
Saya penasaran berapa banyak tautan yang mengarah ke video YouTube privat atau Google Docs, dan sebagainya.
Saya penasaran apakah yang dimaksud dengan "all" benar-benar semua URL yang tersedia untuk publik, atau mereka mencoba seluruh namespace URL secara iteratif.