1 poin oleh GN⁺ 2023-12-23 | 1 komentar | Bagikan ke WhatsApp

Tidak dapat merangkum isi untuk permintaan ini. Konten artikel yang diberikan berupa pesan galat "403 Forbiddennginx", yang bukan isi artikel sebenarnya melainkan kode status HTTP yang menandakan tidak ada izin akses. Ini umumnya merupakan galat yang terjadi ketika server web memahami permintaan tersebut, tetapi tidak memiliki izin untuk menjalankannya.

Opini GN⁺

  • Galat "403 Forbidden" adalah masalah yang familier bagi pengembang web atau administrator sistem, dan dapat terjadi karena pengaturan izin atau kesalahan konfigurasi server.
  • Pesan galat ini berarti server menolak akses ketika pengguna mencoba mengakses bagian tertentu dari situs web.
  • Galat semacam ini sangat terkait dengan keamanan web, dan merupakan fungsi penting untuk mencegah pengguna mengakses informasi sensitif tanpa izin yang sesuai.

1 komentar

 
GN⁺ 2023-12-23
Opini Hacker News
    • Ini adalah cara sampling yang sangat cerdas, dan saya angkat topi untuk para penulisnya. Saat bekerja di Pew, saya pernah mencoba memetakan YouTube melalui penjelajahan acak lewat endpoint API "video terkait", dan setelah setahun tampaknya kami mencapai titik jenuh. Namun, skala yang dijelaskan di sini menunjukkan adanya long tail yang luput dari radar. Tidak lama setelah kami menerbitkan penelitian itu, Google mulai mengunci API hampir seketika, tetapi saya senang melihat orang-orang masih melanjutkan riset dengan scraping gaya lama. Analisis kami dilakukan di level channel dan hanya berfokus pada channel populer, tetapi menarik bahwa beberapa angka dari TubeStats cukup dekat dengan temuan kami (misalnya distribusi bahasa).*
    • Pujian untuk metode sampling yang cerdas, serta berbagi pengalaman riset serupa di Pew
    • Tanggapan positif bahwa riset lewat scraping tetap berlanjut meski Google membatasi akses API
    • Menyebut adanya kemiripan antara riset pribadi dan data TubeStats
    • Ini menarik sebagai metode serangan mitigasi terhadap masalah tank Jerman. Solusi optimalnya mungkin adalah memperluas ruang alamat untuk mencegah sampel acak mengumpulkan data yang diperlukan agar bisa mencapai kesimpulan yang signifikan secara statistik. Mungkin ada solusi bagus lain juga, tetapi sampel yang benar-benar acak akan membatasi arah semacam itu.*
    • Rujukan ke masalah tank Jerman dan usulan memperluas ruang alamat untuk mencegah pengumpulan data
    • Saya merekomendasikan untuk melihat dataset "YouTube Dislike". Dataset ini dibuat sebagai upaya pengarsipan untuk mengumpulkan informasi sebelum fitur dislike dihapus. Dengan ini, Anda bisa mencari video yang paling kontroversial, video teratas dengan deskripsi dalam bahasa tertentu, dan sebagainya.*
    • Memberikan informasi tentang kemungkinan analisis menggunakan dataset YouTube Dislike
    • Saya mencoba mencari tahu berapa banyak data yang dimiliki YouTube, tetapi tidak menemukan angkanya. Dengan mengasumsikan durasi video rata-rata 500 detik, bitrate 400 KB/s, dan berdasarkan 1,3 miliar video, saya menghitung 2,7 exabyte. Itu adalah perkiraan yang lebih rendah daripada jumlah penyimpanan yang dibutuhkan, mengingat YouTube menyimpan video populer di beberapa data center dan dalam format VP9 serta AV1. Mungkin saja YouTube mengompresi video yang tidak populer atau melakukan transcoding on-demand dari format lain, yang bisa membuat perkiraan ini terlalu tinggi, tetapi saya rasa tidak demikian.*
    • Memberikan estimasi jumlah data YouTube dan dugaan tentang cara penyimpanannya
    • Google dulu suka menanyakan masalah skalabilitas YouTube untuk beberapa posisi. Sering kali itu berujung pada pertanyaan kompleksitas big-O tentang sinkronisasi data log dalam infrastruktur terdistribusi yang terus tumbuh. Hasilnya adalah fungsi big-O(f(n)) yang hampir mustahil dijelaskan karena sangat rumit. Menarik juga.*
    • Menyebut masalah skalabilitas YouTube berdasarkan pengalaman wawancara di Google
    • Situs pendamping untuk hasil artikel ini adalah: TubeStats.org*
    • Memberikan tautan situs web yang terkait dengan artikel
    • Terlalu besar. Tadi malam saya mendapat notifikasi untuk memperbarui aplikasi YouTube di ponsel saya. Masalahnya, itu adalah versi terakhir yang bisa berjalan di ponsel saya. Setidaknya versi web masih berfungsi.*
    • Berbagi pengalaman pribadi tentang ukuran aplikasi YouTube dan masalah pembaruan
    • Dataset ini menarik. Makalahnya memberi kesan yang agak keliru tentang statistik channel: jika Anda tidak menyesuaikan kembali jumlah subscriber untuk mengoreksi bias sampling, maka probabilitas sebuah channel muncul akan sebanding dengan jumlah video publik channel tersebut, sehingga perlu diberi bobot ~1/# terhadap jumlah video per channel.*
    • Menjelaskan potensi kesalahpahaman tentang statistik channel dalam dataset dan metode sampling
    • Apakah fungsi sampling mengasumsikan semua "kode wilayah" memiliki jumlah nomor yang tersedia yang sama? Untuk beberapa situs besar (misalnya Twitter, dll.), shard yang menyimpan data yang lebih sering diminta bisa jauh lebih renggang. Misalnya, kode wilayah yang berisi Justin Bieber akan memiliki lebih sedikit nomor. Ini bisa sangat mendistorsi hasilnya.*
    • Mengajukan pertanyaan tentang metode sampling dan menunjukkan dampak perbedaan kepadatan shard data tertentu pada hasil
    • Mengungkapkan kekaguman terhadap situs web tertentu