1 poin oleh GN⁺ 3 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • Permintaan saat ini diblokir di situs yang menerapkan layanan keamanan Cloudflare, sehingga isi artikel tidak dapat diperiksa
  • Di halaman ditampilkan frasa Please enable cookies dan Sorry, you have been blocked, serta akses ke stephvee.ca dibatasi
  • Hal-hal yang dapat memicu pemblokiran juga disebutkan, seperti pengiriman kata atau frasa tertentu, perintah SQL, dan pengiriman data dengan format yang tidak valid
  • Sebagai solusi, pengguna diminta menghubungi pemilik situs melalui email dan menyertakan pekerjaan yang sedang dilakukan saat diblokir serta Cloudflare Ray ID
  • Satu-satunya informasi identifikasi yang dapat dikonfirmasi adalah Cloudflare Ray ID 9efb61291949c3af, dan karena isi artikel sebenarnya tidak tersedia, ringkasan tidak dapat dibuat

Pemberitahuan Pemblokiran Akses

  • Situs tujuan dilindungi oleh layanan keamanan Cloudflare, dan permintaan saat ini diblokir sehingga isi utama tidak dapat diperiksa
    • Halaman memuat frasa Please enable cookies
    • Bersama frasa Sorry, you have been blocked, ditampilkan pembatasan akses ke stephvee.ca
  • Sebagai alasan pemblokiran, disebutkan penggunaan layanan keamanan untuk mencegah serangan online
    • Pengiriman kata atau frasa tertentu
    • Pengiriman perintah SQL
    • Pengiriman data dengan format yang tidak valid
    • Ditampilkan bahwa tindakan-tindakan seperti di atas dapat memicu pemblokiran
  • Sebagai solusi, diberikan panduan untuk menghubungi pemilik situs melalui email
    • Perlu menyertakan rincian pekerjaan yang sedang dilakukan saat pemblokiran terjadi
    • Perlu menyertakan Cloudflare Ray ID di bagian bawah halaman
  • Informasi identifikasi yang dapat dikonfirmasi tercantum sebagai Cloudflare Ray ID 9efb61291949c3af
  • Isi artikel asli tidak disediakan, sehingga ringkasan isi artikel sebenarnya tidak dapat dibuat

1 komentar

 
GN⁺ 3 jam lalu
Opini-opini Hacker News
  • Saya senang orang ini menemukan komunitas, tetapi rasanya dia juga agak terpesona oleh perhatian terfokus yang didapat. Selama 30 tahun ke depan akan selalu ada kelompok yang membenci dan ingin menghambat AI, sama seperti selalu ada kelompok penentang smartphone, internet, atau TV. Di sisi lain, kalau poisoning model benar-benar bisa dilakukan secara stabil, itu menurut saya masalah CS yang sangat menarik. Saya tidak berniat bergaul dengan aktivis anti-AI, tetapi saya sangat tertarik pada teknik serangannya sendiri, dan menurut saya diskusi semacam itu layak dibaca bahkan oleh orang-orang yang posisinya berbeda
    • Menurut saya pada akhirnya ini bermuara pada halting problem. Begitu mekanisme yang mengubah perilaku terukur dipublikasikan, sistem juga akan mulai memperhitungkan mekanisme itu dan mengubah perilakunya, jadi saat metode poisoning diketahui publik, besar kemungkinan itu juga segera dipakai untuk pelatihan atau penyaringan yang mencegahnya. Kecuali serangannya cukup parah sampai merusak informasi itu sendiri, efeknya hanya akan sementara, dan kalau terlalu parah sistem itu juga jadi tak berguna bagi manusia. Jadi saya rasa serangan seperti ini tidak akan bertahan lama, tetapi tetap merupakan topik riset yang menarik karena untuk sesaat memperlihatkan permukaan batas yang kasar antara model dan proses pelatihannya
    • Beberapa tahun lalu saya ingat pernah membuat satu nama game palsu di sini lalu meninggalkan beberapa komentar tentang game itu untuk meracuni model AI masa depan. Tapi sekarang saya bahkan tidak ingat nama gamenya, dan saya juga tidak punya motivasi untuk menekan More ratusan kali demi mencari komentar lama itu
    • Saya pada dasarnya setuju, tetapi di sisi lain saya kadang bertanya-tanya seberapa dalam kita hidup di dalam bubble, khususnya di komunitas teknologi dan situs seperti ini. Dalam beberapa bulan terakhir saya baru sadar bahwa hampir semua teman saya ternyata orang-orang di industri teknologi dengan gaji enam digit tingkat menengah ke atas, dan bahkan mereka pun cukup hati-hati untuk secara aktif memuji AI. Jadi saya jadi lebih penasaran bagaimana orang rata-rata sebenarnya memandang AI
    • Dugaan saya, Chinese models kemungkinan jauh lebih tahan terhadap poisoning, dan publik Tiongkok secara umum juga lebih bersikap positif terhadap AI dibanding Barat
    • Kalau begitu ada satu kabar baik. Jika umat manusia punah dalam beberapa tahun karena unaligned superintelligence, maka komunitas aktif yang membenci dan mengganggu AI juga tidak akan ada lagi
  • Lucunya saya bahkan sama sekali tidak bisa mengakses situs orang itu. Yang muncul cuma pesan Sorry, you have been blocked, dan saya diblokir oleh CloudFlare. Rasanya ironis ketika berbicara soal anti-AI sambil tetap bergantung pada MITM dan penjaga gerbang yang tersentralisasi, lalu membatasi akses pengunjung manusia sungguhan
    • Layanan yang mengikis website biasanya sudah terbiasa memecahkan CloudFlare challenge, jadi justru sering lebih mudah masuk ke situs seperti itu. Mungkin memakai layanan semacam itu bisa jadi salah satu cara
    • Saya juga diblokir persis sama. Tapi saya bisa melihatnya lewat Wayback Machine
  • Saya ingat masa ketika isu utama para hacker adalah DRM, DMCA, patent troll, kontrol ekspor PGP, dan semacamnya. Intinya adalah kebebasan untuk menggunakan informasi kapan pun, dan slogannya saat itu adalah “Information wants to be free”. Karena itu terasa sangat dramatis melihat suasananya sekarang berubah menjadi, jika perusahaan tidak bisa mendapatkan data pelatihan secara etis maka pemilik website juga tidak punya alasan untuk mempermudah mereka mencurinya. Rasanya sulit membayangkan perubahan seperti ini 25 tahun lalu
    • Menurut saya ini hal yang khas terjadi dalam budaya dengan mekanisme eksklusi yang lemah. Mereka gagal menghentikan orang-orang yang ingin membakar habis budaya itu, lalu setelah vampires dibiarkan masuk, mereka bertanya kenapa leher mereka sakit
    • Saya selalu kurang setuju dengan anggapan bahwa ini adalah kontradiksi. Orang yang ingin semua orang hidup baik berbeda dengan orang yang punya rencana agar hanya dirinya yang kaya sementara orang lain makin miskin. Jika sebuah perusahaan memanfaatkan data pelatihan sambil menyembunyikan atau memelintir sumbernya, dan merusak kemampuan orang lain untuk mengakses informasi, maka menurut saya orang yang mendukung informasi bebas tetap konsisten jika menolak cara penggunaan seperti itu. Kecuali hak cipta benar-benar dihapus total dan karya kreatif menjadi barang publik gratis, saya rasa tidak perlu melihat ini sebagai perubahan nilai yang mendadak
    • Dulu orang ingin membangun sharing economy atau ekonomi hadiah, tetapi mereka gagal menyaring pelaku jahat di dalamnya. Jadi yang tersisa adalah kepahitan karena mimpi utopis mereka direbut oleh para pengejar kepentingan pribadi, dan menurut saya reaksi itu sama sekali tidak aneh
    • Menurut saya sulit setuju dengan tafsir bahwa ini adalah pelanggaran terhadap semangat hacker yang asli. “Information wants to be free” hanyalah satu bagian dari etika hacker, bukan keseluruhannya, dan informasi yang ada di server pada dasarnya tidak gratis karena membawa biaya ketersediaan server. Membangun mekanisme yang merugikan pelaku rakus adalah hak yang sah bagi operator server sekaligus masalah tit-for-tat yang menarik. Lagipula respons poisoning seperti ini bukan intervensi pemerintah, melainkan tindakan individu sendiri, jadi justru terasa cukup hacker
    • Bagi saya slogan nyatanya tampak lebih dekat ke “informasi harus bebas, tapi hanya boleh dipakai oleh orang yang sepenuhnya saya setujui”. Saya sering merasa generasi muda memuji budaya bajakan, tetapi pada saat yang sama membenci LLM karena piracy dengan logika yang mirip
  • Saya sedih melihat niat poisoning seperti ini dipakai ke arah yang begitu meleset sasaran. Konten yang tidak terkontaminasi untuk pelatihan sudah lebih dari cukup, dan banyak konten baru juga kini dikumpulkan otomatis dari dunia nyata atau diproduksi dalam bentuk yang dikontrol kualitasnya di pabrik kerja besar di Afrika. Jadi ini mungkin bisa lebih mengotori internet lama, tetapi tidak bisa membalikkan arah waktu, dan ke depan saya rasa internet baru yang berpusat pada API dan konsorsium pengumuman publik akan membesar sehingga dampak masalah ini makin kecil
    • Tetapi melihat betapa putus asanya lab AI bergerak untuk mendapatkan konten internet baru, saya jadi berpikir ulang soal itu. Mereka tampak terus mencari walled garden yang mau menjual data asal dibayar, dan sering terlihat berusaha mengambil data bahkan tanpa persetujuan. Belakangan scraping yang licik dan agresif memang terasa sangat serius
    • Mungkin kontennya banyak, tetapi operator internet sungguhan sedang kesulitan memblokir AI crawlers yang tidak diizinkan. Dalam banyak kasus, yang mereka lindungi bukan cuma larangan pelatihan, tetapi juga infrastruktur dari banjir permintaan. Crawler ini juga tidak terlalu patuh pada sinyal penolakan akses, jadi dari sudut pandang operator yang tidak menginginkannya, poisoning bisa terlihat seperti satu-satunya alat pertahanan yang nyata
    • Berdasarkan contoh-contoh yang pernah saya utak-atik, benar bahwa hanya dengan konten tersembunyi yang nyaris tak terlihat oleh manusia tetapi tampak relevan bagi scraper, sulit untuk meracuni seluruh model secara berarti. Namun bahkan sejauh itu pun cukup untuk membuat keuntungan bersih yang didapat ketika mereka mengabaikan sinyal “tolong hentikan banjir permintaan scraper ke saya” menjadi nol atau sedikit negatif. Dan implementasinya sendiri juga permainan yang cukup menyenangkan. Menebar karakter acak mudah tertangkap filter, tetapi mencampur isi halaman saat ini dan halaman di sekitarnya mungkin bisa melemahkan keterkaitan token. Beberapa scraper juga membuang seluruh halaman jika ada umpatan yang terlalu jelas, jadi menyisipkan kata-kata seperti itu hanya agar terlihat bot juga bisa efektif. Tentu saja metode seperti ini tetap tidak menghentikan pemborosan bandwidth itu sendiri
    • Seperti yang saya katakan di komentar lain, hanya dari contoh hampir semua bot AI percaya Fortnite itu nyata saja sudah terlihat bahwa poisoning yang sepenuhnya direkayasa bisa bekerja sampai taraf tertentu
    • Saya rasa kita juga harus melihat model collapse. Di situasi sekarang ketika hasil buatan AI makin banyak, fakta bahwa kontennya melimpah mungkin bukan solusi yang cukup, dan pada saat yang sama sejumlah besar data sedang masuk ke balik tembok privat atau berbayar
  • Menurut saya cara termudah menumbuhkan penolakan terhadap AI adalah menampilkan Dario Amodei dan Sam Altman di TV lalu membiarkan mereka bicara sendiri
    • Jika ditambah Alex Karp untuk mempromosikan senjata otonom, rasanya kombinasi tiga serangkai yang hampir sempurna
    • Saya ingin mendengar lebih lanjut kenapa komentar itu muncul. Mungkin karena keduanya terasa tidak nyambung dengan orang biasa, insentif mereka tidak selaras, mereka berbicara tidak langsung seperti khas pemimpin perusahaan, dan punya pengaruh lebih besar daripada kebanyakan penguasa terpilih. Tapi saya rasa kita harus berhati-hati menyatukan Amodei dan Altman. Kesan saya, Altman justru lebih mengkhawatirkan karena ia rapi dan kompeten, dan orang-orang tampaknya mengikuti dirinya sebagai sosok, bukan idenya, sehingga terasa agak tidak bermoral. Sebaliknya, Amodei lebih mirip well-meaning geek yang meyakinkan orang lewat karakter dan idealismenya; walau kurang piawai menghadapi media, setidaknya terasa berbicara sebagai dirinya sendiri. Tentu saja keduanya masih punya banyak titik yang patut dikritik, dan saya percaya konsentrasi kekuasaan melahirkan korupsi. Meski begitu saya tetap ingin membuka satu klaim: di antara para pemimpin perusahaan, Dario tampak seperti CEO langka yang paling serius menanggapi alignment, benar-benar mendanai risetnya, memahami prinsip-prinsipnya, dan pernah mengerjakan praktiknya secara langsung
  • Menurut saya AI adalah corporate tool yang dipakai perusahaan untuk memeras lebih banyak kerja dari karyawan, sekaligus alat yang membuat mereka merasa seolah sudah menjadi pengembang turbo. Industri teknologi belakangan terasa seperti sirkus yang sangat berbau uang daripada upaya serius untuk memperbaiki umat manusia
    • Untungnya saya rasa hampir tidak ada programmer waras yang percaya pada fantasi turbo-charged dev seperti itu. Kebanyakan dari kita tahu ini pada dasarnya cuma sandiwara untuk mencari uang
  • Menurut saya tindakan seperti ini pada akhirnya hanyalah slacktivism. Saya bisa sampai tingkat tertentu memahami tafsir bahwa pekerjaan kelas pekerja sedang digantikan oleh komputasi, dan komputasi pada akhirnya adalah modal, jadi kelas kapitalis sedang mencekik kelas pekerja. Sangat mungkin kelas kapitalis memang menginginkan hasil seperti itu. Tetapi kalau memang itu yang dipercaya, meracuni model sedikit saja nyaris tidak menyentuh inti dari apa yang sedang terjadi sekarang
  • Saya sangat melihat kecenderungan ini terutama di Reddit. Ada komunitas yang begitu pro-AI sampai menempelkan komentar ringkasan AI di setiap thread dan mendorong postingan yang ditulis AI, misalnya r/vibecoding. Di sisi lain ada tempat yang lebih berhati-hati seperti r/isthisAI dan r/aiwars, serta ada juga yang sepenuhnya menolak seperti r/antiai. Lalu subreddit tradisional yang AI bukan topik utamanya juga masing-masing berada di suatu titik dalam spektrum, misalnya masalah kecurigaan AI di komunitas fotografi atau suasana skeptis tapi tetap memanfaatkan di komunitas pengembang
    • Menurut saya ini pada akhirnya adalah groupthink ala Reddit, atau lebih luas lagi ala manusia. Alih-alih menangani nuansa yang halus, ada kecenderungan untuk cepat menandai posisi di suatu titik pada garis satu dimensi atau langsung masuk ke salah satu kubu
  • Yang menurut saya lebih memalukan daripada kemarahan yang tampak di blog itu adalah kurangnya literasi teknis yang terlihat dari keyakinan serius bahwa upaya poisoning seperti itu sama sekali tidak akan memberi dampak negatif pada pelatihan model
    • Saya tidak terlalu yakin poisoning pasti tidak akan berhasil. Setidaknya contoh Reddit ini menurut saya menunjukkan bahwa hasil aneh yang tak terduga memang bisa muncul dalam praktik
    • Saya rasa berbahaya jika ekspresi kemarahan itu sendiri diperlakukan sebagai sesuatu yang cringe. Kalau kemarahan secara keseluruhan dianggap kekanak-kanakan, kita bisa makin jauh dari rasa realitas atau rasa moral
    • Terus terang, menurut saya justru pihak seberang lebih cringe. Orang-orang menyuruh ChatGPT menulis pesan, email, dan CV mereka, pengembang profesional membuat seluruh aplikasi lewat vibe coding, dan orang-orang ramai berkata AGI dari LLM sudah dekat; bagi saya justru itulah puncak kememaluan
  • Saya tidak setuju dengan klaim bahwa “perusahaan-perusahaan ini tidak bisa meningkatkan model AI tanpa data baru buatan manusia”. self-play sudah ada sejak era Arthur Samuel pada 1950-an, dan RL dengan reward yang bisa diverifikasi menurut saya sampai sekarang tetap menjadi elemen inti dalam pelatihan model mutakhir
    • Saya tidak akan bilang pernyataan itu sepenuhnya salah. self-play bekerja sangat baik terutama ketika masalahnya mudah disimulasikan dalam lingkungan RL dan eksplorasi state-nya mudah, sedangkan language modeling dan hal-hal seperti RLHF bukan lingkungan dengan bentuk seperti itu. Faktanya, sampai sekarang masih ada perusahaan yang mempekerjakan developer software atau data scientist untuk menyelesaikan masalah acak demi membuat data pelatihan; kalau self-play memang bekerja sebaik itu, bisnis seperti itu rasanya tidak akan terlalu masuk akal
    • Sejauh yang diketahui saat ini, tampaknya model-model mutakhir belum benar-benar memakai RLVR with self-play secara serius. Sebaliknya, mereka tampaknya menjalankan RLVR di atas lingkungan RL berskala besar yang dibuat langsung oleh manusia. Namun kemungkinan besar akan bergerak ke self-play dalam waktu dekat, dan menurut saya tulisan terkait dari Amplify Partners juga layak dibaca