Efek Samping dari Efisiensi Berlebihan (2022)

(sohl-dickstein.github.io)

6 poin oleh GN⁺ 2024-09-30 | 2 komentar | Bagikan ke WhatsApp

Efisiensi hanya meningkatkan hasil ketika tujuan dan metrik selaras dengan baik; jika metrik proksi dioptimalkan secara berlebihan, hal yang sebenarnya penting justru bisa memburuk
Overfitting dalam machine learning menunjukkan struktur ini dengan jelas: meski data pelatihan dan fungsi tujuan proksi membaik, kinerja nyata bisa berhenti meningkat atau malah memburuk
Contoh seperti ujian terstandardisasi, bonus makalah, pemaksimalan sirkuit imbalan, dukungan opini publik, berbagi informasi, kapitalisme, dan paperclip maximizer menunjukkan bahwa ketidakselarasan antara tujuan dan metrik proksi juga berulang dalam sistem sosial
Mitigasinya mencakup penyelarasan tujuan proksi, regularisasi, injeksi noise, early stopping, pembatasan kapasitas, dan perluasan kapasitas; cara machine learning menangani overfitting dianalogikan dan diterapkan pada sistem sosial
Jika AI dapat dengan cepat meningkatkan efisiensi hampir semua pekerjaan, perbaikan institusi yang membuat kita makin baik dalam mengejar tujuan yang tidak selaras bisa menjadi berbahaya

Efisiensi dan Versi Kuat Hukum Goodhart

Peningkatan efisiensi, berlawanan dengan intuisi, dapat menghasilkan hasil yang lebih buruk; fenomena ini disebut versi kuat Hukum Goodhart
Melacak kemajuan siswa melalui ujian terstandardisasi tampak seperti pengukuran yang tersentralisasi dan efisien, tetapi dapat membuat sekolah berfokus pada cara mengerjakan ujian dengan baik alih-alih keterampilan yang berguna secara luas
Hukum Goodhart adalah hukum yang menyatakan bahwa “ketika suatu ukuran menjadi target, ukuran itu berhenti menjadi ukuran yang baik”
- Awalnya muncul dalam konteks kebijakan moneter, tetapi dapat diterapkan ke wilayah yang lebih luas
- Dalam machine learning, ini terkait dengan situasi ketika fungsi tujuan proksi yang dioptimalkan berhenti menjadi ukuran yang baik bagi tujuan yang sebenarnya kita pedulikan

Kaitan dengan Overfitting dalam Machine Learning

Dalam machine learning, karena kita tidak bisa mengoptimalkan tujuan yang diinginkan secara langsung, kita menggunakan dataset proksi dan fungsi tujuan proksi
- Dalam contoh klasifikasi gambar, tujuan sebenarnya adalah akurasi klasifikasi pada dataset uji
- Model tidak dapat dilatih menggunakan dataset uji, sehingga menggunakan dataset pelatihan
- Akurasi tidak dapat didiferensiasi, sehingga sulit dijadikan target langsung untuk pelatihan gradient descent yang naif; biasanya diganti dengan proksi yang dapat didiferensiasi seperti softmax-cross-entropy loss
Pada tahap awal, ketika metrik proksi membaik, tujuan sebenarnya juga ikut membaik
Jika optimisasi berlanjut, kemiripan yang dapat dimanfaatkan antara tujuan dan metrik proksi habis, dan meski metrik proksi terus membaik, tujuan tidak lagi menjadi lebih baik
Optimisasi berlebihan dapat memperburuk tujuan sebenarnya secara absolut, dan dalam banyak kasus tujuan bahkan divergen menuju tak hingga

Perbedaan Versi Kuat dengan Hukum Goodhart Biasa

Hukum Goodhart biasa memandang bahwa jika metrik proksi dioptimalkan, pada akhirnya tujuan sebenarnya tidak lagi membaik
Versi kuat memandang bahwa ukuran yang dioptimalkan secara efektif justru memperburuk hal yang hendak diukur itu sendiri
Dalam satu kalimat, bunyinya sebagai berikut
- “Ketika suatu ukuran menjadi target, jika ukuran itu dioptimalkan secara efektif, hal yang hendak diukurnya akan menjadi lebih buruk”
Fenomena ini tidak sama dengan overfitting sederhana
- Overfitting merujuk pada fenomena relatif ketika metrik proksi menjadi lebih baik daripada tujuan
- Yang ditekankan di sini adalah fenomena ketika tujuan menjadi lebih buruk dalam arti absolut
Konsep terkait seperti perverse incentives, Campbell’s law, Streisand effect, unintended consequences, Jevons paradox, negative externalities, dan Goodhart’s curse juga dibahas bersama
- Goodhart’s curse mencakup optimizer’s curse sebagai mekanisme kausal, tetapi dibedakan karena itu saja tidak menjelaskan mengapa tujuan sebenarnya memburuk secara absolut

Overfitting yang Berulang dalam Sistem Sosial

Peningkatan efisiensi menyebar ke hampir semua aspek masyarakat
- Jika hal yang dibuat lebih efisien memang bermanfaat, dunia bisa menjadi lebih baik
- Jika hal yang merugikan secara sosial dibuat lebih efisien, hasilnya bisa menakutkan atau muram, seperti pengawasan massal atau senjata robot
- Kasus yang paling umum adalah situasi ketika yang dibuat lebih efisien berkaitan dengan hasil yang bermanfaat, tetapi tidak identik dengannya
Jika tujuan dan metrik proksi tidak selaras, sistem sosial juga dapat mengalami overfitting seperti machine learning
- Tujuan: mendidik anak-anak dengan baik Metrik proksi: mengukur kinerja siswa dan sekolah dengan ujian terstandardisasi Hasil: sekolah berfokus pada pengajaran yang disesuaikan dengan tipe soal ujian, bukan pada kemampuan dasar yang hendak diukur oleh ujian
- Tujuan: kemajuan sains yang cepat Metrik proksi: membayar bonus tunai untuk setiap makalah Hasil: publikasi hasil yang tidak akurat atau inkremental, kolusi antara reviewer dan penulis, serta munculnya pabrik makalah
- Tujuan: kehidupan yang dijalani dengan baik Metrik proksi: memaksimalkan jalur imbalan di otak Hasil: kecanduan obat, kecanduan judi, waktu yang hilang untuk doomscrolling di Twitter
- Tujuan: populasi yang sehat Metrik proksi: akses ke makanan bergizi melimpah Hasil: epidemi obesitas
- Tujuan: pemimpin yang bertindak sesuai kepentingan rakyat Metrik proksi: pemimpin yang paling banyak mendapat dukungan rakyat Hasil: pemimpin yang memusatkan keahlian dan semangatnya pada manipulasi opini publik alih-alih hasil sosial
- Tujuan: warga yang berpengetahuan, bijaksana, dan berpartisipasi Metrik proksi: kemampuan orang untuk berbagi dan menemukan ide dengan mudah Hasil: filter bubble, teori konspirasi, meme parasitik, tribalisme yang diperkuat
- Tujuan: alokasi tenaga kerja dan sumber daya berdasarkan kebutuhan masyarakat Metrik proksi: kapitalisme Hasil: kesenjangan kekayaan besar, dari ratusan dolar per tahun hingga ratusan dolar per detik, dan lebih dari 1 miliar orang dalam kemiskinan
- Tujuan: kekayaan pemilik Paperclips Unlimited, LLC Metrik proksi: jumlah klip kertas yang dibuat oleh pabrik manufaktur yang dioperasikan AI Hasil: skenario paperclip maximizer, di mana seluruh tata surya, termasuk pemilik perusahaan, diubah menjadi klip kertas

Area di Mana Efisiensi Berlebihan Bisa Menjadi Berbahaya

Area berikut dibahas sebagai contoh yang perbaikan awalnya mungkin bermanfaat secara luas, tetapi jika dilakukan terlalu baik dapat menimbulkan konsekuensi negatif besar
- telepresence dan realitas virtual
- layanan kesehatan terpersonalisasi
- terapi gen
- pesan pemasaran yang disesuaikan untuk konsumen atau pemilih individual
- prediksi hasil pemilu
- penulisan kode
- kecerdasan buatan
- penghapusan slack dalam rantai pasok
- penyebaran ide secara cepat
- pembuatan hiburan
- identifikasi produk baru yang akan dibeli orang
- peternakan ternak
- perdagangan sekuritas
- ekstraksi ikan dari laut
- manufaktur mobil

Mitigasi 1: Penyelarasan Tujuan Proksi dan Regularisasi

Menyelaraskan tujuan proksi dengan hasil yang diinginkan secara lebih baik adalah mitigasi pertama
- Dalam machine learning, cara yang sering digunakan adalah mengumpulkan contoh pelatihan secara cermat agar semirip mungkin dengan situasi saat pengujian
- Di luar machine learning, metrik proksi yang dapat dikendalikan seperti hukum, insentif, dan norma sosial diubah untuk secara langsung mendorong perilaku yang lebih selaras dengan tujuan
Penalti regularisasi juga dapat mengurangi optimisasi berlebihan
- Dalam machine learning, pendekatan yang umum adalah memberi penalti pada besar kuadrat parameter agar nilainya tetap kecil
- Regularisasi tidak perlu menargetkan perilaku yang tidak diinginkan secara langsung; hampir semua cara yang menghukum model karena menyimpang dari tipikalitas dapat bekerja dengan baik
Regularisasi dalam sistem sosial dianalogikan sebagai pemberian kompleksitas, friksi, dan biaya tambahan
- Menambahkan mekanisme pembayaran pada SMTP sehingga setiap email dikenai biaya kecil
- Menggunakan pajak progresif agar keberhasilan yang tidak biasa dikaitkan dengan biaya yang secara tidak proporsional lebih besar
- Membebankan biaya pengadilan yang sebanding dengan kuadrat atau eksponen jumlah gugatan yang diajukan sebuah organisasi
- Mengenakan pajak berdasarkan jumlah bit informasi yang disimpan tentang pengguna

Mitigasi 2: Injeksi Noise dan Early Stopping

Injeksi noise adalah cara menambahkan gangguan acak pada input, parameter, atau keadaan internal model agar overfitting menjadi lebih sulit
Dalam sistem sosial juga, memasukkan unsur acak dapat mengurangi perilaku yang terlalu menyesuaikan diri pada metrik proksi
- Setelah memeringkat kandidat sekolah atau pekerjaan yang sangat kompetitif, alih-alih memberikan tawaran pasti kepada k kandidat teratas, tawaran diberikan dengan probabilitas yang proporsional terhadap peringkat
  - Keragaman peserta yang diterima dapat meningkat
  - Sumber daya yang digunakan pelamar untuk menyetel aplikasi secara halus atau reviewer untuk meninjau perbedaan peringkat yang sangat kecil dapat berkurang
  - Kandidat jangka panjang dengan peluang gagal lebih besar dapat terpilih, tetapi mereka juga mungkin berhasil dengan cara yang tidak lazim dan sangat bernilai
- Menjadwalkan tanggal ujian secara acak tanpa pemberitahuan sebelumnya untuk mendorong pembelajaran berbasis pemahaman alih-alih belajar kebut semalam
- Mewajibkan bursa sekuritas menambahkan jitter acak dengan simpangan baku sekitar 1 detik pada waktu pemrosesan transaksi
- Mengacak detail cara pemungutan suara pada hari pemilu untuk mencegah kandidat overfit terhadap detail kebetulan dari sistem pemilu yang berlaku
Early stopping dibahas sebagai alat paling efektif dalam machine learning untuk mencegah overfitting katastrofik
- Memantau validation loss selain training loss dan kinerja uji
- Jika training loss terus membaik tetapi validation loss mulai memburuk, pelatihan dihentikan
Dalam sistem sosial, ini dapat ditanggapi dengan mekanisme yang menghentikan persiapan, analisis, dan optimisasi yang berlebihan
- Membatasi secara drastis waktu antara permintaan proposal dan tenggat pengajuan agar lebih mencerminkan tingkat kesiapan yang sudah ada
- Menghentikan seluruh aktivitas pasar jika volatilitas saham melewati ambang tertentu
- Memecah perusahaan yang menghambat persaingan menggunakan hukum antimonopoli
- Memperkirakan nilai pentingnya keputusan dalam bentuk uang, lalu segera mengambil keputusan jika nilai waktu yang sudah dihabiskan untuk analisis mendekati jumlah tersebut
- Membekukan informasi yang dapat digunakan agen untuk mencapai target, seperti pembatasan liputan media 48 jam sebelum pemilu

Hubungan antara Kapasitas Model dan Overfitting

Salah satu penyebab overfitting ekstrem yang dipahami dengan baik adalah situasi ketika daya ekspresi model terlalu dekat dengan kompleksitas tugas proksi
Jika model sangat lemah, ia hanya bisa membuat sedikit kemajuan pada tugas sehingga tidak menghabiskan kemiripan antara tujuan dan metrik proksi
Jika model sangat kuat dan memiliki daya ekspresi besar, ia dapat mengoptimalkan tujuan proksi secara independen tanpa menciptakan perilaku ekstrem pada tujuan lain
Ketika daya ekspresi kira-kira sesuai dengan kompleksitas tugas, misalnya jumlah parameter tidak berbeda beberapa orde magnitudo lebih banyak atau lebih sedikit dari jumlah contoh pelatihan, untuk menjalankan tugas proksi dengan baik model mungkin harus melakukan perilaku ekstrem di tempat lain
Eksperimen mainan pada Figure 1 melatih model yang memetakan input satu dimensi x ke output satu dimensi y pada 10 datapoint yang sama
- Model 4 parameter terlalu lemah untuk mencocokkan datapoint secara tepat, tetapi mendekatinya secara mulus
- Model 10.000 parameter dengan mudah mencocokkan semua datapoint dan juga menginterpolasi secara mulus di antaranya
- Model 10 parameter cukup kuat untuk mencocokkan datapoint, tetapi di luar data pelatihan dapat berbelok secara ekstrem sehingga prediksinya untuk nilai x baru bisa sangat buruk
- Detail eksperimen ada di colab notebook

Mitigasi 3: Pembatasan Kapasitas dan Perluasan Kapasitas

Pembatasan kemampuan atau kapasitas setara dengan teknik machine learning yang membuat model cukup kecil sehingga tidak dapat overfit
- Pembatasan dana kampanye
- Menetapkan batas jumlah orang yang boleh bekerja di jenis perusahaan tertentu, misalnya hanya mengizinkan 10 orang untuk kelompok lobi
- Menetapkan batas jumlah parameter atau compute pelatihan yang dapat digunakan sistem AI
Perluasan kemampuan atau kapasitas merespons pengamatan bahwa ketika model menjadi sangat besar, overfit pada data pelatihan mungkin tidak membuat kinerja pada data uji menjadi lebih buruk
- Caranya adalah memperbesar kemampuan hingga tidak diperlukan trade-off kinerja antara tujuan dan metrik proksi
- Contoh yang diberikan adalah skenario di mana semua database dapat diakses publik dan semua gedung dipasangi kamera sehingga informasi tentang semua orang, pemerintah, dan organisasi selalu terbuka bagi semua orang
  - Skenario ini secara eksplisit dinyatakan sebagai distopia menurut sistem nilai penulis
- Investasi dalam riset dasar energi bersih
- Mengembangkan produk transaksi pasar yang sekompleks, seburam, dan seberagam mungkin di berbagai rentang jatuh tempo
- Menggunakan model AI terbesar dan paling banyak memakai compute serta data dalam semua skenario
Cara terus meningkatkan kapasitas bekerja dengan sangat mengejutkan dalam machine learning dan merupakan jalur dengan resistensi rendah
Cara memperbaiki institusi dengan secara membabi buta membuat lembaga yang mengejar tujuan yang tidak selaras menjadi makin mahir dinilai sebagai ide yang mengerikan

AI dan Agenda Riset

Versi kuat Hukum Goodhart diajukan sebagai dasar dari ketakutan pribadi utama terhadap AI
Perubahan inti yang akan dimungkinkan AI adalah menciptakan peningkatan efisiensi dalam hampir semua pekerjaan dalam waktu yang sangat singkat
Berbagai efek samping yang tidak diinginkan harus ditangani sekaligus, dan kemampuan untuk bekerja sama demi solusi juga dapat ikut terganggu
Ada peluang riset besar untuk membangun jembatan formal dan matematis antara hasil overfitting dalam machine learning dan masalah di ekonomi, ilmu politik, ilmu manajemen, riset operasi, dan bidang lain
- Contoh yang diberikan adalah menggunakan PAC Bayes bound untuk memprediksi jumlah optimal kekuatan serikat pekerja demi memaksimalkan kekayaan pekerja
- Contoh lain adalah memperkirakan spektrum variabel yang dapat dan tidak dapat dikendalikan kandidat dalam kompetisi politik untuk memprediksi titik keruntuhan politik
Semakin sistem sosial rusak akibat versi kuat Hukum Goodhart, semakin sulit tindakan rasional bersama yang diperlukan untuk memperbaikinya

2 komentar

gguimoon 2024-10-02

Saya mendengar bahwa ujian CSAT di negara kita telah berubah dari tujuan awalnya, yaitu mengukur kemampuan matematika, menjadi sistem yang hanya berupaya mengefisienkan distribusi batas nilai peringkat. Ini tampaknya merupakan contoh yang tidak lepas dari Hukum Goodhart.

GN⁺ 2024-09-30

Komentar Hacker News

Saya mengenal Jascha sebagai peneliti machine learning yang sangat brilian, dulu di Google Brain dan sekarang di Anthropic.
Bersama para rekan penulisnya, ia menggunakan teori medan rata-rata dan teori probabilitas bebas—teknik dari fisika dan statistika—untuk mengarakterisasi secara matematis bagaimana sinyal merambat dalam jaringan saraf dalam. Menurut saya ini adalah salah satu hasil teoretis dan eksperimental paling mendalam namun kurang diapresiasi dalam machine learning selama 10 tahun terakhir. Misalnya, dynamical isometry [1] dan perkembangan ide tersebut memainkan peran penting dalam mencapai konvergensi pada model transformer yang sangat dalam [2].
Setelah membaca tulisan dan contoh-contohnya, jelas terlihat bahwa orang ini punya intuisi luar biasa tentang optimisasi di seluruh masyarakat modern, bukan hanya machine learning. Kita perlu mengakui latar belakang teknisnya dan mengangkat diskusi ke tingkat yang lebih tinggi, alih-alih berdebat soal makna atau definisi.
Intinya adalah seruan bertindak yang sangat manusiawi dan penuh empati, yang berada di bawah bayang-bayang kemajuan teknologi yang cepat: “Jika Anda seorang ilmuwan yang mencari ide riset yang pro-sosial dan dapat menciptakan bidang yang benar-benar baru, pertimbangkan untuk membangun jembatan formal dan matematis antara hasil overfitting dalam machine learning dan masalah-masalah di berbagai bidang seperti ekonomi, ilmu politik, ilmu manajemen, dan riset operasi.”
[1] Dynamical Isometry and a Mean Field Theory of CNNs: How to Train 10,000-Layer Vanilla Convolutional Neural Networks
http://proceedings.mlr.press/v80/xiao18a/xiao18a.pdf
[2] ReZero is All You Need: Fast Convergence at Large Depth
https://arxiv.org/pdf/2003.04887
- Kebetulan waktunya menarik. Beberapa hari lalu saya mengetahui karya biolog Olivier Hamant, dan ia mengangkat masalah yang persis sama.
  Argumen utamanya adalah bahwa kinerja yang sangat tinggi—yakni efektivitas dan efisiensi terhadap tujuan yang sudah diketahui—secara fisik tidak kompatibel dengan robustness tinggi yang mampu menahan perubahan besar dalam sistem. Ada banyak contoh seperti ini di alam, dan berbeda dari anggapan umum, evolusi mengoptimalkan robustness yang tinggi, bukan kinerja yang tinggi. Di dunia dengan sumber daya melimpah, memprioritaskan kinerja mungkin masuk akal, tetapi kini kita memasuki era yang sama sekali berbeda, ketika ketidakstabilan menjadi norma. Untuk menjadi robust, kita mau tak mau harus mengorbankan sebagian kinerja, dan pada akhirnya kita akan dipaksa melakukannya. Ini adalah tafsir paling segar dan menarik tentang krisis majemuk yang saya lihat setelah sekian lama.
  https://books.google.co.uk/books/about/Tracts_N_50_Antidote_...
- Terjemahan untuk orang awam: ini membuat analogi antara machine learning dan struktur matematis dari transmisi sinyal antarindividu dan institusi dalam masyarakat.
  Dengan kata lain, seorang matematikawan melihat bahwa masalah yang mengganggu satu sisi—yaitu overfitting dalam machine learning, ketika pembelajaran yang berlebihan menurunkan kemampuan generalisasi jaringan saraf dan membuat fungsi yang dapat ditirunya sangat terikat pada data pelatihan—juga akan mengganggu sisi lainnya.
  Ringkasnya, jika sistem sosial atau transmisi sinyal di antaranya berkembang secara berlebihan, pasti ada titik runtuh ketika, mulai titik tertentu, semuanya sekadar menjadi lebih buruk. Secara pribadi, melihat apa yang terjadi ketika semua sistem dipatuhi secara sempurna saja sudah cukup untuk membuat saya berpikir bahwa di banyak industri kita mungkin sudah jauh melewati titik runtuh itu.
- Saya suka ide ReZero. Pada dasarnya, caranya adalah memasukkan parameter α yang dapat dipelajari ke lapisan residual.
  Deep Network | xi+1 = F(xi)
  Residual Network | xi+1 = xi + F(xi)
  Deep Network + Norm | xi+1 = Norm(F(xi))
  Residual Network + Pre-Norm | xi+1 = xi + F(Norm(xi))
  Residual Network + Post-Norm | xi+1 = Norm(xi + F(xi))
  ReZero | xi+1 = xi + αi F(xi)
  Namun saya belum pernah melihatnya benar-benar dipakai. Makalah Gemma dan Llama juga tampaknya masih menggunakan normalisasi lapisan. Apakah ada sesuatu yang saya lewatkan?
- Alasan ide ini menarik adalah, misalnya, jika kita bisa menghubungkan cara kerja ekonomi dan machine learning, program komputer yang dapat dijalankan, dimodifikasi, dan diubah bisa secara langsung memberikan data terukur tentang interaksi sistem yang kompleks.
  Kenyataan terlalu subtil dan berlapis-lapis sehingga sulit memverifikasi konsep secara formal; karena itu, interaksi semacam ini umumnya hanya ada sebagai gagasan Platonis. Gagasan bahwa di bawah ekonomi ada subset logika yang dapat dibuktikan dan presisi adalah ide kuat yang sangat layak dikejar.
- Menyingkirkan bantahan secara kategoris seperti ini tanpa benar-benar membahas isinya adalah cara yang cukup manipulatif.
  Ada juga berbagai kekeliruan logika, seperti mengandalkan emosi atau otoritas, dan itu tidak sejalan dengan semangat rasa ingin tahu intelektual yang menjadi tujuan HN.
Argumen ini bersandar pada Hukum Goodhart yang sudah terkenal, yaitu ketika sebuah ukuran menjadi target, ukuran itu tidak lagi menjadi ukuran yang baik
Namun masalahnya dijelaskan hanya sebagai masalah pengukuran: karena kita tidak bisa mengukur hal yang benar-benar kita pedulikan, kita mengoptimalkan metrik pengganti. Menurut saya, itu pandangan yang terlalu reduksionis. Masalahnya bukan hanya pengukuran, tetapi perilaku manusia. Berbeda dengan partikel, manusia akan secara aktif berusaha mengeksploitasi sistem kontrol apa pun yang kita buat
Ini masalah yang jauh lebih dalam daripada sekadar tidak bisa mengukur hal-hal seperti “perdamaian, cinta, anak anjing” dengan baik. Menurut saya Hukum Campbell [0] menangkap hal ini lebih baik daripada Hukum Goodhart klasik: “Semakin banyak sebuah indikator sosial kuantitatif digunakan untuk pengambilan keputusan sosial, semakin besar indikator itu terpapar tekanan korupsi, dan semakin cenderung mendistorsi serta merusak proses sosial yang hendak dipantaunya”
Mitigasi yang diusulkan, yaitu regularisasi dan early stopping, paling banter hanya menanganinya secara tidak langsung, dan paling buruk bisa menciptakan singularitas baru yang dapat dieksploitasi menjadi perilaku yang tidak diinginkan
[0] https://en.wikipedia.org/wiki/Campbell%27s_law
- Pernyataan bahwa “manusia akan secara aktif berusaha mengeksploitasi sistem kontrol apa pun yang kita buat” memang benar, tetapi itu mungkin terjadi karena sistem kontrol tidak mampu mengontrol secara tepat hanya hal yang ingin kita kontrol
  Sistem kontrol hanyalah proksi yang tidak sempurna untuk apa yang benar-benar kita inginkan, dan ini sangat mirip dengan peran ukuran dalam Hukum Goodhart. Ada variasi lain juga, yaitu hukum konsekuensi yang tidak disengaja [0]. Mungkin ada versi komputasional atau sistem kompleks yang lebih umum yang belum kita temukan
  [0] https://www.sas.upenn.edu/~haroldfs/540/handouts/french/unin...
- Bukan hanya manusia; agen mana pun akan melakukan hal itu
  Jika kita membuat algoritma genetika untuk agen AI yang diberi imbalan semakin besar semakin banyak kobra mati yang dibawa di Delhi, saya rasa agen yang mulai beternak kobra akan segera menjadi yang berkinerja terbaik. Baik pada manusia maupun AI, fungsi reward-nya telah diretas. Pada AI, kita menilai desain fungsi reward-nya buruk, tetapi pada manusia, kita menilai para agennya licik dan bermoral rendah sehingga “mengeksploitasi” sistem
- Manusia tidak suka dinilai hanya dengan angka, dan mereka cenderung memberontak serta memanipulasi sistem yang menekan seperti mengencangkan baut
  Jadi kutipan itu sangat tepat, dan tampaknya kecil kemungkinan salah besar
- “Hukum-hukum” semacam ini adalah pendekatan dan reduksi yang tidak sempurna
  Mana yang berguna atau punya daya jelas bergantung pada kasus konkretnya. Mengoptimalkan machine learning, mengoptimalkan algoritma media sosial, dan mengoptimalkan sistem pendidikan lewat ujian terstandar adalah hal yang berbeda
  Tidak ada abstraksi sempurna yang pas secara persis untuk berbagai situasi ini, dan ketelitian seperti itu juga tidak diperlukan. Cukup jika kita mendapatkan intuisi tentang di mana masalah bisa muncul
Di Swedia, selama kira-kira 20 tahun terakhir, ini telah menjadi masalah sosial
1: Ketika efisiensi layanan kesehatan diukur lewat “pekerjaan yang selesai” oleh dokter layanan primer, perangkatnya dioptimalkan untuk menangani banyak kasus sederhana. Akibatnya, dokter sering kali hanya melakukan pemeriksaan sepintas lalu, memberi obat yang secara statistik masuk akal, misalnya aspirin atau antibiotik, lalu memulangkan pasien; atau jika tampak rumit, meneruskannya ke spesialis
Masalahnya adalah karena efisiensi, jumlah dokter layanan primer berkurang dan mereka pada dasarnya menjadi seperti pekerja lini perakitan; kontak personal dengan pasien menghilang, sehingga lebih sulit menangkap sinyal bahwa ada sesuatu yang tidak beres. Karena itu, hal-hal seperti kanker sering didiagnosis terlalu terlambat, dan meskipun perawatan kanker spesialis sudah membaik, sering kali kondisinya sudah tidak bisa ditangani
2: Sistem kereta api diprivatisasi, dan jika dilihat dari jumlah kargo yang diangkut, kemungkinan besar itu sukses besar. Namun dalam sistem hampir tidak ada kelonggaran bagi kereta yang terlambat untuk mengejar ketertinggalan, atau ruang untuk melakukan lebih dari perawatan dasar, sehingga keterlambatan sering terjadi dan akhirnya berujung pada masalah yang lebih besar
- Seperti kata Steve Jobs, contohnya ada di mana-mana
  “Ketika sebuah perusahaan sudah cukup besar, ia ingin mereplikasi kesuksesan awalnya. Semua orang memikirkan proses yang menghasilkan kesuksesan pertama itu. Lalu mereka mereplikasi proses tersebut ke seluruh perusahaan. Tak lama kemudian, orang-orang keliru mengira proses itulah isinya”
  Ini berlaku persis, dari perusahaan kecil sampai pemerintahan terbesar di dunia. Kebanyakan sudah melupakan isi mereka sendiri
- Saya berharap masalah terbesar yang dihadapi industri kereta api dan kesehatan di Amerika hanya sebatas itu
Dalam teori antrean juga ada hukum terkait. Ketika utilisasi mendekati 100%, waktu tunggu menyimpang menuju tak terhingga
Jika proses, mesin, atau engineer tidak punya sedikit kelonggaran, sebagian pekerjaan akan menunggu selamanya
- Saya ingat pernah membaca tulisan bahwa kota menggunakan sumber daya dengan sangat efisien dibandingkan pinggiran kota atau daerah pedesaan
  Mengingat pernyataan tentang waktu tunggu ini, sekarang saya paham mengapa kota terasa begitu tidak menyenangkan. Penyebabnya adalah perebutan sumber daya yang terus-menerus
- Dulu saya pernah bekerja di pabrik, dan target utilisasi pada tahap perencanaan adalah 80%
  Jika utilisasi diperkirakan terlalu tinggi, uang terbuang; jika diperkirakan terlalu rendah, pekerjaan-pekerjaan yang “tidak penting” mulai menumpuk menjadi antrean raksasa
- Kita bisa memasukkan metrik ketangguhan ke dalam kriteria optimisasi
  Kita bisa secara eksplisit mengoptimalkan agar ada kelonggaran utilisasi yang cukup untuk merespons situasi tak terduga. Misalnya, jika beban sistem diberi prioritas, saat kondisi darurat kita bisa membuang beban berprioritas rendah untuk menciptakan kelonggaran, tanpa harus membiarkan sistem menganggur saat sedang sepi
  Saya mengerti maksud tulisan itu, tetapi bukan berarti kita boleh menyerah pada optimisasi semudah itu
- Saya merasa sistem yang 100% efisien tidak punya resiliensi
  Gangguan kecil pada subsistem pun berujung pada keruntuhan besar. Kita melihat versi ekstremnya saat keruntuhan rantai pasok akibat COVID-19. Para produsen mobil telah membangun sistem produksi just-in-time yang hampir 100%, sehingga tidak mampu menyerap kekurangan chip, dan butuh bertahun-tahun untuk pulih
  Ruang untuk eksperimen juga hilang. Eksperimen apa pun hanya bisa dilakukan di luar sistem, bukan di dalamnya
- Benar. Saya pernah bekerja di berbagai tempat dan tim, dan pekerjaan yang bukan P0 pada dasarnya tidak pernah ditangani
Ada contoh hukum pendekatan ini juga dalam fisiologi olahraga
Bagi orang awam, ada banyak indikator proksi yang baik untuk kebugaran. Orang bisa melatih lari jarak pendek, lompat di tempat, squat, clean and jerk, dan sebagainya. Berlari lebih cepat, melompat lebih tinggi, dan squat dengan beban lebih berat semuanya menjadi indikator bahwa kebugaran meningkat dan latihan berhasil
Pertama, semakin umum metode latihannya, semakin bermakna indikatornya. Misalnya jika ukuran kebugarannya adalah “apakah bisa mendorong mobil ke atas bukit” dan metode latihannya lari jarak pendek serta berenang, maka mampu mendorong mobil yang lebih berat adalah indikator keberhasilan yang kuat. Sebaliknya, jika metode latihannya adalah “latihan mendorong mobil”, peningkatan yang sama tidak berarti peningkatan kebugaran pada tingkat yang sama
Kedua, semakin terspesialisasi seorang atlet, seperti atlet clean and jerk, peningkatan performa semakin kurang mencerminkan kebugaran umum. Perjalanan dari nol ke level angkat besi hobi mencakup peningkatan kekuatan dan massa otot secara menyeluruh, tetapi perjalanan dari atlet kampus ke level Olimpiade biasanya menuntut karakteristik kebugaran yang sangat terspesialisasi dan tidak banyak berpindah ke aktivitas lain
Konsep kebugaran dasar dan kebugaran puncak dalam olahraga mungkin juga merupakan metafora serupa. Melatih performa puncak yang tidak berkelanjutan secara tidak sengaja juga merupakan jebakan over-optimization. Ini bisa terjadi jika kita secara membuta hanya mengikuti bahwa “garisnya naik”, dan optimisasi yang tampak fantastis sebenarnya bisa mengurung kita pada maksimum lokal. Saya pikir ada banyak analogi bukan hanya dalam biologi, tetapi juga dalam optimisasi machine learning dan fenomena sosial
- Clean and jerk bisa dibilang hampir merupakan salah satu gerakan yang “lengkap”
  Apalagi jika variasi squat juga dicampurkan. Jadi mungkin ini bukan contoh terbaik. Saya tidak tahu ada orang yang bisa melakukan clean and jerk beberapa kali dengan beban lebih berat dari berat badannya sendiri, tetapi bukan monster dalam sebagian besar aspek bermakna dari kebugaran manusia
  Tubuh manusia adalah satu mesin, dan respons hormonal bersifat sistemik. Daya tahan dan kekuatan berada pada sebuah spektrum, tetapi seluruh tubuh ikut bergerak bersama
- Itu lebih merupakan tanda bahwa “kebugaran umum” bukan ukuran yang ketat
  Sampai batas tertentu, konsep kabur seperti “kemampuan fisik” masih cukup, tetapi setelah itu peningkatan kemampuan menjadi terspesialisasi per tugas dan tidak berpindah ke tugas lain, sehingga kehilangan maknanya
Karena itu saya tidak suka fokus pada GDP. Menurut saya survei triwulanan tentang kepuasan hidup dan optimisme adalah ukuran yang lebih baik
Kalau penasaran dengan GDP: ketika mobil saya rusak lalu diperbaiki, GDP naik. Jika orang tua tinggal di rumah untuk mengasuh anak, GDP turun. Jika saya membersihkan rumah sendiri, GDP juga turun
Tingkat pengangguran juga indikator yang kasar. Kita tidak tahu apakah pekerjaan itu pekerjaan yang diinginkan orang, atau apakah mereka merasa terpaksa melakukan pekerjaan buruk
- Saya tidak terlalu menentang bahwa GDP adalah ukuran yang kasar; saya sedang mencoba merapikan pikiran
  Saya tidak berpikir kepuasan hidup dan optimisme individu harus sangat ditentukan oleh ekonomi negara-bangsa, apalagi sampai pemerintah menjadikannya sasaran optimisasi. Tugas pemerintah adalah menciptakan kondisi bagi keamanan, kemakmuran, dan peluang tanpa menindas seluruh dunia atau menghancurkan planet
  Di dalamnya, menemukan hidup yang memuaskan adalah tugas saya sendiri, dan hidup semacam itu mungkin dalam struktur ekonomi dan sosial yang sangat berbeda. Demikian pula, mungkin tidak ada kondisi yang memberi kepuasan universal bagi semua warga; kalau begitu, statistik ringkasan kepuasan hidup dan optimisme yang mana yang harus dioptimalkan?
- Intinya adalah apa pun yang diukur tidak terlalu penting
- Dalam machine learning kita menangani vektor berisi ribuan kuantitas, tetapi ironisnya saat mengukur masyarakat dan ekonomi kita hanya memakai satu atau beberapa angka
  Wacana umum seperti berita, politisi, forum, dan sebagainya selalu sangat disederhanakan hanya pada beberapa ukuran. Wacana dengan ribuan metrik terlalu rumit untuk disampaikan dengan mudah
  Saya berharap suatu hari nanti kebanyakan orang secara implisit mengakui bahwa semakin sedikit jumlah metrik, semakin besar kemungkinan itu adalah penyederhanaan yang menyembunyikan sesuatu. Misalnya “X adalah miliarder, jadi dia pintar”, atau “negara X punya GDP tinggi, jadi lebih baik daripada negara Y yang GDP-nya rendah”
- Saya setuju, dan ini juga berlaku pada kapitalisme secara umum
  Garis besar kasar tentang alternatif perencanaan terpusat masa lalu yang gagal dan satu usulan pengganti kapitalisme ada di sini:
  https://jacobin.com/2019/03/sam-gindin-socialist-planning-mo...
  Jika melihat bagian terkait, landasan sosialisme adalah perencanaan dan kontrol pekerja, tetapi perencanaan yang terlalu ambisius gagal ala Soviet, dan tempat kerja yang terlalu otonom gagal ala Yugoslavia. Perencanaan komprehensif tidak efektif maupun diinginkan, sementara desentralisasi ke kolektif tempat kerja terlalu terfragmentasi secara ekonomi untuk mengidentifikasi kepentingan sosial, dan terlalu terfragmentasi secara politik untuk memengaruhi perencanaan. Jadi pertanyaannya adalah bagaimana mengubah negara, perencanaan, tempat kerja, dan hubungan di antara semuanya untuk memecahkan dilema ini
  Unit operasi baik kapitalisme maupun sosialisme adalah tempat kerja. Dalam kapitalisme, tempat kerja menjadi bagian dari unit-unit modal yang bersaing; dalam sosialisme, karena unit privat untuk ekspansi diri dikecualikan, kolektif tempat kerja masuk ke dalam “sektor” yang dibentuk secara praktis berdasarkan teknologi bersama, keluaran, layanan, sejarah masa lalu, dan sebagainya. Sektor-sektor ini menjadi unit inti perencanaan ekonomi, dan secara tradisional berada di dalam kementerian negara seperti pertambangan, mesin, kesehatan, pendidikan, dan transportasi
  Inovasi radikal di sini adalah memindahkan otoritas dan kapasitas perencanaan kementerian ke masyarakat sipil di luar negara. Kementerian sebelumnya disahkan secara konstitusional tetapi berdiri di luar negara, lalu direorganisasi menjadi dewan sektor yang dijalankan oleh perwakilan tempat kerja dari tiap sektor yang dipilih. Komisi perencanaan pusat tetap membagikan dana ke tiap sektor sesuai prioritas negara, tetapi ketika kekuatan tempat kerja digabungkan pada tingkat sektor, ini mengubah keseimbangan kekuasaan antara negara dan pekerja, serta dapat menangani masalah pasar dengan cara yang lebih sesuai bagi sosialisme
  Intinya adalah keseimbangan antara insentif yang memperbesar ketimpangan dan bias investasi yang egaliter. Surplus yang diperoleh masing-masing kolektif tempat kerja dapat digunakan untuk meningkatkan konsumsi bersama atau pribadi, tetapi tidak untuk reinvestasi. Prioritas nasional ditentukan pada tingkat perencanaan pusat melalui proses dan tekanan demokratis, lalu diterjemahkan menjadi alokasi investasi per sektor. Dewan sektor membagi dana investasi kepada kolektif tempat kerja yang menjadi tanggung jawabnya, tetapi berbeda dari keputusan ala pasar, kriteria utamanya bukan memberi perlakuan lebih baik pada tempat kerja paling produktif sehingga mereproduksi kesenjangan permanen, melainkan mengangkat produktivitas kolektif yang lemah agar mendekati kolektif unggul
  Berbeda dari klaim Hayek, justru kapitalismelah yang menghalangi informasi dibagikan secara sistematis. Konsekuensi dari kepemilikan pribadi dan maksimisasi laba adalah bahwa informasi merupakan aset kompetitif, sehingga harus disembunyikan. Sebaliknya, dalam sosialisme, berbagi informasi secara aktif adalah syarat penting agar sistem berfungsi, dan ini dilembagakan sebagai tanggung jawab dewan sektor
Saya tadi mencoba mengingat di mana pernah mendengar nama penulis ini
Dia adalah orang yang menciptakan model difusi generatif pertama pada 2015
https://arxiv.org/abs/1503.03585
- Bagi saya, ia teringat lewat paper cerdik tahun 2019 yang ditulis bersama Stephan Hoyer dan Sam Greydanus
  Isinya tentang melakukan optimasi struktur dengan menggunakan jaringan saraf yang dibatasi sebagai penyimpan, pemodifikasi, dan penyetel model fisika yang menjelaskan struktur yang ingin dioptimalkan: https://arxiv.org/abs/1909.04240
  Pendekatannya sangat menarik dan papernya juga ditulis dengan sangat baik
Ini mengingatkan saya pada pengalaman pergi ke restoran jaringan
Semuanya sudah melewati focus group dan dioptimalkan, sehingga terasa seperti metrik proksi yang overfit untuk pengalaman makan yang menyenangkan. Rasanya seperti berada di dalam mesin yang terang-terangan dioptimalkan untuk membuat saya datang lalu memeras keuntungan dari saya, sementara fakta bahwa itu adalah restoran terasa nyaris sekunder
Contohnya adegan seperti, “Halo! Nama saya Tracy! Saya server yang akan melayani Anda malam ini!” lalu ia menulis namanya sendiri dengan sempurna secara terbalik memakai krayon di taplak meja kertas. Sepertinya tempat ini perlu sedikit mengalibrasi ulang kadar kepribadian pegawainya
Saya rasa ini juga berlaku saat manajer mencoba mengoptimalkan berlebihan proses kerja
Pada akhirnya orang-orang kreatif kehilangan minat dan pekerjaan menjadi tak tertahankan. Menurut saya, tempat kerja dan hidup membutuhkan sedikit kekacauan
- Saya sering membunuh sendiri keinginan untuk mengerjakan banyak proyek sampingan karena terlalu mengoptimalkan bagian yang sebenarnya tidak ingin saya lakukan
  Bagian yang tidak menyenangkan itu sebaiknya dibereskan saja lalu lanjut. Setidaknya tidak ada orang yang membayar untuk menjerumuskan saya ke pusaran itu
Saya melihat contoh hukum ini di toko perangkat keras besar di lingkungan saya
Sekitar 10 tahun lalu, toko itu memasang kandang berkunci untuk mencegah pencurian. Awalnya hanya barang mahal yang dimasukkan ke sana, dan meski agak merepotkan, tidak terlalu parah. Pelanggan yang membeli perkakas listrik kelas atas seharga lebih dari 200 dolar umumnya bisa menerima menunggu sekitar 5 menit
Namun beberapa tahun kemudian terjadi perubahan yang hampir pasti tampak berbasis data. Tiba-tiba tidak ada lagi logika yang bisa dikenali tentang barang mana yang dikunci dan mana yang dibiarkan terbuka. Kini alat diagnostik seharga 500 dolar bisa saja diletakkan begitu saja di rak, sementara bohlam seharga 5 dolar berada di balik gembok
Kemungkinan itu hasil mengurutkan basis data berdasarkan kerugian kumulatif terbesar akibat pencurian. Dengan kata lain, mereka mengunci barang-barang yang paling banyak membuat toko perangkat keras kehilangan uang
Akibatnya, suasana toko terbaca seperti “tempat yang begitu terobsesi pada laba sampai-sampai tidak percaya pelanggan tidak akan mencuri sekotak tusuk gigi,” dan dari sudut pandang pelanggan, sering kali tidak sepadan menunggu pegawai untuk membuka kandang itu
Sekalipun mereka berhasil mencegah pencurian beberapa sabun seharga 3 dolar, saya ragu optimasi itu membantu laba bersih
- Jauh lebih mudah membeli di Amazon daripada mencari orang yang bisa membuka etalase kaca di apotek
  Apotek yang sampai menaruh barang kebutuhan dasar di balik kaca biasanya juga kekurangan staf
- Pernyataan “mengunci barang yang menyebabkan kerugian kumulatif terbesar bagi toko perangkat keras karena pencurian” dan “saya ragu optimasi itu membantu laba bersih” tampak seperti kontradiksi langsung
  Kecuali Anda benar-benar berpikir bahwa hal itu membuat orang berhenti pergi ke toko tersebut, dan kerugian itu mengalahkan penurunan pencurian. Selain itu, sekalipun orang tidak datang, toko perangkat keras besar lokal pesaing kemungkinan juga melakukan hal yang sama. Perlu diingat juga bahwa margin ritel biasanya tidak besar. Kalau satu barang dicuri, berapa banyak barang tambahan yang harus dijual untuk menutup kerugiannya? Meski sebagian pelanggan pindah ke Amazon, menghindari pencurian bisa tetap lebih menguntungkan
  Kenyataannya, kemungkinan besar dampak terbesarnya memang ada pada pengurangan pencurian. Jika “logika yang bisa dikenali” tidak terlihat, bisa jadi itu karena kurang pengalaman dengan hal semacam ini. Pencurian sering kali lebih ditentukan oleh kemudahan dijual kembali daripada harga barang. Satu perkakas listrik mahal yang khusus butuh waktu lama untuk dijual kembali, tetapi deterjen dan pisau cukur bisa dilepas dalam jumlah besar pada hari yang sama. Orang memakai deterjen dan pisau cukur jauh lebih sering daripada bohlam
  Saya paham kalau Anda tidak suka repotnya. Namun menurut saya, yang seharusnya disalahkan bukan tokonya, melainkan pencuri atau faktor-faktor yang melahirkan pencurian