- Karyawan Amazon mendapat tekanan untuk memasukkan lebih banyak AI ke dalam pekerjaan mereka, tetapi titik penerapannya tidak jelas sehingga memunculkan pekerjaan yang tidak perlu
- Sebagian karyawan memakai alat internal MeshClaw untuk membuat agen yang meningkatkan volume aktivitas AI, alih-alih produktivitas
- Karyawan menilai pelacakan konsumsi token AI telah menciptakan suasana yang lebih mengutamakan penggunaan daripada kualitas
- Amazon menyatakan tidak ada metrik AI tingkat perusahaan atau leaderboard internal, tetapi karyawan mengatakan ada target penggunaan 80% dan pelacakan
- OpenClaw dan MeshClaw berjalan secara lokal, sehingga lebih mandiri, tetapi risikonya bisa meningkat jika diberi izin akses yang berlebihan
Tekanan penggunaan AI dan pemakaian MeshClaw
- Karyawan Amazon mendapat tekanan untuk memasukkan lebih banyak AI ke dalam alur kerja mereka, tetapi tidak jelas di mana teknologi itu harus diterapkan, sehingga sumber daya AI berpotensi terpakai untuk tugas yang tidak perlu
- Menurut laporan Financial Times, sebagian karyawan Amazon menggunakan alat AI internal MeshClaw untuk membuat agen AI yang tidak perlu demi menaikkan volume aktivitas AI, bukan meningkatkan produktivitas
- Seorang karyawan mengatakan, “Tekanannya untuk memakai alat-alat ini terlalu besar,” dan menambahkan bahwa sebagian orang memakai MeshClaw untuk memaksimalkan penggunaan token
Perbedaan pandangan soal metrik penggunaan
- Karyawan menilai bahwa saat Amazon melacak konsumsi token AI, sebagian rekan kerja menjadi lebih mementingkan kuantitas penggunaan teknologi daripada kualitasnya
- Beberapa karyawan Amazon yang tidak disebutkan namanya menilai lingkungan kerja memburuk seiring meningkatnya ekspektasi penggunaan AI
- Amazon tampaknya telah memberi tahu karyawan bahwa statistik penggunaan AI tidak masuk ke evaluasi kinerja, tetapi tidak semua karyawan mempercayainya
- Karyawan lain menilai pelacakan penggunaan menciptakan insentif yang menyimpang dan membuat sebagian karyawan bertindak sangat kompetitif
- Karyawan yang diwawancarai mengatakan perusahaan memiliki target agar 80% developer menggunakan AI setiap minggu, dan konsumsi token para karyawan dilacak di leaderboard internal
- Juru bicara Amazon menyatakan tidak ada metrik AI tingkat perusahaan untuk penggunaan AI, dan juga tidak ada leaderboard internal yang membandingkan karyawan satu sama lain
- Menurut Amazon, karyawan dapat melihat penggunaan AI mereka sendiri di dashboard pribadi
OpenClaw dan risiko eksekusi lokal
- MeshClaw, yang dipakai sebagian karyawan Amazon untuk menggembungkan penggunaan AI, adalah alat yang terinspirasi dari alat AI lain bernama OpenClaw
- Berbeda dari model AI lain, OpenClaw dan MeshClaw berjalan secara lokal di perangkat keras milik pengguna sendiri, sehingga memiliki tingkat kemandirian yang lebih tinggi
- Awal tahun ini, direktur alignment di Meta Superintelligence Labs menjadi sorotan karena OpenClaw hampir menghapus seluruh kotak masuk emailnya, yang menyoroti risiko saat AI diberi izin akses yang berlebihan
1 komentar
Komentar Hacker News
Bukan cuma Amazon, rasanya industri teknologi besar secara umum dan bahkan sebagian perusahaan kecil juga sedang sama-sama jadi gila
Mirip situasi ketika seorang CEO suatu hari berkata, “Kita harus mendorong pengeluaran perjalanan dinas, jadi pesan perjalanan sebanyak mungkin dan habiskan uang sebanyak-banyaknya. Naik kelas satu saat pergi ke kantor satelit, pakai limusin alih-alih Uber, makan di restoran mahal. Kalau pengeluaran perjalanan dinasmu tidak cukup tinggi, nilai evaluasi kinerjamu akan rendah”
Sekarang benar-benar zaman yang tidak normal
Kalau saya wakil presiden Amazon, saya bahkan akan mempertimbangkan penawaran akuisisi, dan sekarang juga sedang mengerjakan versi enterprise dengan fitur tambahan
Show HN: https://news.ycombinator.com/item?id=48151287
Dia kira akan dimarahi, tapi justru mendapat pujian dan bahkan diminta memberi presentasi singkat kepada karyawan lain tentang cara suksesnya
Sekarang 20% pengeluaran infrastruktur kami berupa token, dan jumlah pull request mingguan per developer naik dari 4,2 menjadi 5,1
Sebagian besar di antaranya cuma agen yang mengubah satu-dua baris file konfigurasi, jadi semuanya terlihat seperti pemikiran magis
Di penerbangan lain sebenarnya kelas satu bisa didapat lebih murah, tapi menurut kebijakan perusahaan dia tidak boleh naik kelas satu
Kita memang selalu hidup di zaman yang tidak normal
Karena itu tidak terjadi, tampaknya mereka berasumsi penyebabnya adalah karyawan tidak cukup sering memakai AI ajaib itu
Perusahaan yang membuat produk AI sendiri juga mungkin ingin karyawannya memakai AI sebanyak mungkin agar pada akhirnya mendapatkan data pelatihan untuk menggantikan sebagian besar atau seluruh karyawan
Menghukum karyawan yang menolak melatih pengganti AI mereka sendiri mungkin terasa masuk akal bagi mereka jika biaya saat ini dianggap kecil dibanding penghematan nanti
Sekitar 6 bulan lalu saya mendengar presentasi dari seorang karyawan AWS tentang alat AI yang cocok untuk kasus penggunaan kami
Di tengah presentasi, dia tiba-tiba menunjukkan lewat screen sharing, “Lihat berapa banyak token yang saya pakai bulan ini. Saya benar-benar menggeber Opus,” dan angkanya sangat besar sampai terasa memalukan
Saat itu saya berpikir, “Aneh sekali untuk dibanggakan. Bukankah fakta bahwa ini dipakai begitu banyak justru sinyal bahaya karena terlalu mahal?”
Dia menunjukkan beberapa contoh penggunaan Claude Code untuk mengelola dan menyesuaikan infrastruktur AWS, dan di mata saya sebagai sysadmin tua berjanggut abu-abu yang lebih tua dari internet, itu terlihat seperti “AI dipakai untuk melakukan hal yang sebenarnya cukup dengan satu perintah saja”
Jadi cerita ini masuk akal. Rupanya sejak 6 bulan lalu mereka sudah didorong untuk menggunakannya secara habis-habisan
Tapi kalau menekan
tab, itu dihitung sebagai baris yang diedit AISebagian besar sisanya juga adalah pekerjaan yang sebenarnya bisa dilakukan dengan kecepatan serupa jika sejak dulu belajar multi-cursor, navigasi vim, atau macro
Kenyataannya, saya tidak pernah belajar hal-hal itu bukan karena tidak perlu, melainkan karena saya tidak pernah cukup lambat sampai kecepatan mengetik kode ke layar menjadi bottleneck
Mungkin ini bukan soal hitam-putih dan berubah tergantung banyak faktor, tapi tetap terasa aneh melihat laporan yang sangat berbeda muncul bersamaan
Kalau begitu, jadi bisa dihitung dari mana instruksi seperti ini datang, dan mengapa arahnya tidak hati-hati atau seimbang
Ini kelemahan besar dalam pengembangan sistem, dan bisa menjadi permukaan serangan yang sangat besar bagi pihak lawan
Sebagian besar nilai AI memang ada di situ
Sekarang kita tidak perlu tahu perintah itu, cukup memahami kontrak fungsionalnya untuk bisa menyelesaikan pekerjaan yang dibutuhkan
Ini perubahan yang sangat besar
Banyak cerita bermunculan soal “harus memakai token jadi dibakar untuk hal yang tidak berguna”, dan itu tindakan yang sulit dipercaya di tengah darurat iklim
Kalau didorong terus, mungkin pemanasan 3 derajat pun bisa tercapai
Ini mengingatkan pada cerita bahwa Soviet hampir membuat paus punah demi memenuhi kuota daging paus yang sebenarnya tidak ingin dimakan siapa pun
Pada dasarnya kita sudah punya perencanaan terpusat beserta semua patologi sistem itu, bedanya dengan Soviet hanya bahwa GOSPLAN kita dijalankan oleh segelintir orang yang kebetulan jadi kaya atau menyuap orang yang tepat
Bukan untuk peningkatan produktivitas yang “nyata”, melainkan cuma demi memakai token
Kalau tidak membakar token, target metrik tidak tercapai, lalu kita bisa dicap Luddite dan dipecat bahkan sebelum AI sempat mengambil pekerjaan kita
Saya setuju arus seperti ini dan para penggila perang sedang merusak planet ini
Klaim bahwa “tidak ada yang mau memakannya” juga kurang punya dasar
Untungnya saya bekerja di sisi pengelolaan aplikasi, dan saya tahu bahwa yang bisa dilihat hanya tanggal terakhir penggunaan, jadi cukup masukkan satu query per hari dan aman
Tapi saya benar-benar lelah dengan demam AI ini
Saya bekerja di salah satu FAANG, tapi bukan Amazon, dan sudah sering mendengar cerita seperti ini dari dalam maupun luar
Tapi orang-orang penting, yaitu kepemimpinan, tidak pernah sekalipun mengatakannya secara resmi
Selalu dimulai dari rumor atau dari dashboard/metrik yang dibuat seseorang di internal lalu membesar
Saya juga pernah mendengar para pemimpin berkata, “Bukan itu yang kami lihat, dan token mahal tidak boleh diboroskan”
Tentu, di masa lalu mereka memang pernah memakai metrik bodoh seperti jumlah baris kode atau jumlah commit tanpa benar-benar mengakuinya sepenuhnya, tetapi saya tidak percaya sesederhana semakin banyak token semakin baik
Saat kami membantah, kepemimpinan mengakui bahwa pengeluaran token bukan metrik yang baik dan sangat mungkin disalahgunakan, tetapi segera setelah itu mereka tetap menyuruh kami meningkatkan pengeluaran token tim
Saya tahu karena ada dashboard pelacakan token yang dilihat kepemimpinan dan ditampilkan langsung dalam rapat
Untungnya sejauh ini belum dipublikasikan ke semua orang seperti papan peringkat
Banyak rumor bahwa pengeluaran token akan masuk evaluasi kinerja, dan kepemimpinan membantahnya, tetapi sesudah itu mereka kembali mengadakan rapat tentang betapa pentingnya menaikkan pengeluaran token serta membahas kekurangan yang terlihat di dashboard
Di perusahaan yang membuat papan peringkat penggunaan token atau memberi isyarat bahwa engineer bisa dipecat karena menolak memakai alat AI, masalahnya meledak
Lalu dimulailah perlombaan untuk memakai token sebanyak mungkin demi bertahan hidup
Terutama parah di kalangan developer yang banyak membaca media sosial
Di Twitter, Threads, Mastodon, LinkedIn, dan tempat lain, cerita viral soal menjadi AI-native dan memecat orang yang tidak cukup memakai AI terus didaur ulang, dan developer yang cemas mulai merasa bahwa untuk lolos dari perampingan yang tak terhindarkan mereka harus membakar token lebih cepat daripada rekan-rekan mereka
Setelah itu para individual contributor di organisasi kami diberi tahu untuk memakai AI dalam semua hal, dan jika tidak, karier mereka bisa dirugikan
Ada pelatihan wajib, workshop, dan hackathon bertubi-tubi atas nama memotivasi penggunaan AI dalam pekerjaan sehari-hari
Bahkan untuk hal yang gampang diselesaikan dengan shell script, pertanyaannya menjadi “bagaimana ini bisa kita ubah menjadi agen?”
Mereka sudah mengeluarkan banyak uang untuk Copilot, jadi ingin melihat orang-orang memakainya
Bisa jadi tujuannya memang untuk membuat orang memainkan metrik
Jika didorong untuk lebih banyak memakai AI, mereka akan mencoba, bereksperimen, dan “membuang” waktu sambil belajar
Itulah tujuan akhirnya
Saat ini token dipakai untuk hal-hal tak berguna sambil mencari tahu di mana AI membantu, dan di mana AI tidak membantu juga harus dipelajari dengan cara itu
Perusahaan kami juga melakukan hal yang sama
Mungkin boros, tapi itu cara tercepat untuk mengeksplorasi di mana AI benar-benar berguna bagi bisnis
Bahkan jika 80% karyawan hanya membuang token, 20% sisanya sedang menemukan caranya
Kalau uangnya sebanyak itu untuk dibakar, saya masih bisa membayangkan cara belanja yang lebih buruk, tetapi kalau dipikir serius ini tetap bodoh
Pernahkah perusahaan menghabiskan jutaan dolar dan waktu karyawan untuk suatu alat hanya demi “mencari tahu alat ini sebenarnya bisa berguna buat apa”?
Ini solusi yang sedang mencari masalah
Jika pada tahap awal tidak jelas alat ini menyelesaikan masalah apa, seharusnya dibuang dan lanjut ke hal lain
Lebih baik sisa uangnya diberikan kepada karyawan dan pemegang saham
Sangat disayangkan bahwa AI sekarang punya program pekerjaan dasar universal, sementara manusia masih belum
Perusahaan membayar AI untuk menggali lubang, lalu AI lain membayar untuk menutupinya kembali
[1] https://locusmag.com/feature/cory-doctorow-full-employment/
Soviet sudah lama mencapai 100% lapangan kerja[0], dan kemiskinan yang menyertainya juga ada
Ini tidak sama karena tidak dijalankan dengan pajak
Perusahaan swasta sedang bereksperimen dengan uang mereka sendiri, dan juga menanggung risiko bahwa nanti biaya naik lalu pelanggan pindah ke tempat lain
Ini jauh lebih baik daripada memberi orang uang lewat pajak paksa tanpa kaitan dengan produktivitas
[0] https://nintil.com/the-soviet-union-achieving-full-employmen...
Di internal Amazon, penggunaan Kiro membuat penggunaan token tergamifikasi
Sebab tim tidak dikenai biaya seperti di AWS atau diminta menjelaskan kapasitas seperti pada sistem lama
Bahkan sebelum siapa pun melihat peringkat internal, saya sudah mendengar cukup meyakinkan bahwa orang-orang memainkan metrik ini, dan para pengguna fanatik juga banyak membuat serta membagikan berbagai proyek internal
Memang jelas ada tekanan dari manajer yang mendengar presentasi internal tentang peningkatan produktivitas N00% dan semacamnya, tetapi di tempat saya kalau seseorang membuat pekerjaan palsu alih-alih mengerjakan pekerjaan nyata, itu akan cepat ketahuan
Tekanan lebih banyak datang dari tenggat yang agresif dan perubahan di proses OP1 tahunan ke cara kerja yang lebih lincah
Saya juga mendengar cerita serupa dari karyawan AWS dan FAANG non-AWS lainnya
Semua papan peringkat token punya catatan penyangkalan “ini tidak memengaruhi evaluasi kinerja”, tetapi rasanya selalu disertai kode-kode tersirat
Di satu organisasi yang saya dengar, ada orang yang menjalankan GasTown 24 jam sehari untuk melahap token
Kontribusinya kecil, tapi dia tetap nyaman di posisi nomor satu
Dia menjalankan GasTown dan membiarkan agen mengutak-atik seluruh codebase sehingga ada sekitar 50 commit per hari
Isinya hal-hal seperti versi kompatibilitas, formatting, dan sebagainya
Tapi masalahnya bukan teknologinya, melainkan orangnya
Dia sudah seperti itu bahkan sebelum ada LLM
Dia suka “merefaktor” repositori menjadi repositori yang lebih kecil sehingga tiba-tiba namanya melekat ke seluruh kode, dan kalau dilihat sekilas seolah-olah dialah yang membuat sebagian besar codebase perusahaan
Dia pernah menolak pekerjaan yang ingin saya lakukan lalu belakangan mengerjakannya sendiri
Dia akan mencari-cari masalah tanpa akhir di pull request saya atau bahkan bilang pekerjaan itu tidak boleh dilakukan, lalu berbalik dan mengimplementasikannya sendiri
Dia tidak menyalin-tempel kode saya, tetapi setelah PR saya terbuka dia mengimplementasikan kembali ide yang sama yang sebelumnya dia tolak
Dia sangat pintar, tapi juga sangat tidak jujur, dan pandai menyembunyikan ketidakjujurannya
Kalau ditanya, jawabannya biasanya seperti, “Saya rasa cara ini terlihat lebih rapi”
Dari luar, selalu ada ruang untuk berargumen bahwa satu cara lebih baik daripada cara lain sehingga ketidakjujurannya tidak tampak jelas, tetapi saya melihat 100% dari apa yang dia lakukan, jadi polanya sangat jelas
Tambahan lagi, suatu kali saya bilang saya ingin mengambil cuti pada minggu tertentu, dan dia tidak menolaknya secara eksplisit, tetapi berkata bahwa tekanan untuk mengirim The Thing sangat besar dan bertanya apakah saya bisa menunda cuti
Ketika saya bilang “tidak, saya tidak akan menundanya”, dia menyetujuinya, tetapi ketika minggu itu tiba, dia sendiri juga mengambil cuti pada minggu yang sama
Saya tidak mempermasalahkan itu. Saya sudah tahu cukup banyak bahwa dia tidak punya rasa malu untuk menuntut orang lain melakukan hal yang tidak akan pernah dia terima jika ditujukan kepadanya
Jika juru bicara Amazon mengatakan tidak ada metrik penggunaan AI tingkat perusahaan, tidak ada papan peringkat internal yang membandingkan karyawan, dan di dashboard pribadi orang hanya bisa melihat penggunaan sendiri, itu omong kosong total
Ada dashboard global yang memberi peringkat penggunaan Kiro/QuickSuite (sebelumnya Amazon Q) per karyawan berdasarkan token
Dashboard itu sendiri ada di QuickSight, yang pada dasarnya juga sudah menjadi bagian dari QuickSuite
Datanya bukan cuma terbuka untuk siapa saja, tetapi juga bisa diurutkan menurut peringkat, penggunaan harian, mingguan, bulanan, dan tahunan
Baik karyawan aktif maupun mantan karyawan saat ini masuk berdasarkan alias internal
Selain itu ada sistem “penghargaan” internal yang muncul di profil PhoneTool, sehingga setiap karyawan mendapat gelar Kiro/AmazonQ/Quicksuite seperti “Blaze”, “Thunderstorm”, dan sebagainya
Orang lain dengan penghargaan yang sama juga bisa dilihat hanya dengan satu klik
Sebagai referensi, PhoneTool adalah direktori profil internal untuk mencari karyawan lain
Sementara itu, saya mengenal beberapa orang yang tidak bisa benar-benar menulis kode yang layak sendiri atau mengintegrasikan sesuatu secara langsung
Orang-orang yang perlu terus dituntun ini menghasilkan jumlah besar lewat Kiro/AmazonQ dan belakangan peringkatnya bahkan lebih tinggi daripada SDE
Mereka lebih dekat ke SysDev, engineer support, atau TPM daripada SDE
Itu sendiri tidak bisa dibilang semata-mata baik atau buruk, tetapi jika stack ranking dilakukan berdasarkan penggunaan token, engineer bagus yang berusaha menulis kode “baik” kemungkinan akan dinilai lebih rendah daripada orang yang tidak berusaha mencari solusi ringkas
Pada akhirnya kualitas akan turun, dan saat kepemimpinan sadar apa yang sedang terjadi, semuanya sudah terlambat
Saya sudah melihat gangguan terkait Amazon-Q/Kiro, tetapi mereka terus menyangkalnya
Arus seperti ini juga mulai datang ke tempat kerja saya
Kalau saya tidak memakai Copilot di MS Office setiap hari, saya mendapat notifikasi marah, jadi sekarang saya cuma mengetik Hello