1 poin oleh GN⁺ 3 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • Karyawan Amazon mendapat tekanan untuk memasukkan lebih banyak AI ke dalam pekerjaan mereka, tetapi titik penerapannya tidak jelas sehingga memunculkan pekerjaan yang tidak perlu
  • Sebagian karyawan memakai alat internal MeshClaw untuk membuat agen yang meningkatkan volume aktivitas AI, alih-alih produktivitas
  • Karyawan menilai pelacakan konsumsi token AI telah menciptakan suasana yang lebih mengutamakan penggunaan daripada kualitas
  • Amazon menyatakan tidak ada metrik AI tingkat perusahaan atau leaderboard internal, tetapi karyawan mengatakan ada target penggunaan 80% dan pelacakan
  • OpenClaw dan MeshClaw berjalan secara lokal, sehingga lebih mandiri, tetapi risikonya bisa meningkat jika diberi izin akses yang berlebihan

Tekanan penggunaan AI dan pemakaian MeshClaw

  • Karyawan Amazon mendapat tekanan untuk memasukkan lebih banyak AI ke dalam alur kerja mereka, tetapi tidak jelas di mana teknologi itu harus diterapkan, sehingga sumber daya AI berpotensi terpakai untuk tugas yang tidak perlu
  • Menurut laporan Financial Times, sebagian karyawan Amazon menggunakan alat AI internal MeshClaw untuk membuat agen AI yang tidak perlu demi menaikkan volume aktivitas AI, bukan meningkatkan produktivitas
  • Seorang karyawan mengatakan, “Tekanannya untuk memakai alat-alat ini terlalu besar,” dan menambahkan bahwa sebagian orang memakai MeshClaw untuk memaksimalkan penggunaan token

Perbedaan pandangan soal metrik penggunaan

  • Karyawan menilai bahwa saat Amazon melacak konsumsi token AI, sebagian rekan kerja menjadi lebih mementingkan kuantitas penggunaan teknologi daripada kualitasnya
  • Beberapa karyawan Amazon yang tidak disebutkan namanya menilai lingkungan kerja memburuk seiring meningkatnya ekspektasi penggunaan AI
  • Amazon tampaknya telah memberi tahu karyawan bahwa statistik penggunaan AI tidak masuk ke evaluasi kinerja, tetapi tidak semua karyawan mempercayainya
  • Karyawan lain menilai pelacakan penggunaan menciptakan insentif yang menyimpang dan membuat sebagian karyawan bertindak sangat kompetitif
  • Karyawan yang diwawancarai mengatakan perusahaan memiliki target agar 80% developer menggunakan AI setiap minggu, dan konsumsi token para karyawan dilacak di leaderboard internal
  • Juru bicara Amazon menyatakan tidak ada metrik AI tingkat perusahaan untuk penggunaan AI, dan juga tidak ada leaderboard internal yang membandingkan karyawan satu sama lain
  • Menurut Amazon, karyawan dapat melihat penggunaan AI mereka sendiri di dashboard pribadi

OpenClaw dan risiko eksekusi lokal

  • MeshClaw, yang dipakai sebagian karyawan Amazon untuk menggembungkan penggunaan AI, adalah alat yang terinspirasi dari alat AI lain bernama OpenClaw
  • Berbeda dari model AI lain, OpenClaw dan MeshClaw berjalan secara lokal di perangkat keras milik pengguna sendiri, sehingga memiliki tingkat kemandirian yang lebih tinggi
  • Awal tahun ini, direktur alignment di Meta Superintelligence Labs menjadi sorotan karena OpenClaw hampir menghapus seluruh kotak masuk emailnya, yang menyoroti risiko saat AI diberi izin akses yang berlebihan

1 komentar

 
GN⁺ 3 jam lalu
Komentar Hacker News
  • Bukan cuma Amazon, rasanya industri teknologi besar secara umum dan bahkan sebagian perusahaan kecil juga sedang sama-sama jadi gila
    Mirip situasi ketika seorang CEO suatu hari berkata, “Kita harus mendorong pengeluaran perjalanan dinas, jadi pesan perjalanan sebanyak mungkin dan habiskan uang sebanyak-banyaknya. Naik kelas satu saat pergi ke kantor satelit, pakai limusin alih-alih Uber, makan di restoran mahal. Kalau pengeluaran perjalanan dinasmu tidak cukup tinggi, nilai evaluasi kinerjamu akan rendah”
    Sekarang benar-benar zaman yang tidak normal

    • Jadi saya sampai membuat alat CLI baru Burn, Baby, Burn: https://github.com/dtnewman/burn-baby-burn/tree/main
      Kalau saya wakil presiden Amazon, saya bahkan akan mempertimbangkan penawaran akuisisi, dan sekarang juga sedang mengerjakan versi enterprise dengan fitur tambahan
      Show HN: https://news.ycombinator.com/item?id=48151287
    • Ada orang yang diperintahkan untuk lebih banyak memakai AI di pekerjaan lalu membuat agen yang cuma membakar token, dan katanya pemakaiannya sekitar 10 kali lebih banyak daripada karyawan berikutnya yang paling banyak memakai
      Dia kira akan dimarahi, tapi justru mendapat pujian dan bahkan diminta memberi presentasi singkat kepada karyawan lain tentang cara suksesnya
    • Di perusahaan kami, pengeluaran AI masuk ke evaluasi kinerja, dan kami mendengar bahwa “singularitas” sudah datang
      Sekarang 20% pengeluaran infrastruktur kami berupa token, dan jumlah pull request mingguan per developer naik dari 4,2 menjadi 5,1
      Sebagian besar di antaranya cuma agen yang mengubah satu-dua baris file konfigurasi, jadi semuanya terlihat seperti pemikiran magis
    • Ayah saya bekerja pada awal 90-an di perusahaan yang punya agen perjalanan sendiri, dan sering kali penerbangannya dipesankan yang lebih mahal karena agen perjalanan itu bisa mendapat lebih banyak uang
      Di penerbangan lain sebenarnya kelas satu bisa didapat lebih murah, tapi menurut kebijakan perusahaan dia tidak boleh naik kelas satu
      Kita memang selalu hidup di zaman yang tidak normal
    • Beberapa perusahaan mungkin tertipu oleh pemasaran bahwa AI akan membuat semua karyawan 10.000 kali lebih produktif dan menghemat miliaran dolar
      Karena itu tidak terjadi, tampaknya mereka berasumsi penyebabnya adalah karyawan tidak cukup sering memakai AI ajaib itu
      Perusahaan yang membuat produk AI sendiri juga mungkin ingin karyawannya memakai AI sebanyak mungkin agar pada akhirnya mendapatkan data pelatihan untuk menggantikan sebagian besar atau seluruh karyawan
      Menghukum karyawan yang menolak melatih pengganti AI mereka sendiri mungkin terasa masuk akal bagi mereka jika biaya saat ini dianggap kecil dibanding penghematan nanti
  • Sekitar 6 bulan lalu saya mendengar presentasi dari seorang karyawan AWS tentang alat AI yang cocok untuk kasus penggunaan kami
    Di tengah presentasi, dia tiba-tiba menunjukkan lewat screen sharing, “Lihat berapa banyak token yang saya pakai bulan ini. Saya benar-benar menggeber Opus,” dan angkanya sangat besar sampai terasa memalukan
    Saat itu saya berpikir, “Aneh sekali untuk dibanggakan. Bukankah fakta bahwa ini dipakai begitu banyak justru sinyal bahaya karena terlalu mahal?”
    Dia menunjukkan beberapa contoh penggunaan Claude Code untuk mengelola dan menyesuaikan infrastruktur AWS, dan di mata saya sebagai sysadmin tua berjanggut abu-abu yang lebih tua dari internet, itu terlihat seperti “AI dipakai untuk melakukan hal yang sebenarnya cukup dengan satu perintah saja”
    Jadi cerita ini masuk akal. Rupanya sejak 6 bulan lalu mereka sudah didorong untuk menggunakannya secara habis-habisan

    • Banyak saran dari Cursor sebenarnya adalah hal-hal yang seharusnya diperbaiki otomatis oleh linter
      Tapi kalau menekan tab, itu dihitung sebagai baris yang diedit AI
      Sebagian besar sisanya juga adalah pekerjaan yang sebenarnya bisa dilakukan dengan kecepatan serupa jika sejak dulu belajar multi-cursor, navigasi vim, atau macro
      Kenyataannya, saya tidak pernah belajar hal-hal itu bukan karena tidak perlu, melainkan karena saya tidak pernah cukup lambat sampai kecepatan mengetik kode ke layar menjadi bottleneck
    • Saya masih tidak tahu bagaimana mendamaikan contoh-contoh seperti ini dengan cerita bahwa pengembangan berbantuan agen AI generatif sekarang menjadi satu-satunya cara bekerja, terutama di startup
      Mungkin ini bukan soal hitam-putih dan berubah tergantung banyak faktor, tapi tetap terasa aneh melihat laporan yang sangat berbeda muncul bersamaan
    • Banyak firma investasi besar kemungkinan punya keterikatan yang dalam bukan hanya dengan berbagai perusahaan teknologi, tetapi juga dengan OpenAI dan Anthropic
      Kalau begitu, jadi bisa dihitung dari mana instruksi seperti ini datang, dan mengapa arahnya tidak hati-hati atau seimbang
    • Seiring waktu, ketika lapisan abstraksi makin menumpuk, generasi berikutnya jadi tidak lagi memahami lapisan di bawahnya
      Ini kelemahan besar dalam pengembangan sistem, dan bisa menjadi permukaan serangan yang sangat besar bagi pihak lawan
    • “AI dipakai untuk melakukan hal yang sebenarnya cukup dengan satu perintah” justru hal yang bagus
      Sebagian besar nilai AI memang ada di situ
      Sekarang kita tidak perlu tahu perintah itu, cukup memahami kontrak fungsionalnya untuk bisa menyelesaikan pekerjaan yang dibutuhkan
      Ini perubahan yang sangat besar
  • Banyak cerita bermunculan soal “harus memakai token jadi dibakar untuk hal yang tidak berguna”, dan itu tindakan yang sulit dipercaya di tengah darurat iklim
    Kalau didorong terus, mungkin pemanasan 3 derajat pun bisa tercapai
    Ini mengingatkan pada cerita bahwa Soviet hampir membuat paus punah demi memenuhi kuota daging paus yang sebenarnya tidak ingin dimakan siapa pun

    • Semakin ekonomi bergerak ke arah top-down, semakin terasa gaya Soviet
      Pada dasarnya kita sudah punya perencanaan terpusat beserta semua patologi sistem itu, bedanya dengan Soviet hanya bahwa GOSPLAN kita dijalankan oleh segelintir orang yang kebetulan jadi kaya atau menyuap orang yang tepat
    • Jadi ini alasan hutan dibabat habis untuk membangun data center baru
      Bukan untuk peningkatan produktivitas yang “nyata”, melainkan cuma demi memakai token
    • Tidak usah khawatir. Kita tetap pakai sedotan kertas, karena itu kan yang benar-benar penting
      Kalau tidak membakar token, target metrik tidak tercapai, lalu kita bisa dicap Luddite dan dipecat bahkan sebelum AI sempat mengambil pekerjaan kita
      Saya setuju arus seperti ini dan para penggila perang sedang merusak planet ini
    • Soviet hanya menyumbang sekitar 15% dari tangkapan paus dunia, dan peringkat pertama adalah Jepang
      Klaim bahwa “tidak ada yang mau memakannya” juga kurang punya dasar
    • Tapi ya mau bagaimana lagi. Saya juga tidak ingin dihukum di kantor
      Untungnya saya bekerja di sisi pengelolaan aplikasi, dan saya tahu bahwa yang bisa dilihat hanya tanggal terakhir penggunaan, jadi cukup masukkan satu query per hari dan aman
      Tapi saya benar-benar lelah dengan demam AI ini
  • Saya bekerja di salah satu FAANG, tapi bukan Amazon, dan sudah sering mendengar cerita seperti ini dari dalam maupun luar
    Tapi orang-orang penting, yaitu kepemimpinan, tidak pernah sekalipun mengatakannya secara resmi
    Selalu dimulai dari rumor atau dari dashboard/metrik yang dibuat seseorang di internal lalu membesar
    Saya juga pernah mendengar para pemimpin berkata, “Bukan itu yang kami lihat, dan token mahal tidak boleh diboroskan”
    Tentu, di masa lalu mereka memang pernah memakai metrik bodoh seperti jumlah baris kode atau jumlah commit tanpa benar-benar mengakuinya sepenuhnya, tetapi saya tidak percaya sesederhana semakin banyak token semakin baik

    • Saya juga di FAANG, dan dalam rapat mingguan para manajer, kepemimpinan mendorong peningkatan penggunaan token
      Saat kami membantah, kepemimpinan mengakui bahwa pengeluaran token bukan metrik yang baik dan sangat mungkin disalahgunakan, tetapi segera setelah itu mereka tetap menyuruh kami meningkatkan pengeluaran token tim
      Saya tahu karena ada dashboard pelacakan token yang dilihat kepemimpinan dan ditampilkan langsung dalam rapat
      Untungnya sejauh ini belum dipublikasikan ke semua orang seperti papan peringkat
      Banyak rumor bahwa pengeluaran token akan masuk evaluasi kinerja, dan kepemimpinan membantahnya, tetapi sesudah itu mereka kembali mengadakan rapat tentang betapa pentingnya menaikkan pengeluaran token serta membahas kekurangan yang terlihat di dashboard
    • Saya berada dalam kelompok kolega besar berisi para manajer engineering, dan penggunaan token AI yang berlebihan makin menjadi masalah besar
      Di perusahaan yang membuat papan peringkat penggunaan token atau memberi isyarat bahwa engineer bisa dipecat karena menolak memakai alat AI, masalahnya meledak
      Lalu dimulailah perlombaan untuk memakai token sebanyak mungkin demi bertahan hidup
      Terutama parah di kalangan developer yang banyak membaca media sosial
      Di Twitter, Threads, Mastodon, LinkedIn, dan tempat lain, cerita viral soal menjadi AI-native dan memecat orang yang tidak cukup memakai AI terus didaur ulang, dan developer yang cemas mulai merasa bahwa untuk lolos dari perampingan yang tak terhindarkan mereka harus membakar token lebih cepat daripada rekan-rekan mereka
    • Saya baru-baru ini meninggalkan FAANG, dan sesaat sebelum pergi direktur organisasi kami dimarahi oleh VP dalam garis pelaporannya karena penggunaan token organisasinya rendah
      Setelah itu para individual contributor di organisasi kami diberi tahu untuk memakai AI dalam semua hal, dan jika tidak, karier mereka bisa dirugikan
    • Di sisi konsultasi enterprise juga makin konyol
      Ada pelatihan wajib, workshop, dan hackathon bertubi-tubi atas nama memotivasi penggunaan AI dalam pekerjaan sehari-hari
      Bahkan untuk hal yang gampang diselesaikan dengan shell script, pertanyaannya menjadi “bagaimana ini bisa kita ubah menjadi agen?”
    • Di perusahaan kami ini memang benar-benar datang dari kepemimpinan
      Mereka sudah mengeluarkan banyak uang untuk Copilot, jadi ingin melihat orang-orang memakainya
  • Bisa jadi tujuannya memang untuk membuat orang memainkan metrik
    Jika didorong untuk lebih banyak memakai AI, mereka akan mencoba, bereksperimen, dan “membuang” waktu sambil belajar
    Itulah tujuan akhirnya
    Saat ini token dipakai untuk hal-hal tak berguna sambil mencari tahu di mana AI membantu, dan di mana AI tidak membantu juga harus dipelajari dengan cara itu
    Perusahaan kami juga melakukan hal yang sama

    • Kalau disuruh memasang meshclaw lalu menghabiskan banyak token, ceritanya jadi lain
    • Itulah tepatnya intinya
      Mungkin boros, tapi itu cara tercepat untuk mengeksplorasi di mana AI benar-benar berguna bagi bisnis
      Bahkan jika 80% karyawan hanya membuang token, 20% sisanya sedang menemukan caranya
    • Maaf, tapi itu gila
      Kalau uangnya sebanyak itu untuk dibakar, saya masih bisa membayangkan cara belanja yang lebih buruk, tetapi kalau dipikir serius ini tetap bodoh
      Pernahkah perusahaan menghabiskan jutaan dolar dan waktu karyawan untuk suatu alat hanya demi “mencari tahu alat ini sebenarnya bisa berguna buat apa”?
      Ini solusi yang sedang mencari masalah
      Jika pada tahap awal tidak jelas alat ini menyelesaikan masalah apa, seharusnya dibuang dan lanjut ke hal lain
      Lebih baik sisa uangnya diberikan kepada karyawan dan pemegang saham
  • Sangat disayangkan bahwa AI sekarang punya program pekerjaan dasar universal, sementara manusia masih belum
    Perusahaan membayar AI untuk menggali lubang, lalu AI lain membayar untuk menutupinya kembali
    [1] https://locusmag.com/feature/cory-doctorow-full-employment/

    • Sebenarnya itu sudah pernah ada
      Soviet sudah lama mencapai 100% lapangan kerja[0], dan kemiskinan yang menyertainya juga ada
      Ini tidak sama karena tidak dijalankan dengan pajak
      Perusahaan swasta sedang bereksperimen dengan uang mereka sendiri, dan juga menanggung risiko bahwa nanti biaya naik lalu pelanggan pindah ke tempat lain
      Ini jauh lebih baik daripada memberi orang uang lewat pajak paksa tanpa kaitan dengan produktivitas
      [0] https://nintil.com/the-soviet-union-achieving-full-employmen...
  • Di internal Amazon, penggunaan Kiro membuat penggunaan token tergamifikasi
    Sebab tim tidak dikenai biaya seperti di AWS atau diminta menjelaskan kapasitas seperti pada sistem lama
    Bahkan sebelum siapa pun melihat peringkat internal, saya sudah mendengar cukup meyakinkan bahwa orang-orang memainkan metrik ini, dan para pengguna fanatik juga banyak membuat serta membagikan berbagai proyek internal
    Memang jelas ada tekanan dari manajer yang mendengar presentasi internal tentang peningkatan produktivitas N00% dan semacamnya, tetapi di tempat saya kalau seseorang membuat pekerjaan palsu alih-alih mengerjakan pekerjaan nyata, itu akan cepat ketahuan
    Tekanan lebih banyak datang dari tenggat yang agresif dan perubahan di proses OP1 tahunan ke cara kerja yang lebih lincah

  • Saya juga mendengar cerita serupa dari karyawan AWS dan FAANG non-AWS lainnya
    Semua papan peringkat token punya catatan penyangkalan “ini tidak memengaruhi evaluasi kinerja”, tetapi rasanya selalu disertai kode-kode tersirat
    Di satu organisasi yang saya dengar, ada orang yang menjalankan GasTown 24 jam sehari untuk melahap token
    Kontribusinya kecil, tapi dia tetap nyaman di posisi nomor satu

    • Saya juga mendengar dari banyak orang di berbagai organisasi skala kecil hingga menengah bahwa penggunaan token dan adopsi AI telah menjadi inti evaluasi kinerja
    • Manajer saya di perusahaan berukuran 400 orang adalah orang seperti itu
      Dia menjalankan GasTown dan membiarkan agen mengutak-atik seluruh codebase sehingga ada sekitar 50 commit per hari
      Isinya hal-hal seperti versi kompatibilitas, formatting, dan sebagainya
      Tapi masalahnya bukan teknologinya, melainkan orangnya
      Dia sudah seperti itu bahkan sebelum ada LLM
      Dia suka “merefaktor” repositori menjadi repositori yang lebih kecil sehingga tiba-tiba namanya melekat ke seluruh kode, dan kalau dilihat sekilas seolah-olah dialah yang membuat sebagian besar codebase perusahaan
      Dia pernah menolak pekerjaan yang ingin saya lakukan lalu belakangan mengerjakannya sendiri
      Dia akan mencari-cari masalah tanpa akhir di pull request saya atau bahkan bilang pekerjaan itu tidak boleh dilakukan, lalu berbalik dan mengimplementasikannya sendiri
      Dia tidak menyalin-tempel kode saya, tetapi setelah PR saya terbuka dia mengimplementasikan kembali ide yang sama yang sebelumnya dia tolak
      Dia sangat pintar, tapi juga sangat tidak jujur, dan pandai menyembunyikan ketidakjujurannya
      Kalau ditanya, jawabannya biasanya seperti, “Saya rasa cara ini terlihat lebih rapi”
      Dari luar, selalu ada ruang untuk berargumen bahwa satu cara lebih baik daripada cara lain sehingga ketidakjujurannya tidak tampak jelas, tetapi saya melihat 100% dari apa yang dia lakukan, jadi polanya sangat jelas
      Tambahan lagi, suatu kali saya bilang saya ingin mengambil cuti pada minggu tertentu, dan dia tidak menolaknya secara eksplisit, tetapi berkata bahwa tekanan untuk mengirim The Thing sangat besar dan bertanya apakah saya bisa menunda cuti
      Ketika saya bilang “tidak, saya tidak akan menundanya”, dia menyetujuinya, tetapi ketika minggu itu tiba, dia sendiri juga mengambil cuti pada minggu yang sama
      Saya tidak mempermasalahkan itu. Saya sudah tahu cukup banyak bahwa dia tidak punya rasa malu untuk menuntut orang lain melakukan hal yang tidak akan pernah dia terima jika ditujukan kepadanya
  • Jika juru bicara Amazon mengatakan tidak ada metrik penggunaan AI tingkat perusahaan, tidak ada papan peringkat internal yang membandingkan karyawan, dan di dashboard pribadi orang hanya bisa melihat penggunaan sendiri, itu omong kosong total
    Ada dashboard global yang memberi peringkat penggunaan Kiro/QuickSuite (sebelumnya Amazon Q) per karyawan berdasarkan token
    Dashboard itu sendiri ada di QuickSight, yang pada dasarnya juga sudah menjadi bagian dari QuickSuite
    Datanya bukan cuma terbuka untuk siapa saja, tetapi juga bisa diurutkan menurut peringkat, penggunaan harian, mingguan, bulanan, dan tahunan
    Baik karyawan aktif maupun mantan karyawan saat ini masuk berdasarkan alias internal
    Selain itu ada sistem “penghargaan” internal yang muncul di profil PhoneTool, sehingga setiap karyawan mendapat gelar Kiro/AmazonQ/Quicksuite seperti “Blaze”, “Thunderstorm”, dan sebagainya
    Orang lain dengan penghargaan yang sama juga bisa dilihat hanya dengan satu klik
    Sebagai referensi, PhoneTool adalah direktori profil internal untuk mencari karyawan lain
    Sementara itu, saya mengenal beberapa orang yang tidak bisa benar-benar menulis kode yang layak sendiri atau mengintegrasikan sesuatu secara langsung
    Orang-orang yang perlu terus dituntun ini menghasilkan jumlah besar lewat Kiro/AmazonQ dan belakangan peringkatnya bahkan lebih tinggi daripada SDE
    Mereka lebih dekat ke SysDev, engineer support, atau TPM daripada SDE
    Itu sendiri tidak bisa dibilang semata-mata baik atau buruk, tetapi jika stack ranking dilakukan berdasarkan penggunaan token, engineer bagus yang berusaha menulis kode “baik” kemungkinan akan dinilai lebih rendah daripada orang yang tidak berusaha mencari solusi ringkas
    Pada akhirnya kualitas akan turun, dan saat kepemimpinan sadar apa yang sedang terjadi, semuanya sudah terlambat
    Saya sudah melihat gangguan terkait Amazon-Q/Kiro, tetapi mereka terus menyangkalnya

  • Arus seperti ini juga mulai datang ke tempat kerja saya
    Kalau saya tidak memakai Copilot di MS Office setiap hari, saya mendapat notifikasi marah, jadi sekarang saya cuma mengetik Hello