- AI generatif memungkinkan produksi lintas domain, yaitu orang yang tidak terlatih dapat membuat keluaran dari bidang profesional lain, sehingga pemula tampak seperti meningkatkan produktivitas tanpa memiliki penilaian untuk meninjau hasilnya
- Di tempat kerja, keluaran seperti kode, sistem data, dan dokumen yang sekilas tampak sebagai kemajuan memang bertambah, tetapi pengguna sering tidak bisa menjelaskan cara kerjanya yang sebenarnya, atau sudah salah sejak skema dan tujuan awal
- AI memutus hubungan di mana kualitas keluaran dulu menunjukkan kemampuan pembuatnya, menciptakan pemisahan antara keluaran dan kompetensi, dan membuat pengguna lebih mirip saluran yang meneruskan hasil tanpa mampu mengevaluasinya
- Dokumen internal dan pembaruan menjadi lebih panjang karena biaya pembuatannya turun, tetapi biaya membacanya tidak berkurang, sehingga semakin sulit menemukan sinyal di dalam organisasi dan melahirkan bentuk baru AI slop yang dibuat oleh orang-orang bergaji
- AI generatif cocok untuk draf, contoh, ringkasan, brainstorming, dan penyuntingan saat manusia tetap menjadi pengambil keputusan akhir dan umpan balik bisa cepat, sementara kemampuan menyediakan pekerjaan yang dapat dipercaya tetap menjadi keunggulan kompetitif perusahaan
Masalah keluaran AI yang tampak seperti produktivitas kerja
- AI generatif dapat menghasilkan hasil yang terlihat seperti keluaran profesional tanpa adanya keahlian, dan kegagalannya muncul dalam dua bentuk
- Pemula di suatu bidang membuat hasil yang tampak lebih cepat atau lebih canggih daripada penilaiannya sendiri
- Orang yang tidak pernah dilatih di bidang tersebut membuat keluaran untuk bidang profesional lain
- Riset yang ada terutama mengukur bentuk pertama, tetapi yang lebih berbahaya adalah produksi lintas domain, ketika orang yang tidak terlatih menghasilkan keluaran untuk bidang lain
- Di kanal publik, ada rekan kerja yang menyalin-tempel jawaban yang tampak dibuat dengan Claude, lalu terlihat percaya diri membahas teknologi yang sebenarnya tidak ia pahami
- Dalam situasi seperti ini, orang di seberang kita bukan benar-benar lawan bicara, melainkan lebih seperti entitas yang meneruskan keluaran model
Produksi lintas domain
- Orang yang tidak bisa menulis kode membuat perangkat lunak, dan orang yang belum pernah merancang sistem data merancang sistem data
- Sebagian besar tidak pernah dirilis, tetapi dibagikan dengan antusias secara internal atau dipakai diam-diam, dan kadang terlihat oleh pelanggan
- Saat ini memang ada praktisi yang bisa menyelesaikan pekerjaan kompleks dengan alat berbasis agen, tetapi jumlahnya sedikit dan terutama terlihat di ranah pembuatan kode
- Kapabilitas AI di tingkat individu meningkat, tetapi tidak benar-benar terskalakan di lapangan kerja
- Seorang rekan kerja dari peran non-engineering menghabiskan dua bulan pada awal tahun ini membangun sistem yang seharusnya dirancang oleh orang dengan pelatihan arsitektur data formal
- Menurut standar saat ini dalam menilai penggunaan alat AI, ia memakai alat itu dengan baik, menghasilkan banyak kode, dokumentasi, dan keluaran yang secara kasat mata tampak seperti kemajuan
- Namun ketika ditanya, ia tidak bisa menjelaskan bagaimana sistem itu benar-benar bekerja
- Skema dan tujuannya sudah salah sejak hari pertama, pada tingkat kesalahan yang akan disadari oleh orang dengan pengalaman dua tahun di bidang itu
- Banyak orang mengetahui hal ini dan masalahnya sudah naik sampai level V.P., tetapi manajer tidak ingin mengguncangnya karena sudah telanjur berinvestasi pada tampilan momentum itu
- Alat ini tidak membuatnya menjadi rekan kerja yang lebih buruk, tetapi memungkinkannya meniru secara meyakinkan bidang yang tidak pernah ia pelajari selama berbulan-bulan
- Insentif organisasi cenderung membuat peniruan itu terus berjalan
- Ini bisa jadi kegagalan manajemen, tetapi kemauan manajemen untuk mengadopsi AI membuat mereka menerima risikonya
- Jika model menilai keluarannya sendiri dengan jujur, dampaknya mungkin bisa dikurangi, tetapi kenyataannya tidak begitu
- Akibatnya, pemula dapat meningkatkan produktivitas personal di luar area keahliannya, tetapi tetap tidak memiliki kemampuan untuk meninjau apakah keluarannya benar
Masalah saluran
- Fenomena ini semakin sering disebut pemisahan antara keluaran dan kompetensi (output-competence decoupling)
- Dulu, kualitas keluaran umumnya menjadi sinyal kemampuan pembuatnya
- Tulisan pemula terbaca seperti tulisan pemula, dan kode pemula gagal dengan cara yang khas pemula
- AI memutus hubungan ini, sehingga pemula kini bisa menghasilkan keluaran yang tidak lagi memperlihatkan bahwa ia sebenarnya pemula
- Kompetensi yang tercermin dalam keluaran bukan lagi kompetensi pengguna, melainkan kompetensi sistem
- Pengguna bisa meneruskan hasil itu ke penerima, tetapi dalam prosesnya ia lebih mirip saluran yang tidak mampu mengevaluasi apa yang disampaikannya
- Kemampuan membuat keluaran dan kemampuan menilai sebenarnya sejak dulu berbeda, tetapi proses mengerjakan pekerjaan nyata membangun daya penilaian itu
- Kemampuan pertama, yaitu membuat keluaran, kini sebagian besar berpindah ke mesin
- Kemampuan kedua, yaitu menilai, masih tersisa pada manusia, tetapi semakin sedikit orang yang belajar atau menggunakannya
- Dulu, kritik arsitektur datang dari orang yang pernah dididik atau sudah beberapa kali membangun dan merusakkan sistem serupa
- Sekarang kritik semacam itu keluar dari model yang tidak punya ingatan terwujud karena pernah membangun atau merusakkan sesuatu
- Lambatnya proses dulu bukan sekadar biaya yang menempel pada pekerjaan nyata, melainkan proses yang membuat pekerjaan membaik, orang menjadi terampil, dan perusahaan mampu menjanjikan kualitas tertentu kepada pelanggan
- Sistem berbasis agen generasi sekarang dirancang dengan asumsi bahwa manusialah bottleneck-nya
- Asumsinya, semakin sedikit jeda karena manusia membaca dan menilai apa yang akan terjadi, semakin cepat dan bersih loop-nya
- Dalam banyak kasus justru sebaliknya; manusia di dalam loop bukan sisa masa lalu, melainkan satu-satunya komponen yang punya kepentingan terhadap hasil
- Menghapus manusia dari human-in-the-loop (HITL) bukanlah efisiensi, melainkan melepaskan satu-satunya mekanisme yang memungkinkan sistem menangkap kesalahannya sendiri
AI slop di dalam organisasi
- Dokumen kerja semakin cepat memanjang
- Dokumen kebutuhan yang dulu satu halaman menjadi 12 halaman
- Pembaruan status yang dulu tiga kalimat berubah menjadi dokumen bullet yang merangkum ringkasan dari ringkasan
- Retrospektif, laporan insiden, memo desain, dek kickoff, dan semua keluaran yang bisa dipanjangkan kini memang menjadi lebih panjang
- Biaya produksi hampir mendekati 0, tetapi biaya membaca tidak turun, bahkan meningkat
- Pembaca harus menyaring konteks sintetis untuk menemukan apa yang sebenarnya ingin disampaikan dokumen itu
- Pilihan tiap orang untuk memperpanjang dokumen tampak rasional dan diberi imbalan secara terpisah
- Menurut Beyond the Steeper Curve: AI-Mediated Metacognitive Decoupling, pembaca merasa lebih yakin pada penjelasan buatan AI yang lebih panjang, terlepas dari apakah penjelasan itu akurat atau tidak
- Akibatnya, mencari sinyal di tempat kerja menjadi lebih sulit daripada sebelumnya
- Checkpoint tersembunyi di dalam dokumen, dan orang-orang tetap tenggelam dalam kerja dokumentasi meski sebenarnya berniat membuat segala sesuatunya “ringkas”
- Ini adalah bentuk baru slop yang lebih mahal daripada AI slop yang menyebar di pasar publik
- Karena orang yang membuatnya dibayar gaji
- Pekerjaan yang dulu melatih daya penilaian kini dikerjakan alat, dan peran junior tempat pembelajaran itu terjadi berkurang karena alat dianggap bisa melakukan pekerjaannya
- Di banyak kantor, pergerakan memang banyak, tetapi hasil nyata yang dulu dihasilkan oleh pergerakan itu justru lebih sedikit
- Diskusi publik selama ini terutama berfokus pada AI slop yang mengalir ke pasar terbuka, dan Generative AI and the market for creative content dari University of Florida membahas arus itu
- Namun dinamika yang sama juga muncul di dalam organisasi
- Waktu dihabiskan untuk pekerjaan yang tidak membutuhkan AI, keluaran yang tidak akan dibaca siapa pun, dan proses yang muncul karena alat kini bisa membuatnya dengan murah
- Semakin sering hal-hal yang dulu bahkan tidak perlu diucapkan, atau dianggap sudah jelas, diurai menjadi dek presentasi
Cara merespons
- Disiplin yang dibutuhkan di lingkungan ini justru mirip cara lama
- Gunakan alat hanya di tempat Anda bisa memverifikasi dengan tepat hasil yang dibuatnya
- Jangan meminta model untuk mengonfirmasi
- Alat akan setuju dengan siapa saja, dan persetujuan yang tidak menimbulkan biaya apa pun di pihak yang setuju tidak punya nilai
- Pekerjaan yang cocok untuk AI generatif adalah pekerjaan dengan umpan balik cepat, cukup jika kira-kira benar, dan manusia tetap menjadi penilai akhir
- Menulis draf memo
- Menghasilkan contoh
- Merangkum materi yang dapat diverifikasi pembaca bila diinginkan
- Generative AI Guidance dari University of Illinois dan Ten simple rules for optimal and careful use of generative AI in science di PLOS Computational Biology merekomendasikan penggunaan seperti berikut
-
Brainstorming
-
Penyuntingan
-
Menyusun ulang ide sendiri
-
Mendeteksi pola dalam data yang sudah dipahami
- Dalam semua penggunaan yang direkomendasikan, manusialah yang menyediakan penilaian, dan alat menyediakan throughput
- Ini adalah posisi yang lebih kuat daripada sekadar human-in-the-loop
- Alat harus tetap berada di luar pekerjaan dan hanya berkontribusi ketika diundang, selebihnya diam
- Ini berlawanan dengan arah yang sedang dituju banyak sistem berbasis agen saat ini
- Bagi perusahaan, kemampuan menyediakan pekerjaan yang dapat dipercaya tetap merupakan keunggulan kompetitif
- Semakin para pesaing mengubah diri mereka menjadi pipeline pembuat konten sambil berharap pelanggan tidak menyadarinya, semakin tinggi nilai pekerjaan yang dapat dipercaya
- Masalahnya sudah mulai muncul ke permukaan
- Deloitte mengembalikan sebagian dari biaya sebesar 440 ribu dolar terkait laporan pemerintah yang memuat halusinasi AI
- Masalah berikutnya bisa berupa sistem operasional yang dibangun dari spesifikasi halusinatif, atau insinyur senior yang menyadari bahwa selama setahun terakhir ia secara nominal meninjau pekerjaan yang sebenarnya tidak mampu ia telaah dengan benar
- Perusahaan yang bekerja dengan benar akan berada pada posisi untuk menetapkan harga atas pekerjaan itu
- Perusahaan yang mengosongkan dirinya sendiri akan sadar bahwa justru bagian yang dikosongkan itulah yang dulu dibayar pelanggan
- Kesalahpahaman dan penyalahgunaan AI di tempat kerja sudah meluas
- Keahlian mendapat tekanan untuk mengirim lebih cepat, membuat lebih banyak, mengintegrasikan alat lebih dalam, dan tidak menghalangi rekan kerja yang “menyelesaikan pekerjaan”
- Keluaran menumpuk, tetapi pekerjaan nyata tidak menumpuk
- Di sisi lain dari keluaran itu, pelanggan bisa saja membuka deliverable, membaca daftar ringkasannya, lalu memilih untuk meninjaunya sendiri
1 komentar
Komentar Hacker News
Saya sangat merasakan inflasi verbosity hasil kerja seperti dokumen requirement yang dulu cukup satu halaman sekarang jadi dua belas halaman
Ini mengingatkan saya pada masa sengaja memperpanjang kalimat demi memenuhi batas minimum 1000 kata esai SMA, dan sekarang format profesional, panjang dokumen, serta kalimat yang jelas tidak lagi menjadi sinyal ketekunan dan kualitas
Jadi sepertinya bottleneck peningkatan produktivitas saat ini tetaplah orang-orang yang masih cukup peduli untuk meninjau semuanya secara manual
Sekarang bahkan dokumen spesifikasi 10–30 halaman yang penuh format dan gambar ASCII kemungkinan besar pada dasarnya hanyalah ide yang dilempar asal lewat kata-kata, jadi perlu beradaptasi untuk membacanya seperti itu
Manajer mungkin akan merangkum atau menilai apa yang saya kirim lewat chatbot atau agent, tetapi anehnya saya tidak boleh langsung mengirim versi ringkasnya sendiri
Seperti ATS checker untuk CV, sekarang tulisan saya pun rasanya butuh pemeriksa AI, dan akhirnya AI menulis teks yang lalu diparse AI lain, yang tampaknya jadi pemborosan energi besar
Akan bagus kalau ada aturan, struktur, standar, atau prosedur yang disepakati bersama untuk komunikasi yang lebih efisien
Produk dari tulisan yang memanjangkan apa pun demi naik ke hasil pencarian teratas
Orang yang mengirim hal begitu toh biasanya tidak akan melakukan tindak lanjut, jadi masalahnya selesai sendiri
Situasi yang digambarkan di sini juga sangat mirip dengan pengalaman saya
Di perusahaan kami ada banyak manajer yang sudah bertahun-tahun tidak menulis kode, dan arsitek yang direkrut 18 bulan lalu merancang semuanya dengan AI
Bagi para senior developer, semuanya jelas sangat overengineered, tetapi karena ia memakai semua istilah yang benar, di mata eksekutif puncak ia tampak lebih kompeten daripada senior manager lain, dan ketika dikritik ia membalas dengan serangan pribadi
Sekitar 6 bulan kemudian beberapa orang pergi, yang tersisa all-in ke AI, dan selama 12 bulan terakhir mereka membangun workflow berbasis agent untuk menutup kekosongan yang ditinggalkan karyawan kompeten yang hengkang
Hasilnya, selama 18 bulan terakhir tidak ada satu pun hal bernilai yang dirilis, lalu setelah memboroskan banyak biaya komputasi cloud pada solusi yang salah desain, sekarang mereka menekan biaya dengan hiring freeze
Jika keekonomian berubah besar, itu pada dasarnya seperti menghilangkan bendungan sehingga sisa sistem menanggung tekanan jauh lebih besar
Jika pemimpin organisasi tidak melihat efek samping dan risikonya, mereka bisa sangat terpukul
Walaupun teknologi ini dijual sebagai peningkatan umum, rasanya kita akan melihat lonjakan perusahaan seperti ini yang lalu jatuh
Perusahaan yang bertahan akan menyebarkan cara menjinakkan kuda liar ini, dan idealnya di masa depan kita akan mempelajari sesuatu darinya
Tetapi euforia naif saat ini sungguh mengejutkan, dan September tanpa akhir dari orang-orang yang terlalu bersemangat dengan kemampuan vibe coding barunya sepertinya akan berlanjut cukup lama
Dua pekerjaan lalu, vibe coding bahkan belum praktis, tetapi beberapa orang terlalu sibuk memakai LLM untuk menggembungkan semuanya sehingga sulit mendapat jawaban ya/tidak untuk pertanyaan apa pun
Pertanyaan satu baris di Slack yang butuh 20 detik malah dijawab dengan tulisan kabur dua halaman tanpa kesimpulan, dan pertanyaan lanjutan hanya membuang waktu lebih banyak
Di pekerjaan terakhir, saya melihat PM perlahan berubah menjadi vibe manager untuk para vibe coder
Ia menyela diskusi teknis dan mengarahkan setiap tahap lewat AI, dan saat kami membantah, itu berubah jadi pertarungan melawan hasil terjemahan AI oleh orang yang bahkan tidak paham topiknya, sungguh menyiksa
Penolakan pun tidak lagi diizinkan, dan kami ditekan dengan narasi bahwa AI mengancam pekerjaan kami
Setelah itu vibe coding diwajibkan untuk semua orang dan jumlahnya dipantau, dan karena PM itu sekaligus bermain sebagai PM, engineer, dan architect, ia membuat beberapa tiket untuk pekerjaan yang sama dengan requirement yang benar-benar saling berbeda
Lalu satu anggota tim melakukan vibe coding dengan satu cara dan anggota lain mengimplementasikan versi yang sama sekali berbeda
Sangat menyakitkan melihat tim beranggotakan 20 orang yang menguntungkan, yang dulu menghasilkan hampir 100 juta dolar per tahun, dihancurkan oleh pekerjaan yang sia-sia dan tak bermakna, dan akhirnya saya pergi
Saya berusaha agar tidak menjadi sinis terhadap perubahan di industri software, tetapi sungguh sulit
Manajer memakai Claude dengan pemahaman domain yang tidak lengkap untuk memberi nasihat dan usulan ala pakar, sementara berbagai staf nonteknis di perusahaan berusaha membuat alat software internal yang akan disebarkan ke seluruh organisasi dan ingin mendapat pengakuan serta imbalan lewat demo seperti itu
Pimpinan, seperti yang diduga, terkesan dan menyetujui proof of concept semacam itu
Rekan kerja yang terlalu aktif memamerkan demo yang tampak seperti karya ahli padahal mereka sama sekali tidak memahami isinya, dan kepemimpinan menerimanya
Saya tidak tahu bagaimana mengungkapkan masalah ini, tetapi tulisan ini menjelaskannya dengan tepat
Tentu saja, dengan AI mereka jadi bisa membuat lebih sedikit lagi
Kedengarannya seperti lingkungan yang sangat beracun
Tim yang paling produktif dalam membuat software berkualitas dengan LLM kemungkinan besar memakainya untuk hal-hal seperti ini
Autocomplete cerdas adalah bentuk asli pemakaian LLM, di mana kode yang dihasilkan dipakai sebagai perpanjangan dari proses berpikir sambil mempertahankan konteks kode yang sedang dikerjakan developer, bukan mengalihdayakan proses berpikir itu sendiri ke LLM
Untuk brainstorming, LLM bisa memperluas konsep, ide, atau arah yang masih kabur sehingga merangsang kreativitas
Untuk problem solving, cukup berguna untuk debugging seperti konflik paket, exception acak, atau bug report, dan bisa membantu mencapai akar masalah saat tidak ada rekan di sebelah
Untuk code review, kadang ia menangkap beberapa hal yang luput dari manusia, jadi lebih mirip tahap lint yang lebih cerdas, tetapi tidak menggantikan code review manusia
Untuk proof of concept, ia bisa menghasilkan berbagai pendekatan terhadap masalah sebagai inspirasi bagi solusi yang dibuat lebih hati-hati
Pemakaian seperti ini mempercepat development sambil tetap mempertahankan tanggung jawab bahwa developer harus tahu apa yang dibuat dan mengapa
Sebaliknya, tim yang all-in ke agentic coding tampaknya sangat mungkin merusak produk dan tim mereka sendiri dalam jangka panjang tanpa sengaja
Beberapa hasil terakhir yang saya tanyakan terdengar sepenuhnya meyakinkan tetapi salah total, bahkan topiknya pun tidak tepat
Dalam code review, false positive sangat mendominasi, dan saya juga tidak melihat alasan jelas mengapa itu akan membaik
Meski begitu, tetap ada kemungkinan alat ini membantu ke arah sana
Secara pribadi, saya mematikannya sekitar setahun lalu dan kembali ke autocomplete tradisional di JetBrains IDE
Dalam pengalaman saya, saran AI yang benar-benar menebak apa yang saya inginkan kurang dari 1%, yang berguna mungkin sekitar 10%, dan sisanya hanya salah atau mengganggu
Fitur IDE standar yang membantu mencari atau menjelajahi method, variable, dan sejenisnya jauh lebih berguna untuk menerjemahkan pikiran menjadi kode
Tim kami juga mencoba beberapa alat, tetapi sebagian besar temuan yang ditunjukkan sangat dangkal atau bukan masalah sama sekali
Saat mereview kode dari anggota tim yang kurang kuat, alat itu justru melewatkan masalah yang lebih dalam, sedangkan reviewer manusia menangkap perubahan yang salah untuk persoalan yang sebenarnya bisa diselesaikan dengan cara lebih baik
Manajer memakai hasil itu sebagai bukti yang mengonfirmasi biasnya sendiri bahwa kami tidak tahu apa yang kami lakukan
Ia menempelkan output tool code review yang penuh emoji ke komentar PR, dan ketika kami memperbaiki masalah sepele, ia memposting “code review ronde 2”
Moral tim turun drastis dan beberapa anggota akhirnya menyerah untuk benar-benar mereview, lalu hanya meng-approve PR begitu saja
Menurut saya alat seperti ini lumayan untuk meninjau kode sendiri, tetapi tidak boleh menjadi kendala wajib dalam proses
Tujuan asli code review adalah orang-orang meluangkan waktu untuk saling membantu berkembang, dan ketika itu dialihdayakan ke mesin, kontrak sosial dalam tim pun runtuh
Dua tahun lalu orang bilang ini hanya autocomplete murni dan Google yang ditingkatkan
Orang-orang yang pesimis terhadap AI terus salah dari tahun ke tahun, tetapi bersikap seolah mereka tidak pernah mengatakan bahwa AI tidak akan pernah mampu melakukan hal-hal yang sekarang memang sudah bisa dilakukan
Software engineering tampaknya sangat memungkinkan terjadinya hal ini karena beberapa alasan
Banyak software engineer sepanjang kariernya sebenarnya tidak pernah melakukan engineering sungguhan, dan di perusahaan besar itu lebih parah
Mereka masuk sebagai roda gigi kecil ke mesin besar, mempelajari bahasa konfigurasi yang dibuat seseorang demi promosi, merapikan dan merapikan ulang konfigurasi itu, lalu “memperbaiki” hasil framework internal lain dengan memutar knob konfigurasi, dan lima tahun kemudian masih melakukan hal yang sama
Di industri ini juga banyak peran kuasi-engineering
Orang-orang yang berhenti ngoding karena lebih suka bekerja dengan manusia, atau tertarik pada produk dan pekerjaan pengguna, mengisi berbagai posisi .*M di perusahaan besar maupun kecil
Di perusahaan besar, kereta bergerak lambat sehingga commit butuh berbulan-bulan untuk sampai ke production, dan 6 bulan itu biasa
Banyak sistem besar dan penting bahkan belum melihat kode berbasis agent masuk ke production
Jadi AI menggantikan beberapa pekerjaan basa-basi, orang-orang yang tadinya hanya berada di sekitar kode mendadak menikmati vibe coding, dan di perusahaan yang bergerak lambat hasilnya belum meledak
Dari luar, ini terlihat seperti booming produktivitas
Bagian “orang yang tidak bisa menulis kode membuat software, dan orang yang belum pernah merancang sistem data merancang sistem data” membuat saya teringat pada “cara meluncurkan proyek di perusahaan teknologi besar”
Terutama bagian “peluncuran adalah konstruksi sosial di dalam perusahaan. Secara spesifik, proyek dirilis ketika orang-orang penting di perusahaan percaya bahwa proyek itu sudah dirilis”
https://news.ycombinator.com/item?id=42111031
Tulisan yang bagus, dan juga memunculkan diskusi yang lumayan tentang bagaimana menjaga penampilan luar dan hal-hal yang terlihat sering kali penting, bahkan jauh lebih penting daripada yang kita kira
Di awal adopsi AI di tempat kerja, saya menyadari beberapa rekan memakai teknologi ini untuk menunjukkan inisiatif berlebihan
Setiap minggu muncul TOD baru, ide refactoring baru, atau cara menyelesaikan masalah lama dengan algoritme baru yang berkilau
Sekarang fenomena itu berlipat ganda, karena upaya untuk terlihat lebih proaktif telah bercampur dengan ketakutan PHK akibat AI, sehingga orang membuat solusi bahkan sebelum masalahnya terdefinisi penuh
Misalnya saya ditugaskan meneliti masalah arsitektur tertentu di tingkat perusahaan, dan saya pikir akan mendapat pengakuan kalau memberi solusi yang kokoh, tetapi ternyata sudah terlambat
Seorang intern sudah menemukan jawabannya dan menulis TOD, dan sekarang saya terlalu lelah untuk bersaing
Kemarin saya menghabiskan sebagian besar waktu untuk menghapus dan mengganti kode yang dihasilkan LLM
Secara umum bantuan LLM itu bagus, tetapi kali ini ia mengeluarkan banyak kode thread yang gila, dan untuk pertama kalinya dalam beberapa tahun aplikasi saya mulai crash
Aplikasi saya tidak crash
Bisa saja ada banyak masalah lain, tetapi crash bukan salah satunya, dan saya orang yang sangat gigih soal itu
Aturan praktis saya: hampir tidak pernah perlu dispatch ke thread baru
Sering kali saya membiarkan OS SDK melakukan itu jika memang semestinya begitu dan menghormati pilihan tersebut, tetapi jarang sekali saya mendapat manfaat lebih besar daripada derita debugging dari memunculkan worker thread sendiri
Mungkin ini tidak berlaku untuk semua jenis aplikasi, tetapi berlaku untuk aplikasi yang saya tulis
LLM suka thread, mungkin karena banyak kode pelatihan yang diunggah orang-orang hiperaktif yang tergila-gila pada teknologi mengilap
Pada akhirnya saya mencabut kode layar itu dan memasukkan kode saya sendiri, performa langsung terasa jauh lebih baik dan crash pun berhenti
Pelajarannya adalah buyer beware
Saya paham bagian tentang mempertimbangkan apakah perlu berdiskusi dengan orang yang jelas-jelas copy-paste langsung dari model
Saya pernah merasakan kesenangan kecil dengan menanggapi mereka menggunakan cara yang sama
Saya tempel output AI mereka ke AI saya, lalu menempelkan jawaban AI saya kembali
Jadinya dua manusia bertindak seperti mesin agar dua mesin bisa berkomunikasi seperti manusia, sebuah cosplay
Sungguh pemandangan yang luar biasa
Untuk pertanyaan sederhana tentang arahan senior saya mengapa proof of concept di antara teman sebaiknya cepat dirilis lewat Vercel daripada dioverengineer dengan AWS, dia malah mengirim chart gado-gado AI
Ia terlalu terjebak pada kerangka pikir bahwa kakaknya memakai AWS dan ia sendiri ingin berkarier ke arah itu, sehingga alih-alih memikirkan sendiri mengapa pendekatan itu tepat untuk proof of concept antar teman, ia malah mengalihdayakan pikirannya ke AI
Ketika dia bertanya apakah saya membacanya, saya bilang saya membacanya lewat ringkasan AI tetapi tidak menjawabnya, dan percakapan itu cepat selesai
Pernyataan bahwa “ini tidak membantu ahli” agak terlalu picik
Bahkan orang yang sangat hebat pun punya area lemah atau area membosankan yang bisa diotomatisasi
Dalam kasus saya, hal yang dulu menghambat karier adalah mengatur banyak tugas sekaligus, menyampaikan perubahan secara efektif ke seluruh organisasi, serta dokumentasi dan pengelolaan tiket di tempat seperti Jira
Sekarang itu bukan lagi hal yang saya khawatirkan, dan peningkatan efisiensi di bagian itu sangat besar
Dalam pekerjaan inti yang memang saya kuasai, ini tidak banyak membantu selain membuat saya mengetik jauh lebih cepat, tetapi itu pun cukup bagus
Jika diberi tugas yang tidak saya kuasai, biasanya ia bekerja lebih baik daripada saya, atau setidaknya mengarahkan saya ke keputusan yang lebih berinformasi
Saya setuju dengan kalimat “jangan minta model memverifikasi sesuatu. Alat itu akan setuju dengan semua orang”
Jika saya sembarang mengatakan ada sesuatu yang salah, LLM akan entah bagaimana menemukan cacat bahkan pada kode yang saya tahu benar
Masalahnya adalah LLM sering terlalu harfiah menerima masukan
Bahkan ketika diminta membuat rencana, LLM tidak pernah berhasil merancang keseluruhan sistem secara otonom
Setelah LLM membuat kode, kalau ditanya dengan beberapa cara apakah hasilnya benar, ia cukup sering benar-benar menemukan masalah