7 poin oleh GN⁺ 5 jam lalu | Belum ada komentar. | Bagikan ke WhatsApp
  • Alat coding berbasis agen Claude Code membawa perubahan yang lebih besar bukan pada penulisan kode itu sendiri, melainkan pada pembuatan produk dan penyusunan ulang alur kerja
  • Dalam survei Microsoft terhadap pengguna AI untuk pekerjaan, tekanan untuk cepat mengadopsi AI, penciptaan hasil kerja baru, dan bertambahnya waktu untuk pekerjaan bernilai lebih tinggi muncul bersamaan, tetapi imbalan untuk eksperimen AI tetap rendah
  • Jika organisasi menjadikan sekadar volume pemakaian sebagai target, maka akan muncul leaderboard token dan pembengkakan penggunaan; metrik yang terhubung dengan cara AI menambah nilai jauh lebih penting
  • Boris Cherny melihat gelar engineer bisa berubah menjadi peran yang lebih dekat ke builder, non-engineer pun dapat membuat kode, dan engineer akan lebih fokus pada penilaian, perencanaan, serta pemahaman pengguna daripada mengetik langsung
  • Peningkatan produktivitas AI tidak otomatis berarti pengurangan jam kerja atau pekerjaan; perusahaan akan menata ulang workflow dengan AI sebagai pusatnya, dan individu akan memiliki pilihan yang lebih besar dan leverage

Data kerja AI dan jebakan metrik organisasi

  • Microsoft meneliti 20.000 pengguna yang memakai AI dalam pekerjaan nyata, dan menemukan fenomena yang mereka sebut "paradoks transformasi (transformation paradox)"
    • 65% khawatir akan tertinggal bila tidak cepat mengadopsi AI
    • 58% membuat hasil kerja yang setahun lalu tidak mungkin mereka buat berkat AI
    • 66% menjawab bahwa berkat AI mereka bisa menghabiskan waktu untuk pekerjaan yang bernilai lebih tinggi
    • Di sisi lain, hanya 13% yang menjawab bahwa mereka mendapat imbalan di tempat kerja atas eksperimen AI, menunjukkan adanya jarak antara kemauan memakai AI dan organisasi
  • Dalam riset Microsoft terpisah, ketika manajer secara langsung memperlihatkan penggunaan AI, pemakaian naik 17% dan tingkat kepercayaan pada agen naik 30%
    • Dibanding slogan seperti "AI adalah masa depan", hasil lebih nyata muncul ketika manajer menunjukkan cara spesifik yang benar-benar mereka pakai sendiri
    • Jika karyawan percaya mereka bisa ikut menikmati hasil dari produktivitas yang ditingkatkan AI, motivasi penggunaan bisa berubah, tetapi hampir tidak ada tempat yang memberi imbalan finansial seperti itu
  • Sebagian tempat kerja mensubsidi biaya token, tetapi dukungan itu tidak selalu berakhir dengan hasil yang baik

Token maxing — efek samping metrik penggunaan

  • Di perusahaan teknologi besar muncul fenomena token maxing, yaitu menghabiskan token secara berlebihan demi menaikkan angka penggunaan
    • Menurut keterangan karyawan Amazon kepada Financial Times, Amazon memperkenalkan alat internal mesh claw yang terinspirasi dari OpenClaw dan mendorong penggunaannya
    • Ada papan peringkat penggunaan token di dalam tim, sehingga sebagian karyawan menjalankan agen yang tidak produktif tanpa tujuan hanya untuk menaikkan angka pemakaian
    • Di Meta, penggunaan maksimum mencapai ratusan miliar token, dan jumlah setara biaya jutaan dolar pada dasarnya terbuang sia-sia
  • Posisi resmi Amazon adalah bahwa penggunaan token bukan metrik evaluasi manajer, tetapi karyawan menganggap manajer melihatnya sehingga mereka menaikkan angka penggunaan mentah
    • Di Amazon ada target dari atas agar 80% developer memakai AI setiap minggu
    • Tanpa imbalan yang jelas, orang hanya mematuhi kalimat "gunakan AI" dan kehilangan maksud awal yaitu "lakukan pekerjaan dengan lebih baik"
    • Bagi developer, yang dibutuhkan bukan pelacakan yang ambigu, melainkan metrik produktif yang terhubung dengan penciptaan nilai

Kelahiran Claude Code dan penyebarannya yang cepat

  • Claude Code adalah alat coding berbasis agen yang dirilis Anthropic pada Mei tahun sebelumnya, alat yang menghasilkan kode ketika diberi kata-kata
    • Dalam 8 bulan setelah peluncuran, alat ini menangani sekitar 4% dari seluruh kode yang diunggah ke GitHub
    • Pada Februari tahun itu mencapai run rate pendapatan tahunan 2,5 miliar dolar, menjadikannya produk enterprise yang paling cepat mencapai level tersebut
    • Penciptanya Boris Cherny tidak memiliki gelar ilmu komputer, berlatar ekonomi, keluar dari kuliah pada usia 18 tahun, menjalankan startup, lalu bekerja di hedge fund sebelum menjadi principal engineer di Meta selama 5 tahun dan bergabung pada akhir 2024
    • Kini Cherny tidak menulis satu baris kode pun secara langsung, tetapi menjalankan 5 agen paralel di 5 tab terminal dan menangani 20~30 pull request per hari
  • Ini bermula sebagai proyek sampingan saat ia mencoba mempelajari API, bukan karena mendapat tugas membuat alat coding
    • Awalnya sederhana: menghubungkan Claude ke AppleScript untuk menampilkan musik yang sedang ia dengarkan
    • Dalam dua bulan, versi Claude Code muncul, dan pada hari pertama 20% tim engineering Anthropic sudah memakainya
  • Ia bergabung pada September 2024 dan masuk ke tim labs yang sangat kecil
    • Tim ini membuat Claude Code, MCP, skills, dan aplikasi desktop, serta banyak mengerjakan ide eksperimental yang belum jelas apakah akan berhasil
    • Anthropic selama ini fokus pada enterprise, coding, dan keamanan, sehingga jika harus membuat produk, produk coding dinilai masuk akal karena akan membantu baik model coding yang lebih baik maupun riset keamanan
  • Saat itu sebagian besar produk coding berupa ekstensi IDE, dan pada level Sonnet 3.5 fungsinya masih mirip autocomplete tingkat lanjut
    • Mereka merasakan adanya model overhang, yaitu modelnya sebenarnya mampu tetapi belum ada produk yang bisa menarik keluar kemampuannya; perasaan ini masih sama sampai sekarang
    • Produk dibuat hanya dalam beberapa hari dalam bentuk termurah, berjalan di terminal tanpa UI atau aplikasi terpisah
    • Pengguna menyebar mulai dari orang-orang sekitar, dan dalam beberapa minggu banyak orang di internal memakainya setiap hari; dalam 5 hari setelah rilis, setengah tim engineering sudah memakai
    • Bahkan engineer yang enggan memakai terminal ikut menggunakannya, dan Cherny tidak terlalu menganalisis apakah "software engineering telah berubah selamanya", melainkan hanya fokus pada peluncuran

Apakah engineer akan menghilang — percampuran peran

  • Kejutan pertama datang saat Claude memberi tahu musik yang sedang ia dengarkan
    • Saat ditanya, Claude menulis kode AppleScript yang membuka pemutar musik; Cherny tidak tahu bahasa itu dan tidak pernah membayangkan jawaban dalam bentuk seperti itu
    • Masalah diselesaikan dengan cara yang tidak akan dipilih seorang engineer
  • Model berkembang sangat cepat, sehingga saat membangun produk di atas model, perlu penyesuaian ulang setiap bulan
    • Dengan Co-work, ia memesan 8 penerbangan dan 5 hotel; satu-satunya kesalahan adalah hotel seharga sekitar 5.000 dolar per malam sehingga melewati anggaran → hanya pemesanan itu yang diulang
  • Karena trennya berbentuk kurva eksponensial, tidak ada yang tahu pasti, dan dua hal terjadi bersamaan
    • Ada perusahaan yang karena produktivitas engineer meningkat membutuhkan lebih sedikit engineer untuk pekerjaan yang sama
    • Ada juga perusahaan yang karena produktivitas per orang naik, justru mengerjakan lebih banyak produk dan bisnis sehingga membutuhkan lebih banyak engineer (tim Cherny sendiri terus terhambat oleh kurangnya engineer bagus dan merekrut secepat mungkin)
  • Peran-peran kini sedang bercampur dengan menarik
    • Manajer Fiona tidak menulis kode selama 15 tahun, tetapi setelah bergabung kembali coding; product manager Cat dan desainer Megan juga coding, sehingga seluruh tim menulis kode
    • Non-engineer menulis sedikit lebih banyak kode, sementara engineer seperti Cherny tidak menulis kode langsung selama lebih dari 6 bulan tetapi tetap membuat sesuatu sepanjang hari
    • Belum jelas apakah ini akan disebut builder, engineer, atau product manager, tetapi perannya sendiri jelas sedang berubah

Analogi traktor — waktu penyebaran teknologi

  • Traktor ditemukan John Frick di Iowa pada 1890-an, tetapi baru sekitar 1960-an jumlah traktor di AS melampaui kuda, memakan waktu sekitar 70 tahun
    • Traktor sangat meningkatkan hasil panen dan produktivitas, tetapi perlu pelatihan untuk memakainya, dan pada awalnya lebih mahal sehingga kuda lebih murah
    • Performanya juga terbatas, misalnya bisa dipakai untuk gandum tetapi tidak untuk jagung, dan butuh waktu lama untuk menyesuaikannya ke berbagai tanaman
    • Dalam transisi AI saat ini, persoalan yang sama terjadi dalam mode speedrun
  • Ini terhubung dengan sudut pandang AI as normal technology — meskipun model sangat cakap muncul, perubahan pada manusia dan organisasi tetap lambat
    • Namun melihat tren pendapatan Anthropic, ada juga bantahan bahwa kali ini kecepatannya lebih tinggi, sehingga kita masih berada pada tahap mengukur kecepatan perubahan yang sebenarnya
  • Komputer memang meningkatkan produktivitas, tetapi itu tidak serta-merta berarti jam kerja berkurang — orang justru melakukan lebih banyak pekerjaan dalam waktu yang sama

Apakah coding sudah "terpecahkan"

  • Ungkapan "coding is solved" dibatasi pada "jenis coding yang saya kerjakan"
    • Pekerjaan Cherny seperti cloud CLI, aplikasi desktop, dan aplikasi mobile berada pada codebase yang relatif baru dan sederhana
    • Sebaliknya, pada codebase besar dan kompleks milik pelanggan besar seperti NASA, hal itu masih belum terpecahkan, dan model juga belum sempurna sehingga tetap membuat kesalahan
  • Sanggahan dari engineer bahwa coding bukan sekadar mengetik tetapi soal penilaian, intuisi, dan pemikiran kritis, sementara agen masih lemah di sana, adalah valid
    • Dulu pun dalam satu hari kerja Cherny hanya sekitar 50% benar-benar mengetik kode, sisanya untuk berbicara dengan pengguna, brainstorming, debugging, desain, dan perencanaan
    • Ketika model mengambil alih coding, engineer dibebaskan untuk melakukan hal yang lebih menyenangkan, seperti berbicara dengan pengguna dan memikirkan langkah berikutnya
  • Claude Code sendiri sudah lebih dari 6 bulan ditulis 100% dengan Claude Code, demikian pula produk lain seperti Co-work
    • Dalam percakapan batch Y Combinator terbaru, saat ditanya "kode 100% ditulis dengan Claude Code", sekitar setengah dari ratusan peserta mengangkat tangan; untuk "tidak ditulis dengan model sama sekali" hanya satu orang, sisanya berada di antara 50~100%
    • Ia melihat perubahan di engineering sebagai indikator awal bagi semua bidang di luar engineering
  • Kekhawatiran penyusutan kemampuan dan evolusi pemrograman

    • Muncul kekhawatiran bahwa tanpa menulis kode langsung, pemahaman terhadap profesi sendiri bisa mengalami atrofi
      • Engineer di tim bernama Lena menulis C++ dengan tangan setiap akhir pekan demi kesenangan, dan ruang seperti ini akan selalu ada
      • Cherny melihatnya bukan sebagai penyusutan, melainkan kelanjutan dari perubahan pemrograman yang memang selalu terjadi
        • Pada era Uni Soviet ada kartu berlubang, dan pada masa program Apollo perhitungan manual di atas kertas juga disebut "pemrograman"
        • Setelah itu berkembang dari machine code → assembly → JavaScript dan Python, dan kini bergeser lagi menjadi cara berbicara dengan agen, lalu kelak menjadi agen berbicara dengan agen untuk coding
      • Ini seperti kemampuan matematika yang sebagian menurun karena kalkulator teknik, tetapi orang tetap terus memakai kalkulator; hanya saja berbeda jika alat itu menjadi superintelijen dan diam-diam melemahkan penggunanya
  • Kontroversi penurunan performa model

    • Setelah model baru dirilis, secara berkala selalu ada reaksi bahwa "performanya mundur drastis"
      • Memang ada 2 kasus yang disebabkan bug nyata, dan Anthropic memublikasikan penyebab serta perbaikannya di blog
      • Selain itu, sebagian besar mungkin seperti masa honeymoon, ketika orang makin terbiasa dengan model dan rasa takjub awal memudar
    • Berbeda dengan setahun lalu, sekarang kode model lebih baik daripada kode yang akan ditulis Cherny sendiri
      • Dulu ia harus memeriksa satu per satu hingga tiga kali, tetapi sekarang ia menyerahkannya ke Claude, memintanya meninjau ulang dan menguji hasilnya, sambil sekaligus menjalankan 15 Claude secara paralel

Paradoks produktivitas dan meluasnya pilihan

  • Walaupun produktivitas naik, apakah jam kerja berkurang sangat bergantung pada pilihan individu dan kondisi perusahaan
  • Dijelaskan lewat kisah mesin cuci
    • Sebelum mesin cuci, satu kali mencuci memakan waktu 5~6 jam dan perlu berjalan sekitar 3.000 kaki, sambil menyalakan api, merebus air, menggosok di papan cuci, dan memeras untuk setiap anggota keluarga setiap hari
    • Mesin cuci memangkas waktu sekali mencuci sekitar 3 jam
    • Ini menjadi salah satu faktor yang memungkinkan masuknya perempuan ke pasar kerja dalam skala besar
    • Waktu yang dihemat menciptakan pilihan pribadi: bersama anak, berjalan-jalan, membaca, bertemu teman, atau masuk ke pekerjaan pabrik dan kantor; AI juga memperluas pilihan dengan cara yang sama
  • Nasihat untuk orang berusia 22 tahun yang baru lulus jurusan CS: pekerjaan entry-level masih ada, tetapi jika sedikit saja condong ke arah membangun usaha, ia menyarankan mendirikan startup
    • Ini adalah zaman keemasan terbaik dalam sejarah untuk memulai usaha, dan "Anda bersama para agen" bisa membangun perusahaan raksasa
    • Nyatanya, tim berisi 1~3 orang sedang membangun perusahaan bernilai miliaran dolar dan startup hebat, dan leverage satu orang menjadi sangat besar
  • Tiga tahun lagi mungkin orang tidak lagi menyebutnya "engineer", tetapi jumlah orang yang menulis kode atau membuat kode lewat agen diperkirakan menjadi 100 kali lebih banyak daripada hari ini

Claude Co-work — perluasan untuk non-engineer

  • Co-work bermula saat mereka melihat orang memasang Claude Code di terminal untuk mengurus pelaporan pajak, yakni penggunaan di luar coding
    • Dipakai untuk banyak tugas non-engineering seperti akuntansi, keuangan, hukum, pemesanan penerbangan, membeli tiket konser, hingga membeli izin berburu kerang di negara bagian Washington
    • Produk coding sebelumnya dibuat engineer untuk diri mereka sendiri lalu ternyata berguna bagi orang lain, sedangkan Co-work adalah tantangan baru yang dibuat untuk non-engineer secara luas
  • Arah kuncinya adalah kemampuan berjalan lama
    • Sekitar satu setengah tahun lalu, karena keterbatasan model, Claude Code mulai keluar jalur setelah 30 detik sehingga perlu intervensi
    • Sekarang setiap malam ada ratusan hingga ribuan agen yang berjalan selama 5, 10, 20 jam, dan inilah cara engineering dilakukan saat ini
    • Co-work akan menuju arah yang sama, tetapi tugas apa yang benar-benar membutuhkan eksekusi selama itu masih belum jelas
  • Jika memori dan pemahaman terhadap pengguna membaik, arahnya akan berkembang menjadi memprediksi kebutuhan lebih dulu
    • Contoh: mengetahui episode podcast yang tersisa dan tamu yang belum diundang, lalu melakukan brainstorming kandidat dan menaruh email kontak awal ke draft
    • Definisi pekerjaan bisa dibagi menjadi cara horizontal seperti "desain secara keseluruhan", dan cara vertikal yang menuntaskan tujuan spesifik sampai akhir
    • Contoh vertikal: Claude membuat fitur lalu menguji, menggabungkan, dan merilisnya
  • Sejak Opus 4.7, Claude menjadi lebih proaktif
    • Setelah fitur dirilis, ia menjadwalkan pengingat sendiri untuk mengecek feedback pengguna 12 jam kemudian dan jika ada bug akan mencoba memperbaikinya — tindakan mendahului hal-hal yang mudah dilupakan manusia ini memberi kepuasan tinggi
  • Claude Mythos belum dibuka ke publik untuk sebagian besar orang, dan informasi yang tersedia sejauh ini terutama tentang performa coding dan keamanan siber — lompatan ini lebih besar dari biasanya dan sangat kuat khususnya di cyber dan coding

Siapa yang bertanggung jawab atas penggantian pekerjaan

  • Transisi ini akan membawa campuran dampak baik dan buruk, dan waktu maupun proporsinya tidak bisa diprediksi dengan tepat
    • Anthropic berada pada posisi yang unik karena bisa menjadi sumber pengangguran bagi software engineer dan profesi lain
    • Sebagai engineer, mereka sering membahas di tim adanya kewajiban kuat untuk memberi tahu perubahan yang akan datang dan mengajarkan penggunaan alat agar orang bisa ikut terbawa bersama
  • Ini bukan masalah yang bisa diselesaikan satu perusahaan, dan bahkan tidak diinginkan jika satu perusahaan yang menyelesaikannya sendiri, karena bisa menjadi solusi yang salah
    • Ini masalah yang harus dibahas dan diperdebatkan oleh seluruh masyarakat, dan Anthropic berkontribusi lewat laporan ekonomi, diskusi kebijakan, dan publikasi atas apa yang mereka amati
  • Salah satu alasan Anthropic sebagai laboratorium keamanan tetap membuat produk adalah agar orang bisa mengalami langsung, memahami, dan ikut ambil bagian dalam respons sosial — jika teknologinya dikunci, orang sulit membentuk sudut pandang

Power user dan kesenjangan AI

  • Ada kekhawatiran kesenjangan digital berubah menjadi kesenjangan AI, dan data sejauh ini menunjukkan bahwa orang yang paling pandai memanfaatkan AI cenderung sudah berada di kelompok berpenghasilan atas
    • Anthropic punya beberapa program untuk memperluas aksesibilitas, tetapi nama dan mekanismenya tidak dijelaskan secara spesifik
  • Pengguna yang mendapat nilai terbesar sering kali tidak seperti yang diperkirakan
    • Pemenang hackathon peluncuran Opus 4.7 umumnya bukan engineer profesional, melainkan contoh seperti teknisi listrik, dokter, dan tukang kayu yang membuat aplikasi; kecenderungan yang sama juga muncul pada hackathon 4.6 sebelumnya
    • Model kini sudah cukup canggih sehingga non-spesialis pun bisa memakainya dengan baik
  • Kunci adopsi di perusahaan besar adalah mengubah proses kerja dan menempatkan Claude di pusatnya
    • Salah satu cara yang bekerja baik adalah memberi token kepada semua orang dan membiarkan mereka bereksperimen dengan aman, sehingga ide bisa muncul dari orang yang tak terduga
    • Ide terbaik bisa datang bukan dari engineer senior, melainkan dari staf akuntansi di pojok atau orang GTM yang membuat dashboard internal
    • Tidak ada jaminan bahwa orang yang paling mahir memakai alat hari ini akan tetap demikian besok, jadi yang penting adalah semua orang belajar menggunakan alat itu

Prospek 1 tahun ke depan

  • Tahun depan akan ada banyak kekacauan, dan para pemain besar akan mencoba beradaptasi, dengan banyak di antaranya berhasil
  • Sebagian moat bisnis tradisional akan melemah dan sebagian lagi bertahan
    • Efek jaringan (nilai naik ketika pengguna makin banyak) akan tetap bertahan terlepas dari AI
    • Skala ekonomi (biaya marjinal turun) juga merupakan keunggulan alami yang tidak hilang
    • Sebaliknya, biaya perpindahan akan melemah — jika Claude bisa memindahkan dari vendor A ke B, itu bukan lagi moat besar
    • Perusahaan yang bergantung pada moat yang menghilang akan kesulitan, dan banyak yang akan mencari moat baru
  • Akan terjadi inovasi yang jauh lebih besar daripada perkiraan
    • Ide-ide baru akan mengalir bukan dari perusahaan besar, melainkan dari startup kecil beranggotakan 1, 2, atau 10 orang, dan jumlahnya akan meningkat secara eksplosif
    • Contoh startup penemuan material: dari Zaman Batu, Zaman Besi, hingga Zaman Silikon, dengan keyakinan bahwa menemukan material baru berarti memasuki era berikutnya, sehingga mereka menjelajahi molekul dan desain yang dimungkinkan oleh Claude
    • Hal-hal yang dulu bahkan sulit didanai kini bisa menjadi terobosan oleh tim kecil yang 20 tahun lalu mustahil dilakukan
    • Jika orang yang memahami domain memiliki "pasukan Claude", mereka bisa menyelesaikan jauh lebih banyak pekerjaan daripada ketika memimpin pasukan manusia
  • Cherny telah mengotomatisasi respons pengguna di X dan Threads, tetapi ia lebih suka melakukannya sendiri
    • Ia memindahkan loop Claude Code ke rutinitas yang berjalan tiap 30 menit dan mengumpulkan feedback lewat Threads API dan X API
    • Interaksi langsung dengan pengguna adalah hal yang paling ia sukai, dan bahkan feedback seperti "tidak bekerja" pun menjadi sumber perbaikan produk
    • Claude Code masih punya banyak kekurangan dan jauh dari produk ideal, tetapi mendengarkan feedback dan memperbaikinya sedikit demi sedikit setiap hari adalah satu-satunya cara membuat produk yang baik

Belum ada komentar.

Belum ada komentar.