Jika Anda sedang kesulitan karena Claude Blue
(kciter.so)- Dengan perkembangan AI yang sangat pesat, makin banyak developer yang mengalami depresi psikologis karena merasa keahlian mereka sedang tergantikan
- Karena semakin banyak developer yang merasakan depresi semacam ini, muncullah sebutan Claude Blue
- Selain itu, istilah-istilah baru yang bermunculan setiap hari juga memperparah FOMO dan kecemasan para developer
- Kunci untuk mengatasi rasa takut adalah memahaminya
- Berbagai macam 'engineering' pada dasarnya hanyalah variasi dari "proses mengirim input yang tepat ke API dan memproses responsnya", dan ini adalah hal yang selama ini sudah sangat dikuasai developer
- Jangan terombang-ambing oleh konten pemicu FOMO; jika memahami esensinya, maka saat istilah baru muncul pun kita bisa memasukkannya ke kerangka pengetahuan yang sudah ada dan menilainya dengan tenang
Struktur ketakutan dan cara mengatasinya
- Manusia merasa takut di hadapan sesuatu yang tidak diketahui hakikatnya. Ketakutan terhadap AI juga lebih berasal dari fakta bahwa kita "tidak tahu bagaimana cara kerjanya" daripada dari AI itu sendiri
- Begitu hakikatnya dipahami, sesuatu yang tampak seperti sihir mulai terlihat sebagai teknologi, dan teknologi adalah sesuatu yang bisa dipelajari serta memiliki batasan
- Ada juga hasil survei yang menunjukkan bahwa kesehatan mental 24% pekerja memburuk akibat information overload yang disebabkan oleh AI
Hakikat LLM
- LLM adalah model prediksi kata berikutnya yang "menghasilkan keluaran paling tepat untuk input yang diberikan"
- ChatGPT, Claude, dan Gemini semuanya bekerja dengan prinsip yang sama, dan wujud sebenarnya dari layanan tersebut adalah pemanggilan HTTP API di mana klien mengirim pesan dan model mengembalikan token secara streaming
- Kemampuan coding yang kuat dari AI agent pun pada dasarnya dibungkus di sekitar pemanggilan API ini
Proses AI agent menjadi lebih pintar
- Prompt engineering: pemberian peran, Few-Shot, Chain-of-Thought, dan sebagainya pada akhirnya adalah cara untuk memperjelas konteks teks input agar mengarahkan hasil keluaran
- Kontrol format output: dengan penetapan JSON Schema, Function Calling, dan sebagainya, keluaran model dibuat menjadi struktur yang bisa diparse program. Melalui Function Calling, dimungkinkan struktur di mana model memanggil tool dan runtime mengeksekusinya. MCP dan RAG juga merupakan salah satu bentuk pemanggilan tool
- Context engineering: bukan soal bagaimana bertanya, melainkan merancang apa yang akan dilihat model sebelum melakukan penalaran. Karena fokus menurun ketika input terlalu panjang, kuncinya adalah menempatkan informasi yang tepat di posisi yang tepat
- Pembagian prompt: alih-alih satu prompt raksasa, proses dibagi menjadi beberapa prompt kecil yang fokus. Sub-Agent dan Skill termasuk dalam kategori ini
- Harness engineering: merancang seluruh lingkungan eksekusi yang mengelilingi model. Terdiri dari guide (pengarahan sebelum bertindak) dan sensor (verifikasi hasil setelah bertindak)
- Ralph loop: teknik menyuntikkan prompt yang sama berulang kali jika kriteria penyelesaian belum terpenuhi. Status progres disimpan di file system dan git sehingga bisa dilanjutkan bahkan di konteks baru setiap kali. Ini hanyalah salah satu strategi turunan dari harness, bukan konsep yang sama dengan harness itu sendiri
Keluar dari FOMO
- Bahkan jika punya pengetahuan, kita tetap cemas karena para pemicu FOMO membuat kita merasa seolah-olah tidak tahu apa-apa
- Salah satu cara yang baik untuk tidak merasakan FOMO adalah melihat apa yang sebenarnya berhasil diselesaikan oleh para pemicu FOMO itu
- Sebagian besar hanya memampatkan proses, bukan benar-benar menyelesaikan masalah
- Jika memahami esensinya, saat menerima informasi baru kita akan mampu menilai sendiri apakah itu paradigma baru, variasi dari konsep lama, atau sekadar berlebihan
Apa yang harus dilakukan ke depan
- Tidak harus selalu melakukan sesuatu. Jika AI tidak membantu masalah Anda, jalani saja seperti sekarang. Pada akhirnya AI hanyalah alat; jika perlu pakai, jika tidak perlu tidak usah dipakai
- Tidak ada jawaban benar untuk segala hal. Karena itu, tidak perlu berusaha mencari lembar jawaban.
- Jika punya pengetahuan, maka ketika istilah baru muncul nanti Anda akan memiliki kepekaan untuk memahami itu sedang membahas apa
17 komentar
Salah satu cara yang baik agar tidak merasa FOMO adalah dengan melihat apa yang sebenarnya berhasil diselesaikan para pemicu FOMO itu dengan menggunakan AI.
Kalimat ini sangat relate ya wkwk
"Kalau AI tidak membantu masalah saya, ya hidup saja seperti biasanya. Pada akhirnya itu cuma alat; kalau perlu dipakai, kalau tidak perlu ya tidak usah dipakai" Tidak semudah itu huhu
Hehe, sekarang aku harus ngapain ya
Bukankah keseluruhan keahlian tidak bisa begitu saja tergantikan? Bahkan proses pembentukan istilahnya sendiri pun terasa aneh.
Saya tidak pernah menyatakan dalam tulisan asli bahwa AI bisa sepenuhnya menggantikan keseluruhan keahlian. Saya juga tidak berpikir demikian...
Itu berarti sedang membicarakan GPT-3.
Saya kira model bahasa besar yang tersedia di pasar setelah GPT, kecuali beberapa yang menggunakan diffusion model, semuanya bekerja dengan memprediksi token berikutnya. Jika ada model yang bekerja dengan cara lain, saya akan berterima kasih jika Anda bisa memberi tahu saya.
Kalau begitu, apakah model terbaru berbeda? Jika ada bagian yang keliru, saya akan berterima kasih jika Anda memberi tahu, karena itu sepertinya juga akan membantu orang lain selain saya, hehe
Jika Anda menganggap LLM modern hanya sebagai "prediksi kata berikutnya", maka AlphaGo juga tidak lebih dari "prediksi langkah berikutnya".
Sejak ChatGPT, prediksi kata berikutnya hanyalah pre-trained yang sederhana.
Yang penting adalah model yang mencapai tujuannya.
Bukankah AlphaGo juga memprediksi langkah berikutnya yang dihitung memiliki probabilitas kemenangan tertinggi?????
Membingungkan. Apakah Anda sedang bercanda, atau memang ada teknik atau teknologi baru yang saya tidak ketahui??
"Tingkat kemenangan" itulah intinya.
Hanya dengan prediksi kata berikutnya, jangankan menghasilkan kalimat yang berguna, untuk coding atau matematika pun tidak bisa dilakukan dengan benar.
Teknik seperti ini sudah muncul sejak era 60~70-an.
(Secara ketat, ini bahkan bukan kata juga)
Hmm.. saya merasa mungkin tulisan ini tersampaikan berbeda dari maksud saya. Jika dari tulisan ini terasa seperti saya meremehkan nilai teknis LLM, saya mohon maaf.
Namun, maksud tulisan ini adalah untuk menanggalkan kemasan berlebihan dan pengaburan yang berlebihan, lalu melihatnya dengan tenang dan objektif. Karena itu, secara pribadi saya merasa ungkapan seperti 'model yang mencapai tujuan' justru membuatnya terdengar terselubung aura mistis. Pada akhirnya, baik perangkat lunak biasa maupun model sama-sama dibuat untuk mencapai suatu 'tujuan'.
Jadi, sambil menambahkan rasa penasaran pribadi saya, saya ingin bertanya sekali lagi apakah ungkapan yang Anda sebutkan itu memang lebih akurat secara teknis.
gpt 3: prediksi kata berikutnya -> benar
gpt 3 dan model berbasis transformer setelahnya: prediksi kata berikutnya -> benar.
AlphaGo, AlphaZero, MuZero, ... : prediksi langkah berikutnya -> benar.
Model yang mencapai tujuan (tertentu) -> benar.
Tidak ada pernyataan yang salah dalam penjelasan itu
Sepertinya memang begitu.
Namun, pada akhirnya model itu sendiri hanyalah fungsi input-output.
Dengan asumsi tersedia harness dan agent loop yang tepat, tampaknya pernyataan bahwa model mencapai tujuannya menjadi valid.
“Prediksi token berikutnya” akurat sebagai penjelasan pada tingkat implementasi, tetapi tidak lengkap sebagai cara menjelaskan kemampuan atau tujuan model—bisakah diringkas seperti itu?
Kalau begitu, sepertinya kita bisa bertemu di tengah dengan model yang prediksinya lebih baik 😄