34 poin oleh GN⁺ 2025-08-10 | 1 komentar | Bagikan ke WhatsApp
  • Menggunakan strategi hibrida dengan menjalankan beberapa model AI web gratis secara paralel, memisahkan pemecahan masalah dan pembuatan kode, serta memanfaatkan keunggulan tiap model
  • Dengan AI Code Prep GUI, hanya kode yang diperlukan yang dipilih dan dirapikan untuk mencegah penurunan performa akibat konteks yang tidak perlu, sehingga hanya konteks inti yang diberikan ke AI
  • Untuk perencanaan dan debugging digunakan model gratis/berperforma tinggi (Gemini 2.5 Pro, o3, o4-mini, Claude 4, dll.), sedangkan eksekusi dan penulisan kode dilakukan dengan GPT-4.1·Claude 3.5
  • Mendapatkan token gratis atau murah melalui OpenAI data sharing, GitHub Copilot, Poe.com, OpenRouter, dan lainnya untuk meminimalkan biaya
  • Menggabungkan berbagai alat agen·CLI seperti Claude Code, Qwen Code, Gemini CLI, Roo Code, dan Trae IDE sesuai situasi untuk meningkatkan efisiensi kerja

Setup Browser Saya: Prasmanan AI Gratis

  • Saya membuka banyak tab di browser berisi versi gratis dari berbagai model AI kuat dan menggunakannya secara bersamaan
  • Pendekatannya adalah tidak bergantung pada satu model saja, melainkan mendapatkan jawaban dari berbagai sudut pandang. Kombinasi model gratis yang paling sering digunakan adalah sebagai berikut.
  • GLM 4.5: Bisa digunakan gratis di web, dan dari pengalaman performanya setara atau bahkan lebih baik dari Claude 4. Saya selalu membuka 2–3 tab
  • Kimi K2: Model yang mirip dengan keluarga Claude atau Opus, tersedia gratis di web. Biasanya saya membuka 1–2 tab, dan sebelum GLM 4.5 muncul, model ini berkali-kali membantu menyelesaikan bug rumit dalam sehari
  • Qwen3 Coder dan model-model baru: Digunakan untuk menguji berbagai model yang dioptimalkan untuk coding
  • OpenAI Playground: Bisa memanfaatkan berbagai model seperti GPT-4.5 dan o3 secara gratis. Jika di pengaturan data akun Anda mengizinkan “OpenAI menggunakan data untuk pelatihan model”, token gratis akan diberikan
  • Google Gemini AI Studio: Model Gemini 2.5 Pro/Flash bisa digunakan hampir gratis tanpa batas. Biasanya saya membuka 1–3 tab
  • Google Gemini 2.5 Pro: Layanan terpisah dari AI Studio, dengan kemampuan yang lebih baik untuk pembuatan gambar dan riset mendalam. Digunakan bersama AI Studio di tab terpisah
  • Poe.com: Memberikan kredit gratis harian untuk model premium seperti Claude 4 atau o4-mini
  • OpenRouter: Bisa menggunakan campuran model gratis dan berbayar. Beberapa model disiapkan di tab yang berbeda
  • ChatGPT: Versi gratisnya juga masih berguna, jadi saya selalu mempertahankan setidaknya 1 tab
  • Perplexity AI: Kuat untuk pertanyaan yang berfokus pada riset
  • Deepseek: Menyediakan model v3 dan r1 secara gratis. Namun, perlu memperhatikan batas konteks
  • Grok.com: Menyediakan penggunaan umum, riset mendalam, dan pengeditan gambar gratis tanpa batas. Fitur riset mendalamnya sangat berguna karena mirip dengan Perplexity
  • Phind: Mencoba menyertakan flowchart atau diagram bersama jawabannya
  • lmarena.ai: Menyediakan Claude Opus 4 dan Sonnet 4 secara gratis. Akses gratis ke Opus 4 sangat bernilai

Claude.ai sendiri juga gratis, tetapi sering terkena pembatasan penggunaan sehingga bisa terasa tidak nyaman; karena itu, pendekatan lain seperti ekstensi Cody atau Copilot digunakan.

Catatan – saat menggunakan Grok
Grok menyediakan komputasi gratis dan pembuatan gambar tanpa sensor, sehingga dapat berguna ketika sistem keamanan model lain menghambat. Namun, ada laporan bahwa operatornya mungkin memiliki niat untuk mempromosikan ideologi terkait Nazi atau misinformasi. Secara khusus, ada klaim bahwa sistem ini diarahkan untuk memberikan informasi palsu tentang peristiwa sejarah seperti genosida di Afrika. Distorsi semacam ini terutama muncul di platform X, tetapi disarankan untuk membatasi penggunaannya hanya pada kebutuhan yang aman seperti coding, atau menggunakannya sambil tetap mengingat potensi bias.

Alur kerja yang lebih cerdas dan lebih murah: Focused Context

  • Saat menggunakan antarmuka chat AI berbasis web (AI Studio, ChatGPT, OpenRouter, dll.), hasil pemecahan masalah atau usulan solusi sering kali lebih baik daripada IDE atau framework agen (Cline, Trae, Copilot, dll.)
  • Jika semua pekerjaan ditangani dengan alat seperti Cursor, Cline, atau Roo Code, AI akan menerima banyak teks yang tidak berkaitan langsung dengan masalah, seperti cara memakai server MCP atau prosedur edit file, sehingga AI menjadi bingung dan performanya menurun
  • Karena itu, bahkan jika memakai model termahal, efek “melambat” akibat informasi yang tidak perlu tetap tidak bisa diatasi
  • Karena itu, pendekatannya adalah membuat sendiri konteks yang tepat untuk pemecahan masalah, lalu menempelkannya ke chat AI berbasis web untuk bertanya atau meminta code review
  • Setelah solusi ditemukan, isi tersebut ditulis ulang sebagai prompt untuk agen seperti Cline dan hanya menyerahkan tugas edit file
  • Dengan cara ini, GPT-4.1 (yang bisa digunakan tanpa batas) dapat dimanfaatkan untuk pemecahan masalah dan perencanaan dengan biaya rendah, tanpa harus menghabiskan kredit Claude
  • Untuk masalah yang sulit, Claude digunakan untuk pemecahan, sementara AI chat web digunakan untuk eksekusi agar efisiensi meningkat
  • How AI Code Prep Helps (Struktur Prompt Contoh)

    Prompt contoh:

    Can you help me figure out why my program does x instead of y?  
    
    • AI Code Prep GUI memindai folder proyek secara rekursif hingga semua subfolder dan file, lalu merapikan kode dan pertanyaan dalam format yang mudah dibaca AI
    • Contoh konteks yang dihasilkan:
    Can you help me figure out why my program does x instead of y?  
    
    fileName.js: <code>  
    ... isi file ... </code>  
    
    nextFile.py: <code>  
    import example  
    ... konten lainnya ... </code>  
    
    Can you help me figure out why my program does x instead of y?  
    
    • Pertanyaan diulang dua kali (bisa dipilih di atas/bawah/keduanya) agar AI tetap fokus
    • Di Windows, klik kanan mouse di dalam folder proyek → jalankan “AI Code Prep GUI” → file kode akan dipilih otomatis, sementara direktori yang tidak perlu seperti node_modules, .git, dan lainnya otomatis dikecualikan
    • Meski pemilihannya tidak sempurna, penyesuaian bisa dilakukan dengan mudah melalui checkbox
    • Saat proyek besar melebihi batas konteks AI, hanya file yang benar-benar diperlukan yang bisa dipilih untuk diberikan
  • Mengapa pendekatan ini penting?

    • Banyak agen kode seperti Cline, GitHub Copilot, Cursor, dan Windsurf mengirim konteks terlalu banyak atau terlalu sedikit, sehingga tidak efisien
    • Dengan memilih file secara manual, hanya informasi yang diperlukan yang bisa diberikan ke AI tanpa data yang tidak perlu
    • Karena berbasis GUI, alat ini lebih unggul dalam menjaga keamanan kode pribadi dan kemudahan penggunaan dibanding alat pembuat konteks lain yang memerlukan CLI atau tautan GitHub publik
    • Untuk pembaruan fitur terbaru, lihat wuu73.org/aicp

Strategi Model: Memilih Otak yang Tepat untuk Pekerjaan

  • Banyak model AI yang kuat tersedia gratis melalui antarmuka web (Gemini in AI Studio, Grok, Deepseek, dll.), jadi manfaatkan itu terlebih dahulu
  • Poe.com menyediakan kredit harian gratis untuk model papan atas seperti Claude dan seri o4 terbaru
  • Gemini 2.5 Pro (tersedia di AI Studio) sangat unggul untuk debugging, perencanaan, dan pekerjaan secara umum, sehingga saat ini dinilai sebagai model yang paling serbaguna
  • Untuk masalah yang rumit, coba o4-mini (tersedia di OpenRouter atau Poe)
    • Jauh lebih murah saat digunakan lewat API dibanding model papan atas sebelumnya (Claude 3.5/3.7/4)
    • Ada pengalaman di mana model ini langsung menyelesaikan bug yang sebelumnya sulit dipecahkan
  • Claude 3.7 atau 4 dapat diakses lewat Poe, API (OpenRouter), GitHub Copilot Chat, dan lainnya
    • Ada sebagian kuota gratis, tetapi jika sering dipakai biayanya menjadi cukup berat
    • 3.7/4 menghasilkan output yang kreatif dan eksplosif (gaya “Hunter S. Thompson”), tetapi untuk coding nyata bisa lebih efisien menyerahkan eksekusinya ke Claude 3.5 yang lebih tenang
  • Cara memanfaatkan token gratis OpenAI Playground

    • Jika mengaktifkan pengaturan berbagi data di akun OpenAI, Anda bisa memakai token gratis dalam jumlah besar setiap hari
    • Di OpenAI Playground → ikon pengaturan di kanan atas → menu kiri Data ControlsSharing, aktifkan "Share inputs and outputs with OpenAI" untuk mendapatkan manfaat berikut:
    • Hingga 250 ribu token per hari: gpt-5, gpt-4.1, gpt-4o, o1, o3
    • Hingga 2,5 juta token per hari: gpt-4.1-mini, gpt-4.1-nano, gpt-4o-mini, o1-mini, o3-mini, o4-mini, codex-mini-latest
    • Dengan memanfaatkan pengaturan ini, Anda bisa menggunakan model papan atas seperti o3 dan GPT-4.5 dalam jumlah besar secara gratis
    • Di OpenAI Playground, Anda bisa menjalankan o3 dan o4-mini berdampingan untuk membandingkan serta memahami keunggulan dan kegunaan masing-masing model.
  • Strategi penggunaan yang direkomendasikan per model

    • Gemini 2.5 Pro: prioritas utama untuk debugging, perencanaan, dan pekerjaan coding secara umum
    • o4-mini: kuat untuk menyelesaikan bug yang rumit, dengan efisiensi biaya yang sangat baik
    • Claude 4 / 3.7: paling cocok untuk menyelesaikan masalah yang mendesak dan sulit, tetapi aksesibilitas dan biayanya terbatas
    • Claude 3.5: cocok untuk merapikan hasil kreatif dari 3.7/4 atau menulis kode nyata
    • o3, GPT-4.5, Qwen3 Coder 480b, GLM 4.5: sangat kuat dalam menyelesaikan masalah kompleks, dan bisa digunakan dalam jumlah besar jika memanfaatkan pengaturan token gratis

Pendekatan Hibrida: Perencanaan Premium + Eksekusi Hemat

  • Setelah menguji berbagai model, dikembangkan strategi hibrida yang bisa memaksimalkan kualitas sekaligus efisiensi biaya
  • Wawasan utamanya adalah setiap model punya keunggulan pada tahap tertentu dalam proses pengembangan

Teori "Smart Juice" – Mengapa AI menjadi bodoh
‘Energi kecerdasan’ yang bisa diterima model itu terbatas.
Jika Anda mengirim prompt yang ringkas dan fokus, hampir 100% energi itu dipakai untuk memecahkan masalah.
Tetapi jika Anda mengirim input yang tidak perlu dan terlalu kompleks (penjelasan panjang soal cara memakai tool, konteks yang tidak relevan dengan masalah, kode sepanjang beberapa halaman, dll.), sebagian besar energi akan habis untuk memproses itu, sehingga ‘kecerdasan’ yang tersisa untuk menyelesaikan masalah nyata jadi berkurang.

Contoh: agen terintegrasi IDE seperti Cursor dan Cline mengirim banyak instruksi dan konteks sebelum pertanyaan diajukan, sehingga fokus model menurun.
Karena itu, mengurangi konteks yang tidak perlu dan hanya mengirim inti yang dibutuhkan untuk menyelesaikan masalah adalah cara untuk mendapatkan hasil terbaik.

  • Workflow saat memulai proyek baru

    • 1. Plan & Brainstorm
      • Gunakan model web yang cerdas dan gratis (Gemini 2.5, o4-mini, Claude 3.7/4, o3, dll.) untuk merancang pendekatan, menyusun rencana langkah demi langkah, dan mengidentifikasi library yang dibutuhkan.
    • 2. Generate Agent Prompt
      • Minta ke salah satu model di atas:
        "Write a detailed-enough prompt for [Cline](https://cline.bot/), my AI coding agent, to complete the following tasks: [deskripsi tugas]"
      • Prompt yang dihasilkan lalu dipoles sekali lagi dengan AI gratis yang pandai menulis ulang seperti ChatGPT.
    • 3. Execute with Cline
      • Tempel prompt yang sudah dipoles ke Cline dan jalankan dengan GPT 4.1 atau Claude 3.5 (untuk tugas kompleks, gunakan Claude 4).
      • Seri GPT 4.1 sangat terlatih dalam mematuhi instruksi.
    • 4. Fallback
      • Jika GPT 4.1 gagal, beralih ke Claude 3.5 lewat API.
      • Deepseek v3 atau R1 juga sangat kuat dalam menjalankan instruksi.
  • Strategi inti

    • Gunakan model yang mahal dan pintar (atau Gemini 2.5 Pro yang bisa dipakai gratis) untuk tahap strategi dan desain.
    • Tempel rencana tersebut ke 2–3 model gratis lain (Deepseek R1, Claude di Poe, dll.) untuk verifikasi:
      "Is this good? Can you improve it or find flaws?"
    • Untuk tahap coding dan eksekusi, gunakan model yang stabil dan efisien (GPT 4.1, Claude 3.5) di Cline.
  • Tips pemanfaatan per model

    • o4-mini
      • Kuat untuk strategi implementasi level tinggi seperti menafsirkan logika kode yang kompleks serta memilih framework dan library.
    • Brainstorming ide
      • Manfaatkan Gemini 2.5, o4-mini, GPT 4.1, ChatGPT, o3-mini (sering gratis di duck.ai), Phind, dll.
    • Jika tetap tidak bisa diselesaikan
      • Jika model gratis/murah gagal menyelesaikannya, lakukan escalation ke model premium berbayar lewat API.

Agen & Setup Alternatif

  • Trae.ai (Bytedance, pembuat TikTok)
    • IDE kompatibel VS Code, menyediakan penggunaan AI gratis: termasuk Claude 4, Claude 3.7, Claude 3.5, GPT 4.1.
    • Performa agen bawaannya lebih rendah daripada Cline (jujur saja, Cline yang paling kuat).
    • Karena berbentuk klon VS Code, sepertinya bisa memasang ekstensi Cline.
    • Namun lambat karena server kelebihan beban → efektivitas penggunaan gratisnya rendah.
    • Meski begitu, tetap disebutkan karena akses ke model gratisnya.
  • 2 Pengaturan yang Direkomendasikan

    • 1. VS Code + Cline + Copilot
      • Langganan Copilot $10/bulan → memungkinkan penggunaan API model kuat dengan murah di Cline.
      • Tier gratis juga memungkinkan beberapa fungsi dasar.
    • 2. Trae.ai + Cline
      • Menguji apakah akses model gratis Trae + penggunaan API key Cline bisa dipakai bersamaan.

    Tip: Ada kalanya agen bawaan Copilot menyelesaikan masalah yang sulit ditangani Cline, dan sebaliknya juga bisa terjadi.
    Cline bisa mengirim prompt yang terlalu panjang sehingga performanya menurun → dalam beberapa kasus Copilot lebih menguntungkan.

  • Roo Code: Klon Cline

    • Roo Code hampir sama dengan Cline, tetapi menawarkan beberapa fitur yang berbeda.
    • Tergantung proyek atau gaya coding, Roo Code bisa jadi lebih cocok.
    • Cline sendiri gratis, tetapi biaya pemanggilan API tetap berlaku.
    • Cara paling ekonomis: atur VS Code LM API + langganan Copilot $10/bulan → penggunaan model kuat yang nyaris tanpa batas.
  • Tool CLI Baru: Claude Code, Qwen Code, Gemini CLI

    • Belakangan ini minat pada tool coding berbasis CLI meningkat tajam.
    • Claude Code: mendukung subagent → hanya menjalankan satu tugas, tanpa memakai tool tambahan.
      • Dapat mereproduksi workflow fokus ‘smart juice’ yang dijelaskan dalam panduan ini.
      • Menghapus instruksi agen yang tidak perlu (bloat), sambil menjaga efisiensi.
    • Qwen Code dan Gemini CLI juga masing-masing punya kelebihan.
    • Ada panduan pengaturan untuk menggunakan Claude Code dengan GLM 4.5 di situs z.ai.
    • Karena tiap tool CLI punya kekuatan berbeda, disarankan bereksperimen sambil merujuk ke panduan dan tips komunitas.

TL;DR: Panduan Quickstart

  • Model & Peran
    • Perencanaan & Brainstorming
      GLM 4.5, Kimi K2, seri Qwen3 Coder & 2507 terbaru, Gemini 2.5 Pro (AI Studio), o4-mini (OpenRouter), Claude 3.7/4 (Poe), disarankan memakai 250k token gratis per hari di OpenAI Playground (o3, GPT-5)
    • Pemecahan Masalah & Debugging
      GPT-5 (token gratis Playground), GLM-4.5 (performa setara Claude 4), Claude 4 (token harian gratis Poe)
    • Coding Aktual
      GPT-4.1 (Cline), jika gagal ganti dengan Claude 3.5, atau gunakan Qwen3 Coder, Instruct, 2507, GLM 4.5, Kimi K2
  • Tool Utama
    • VS Code
    • AI Code Prep GUI – memindai dan memilih hanya file yang diperlukan secara lokal, mengoptimalkan konteks AI
    • Cline (agen VS Code) – menjalankan kode langkah demi langkah
    • Chat web gratis – Poe.com, ChatGPT, Grok, Deepseek, Perplexity, OpenAI Playground, AI Studio (Gemini 2.5 Pro), OpenRouter, duck.ai
  • Workflow Cepat
    1. Bundel file terkait proyek dengan AI Code Prep GUI
    2. Tempel konteks tersebut ke model chat web pilihan untuk perencanaan dan debugging
    3. Minta satu model untuk menulis prompt Cline yang detail untuk tugas ini, lalu rapikan lagi di ChatGPT atau layanan serupa
    4. Tempel prompt yang sudah jadi ke Cline yang diatur ke GPT-4.1 untuk membuat atau mengubah kode
      → jika gagal, pindah ke Claude 3.5
  • Hack Penghematan Biaya
    • Aktifkan “data sharing” OpenAI Playground → 250k token gratis per hari (GPT-4.5, o3) + 2.5M token gratis per hari (o4-mini, o3-mini)
    • Langganan GitHub Copilot $10/bulan → memungkinkan penggunaan model Claude secara terbatas di Cline
    • OpenRouter bayar sesuai pemakaian → gunakan model terbaru seperti o4-mini dan Claude 3.7 dengan biaya murah

Beberapa Pemikiran

  • AI adalah pengungkit produktivitas yang luar biasa, tetapi bukan tongkat sihir.
  • Keajaiban sesungguhnya terjadi saat rasa ingin tahu, ketekunan, dan kemauan untuk bereksperimen kalian berpadu dengan tool-tool kuat ini.
  • Jangan frustrasi karena bug atau masalah — setiap tantangan adalah kesempatan untuk mempelajari hal baru.
  • Jangan takut mencampur model, mencoba ide-ide berani, lalu membongkar dan membangun ulang.
  • Pengembang terbaik bukanlah orang yang tidak pernah buntu, melainkan orang yang tetap maju saat buntu dan memanfaatkan setiap tool dan teknik yang ada.
  • Terimalah kekacauan, nikmati prosesnya, dan biarkan kreativitas kalian memimpin jalan!

Update Model Terbaru (Agustus 2025)

💰 Hemat Anggaran: Maksimalkan Value

  • GPT 4.5

    • Status: Dihentikan
  • o3

    • Kemampuan: performa sebanding dengan Claude 4, sangat unggul dalam menyelesaikan masalah sulit, level jenius
    • Tip penggunaan: bisa memasukkan seluruh codebase untuk dianalisis dengan AI Code Prep GUI
    • Token Gratis: 250k token/hari jika mengaktifkan data sharing di Data Controls/Sharing settings
  • o4-mini

    • Kemampuan: sedikit di bawah o3, tetapi tetap sangat kuat, seperti adik dari o3
    • Token Gratis: 2.5M token/hari jika mengaktifkan data sharing
  • Gemini 2.5 Pro

    • Akses: gratis di AI Studio
    • Spesialisasi: debugging kompleks, perancangan arsitektur, dan perencanaan
  • Deepseek R1 0528

    • Kemampuan: model yang sangat cerdas dengan kemampuan penalaran yang ditingkatkan
    • Akses: tersedia gratis di antarmuka web Deepseek

🚀 Premium: Selesaikan Masalah SEKARANG

  • Claude 4 Sonnet

    • Kemampuan: jika diberi konteks yang cukup, bisa menyelesaikan sebagian besar masalah dalam satu kali coba
    • Spesialisasi: performa terbaik secara keseluruhan, termasuk menulis dan pemecahan masalah
    • Penggunaan: saat harus benar-benar tuntas pada percobaan pertama
  • Claude 4 Opus

    • Harga: $75 / 1M token
    • Performa: dikenal lebih unggul dari Sonnet, dengan performa setingkat “magic sauce”
    • Penggunaan: saat membutuhkan pemecahan masalah tingkat tertinggi

Model Pekerja yang Solid

Model-model berikut mampu mengikuti instruksi dengan baik dan menjalankan tugas secara stabil:

  • GPT 4.1

    • Dirancang sebagai model pintar kelas atas untuk perancangan dan pemecahan masalah, lalu digunakan untuk modifikasi kode yang sebenarnya
    • Output dari mana pun bisa langsung ditempel ke Cline dan dijalankan
  • Claude Sonnet 3.5

    • Unggul dalam coding dan pengeditan
    • Sedikit lebih lambat daripada 4.1, tetapi sangat stabil
  • Deepseek v3

    • Cocok untuk penulisan kode, modifikasi, dan pekerjaan agent
    • Performa terhadap harga sangat baik
  • OpenRouter Free Models

    • Di OpenRouter, atur filter harga ke $0 untuk menjelajahi model gratis
    • Saat model baru muncul, layak untuk diuji

Claude 4 Gratis: lmarena.ai, dan Lainnya

Claude Opus 4 and Sonnet 4
  • Di lmarena.ai, Claude Opus 4, Sonnet 4, dan lainnya tersedia gratis
  • Tip: Kesempatan penggunaan gratis untuk model keluarga Anthropic wajib disimpan, diingat, dan dimanfaatkan
  • Penggunaan: Saat semua hal lain gagal, atau ketika pekerjaan harus selesai sempurna seketika, pilih Claude 4 Sonnet atau Opus

BARU!! Model-model China baru yang keren + GPT 5

  • GLM 4.5

    • Performa: Mirip dengan Claude 4 Opus atau Sonnet
    • Karakteristik: Menjalankan aturan agent dan penggunaan tool hampir sempurna
    • Penggunaan: Sangat kuat untuk memperbaiki bug yang sangat sulit dan menangani tugas kompleks yang membutuhkan banyak konteks
  • Qwen3 Coder 480B

    • Penilaian: Model kuat dan murah yang sangat disukai
    • Penggunaan: Pekerjaan coding di lingkungan berperforma tinggi dan berbiaya rendah
  • Qwen3 Instruct & Thinking 2507

    • Performa: Stabil dan kuat, mirip Qwen3 Coder
    • Kelebihan: Andal dan efisien dari sisi biaya
  • Kimi K2 (Moonshot)

    • Karakteristik: Terasa seperti dilatih dengan data sintetis berbasis Anthropic atau mirip Claude
    • Penilaian: Performa sangat unggul, model yang sering digunakan
  • GPT 5

    • Keterbatasan: Tidak terlalu menonjol untuk penggunaan tool kustom (MCP, Cline, dll.)
    • Cara penggunaan yang direkomendasikan:
      1. Gunakan model terbaik seperti GPT 5, GLM 4.5, dan lainnya untuk perencanaan dan pemecahan masalah
      2. Setelah itu, tulis prompt agar model agent yang lebih sederhana menjalankan pengeditan nyata dan penggunaan tool
    • Perbandingan:
      • GPT 4.1 masih sangat bernilai dibanding biayanya
      • Model-model China baru lebih kuat untuk penggunaan tool kustom/Cline
    • Kesimpulan: Belum cukup banyak diuji, tetapi setiap model punya bidang keunggulannya sendiri, dan saat ini model-model China sangat menarik dari segi harga dan stabilitas

Workflow Coding Saat Ini (2025)

  • Untuk Proyek Baru:

    • 1. Fase Perencanaan:
      • Catat semua detail proyek (bahasa, library, server, dll.) di notepad
    • 2. Konsultasi Multi-Model:
      • Tempelkan isi yang sama ke beberapa model untuk mendapatkan ‘beragam opini ahli’:
    • 3. Penyempurnaan:
      • Sesuaikan detail secara halus melalui percakapan berulang dengan model
    • 4. Pembuatan Tugas:
      • Minta model menulis daftar tugas langkah demi langkah untuk agent coding AI Cline
    • 5. Eksekusi:
      • Jalankan tugas di Cline (atau Roo Code) dengan GPT 4.1 disetel ke mode ‘act’
  • Untuk Pemecahan Masalah:

    • Analisis codebase kompleks: gunakan GPT 4.5 + AI Code Prep
    • Minta GPT 4.5: “Tolong tulis prompt agar Cline bisa menyelesaikan tugas ini”
    • Pilih model sesuai tingkat kompleksitas masalah
    • Gunakan berbagai model untuk mencari solusi dari berbagai sudut
  • Daftar Tugas & Test Driven Development (Segera Hadir)

    Test Driven Development & Daftar Tugas:
    • Minta AI menulis daftar tugas terperinci untuk menjalankan Cline, Roo Code, dan agent Trae
    • Cline atau Roo Code bisa diarahkan untuk mencatat progres tugas di file Markdown dan mencentangnya saat selesai
    • Dengan ini, progres mudah dilacak dan hal yang terlewat bisa dicegah
    • Saat ini, pendekatan ini bisa diuji dengan meminta model membuat checklist Markdown, lalu menyuruh Cline atau Roo Code memperbarui file tersebut
  • Tips Hemat Biaya

    • GPT 4.5 & o3: jika berbagi data pelatihan model diaktifkan, tersedia 250 ribu token gratis per hari
    • Model murah: o4-mini, 4.1-mini/nano dapat menggunakan 2,5 juta token per hari
    • GitHub Copilot: dengan $10 per bulan, bisa memakai model Claude terbaru (ada batas kecepatan)
    • Trae IDE: saat ini bisa memakai Claude 4 dan GPT 4.1 secara gratis (tanpa langganan, tampaknya tanpa batas)
    • Poe.com: menyediakan kredit harian gratis untuk semua model
    • Web Interfaces: manfaatkan antarmuka chat web gratis untuk perencanaan dan konsultasi
  • Segera Hadir: Data Reddit Langsung & Insight

    Scraping Data Reddit Langsung & Insight Harian:
    • Akan menyediakan contoh penggunaan model AI yang diperbarui setiap hari dengan melakukan scraping data Reddit secara real-time
    • Termasuk analisis penggunaan terperinci, visualisasi data, serta insight baru tentang workflow coding nyata dan tren

1 komentar

 
GN⁺ 2025-08-10
Komentar Hacker News
  • Kalau ada yang sempat bingung, di artikel aslinya masih ada 2–3 halaman lagi, dan bisa diakses lewat ikon panah di bagian bawah

  • Saya penulis artikelnya, maaf soal masalah font. Isinya memang agak lama, tapi bidang AI berubah sangat cepat jadi saya berencana memperbaruinya dengan model-model terbaru juga. Belakangan model baru keluar sangat sering, dan favorit pribadi saya akhir-akhir ini adalah GLM-4.5. Kimi K2 juga bagus, dan Qwen3-Coder 480b maupun 2507 instruct juga sangat solid. Model-model seperti ini bekerja sangat baik di lingkungan agentic atau tool agent apa pun Saya juga membuat aplikasi context helper saya sendiri (https://wuu73.org/aicp), dan bisa diakses lewat tautan ini. Sangat praktis saat saya bolak-balik antara banyak tab chat AI yang biasa saya pakai dan IDE saya (hampir selalu gratis, dan hasilnya juga terbaik). Saya berusaha menghilangkan sebanyak mungkin kerepotan dan ketidaknyamanan saat memakai antarmuka web chat. Gratis, dan sejauh ini umpan balik yang masuk sangat bagus, tapi kritik juga saya sambut Perpindahan antara IDE <----> tab web chat jadi jauh lebih nyaman. Awalnya saya buat untuk menghemat waktu saya sendiri, dan karena UI-nya berbasis PySide6, aplikasinya jauh lebih ringan daripada webview. Teks yang sering dipakai bisa langsung ditambahkan lewat tombol preset, dan status konteks seperti ukuran jendela serta file yang dipakai per proyek juga diingat. Saat dijalankan lagi, kondisinya akan terbuka seperti semula Aplikasi ini otomatis memindai file kode dan menebak file mana yang kemungkinan berguna. Di kotak prompt, Anda juga bisa menambahkan teks di atas dan bawah kode (dan ini cenderung membuat output lebih baik). Salah satu tombol yang sering saya pakai secara pribadi disetel ke: "tuliskan prompt untuk Cline (coding agent), bungkus seluruh prompt dalam satu code tag agar mudah copy/paste, pecah seluruh pekerjaan menjadi bagian-bagian kecil, sertakan penjelasan rinci dan alasannya agar Cline bisa mengikutinya, lalu tambahkan blok search and replace dalam plain language untuk menunjukkan lokasi edit" Cara saya untuk pemecahan masalah atau mencari bug biasanya begini: di VS Code saya biasa mengetik aicp di terminal untuk membuka aplikasinya, melakukan fine-tuning file, memasukkan penjelasan atau perbaikan yang saya inginkan, lalu klik tombol Cline dan Generate Context! kemudian tempel ke GLM-4.5. Kalau masalahnya sulit, saya coba juga ke 2–3 model seperti o3, o4-mini, GPT-5, sampai Gemini 2.5 Pro. Saya pilih jawaban yang paling masuk akal lalu tempel ke Cline (VS Code, GPT 4.1 versi unlimited/free). 4.1 memang tidak super pintar, tapi sangat akurat dalam menjalankan instruksi. Ia juga memperbaiki sendiri kesalahan kecil khas model besar. Model-model besar pandai menulis penjelasan detail dan daftar tugas, lalu 4.1 mengeksekusinya dalam agent mode Dengan cara ini, Anda bisa coding dengan AI yang sangat pintar secara gratis tanpa batas. Kalau MCP (tool dan sebagainya) ditempelkan langsung ke model, performanya justru turun, dan kalau pakai API seperti Claude 4 biayanya malah jadi besar

    • Kecepatan scroll situs web-nya lambat (sub-1 fps di Firefox Android), dan call-out terkait grok tidak bisa di-scroll. Di bagian atas juga terlihat tombol hijau besar yang mencurigakan bertuliskan CSS loaded

    • Diagram di [https://wuu73.org/aicp] berguna, tapi saat diklik tidak tampil dalam resolusi penuh jadi buram. Di Firefox maupun Chrome sama saja. Di repo GitHub tampil tajam, jadi sepertinya masalahnya ada di library render JS-nya

    • Artikelnya bagus dan terima kasih atas pembaruannya. Saya akan sangat tertarik kalau Anda bisa membahas lebih dalam perbedaan pengalaman memakai Roo Code dan Cline. Sampai sekarang saya baru memakai Roo Code, dan meski menarik, hasilnya agak tidak konsisten

    • Penasaran apakah Anda pernah mencoba Microsoft copilot. Itu pada dasarnya model OpenAI gratis

    • Anda bilang bisa coding gratis, tapi di pengaturan data OpenAI itu gratis hanya kalau Anda mengizinkan data Anda dipakai untuk melatih model. Jadi sebenarnya tidak benar-benar "gratis"

  • Pengalaman saya juga sejalan dengan isi artikel. Fitur agentic memang baru benar-benar bekerja di model besar (dan "bekerja" di sini maksudnya... misalnya OpenAI Codex dengan o4-mini harus mengirim 200 request hanya untuk memperbaiki 3 baris) Untuk perubahan sederhana, model kecil justru jauh lebih cepat jadi lebih baik. Karena itu saya sekarang fokus bukan pada model "terbaik", melainkan "yang sebodoh mungkin tapi masih bisa dipakai" Kalau didorong lebih jauh lagi dan pendekatan agentic ditinggalkan, model yang sangat kecil pun bisa melakukan pekerjaan yang sangat presisi. Kalau Anda menjelaskan persis yang diinginkan, ia langsung memberi hasil diff Cara yang membongkar-bongkar file system tidak efisien di skala saya. Hampir seluruh codebase bisa saya masukkan ke konteks, jadi saya lempar saja seluruh src/ ke prompt. Untuk proyek orang lain, karena boilerplate-nya banyak, saya sedang bereksperimen dengan pencarian kode memakai model super murah seperti gpt-oss-20b, dan untuk tujuan seperti itu model yang lebih kecil pun cukup berguna. Patent pending

    • Saya juga sepakat. Haiku sudah cukup untuk mengelola alur percakapan, dan untuk tugas yang lebih kompleks saya minta ke model besar seperti Gemini 2.5 Pro atau GPT-5. Belakangan saya juga bereksperimen memakai Codex lewat MCP(${codex mcp}) di Gemini CLI, dan hasilnya sangat bagus. Gemini CLI kebanyakan berbasis Flash, tapi itu sudah cukup untuk perumusan masalah dan evaluasi ulang jawaban. Hal yang sama juga berlaku saat memakai Gemini 2.5 Pro lewat Claude Code MCP. Memakai Claude Code sebagai MCP itu sendiri tidak terlalu berhasil. Ide dasarnya tentu datang dari Aider, yaitu konsep memakai model utama, pendamping, dan editor secara bersamaan

    • Aider, sebagai tool coding non-agentic, memberi keseimbangan yang pas antara efisiensi dan efektivitas. Karena ia membuat pemetaan repo dengan tree-sitter, kebutuhan untuk membongkar file system jadi jauh berkurang. Tidak ada MCP, tapi ada shell command jadi saya tetap bisa memakai utilitas yang sudah saya kenal. Jika dipadukan dengan penyedia seperti Cerebras, kecepatan pemrosesan prompt terasa instan. Kita bisa terus campur tangan tanpa menunggu banyak panggilan tool bolak-balik. Untuk proyek kecil, ini benar-benar yang terbaik

    • Saya juga makin berpikir ke arah yang sama. Saya ingin tool yang cepat dan bisa diandalkan. Masuk ke flow state itu penting buat saya, dan menunggu tool coding agentic malah memutus alur itu sepenuhnya. Karena itu saya makin tertarik pada model kecil, atau provider seperti Cerebras. Kalau ruang lingkup masalah dipersempit, keandalannya juga naik. Secara pribadi saya juga ingin dengar lebih banyak soal tool "surgical" yang Anda pakai. Saya juga sempat merapikan beberapa pemikiran soal ini di postingan blog saya

    • Di Codex CLI, model di bawah GPT-5 tidak bisa lagi diganti (kalau tidak punya API key), karena katanya tidak direkomendasikan. Kalau dijalankan dengan opsi thinking=high, performanya jauh lebih baik daripada o4-mini, dan o4-mini pada dasarnya terasa seperti gpt-5-thinking-mini. Di codex pengaturan itu tidak ada, dan gpt-5-thinking-high setara dengan o1 atau o3-pro

    • "(praktis bekerja)"... soal OpenAI Codex dengan o4-mini yang butuh 200 request untuk mengubah 3 baris kode, sebagai catatan, dalam pengalaman saya sendiri saya benar-benar pernah menghabiskan beberapa hari hanya untuk tugas 3 baris seperti itu

  • Saya rasa ada potensi besar pada stack yang sepenuhnya lokal, tanpa perlu cloud seperti Cursor. Contohnya: • Cursor CLI untuk pekerjaan agentic/dev(https://x.com/cursor_ai/status/1953559384531050724) • lapisan memori lokal yang kompatibel dengan CLI - LEANN(97% indeks lebih kecil, biaya cloud 0, privasi penuh, https://github.com/yichuan-w/LEANN) atau Milvus (meski yang ini kadang akhirnya dipakai berbasis cloud/token) • untuk contoh inference engine ada Ollama, yang sangat bagus untuk menjalankan model OSS GPT secara lokal Dengan pendekatan seperti ini, kita bisa membangun lingkungan dev+AI pribadi yang sepenuhnya offline, privat, dan sangat cepat. Proyek LEANN memang dirancang tepat untuk penggunaan seperti ini: tiny footprint, pencarian semantik untuk seluruh lingkungan lokal, kompatibel dengan Claude Code/Cursor langsung out-of-the-box, dan generation bisa ditangani dengan ollama. Tidak perlu keluar uang sama sekali, dan API juga tidak dibutuhkan. Tentu setup-nya butuh sedikit usaha. Tapi saya berharap ada yang membuatnya jadi sangat mudah secara open source

    • Rasanya ini ringkasan yang benar-benar mendekati bentuk ideal dari local AI stack. Di tool seperti Cursor atau aider, saya selalu merasa kurang ada memory layer yang kuat sekaligus privat. Kombinasi indeks privat kecil seperti LEANN + inference lokal Ollama terasa sangat kuat. Saya suka ide memakai kombinasi ini untuk pemrograman, dan kalau pengalaman "mirip Cursor" yang benar-benar privat bisa terwujud, workflow AI rasanya akan berubah total
  • Kalau Anda sedang mencari API gratis, di Google Gemini Anda bisa memakai Gemini secara gratis, terutama gemini-2.5-pro dengan fitur thinking aktif. Batasnya cukup tinggi; saya sedang memakainya untuk benchmark dan sejauh ini belum pernah menyentuh limit. Model berbobot terbuka seperti DeepSeek R1 dan GPT-OSS juga punya akses API gratis dari berbagai inference provider atau vendor hardware

    • Batas gratis Gemini 2.5 pro adalah 100 kali per hari
      https://ai.google.dev/gemini-api/docs/rate-limits

    • Sebagai catatan, kalau fitur ini dipakai untuk hal yang tidak sensitif mungkin tidak masalah, tapi Google memang memakai interaksi seperti ini untuk pelatihan (kecuali yang berbayar)

  • Saya kaget ternyata isi artikelnya punya jauh lebih banyak informasi baru daripada yang saya duga. Biasanya saya tidak terlalu mendalami pilihan-pilihannya, tapi kali ini saya senang sudah membaca artikelnya sampai habis. Dan komentar HN-nya juga penuh informasi praktis, jadi terima kasih untuk semuanya

  • Saya ingin merekomendasikan ke OP agar benar-benar mempelajari Continue.dev, ollama/lmstudio, dan cara menjalankan model secara lokal. Beberapa model sangat kuat untuk autocomplete, dan model seperti gpt-oss juga bagus dalam penalaran maupun penggunaan tool. Buat saya ini adalah my goto copilot

    • Saya juga sama! Saya memakai Continue di VSCode, dan model besar Qwen maupun gpt-oss-120b bekerja lumayan baik dalam mode agentic

    • Menurut saya Zed satu tingkat lebih maju daripada continue.dev. Di sana Anda juga bisa memakai model yang Anda inginkan sendiri

  • Sesuai isi postingan, masalah pada coding agent adalah setiap request mengirim data dirinya + hampir seluruh codebase, sehingga biayanya mahal. Sebaliknya, di chat AI biayanya nyaris bisa diabaikan. Saya pribadi hanya memakai OpenRouter, karena hampir semua model bisa diakses di sana. Sonnet tadinya favorit saya, tapi setelah mencoba Gemini 2.5 Pro, hampir selalu lebih baik (kekurangannya hanya lambat). Untuk pertanyaan sederhana atau saat lupa sintaks, Gemini Flash sangat cepat jadi pas sekali

  • Mungkin ada yang heran kok orang rela menyerahkan datanya sendiri hanya demi free tier, tapi kenyataannya sumber daya yang dibutuhkan untuk menjalankan LLM bagus di rumah itu terlalu besar, jadi menurut saya lebih baik menyerahkan kode saya dan memakainya gratis. Lagi pula kode itu pada akhirnya juga akan jadi open source

    • Kalau tempat saya bekerja memang tidak mempermasalahkan penggunaan model untuk coding, dari sudut pandang saya itu bukan hal yang perlu dikhawatirkan
  • Saya sangat setuju dengan klaim bahwa "saat memakai AI di web chat (yakni antarmuka web seperti ChatGPT atau Openrouter), hasilnya hampir selalu lebih baik untuk pemecahan masalah atau usulan solusi dibanding IDE atau framework agent". Menyalin kode dari IDE ke web chat lalu menempelkannya memang terlihat agak merepotkan, tapi dalam pengalaman saya hasilnya jauh lebih baik daripada Github copilot atau cursor

    • Pengalaman saya justru kebalikannya total. Baik agentic maupun bukan, yang paling penting adalah context. Akses agentic ke seluruh proyek, atau integrasi langsung ke GitHub, atau fine-tune, RAG, dan bentuk akses ke keseluruhan konteks lainnya, semuanya sangat mengurangi halusinasi. Ada perbedaan besar antara "tolong tulis x" dan "tolong tulis x sesuai gaya saya, dependensi y, dan kode sekitar z". Jujur saya tidak paham alasan orang membela coding AI berbasis copy-paste. Menurut saya itulah kenapa pendekatan agent sekarang meledak popularitasnya