32 poin oleh GN⁺ 2025-05-01 | 5 komentar | Bagikan ke WhatsApp
  • gpt-4.1 adalah asisten yang hati-hati dan andal, dengan keunggulan dalam memahami kode secara akurat dan pendekatan yang konservatif
  • gemini 2.5 pro sangat unggul dalam menangani konteks yang luas dan juga memiliki kemampuan analisis gambar yang baik, tetapi ada risiko memicu modifikasi berlebihan
  • sonnet 3.5/3.7 kreatif dan cerdas, tetapi kurang dalam menjaga konteks dan konsistensi sehingga goyah dalam percakapan jangka panjang
  • grok-3-beta lambat, tetapi menunjukkan potensi luar biasa dalam visualisasi desain dan pemecahan masalah kompleks
  • Pengguna memisahkan penggunaan model sesuai alur kerja, dan saat debugging gagal mereka lebih menyukai strategi pemulihan checkpoint dan berpindah model

gpt-4.1

  • Bertindak seperti asisten yang cerdas dan sangat dapat diandalkan
  • Tidak terburu-buru mengambil kesimpulan, mengikuti permintaan tanpa melakukan perubahan berlebihan
  • Terasa seperti perpanjangan dari developer itu sendiri, sehingga sangat cocok terutama bagi developer berpengalaman

gemini 2.5 pro

  • Kuat saat memanfaatkan konteks yang luas seperti log konsol panjang atau seluruh file kode
  • Kemampuan analisis gambar sangat baik, mampu menangkap kesalahan visual
  • Kekurangannya adalah dapat bertindak terlalu otonom, sehingga bisa menyebabkan penghapusan kode yang tidak perlu atau modifikasi berlebihan
  • Memerlukan kontrol yang cermat

sonnet 3.5 / 3.7

  • 3.7 kreatif dan cerdas, tetapi dalam percakapan panjang kadang kehilangan konteks atau mengabaikan instruksi
  • 3.5 kuat dalam memahami dan memodifikasi kode berbasis satu file
  • Integrasinya dengan Cursor sedang mengalami masalah transisi sehingga belum menunjukkan performa yang konsisten

Opini dan strategi lainnya

  • grok-3-beta lambat, tetapi berguna untuk menyelesaikan masalah yang gagal ditangani model lain
  • Seorang pengguna memakai strategi pembagian peran model berikut:
    • o3/4-mini: untuk menyusun rencana dan merapikan penalaran berbasis Markdown
    • gemini 2.5 pro: untuk analisis masalah berbasis seluruh file dan pemanggilan fungsi
    • sonnet 3.5: untuk modifikasi satu file berbasis cmd+k

5 komentar

 
bungker 2025-05-02

Saya bisa dengan tegas mengatakan bahwa Gemini 2.5 Pro adalah yang terkuat khusus untuk Go lang.

 
daddy 2025-05-02

Saya merekomendasikan ZeniMya untuk tanya jawab karena kecepatannya paling tinggi.

 
jk34011 2025-05-02

Saya sebelumnya hampir selalu hanya memakai Sonnet
Saya sangat setuju dengan banyak hal yang ada di isi artikelnya
Sepertinya saya juga harus mencoba 4.1

 
gnoopy 2025-05-01

Rasanya mirip dengan yang saya rasakan. Semakin sering memakai sonnet, semakin terasa tidak menentu, sedangkan chatgpt 4.1 meski sudah diberi instruksi, setidaknya membuat hati lebih tenang.

Saya juga setuju dengan pendapat tentang Grok, tetapi saya cenderung lebih sering menggunakannya saat mengecek dengan tenang di chat daripada di dalam IDE.

 
GN⁺ 2025-05-01

Reaksi komunitas Reddit

Cara memanfaatkan model

  • o3/4-mini: untuk perencanaan dan perapian berbasis Markdown, menunjukkan reasoning yang lebih baik serta lebih cocok untuk percakapan (Masony817, scragz, Princekid1878)
  • gemini 2.5 pro:
    • berguna untuk mode agen atau pemanggilan fungsi berbasis konteks panjang (Masony817, computerlegs)
    • kuat untuk melihat gambaran menyeluruh seluruh kode dan mengambil keputusan dalam proyek yang kompleks (WorryBubbly3438)
    • bagus untuk pencarian, cross-check, dan peran pra-pemrosesan (computerlegs)
  • sonnet 3.5: unggul dalam memahami dan memodifikasi satu file, cocok untuk shortcut cmd+k (Masony817)
  • sonnet 3.7:
    • lebih kreatif dan lebih unggul daripada 3.5, tetapi ada masalah kehilangan alur dalam percakapan panjang (Sea_Cardiologist_212)
    • unggul dalam data cutoff terbaru dan kemampuan berpikir (yairEO)
    • stabil jika jendela konteks ditangani dengan baik (computerlegs)
  • Claude 3.7: stabil dan konsisten di lingkungan Cursor (cmndr_spanky)
  • gpt-4.1:
    • cocok untuk tugas sederhana yang berulang atau pekerjaan yang terstruktur (Princekid1878, ILikeBubblyWater)
    • cenderung melakukan perubahan berlebihan tanpa penjelasan (ILikeBubblyWater)
  • Deepseek R1: pada masalah tertentu, secara tak terduga bekerja lebih baik daripada model lain (Leather_Science_7911)

Strategi penggunaan dan workflow

  • Membagi peran per model lalu berpindah sesuai situasi (beberapa pendapat)
  • cmd+k: pemrosesan satu file dengan sonnet 3.5 (Masony817)
  • Mode agen tidak lagi dipakai setelah pengaturan awal; sebagai gantinya menggunakan fitur checkpoint dan prompt yang jelas (WorryBubbly3438)
  • Lebih suka Auto mode: cepat dan bisa dijalankan dengan biaya rendah (Funny-Anything-791, d0RSI)
  • Pendekatan mekanis: instruksi yang eksplisit dan presisi itu penting, seperti mesin CNC (Funny-Anything-791)
  • Model yang khusus untuk pengujian UI dan desain masih belum memadai (Princekid1878)

Pendapat lainnya

  • Ada keluhan bahwa Sonnet 3.7 kini lebih buruk dalam menjaga fokus dan konteks dibanding sebelumnya (Sea_Cardiologist_212)
  • Gemini atau Claude terlihat bagus di video pengujian, tetapi berbeda di lingkungan nyata (cmndr_spanky)
  • Bagi sebagian besar model, prompt yang eksplisit adalah kuncinya (disebutkan secara umum)
  • Sebagian pengguna berharap ada integrasi berbasis crypto atau Web (disebutkan secara tidak langsung)