Potensi masalah yang ditemukan di curl dengan alat AI

(mastodon.social)

8 poin oleh GN⁺ 2025-10-03 | 1 komentar | Bagikan ke WhatsApp

Joshua Rogers menemukan daftar besar potensi masalah dalam codebase curl menggunakan rangkaian alat berbasis AI miliknya sendiri
Daftar ini mencakup bukan hanya cacat gaya kode yang sepele, tetapi juga bug kecil dan celah keamanan potensial
Sebagian besar masalah yang ditemukan adalah bug kecil, tetapi 1–2 di antaranya bisa merupakan cacat keamanan yang kritis
Karena ini adalah masalah yang sebelumnya tidak terdeteksi, hasilnya benar-benar sangat bernilai
Berdasarkan laporan tersebut, 22 perbaikan bug sudah selesai dilakukan
Masih ada lebih dari dua kali lipat isu yang belum terverifikasi, sehingga peninjauan dan perbaikan terus berlangsung
Masalah rinci ditandai sebagai "Reported in Joshua's sarif data", dan jika tertarik, Anda dapat memeriksa data tersebut secara langsung

1 komentar

GN⁺ 2025-10-03

Komentar Hacker News

Ini menurut saya adalah wujud ideal dari "pendamping coding AI"
Daripada menulis atau memperbaiki kode secara langsung, saya ingin AI berperan memberi tahu bagian kode yang mencurigakan dan lokasi yang perlu saya periksa lebih detail
Saat saya meminta Claude mencari bug di library C saya yang panjangnya 20 ribu baris, ternyata ia memecah file lalu melakukan grep terhadap pola kode tertentu, dan pada akhirnya hanya menampilkan komentar FIXME saya sendiri (haha)
Sebenarnya itu setara dengan yang bisa dilakukan skrip bash sederhana, jadi cukup mengecewakan
ChatGPT malah lebih tidak berguna lagi, hanya mengulang "semuanya terlihat bagus! hebat sekali! tos dulu~"
Sejauh ini, static analysis tradisional jauh lebih membantu untuk menemukan bug nyata, tetapi hasil static analysis yang bersih tidak berarti tidak ada bug logika
Justru di titik inilah saya pikir LLM seharusnya benar-benar bersinar
Jika untuk mendapatkan informasi bug potensial yang lebih berguna dari LLM kita harus membangun lingkungan yang sangat dikustomisasi, maka pada akhirnya kegunaannya juga akan turun, sama seperti alat static analysis yang jarang dipakai saat butuh konfigurasi rumit
- Ada hal yang hampir tidak pernah dibahas: banyak programmer suka merancang dan menulis kode sendiri, terutama selain kode yang repetitif, tetapi tidak suka melakukan code review
  Arah bahwa AI menulis kode lalu programmer hanya melakukan review terasa seperti alur yang keliru
  Tentu saya paham kenapa pendekatan itu dijual dengan gaya "jumlah baris kode meningkat~"
- Saat hasil dari Claude mengecewakan seperti yang disebutkan, sering kali cukup efektif untuk langsung "bertanya ke Claude sendiri prompt seperti apa yang akan efektif"
  Misalnya, bertanya "Prompt seperti apa yang harus saya pakai agar Claude Code menyusun rencana untuk mereview bug logika secara efektif sambil mengabaikan komentar seperti FIXME dan TODO?"
  Prompt hasilnya terlalu panjang untuk ditulis di sini, tetapi bisa dilihat pada contoh yang dibagikan lewat gist
  Berdasarkan hasil itu, kita juga bisa terus menyempurnakannya dan menjadikannya agen
- Cursor BugBot cukup cocok untuk peran seperti ini
  Setelah masa uji coba gratis, alat itu populer di tim pengembangan kami sehingga kami mengadopsinya secara resmi
  Selain kasus salah deteksi sesekali, alat ini sangat berguna
  Baik penulis PR maupun reviewer sama-sama banyak menghemat waktu
- Saya pernah bertanya ke Claude, "Ada bug yang membuat respons lambat di endpoint tertentu, tetapi tidak berkaitan dengan penggunaan CPU/memori maupun DB. Apa penyebabnya?" Setelah beberapa iterasi, saya benar-benar mendapat petunjuk tentang bug yang sangat sulit ditemukan
  Masalah yang sebelumnya mungkin butuh berjam-jam bisa saya selesaikan setelah mendapat petunjuk
  Saya sangat antusias dengan kemungkinan pemanfaatan AI seperti ini
- GPT-5 dalam situasi seperti ini jauh lebih tidak suka menjilat dibanding model-model sebelumnya
  Agak mengejutkan kalau ada respons seperti "semuanya terlihat bagus"
  Saat dipakai di Codex CLI, model ini sering mengajukan pertanyaan atau keraguan
  Gemini 2.5 Pro juga lumayan baik di bagian ini
Saya benar-benar tidak menyangka akan muncul kisah positif tentang curl dan AI
Mungkin ada baiknya melihat riwayatnya: tautan pencarian HN terkait curl+AI
- Saya rasa luar biasa bahwa Daniel Stenberg tetap bersikap lapang dada kali ini, meski sebelumnya ia sudah mengalami berbagai masalah terkait laporan bug AI
Poin pentingnya tampak ada pada fakta bahwa ini adalah sebuah "set alat". Bukan disalahartikan sebagai autopilot, tetapi benar-benar dipakai sebagai kombinasi alat yang membentuk sistem
- Sepertinya penulis tamu menjelaskan lebih banyak detail di artikel aslinya blog rujukan (sebutan Mastodon: tautan terkait)
- Saya menyayangkan pembahasannya dipersempit menjadi dikotomi seperti "self-driving vs. serba dibiarkan"
  Pada akhirnya, sudut pandang yang lebih tepat tampaknya adalah perbedaan antara orang yang benar-benar paham cara memakainya dan orang yang hanya coding mengikuti vibe
- Stenberg menggambarkannya sebagai set alat, tetapi saya juga penasaran dengan pemikiran kontributor yang benar-benar memakai alat tersebut
Di repositori curl ada 55 PR tertutup yang menyebut "sarif data", dan PR yang dibahas kali ini termasuk kelompok itu
Ini kontras dengan masa lalu ketika Daniel Stenberg dibuat pusing oleh isu keamanan palsu berkualitas buruk yang dibuat AI
Terkait HackerOne: "Pelapor isu sampah buatan AI langsung saya ban. Praktis setara serangan DDoS. Rasanya sampai ingin menagih waktu yang terbuang"
Lihat juga tulisan blog Daniel pada Januari tahun ini: The I in LLM stands for Intelligence?
- Beberapa bug, misalnya penggunaan penentu format printf yang salah untuk size_t, sebenarnya bisa terdeteksi hanya dengan mengatur flag warning compiler dengan benar
  Akan cukup berguna jika AI bisa memberi saran seperti, "flag peringatan compiler penting Anda belum diaktifkan"
  Sepertinya sebagian PR mungkin karena kecocokan dependabot, dan jika mencari "Joshua sarif data" Anda bisa melihat daftar PR yang lebih spesifik tautan
- Model yang dipakai saat itu tampaknya sudah banyak berkembang
  Saya menduga itu alasan kesan Daniel Stenberg ikut berubah
Di antara pemindai SAST komersial memang ada yang bagus, tetapi kebanyakan tidak memuaskan
Banyak yang mendorong adopsi teknologi SAST berbasis AI dan produk terkait juga sudah dirilis, tetapi mayoritasnya masih di bawah ekspektasi
Kalau hanya mengecewakan mungkin masih untung, masalahnya bisa berbahaya jika sampai menimbulkan rasa aman yang keliru terhadap keamanan
Pandangan kritis dan alasannya terhadap pemindai SAST berbasis AI diperkenalkan di sini
Sulit untuk langsung memahami alat AI spesifik apa yang digunakan
Dalam situasi ketika berbagai alat sebelumnya gagal menemukan bug, saya penasaran kenapa strategi kali ini lebih efektif
- Ada sedikit informasi tambahan di blog yang memiliki bab tentang produk
  Tautan Mastodon tampaknya dipakai untuk mengonfirmasi bahwa meskipun ada cuplikan kode yang salah, bug-nya memang nyata
Sebagai isu terkait, ada contoh kasus "orang melakukan sesuatu dengan AI lalu tidak memahami apa yang sebenarnya sedang dilakukan" You did this with an AI and you do not understand what you're doing here

Potensi masalah yang ditemukan di curl dengan alat AI

Bacaan terkait

1 komentar

Komentar Hacker News