Ada begitu banyak kebutuhan untuk membuat sesuatu dengan murah lalu mempromosikannya,
sementara ketika kita menemukan hal-hal yang bagus, kita cenderung menyimpan dan mengelolanya sendiri.
Saya rasa sejak awal memang tidak mudah bagi informasi atau berita yang baik untuk tersebar luas.
Akan bagus kalau berbagai bahasa bisa dibandingkan lewat satu eksperimen berskala besar,
namun pengujian sebesar itu pun tidak dilakukan di tingkat perusahaan, dan ketika anggota komunitas yang mengerjakannya, rasanya sulit membuat eksperimen yang akurat.
Saya sudah mencari ke sana-sini, tetapi memang tidak mudah menemukan informasi yang benar-benar bagus.
Dan itu juga wajar, karena entah ada tidak orang yang mau mengeluarkan biaya sendiri untuk merancang eksperimen yang layak demi mengetahui bahasa mana yang lebih baik..
Saya juga merasa ini eksperimen yang punya banyak keterbatasan, tetapi tetap senang karena setidaknya ada yang mencoba..^^
Ini tampaknya contoh yang dengan jelas menunjukkan apa yang terjadi ketika bahkan kriteria keberhasilan terkait performa yang sederhana pun tidak diberikan. Agen coding yang pernah saya gunakan sejauh ini masih berfokus pada penyelesaian masalah itu sendiri, tetapi tanpa prompt awal yang eksplisit atau loop verifikasi, mereka hampir tidak pernah mengoptimalkan performa sendiri. Anda perlu memberi instruksi kepada AI seolah-olah sedang memberikan soal coding test. Terutama bahkan dalam kasus seperti ini, ketika sudah ada baseline, berharap hasil performa terbaik tanpa secara eksplisit menyatakan kondisi performa bisa dibilang sebagai semacam kelalaian dari pihak orang yang menggunakan AI.
Ada perbedaan antara kemungkinan teoretis dan area penggunaan nyata -> ada keterbatasan pada benchmark yang digunakan untuk menghitung kemungkinan teoretis + masih ada gejala jeda budaya karena workflow yang ada belum dioptimalkan untuk AI. Secara pribadi, saya merasa benchmark kemungkinan memang memiliki keterbatasan.
Penurunan tingkat masuk ke pekerjaan baru -> mengisyaratkan bahwa bidang pengembangan telah menjadi kurang padat karya.
Saya belum tahu apakah ini hanya akan menjadi satu lagi metode yang lewat begitu saja, seperti kesalahan di titik tengah,
tetapi saya membagikan sebuah alat yang memungkinkan pemahaman kode dan perbaikan bug sambil melakukan review PR bersama AI.
Saya menggunakannya saat mengerjakan side project ketika saya tidak memahami perubahan kode yang dilakukan AI.
"Dalam tulisan ini, penulis membedah teks yang dihasilkan AI lalu mengungkap 6 tanda utama 'AI slop' dan struktur tersembunyi di dalamnya. Ini bukan sekadar deretan kata. Dari kosakata berlebihan seperti "delve" atau "tapestry" hingga pola kalimat yang menciptakan kesan mendalam palsu, tulisan ini membahas alasan mengapa AI tidak menulis seperti manusia. Intinya adalah memulihkan tulisan yang beragam dan tidak sempurna."
Mungkin karena dampak AI vibe coding, HN tampaknya juga sedang memikirkan hal serupa.
Di komentar pertama, admin dang juga sempat menyebut bahwa Show HN akan dibatasi untuk sementara waktu.
GeekNews juga berada dalam situasi yang mirip.
Agar pengguna baru punya waktu untuk membiasakan diri dengan komunitas, selama 1 minggu setelah pembuatan akun, penulisan postingan dan komentar dibatasi.
Meski begitu, masih cukup banyak postingan yang naik tanpa peninjauan dasar.
Sebagai contoh, kadang ada postingan yang tidak cocok untuk Show GN,
dan meskipun panduan sudah diberikan, ada kasus di mana jenis postingan serupa terus berulang sehingga sebagian di antaranya terpaksa dihapus.
Dengan kata lain, ada kasus ketika proyek pribadi dibagikan sebelum pengguna benar-benar memahami cara penggunaan dasar atau tujuan komunitas.
Pada dasarnya, GeekNews adalah tempat untuk berbagi berita dan informasi serta berdiskusi,
karena itu kami merasa penting agar perkenalan proyek pribadi juga diposting dengan cara yang sesuai dengan konteks tersebut.
Karena itu, kami juga sedang mempertimbangkan pendekatan agar sebelum skor tertentu atau riwayat aktivitas tertentu terkumpul, postingan Show
tidak langsung ditampilkan di daftar terbaru atau di halaman utama.
Sepertinya ini memang masalah yang terus membuat kami berpikir tentang bagaimana menjaga kualitas tanpa mengorbankan keterbukaan GeekNews.
Kesalahan titik tengah (Argument to Moderation): ini adalah logika yang secara gegabah menyimpulkan bahwa ketika ada dua klaim ekstrem (A dan Z), titik tengah di antaranya (M) pasti merupakan kebenaran atau solusi terbaik.
Ada begitu banyak kebutuhan untuk membuat sesuatu dengan murah lalu mempromosikannya,
sementara ketika kita menemukan hal-hal yang bagus, kita cenderung menyimpan dan mengelolanya sendiri.
Saya rasa sejak awal memang tidak mudah bagi informasi atau berita yang baik untuk tersebar luas.
Hehe, perlu diingat bahwa saya mungkin agak bias karena saya adalah committer bahasa Ruby.
Akan bagus kalau berbagai bahasa bisa dibandingkan lewat satu eksperimen berskala besar,
namun pengujian sebesar itu pun tidak dilakukan di tingkat perusahaan, dan ketika anggota komunitas yang mengerjakannya, rasanya sulit membuat eksperimen yang akurat.
Saya sudah mencari ke sana-sini, tetapi memang tidak mudah menemukan informasi yang benar-benar bagus.
Dan itu juga wajar, karena entah ada tidak orang yang mau mengeluarkan biaya sendiri untuk merancang eksperimen yang layak demi mengetahui bahasa mana yang lebih baik..
Saya juga merasa ini eksperimen yang punya banyak keterbatasan, tetapi tetap senang karena setidaknya ada yang mencoba..^^
Terima kasih atas materinya yang bagus. Saya juga telah memberikan hadiah lewat Wikidocs agar Anda bisa menikmati secangkir kopi.
Saya memakai 27b di hx370, dan hasilnya lumayan bagus.
Ini tampaknya contoh yang dengan jelas menunjukkan apa yang terjadi ketika bahkan kriteria keberhasilan terkait performa yang sederhana pun tidak diberikan. Agen coding yang pernah saya gunakan sejauh ini masih berfokus pada penyelesaian masalah itu sendiri, tetapi tanpa prompt awal yang eksplisit atau loop verifikasi, mereka hampir tidak pernah mengoptimalkan performa sendiri. Anda perlu memberi instruksi kepada AI seolah-olah sedang memberikan soal coding test. Terutama bahkan dalam kasus seperti ini, ketika sudah ada baseline, berharap hasil performa terbaik tanpa secara eksplisit menyatakan kondisi performa bisa dibilang sebagai semacam kelalaian dari pihak orang yang menggunakan AI.
Sayangnya, karena mayoritas mutlak adalah konsumen, ini jelas kabar buruk...
Bahkan Samsung pun saat ini terkena dampak di sisi produk jadi.
Melihat komentarnya, rupanya saat itu beliau keluar dan sedang membuat KakaoTalk.
Setahu saya, arahan implementasinya berbeda dengan OpenCode.
Beberapa dugaan mungkin saja.
Dulu ini pasar loak kerajinan tangan, tapi entah sejak kapan rasanya lebih dari separuh isinya jadi barang yang diambil dari AliExpress atau Temu.
Harus dianggap sebagai kabar baik untuk industri Korea ya.... huh
https://app.devin.ai/review
Saya belum tahu apakah ini hanya akan menjadi satu lagi metode yang lewat begitu saja, seperti kesalahan di titik tengah,
tetapi saya membagikan sebuah alat yang memungkinkan pemahaman kode dan perbaikan bug sambil melakukan review PR bersama AI.
Saya menggunakannya saat mengerjakan side project ketika saya tidak memahami perubahan kode yang dilakukan AI.
"Dalam tulisan ini, penulis membedah teks yang dihasilkan AI lalu mengungkap 6 tanda utama 'AI slop' dan struktur tersembunyi di dalamnya. Ini bukan sekadar deretan kata. Dari kosakata berlebihan seperti "delve" atau "tapestry" hingga pola kalimat yang menciptakan kesan mendalam palsu, tulisan ini membahas alasan mengapa AI tidak menulis seperti manusia. Intinya adalah memulihkan tulisan yang beragam dan tidak sempurna."
Apakah pengalamannya akan lebih baik daripada opencode?
Wow... kamu benar-benar, **tepat sasaran.**Saya sedang menggunakan Zed karena ingin lepas dari basis VSCode.
Oh, semoga versi bahasa Koreanya juga keluar.
Mungkin karena dampak AI vibe coding, HN tampaknya juga sedang memikirkan hal serupa.
Di komentar pertama, admin dang juga sempat menyebut bahwa Show HN akan dibatasi untuk sementara waktu.
GeekNews juga berada dalam situasi yang mirip.
Agar pengguna baru punya waktu untuk membiasakan diri dengan komunitas, selama 1 minggu setelah pembuatan akun, penulisan postingan dan komentar dibatasi.
Meski begitu, masih cukup banyak postingan yang naik tanpa peninjauan dasar.
Sebagai contoh, kadang ada postingan yang tidak cocok untuk Show GN,
dan meskipun panduan sudah diberikan, ada kasus di mana jenis postingan serupa terus berulang sehingga sebagian di antaranya terpaksa dihapus.
Dengan kata lain, ada kasus ketika proyek pribadi dibagikan sebelum pengguna benar-benar memahami cara penggunaan dasar atau tujuan komunitas.
Pada dasarnya, GeekNews adalah tempat untuk berbagi berita dan informasi serta berdiskusi,
karena itu kami merasa penting agar perkenalan proyek pribadi juga diposting dengan cara yang sesuai dengan konteks tersebut.
Karena itu, kami juga sedang mempertimbangkan pendekatan agar sebelum skor tertentu atau riwayat aktivitas tertentu terkumpul, postingan Show
tidak langsung ditampilkan di daftar terbaru atau di halaman utama.
Sepertinya ini memang masalah yang terus membuat kami berpikir tentang bagaimana menjaga kualitas tanpa mengorbankan keterbukaan GeekNews.
Kesalahan titik tengah (Argument to Moderation): ini adalah logika yang secara gegabah menyimpulkan bahwa ketika ada dua klaim ekstrem (A dan Z), titik tengah di antaranya (M) pasti merupakan kebenaran atau solusi terbaik.