5 poin oleh GN⁺ 2026-02-10 | 1 komentar | Bagikan ke WhatsApp
  • Sistem agen repositori otomatis yang dapat menjalankan sendiri peningkatan kode, pemeliharaan dokumentasi, penguatan pengujian, dan lainnya di dalam GitHub Actions
  • Setiap pagi, kode yang telah ditingkatkan otomatis diajukan dalam bentuk Pull Request
  • Secara otomatis menangani klasifikasi issue, analisis kegagalan CI, pemeliharaan dokumentasi, peningkatan cakupan pengujian, dan pemantauan kepatuhan
  • Semua otomatisasi didefinisikan dengan file Markdown sederhana, dan dapat diarahkan dalam bahasa alami tanpa menulis kode yang rumit
  • Menjalankan tugas berbasis event dan berkala dengan memanfaatkan berbagai engine AI seperti Copilot, Claude, Codex
  • Memperkuat keamanan dan keselamatan dengan eksekusi sandbox dan prinsip hak akses minimal
  • Dikembangkan bersama oleh GitHub Next dan Microsoft Research, serta dibekali desain berfokus pada keamanan dan guardrail yang kuat

Fitur utama (Key Features)

  • Automated Markdown Workflows
    • Menulis otomatisasi dalam Markdown, bukan YAML yang kompleks
    • Mengubah perintah berbasis bahasa alami menjadi workflow GitHub Actions
  • AI-Powered Decision Making
    • Workflow memahami konteks dan beradaptasi dengan situasi
    • AI menganalisis kode dan status repositori lalu mengambil tindakan yang sesuai
  • GitHub Integration
    • Terintegrasi secara mendalam dengan Actions, Issues, PRs, Discussions dan lainnya
    • Mengotomatiskan pengelolaan repositori secara menyeluruh
  • Safety First
    • Memperkuat keamanan melalui eksekusi sandbox, prinsip hak akses minimal, dan pemrosesan output yang aman
  • Multiple AI Engines
    • Mendukung Copilot, Claude, Codex serta prosesor AI kustom
  • Continuous AI
    • Secara otomatis meningkatkan kolaborasi dan kualitas kode melalui Continuous AI

Guardrails Built-In

  • Workflow secara default berjalan dengan izin baca-saja
  • Operasi tulis hanya diizinkan melalui safe outputs yang telah disetujui sebelumnya
  • Mengendalikan ruang gerak agen AI dengan eksekusi sandbox, whitelist alat, dan isolasi jaringan

Contoh: Daily Issues Report

  • Prosedur pembuatan otomatisasi
    • Write: Membuat file .md yang ditulis dalam bahasa alami
    • Compile: Mengubahnya menjadi workflow GitHub Actions berbentuk .lock.yml dengan perintah gh aw compile
    • Run: GitHub Actions berjalan otomatis sesuai trigger
  • Agen AI membaca konteks repositori, lalu melakukan analisis issue, pembuatan visualisasi, dan penulisan laporan
  • Seluruh proses dijalankan dalam lingkungan container untuk memastikan keamanan dan reproduktibilitas

Gallery

  • Issue & PR Management: klasifikasi otomatis, pelabelan, penyesuaian proyek
  • Continuous Documentation: pemeliharaan dokumentasi dan menjaga konsistensi
  • Continuous Improvement: penyederhanaan kode, refactoring, peningkatan gaya
  • Metrics & Analytics: laporan harian, analisis tren, pemantauan status workflow
  • Quality & Testing: diagnosis kegagalan CI, peningkatan pengujian, pemeriksaan kualitas
  • Multi-Repository: sinkronisasi dan pelacakan fitur lintas banyak repositori
  • Continuous Refactoring: analisis dan otomatisasi melalui slash command
  • Continuous Scanning & Compliance: pemindaian keamanan, klasifikasi peringatan, pemantauan kepatuhan
  • Scheduled Workflows: operasi harian, riset, dan tugas pemeliharaan otomatis

Memulai dengan CLI (Getting Started)

  • Setelah memasang extension, Anda dapat menambahkan contoh workflow dan menjalankan yang pertama dari command line hanya dalam beberapa menit
  • Instal dengan gh extension install github/gh-aw
  • Di Repo Anda, tambahkan gh aw add-wizard githubnext/agentics/daily-repo-status untuk instalasi interaktif dan eksekusi otomatis

Membuat workflow di web (Creating Workflows)

  • Di tab "Agents" pada antarmuka web GitHub, Anda dapat langsung membuat workflow agentic kustom dalam bahasa alami

1 komentar

 
GN⁺ 2026-02-10
Komentar Hacker News
  • Saya penasaran setelah melihat sintaks replace yang aneh di dalam go.mod
    Biasanya orang memakai go get github.com/Masterminds/semver/v3@v3.4.0, tetapi di PR ini(tautan) agen Copilot menambahkan replace dengan cara yang salah
    Tampaknya Dependabot membuat issue upgrade versi yang tidak perlu, lalu Copilot menanganinya sambil ikut memasukkan perubahan yang melenceng
    Reviewer sempat menunjuk bagian yang aneh, tetapi pada akhirnya tampaknya reviewer manusia lolos dan tetap di-merge. Ini contoh yang salah di banyak sisi

    • Semua agen yang pernah saya coba menimbulkan masalah serupa juga di package.json milik npm
      Alih-alih npm i foo, mereka mengisi versi hasil halusinasi (hallucinate) lewat penyuntingan string
      Rename kode juga ditangani dengan penggantian string, bukan alat refactoring, jadi sangat boros GPU
    • Ada upaya untuk memperbaiki ini, tetapi tampaknya dibatalkan di tengah jalan (tautan)
    • Setelah replace yang sama menumpuk sampai tiga kali, akhirnya diperbaiki di PR 14543
      Tetapi setelah itu ditambahkan dua commit “perbaikan unit test”; yang satu mengganti Claude → Copilot, yang satu lagi merusak markdown dokumentasi
      Rasanya sudah menjadi medan perang workflow agen
    • Untuk upgrade paket, perancangan prompt yang tepat benar-benar penting
      Saya memakai Gemini dan Codex untuk memeriksa informasi versi, lalu subagen Claude Opus untuk mengecek apakah perubahan kode diperlukan
      Jika versi mayor, saya git clone dua paket untuk membandingkan perubahan antarmuka, lalu di akhir menjalankan test untuk verifikasi
      Tidak sempurna, tetapi manusia juga tidak sempurna, jadi ya cukup baik
    • Situasi ini mengingatkan saya pada perintah secure sleep di GitHub Actions
  • Saya berharap GitHub membenahi fitur intinya terlebih dahulu
    Dulu saya berhenti memakainya setelah mengalami issue terkait GH Actions, dan setahun kemudian orang-orang masih menderita karena masalah yang sama

    • Sangat merekomendasikan Gitea
      Instalasinya mudah, dan terintegrasi baik dengan jaringan Microsoft LDAP/ADFS
      Aksi yang didefinisikan di folder .gitea dijalankan stabil oleh worker sederhana
      Anda bisa membuat pipeline CI yang sepenuhnya mandiri, dan UI-nya hampir sama dengan GitHub
    • Ada dilema konversi premium ketika makin banyak pengguna gratis berarti beban dukungan makin besar
      Pada akhirnya solusinya sederhana — beli langsung produk mereka
    • Sebagai pengguna berbayar, saya tidak suka uang saya dipakai untuk pengembangan fitur AI, bukan untuk peningkatan fitur inti
    • Langkah seperti ini terlihat seperti upaya perusahaan untuk tetap mempertahankan ilusi saham pertumbuhan
    • Saya bahkan tidak memakai Copilot, tetapi di beranda GitHub terus muncul pesan “batas terlampaui”
      Terasa seperti trik murahan untuk mendorong pembayaran
  • Ekstensi gh aw menerima file markdown sebagai input lalu membuat workflow GitHub Actions raksasa
    Saat menjalankan gh aw init, saya menekan Y pada prompt yang keliru, lalu COPILOT_GITHUB_TOKEN dibuat memakai token akun saya
    Hal seperti ini benar-benar perlu langkah konfirmasi tambahan

    • Sekarang katanya penggunaan token lokal sudah dihapus, dan langkah konfirmasi tambahan juga sudah diperkenalkan
  • Tautan resminya adalah github.com/github/gh-aw
    Saya sempat penasaran kenapa ini dipublikasikan lewat GitHub Pages tanpa domain lain

    • GitHub Pages menyediakan domain ORGNAME.github.io berdasarkan nama akun
      Artinya github.github.io dipublikasikan oleh akun resmi GitHub
    • Menurut saya, GitHub memakai produknya sendiri di domainnya sendiri adalah bentuk dogfooding
    • Tidak ada orang lain yang bisa memiliki tautan itu, jadi tidak ada risiko phishing
    • Katanya baru-baru ini dipindahkan dari organisasi githubnext ke organisasi github
      github.github.io adalah domain Pages default untuk organisasi GitHub
    • Sekarang redirect-nya sudah diperbaiki ke github.github.com/gh-aw
  • Saya menghabiskan akhir pekan membangun workflow CI berbasis agen
    Instance CC bekerja di VM terisolasi dalam mode izin terbatas, dan jika CI lolos, PR dibuat otomatis
    Sekarang saya sedang bereksperimen dengan struktur di mana satu Claude mengelola beberapa Claude lain

    • Ada yang bertanya berapa biayanya
    • Ada juga reaksi, “zaman gila”
  • Rasanya GitHub memaksakan agen masuk alih-alih memperbaiki sistem yang sudah ada
    Terlihat seperti strategi memeras uang yang digerakkan marketing

    • Meski begitu, menempatkan agen pada penyedia tersentralisasi yang bisa mengakses CI, issue, dan source code mungkin juga masuk akal
    • Claude dari Anthropic terintegrasi sangat baik dengan GitHub, sehingga agen buatan GitHub sendiri terasa tidak berguna
      Muncul kecurigaan, jangan-jangan mereka ingin mempersulit penggunaan Claude agar orang terpaksa memakai agen mereka
  • Saya justru paling tidak percaya pada GitHub Actions yang mengusung “prinsip desain berfokus keamanan”

    • Bahkan kalimat terakhir di halaman aslinya juga berbunyi, “gunakan dengan hati-hati, tanggung risiko sendiri
  • Saya paham pendekatan Microsoft dan GitHub
    Nilai kode bukan pada dirinya sendiri, tetapi pada bentuk yang memuat pengetahuan organisasi
    Karena itu, arus perbaikan yang berkelanjutan dan otomatis itu penting
    Refactoring besar-besaran merusak model mental organisasi, jadi rangkaian perbaikan kecil adalah yang ideal
    Struktur yang diinginkan adalah sistem deterministik mendeteksi masalah, lalu LLM hanya memperbaiki bagian yang diperlukan

    • Masih kurang abstraksi yang bagus untuk mendefinisikan invarian proyek dan memberikannya ke agen
      Saya jadi harus menulis panduan sangat rinci ala Deep Wiki, dan itu merepotkan
      Diperlukan alat yang bisa memvisualisasikan struktur seperti diagram C4
    • Pendekatan yang mencampur tahap algoritmik dan tahap agen, seperti pola DataOps, terasa berguna
      Dokumen terkait: pola DataOps
  • Akhir-akhir ini semua produk cloud terasa fitur inti mandek, fitur pinggiran terus bertambah
    Saat organisasi membesar, developer harus terus membuat fitur baru, jadi fenomena ini muncul
    Jika dorongan untuk pertumbuhan tanpa akhir tidak berhenti, produk akan terus mengalami enshittification

  • Dari landing page, tidak jelas nilai praktis apa yang diberikan workflow ini kepada pengguna
    Kurang contoh dan use case yang konkret

    • Ada contoh nyata di bagian galeri
      Misalnya workflow manajemen issue menunjukkan contoh otomatis mengelola PR dan issue
      Nilai utamanya adalah mendelegasikan tugas berulang yang tidak bisa ditangani dengan heuristik
      Katanya mereka masih merapikan storytelling-nya