4 poin oleh sugeuljin 2026-02-23 | 8 komentar | Bagikan ke WhatsApp

Saya berada dalam situasi di mana saya bisa menggunakan token Gemini dengan sangat murah, jadi seperti judulnya, saya memakai backend proxy yang menghubungkan Gemini ke Claude Code. CLI Gemini terlalu agresif (bahkan saat hanya diminta membaca kode, ia terus mencoba memperbaiki sesuatu), jadi kurang cocok buat saya. Menurut saya, desain agen di Claude Code bekerja paling baik, jadi meskipun backend-nya diganti, saya tetap memakainya dengan puas.

Layer proxy ini pada dasarnya menambahkan satu lapisan abstraksi lagi, sehingga OpenAI, XAI, Claude, dan Gemini semuanya bisa dihubungkan ke Claude Code dengan cara yang sama.

Saya memang harus menyelesaikan beberapa masalah yang cukup melelahkan, seperti streaming + parsing JSON, serta pemurnian skema untuk tool use. Kalau ada yang ingin mencoba hal serupa, beri tahu di komentar ya, nanti saya coba rilis sebagai open source.

Kalau ada yang pernah mengerjakan hal serupa, mohon bagikan pengalamannya~

8 komentar

 
srebaragi 2026-03-02

Pendekatan saya agak berbeda. Alih-alih memakai alat agen seperti Claude Code atau Cowork, saya mengembangkan lewat percakapan bahasa alami di web chat LLM murni. Saya memasang satu proxy di server sendiri untuk menghubungkan API Claude ↔ Gemini, lalu layanan produksi nyata (chatbot KakaoTalk, agen bahasa alami ERP) dijalankan oleh Gemini, sementara code review dan perancangan arsitektur dikerjakan sambil berdialog dengan Claude, dan manusia hanya menangani konfirmasi akhir serta deployment.
Gemini untuk pengerjaan coding, Claude untuk pemeriksaan coding, manusia untuk konfirmasi akhir — pembagian peran ini cukup cocok.
Dibanding agen berbasis editor kode (seperti Claude Code), kelebihannya adalah konsumsi token jauh lebih sedikit. Karena tanpa file I/O, kode dipertukarkan lewat percakapan dan diterapkan langsung oleh manusia. Bagian yang saya setujui adalah bahwa "desain agen Claude bekerja paling baik". Gemini CLI memang jelas cukup keras kepala (haha), jadi untuk peran pemeriksaan, Claude terasa lebih baik.

 
sugeuljin 2026-03-02

Terima kasih telah berbagi pengalaman. 👍 Saya juga setuju dengan perbedaan kecenderungan antara Gemini dan Claude.
Ternyata Anda menghubungkan dan memakai beberapa penyedia sekaligus dalam satu antarmuka web; saat melakukan coding otonom berbasis agen, ada kecenderungan untuk menulis secara dangkal ala “pengembangan yang dipimpin resume” alih-alih memikirkan desain yang baik, jadi saya juga merasa desain lebih baik dibahas dalam bentuk percakapan. ☺️

 
winterjung 2026-02-23

Saya sempat menjalankan sesuatu seperti anthropic-proxy secara lokal lalu mem-proxy dengan perintah seperti ANTHROPIC_BASE_URL=http://0.0.0.0:3000 claude untuk memakai model Gemini atau GPT lain, jadi saya penasaran karena Anda bilang ini diimplementasikan secara serverless.

 
sugeuljin 2026-02-23

Oh, ternyata ada juga open source yang ditulis dengan JS. Terima kasih 👍👍
Struktur internalnya mirip, tetapi saya menggunakannya dengan abstraksi yang sedikit lebih banyak. (soal selera)

Bahkan jika ditulis secara serverless pun, karena waktu respons LLM jauh lebih lambat, cold start sulit terasa dan tetap nyaman digunakan. Selain itu, dengan memanfaatkan fitur Function URL dari Lambda, streaming juga memungkinkan sehingga bisa sepenuhnya terakomodasi. Terutama, hal terbaiknya adalah bahkan setelah reboot pun tidak perlu menyalakan server lagi.
Di kode ini, kalau Anda mengubah bagian FastAPI saja ke format handler Lambda lalu mencoba menaikkannya ke Lambda, sepertinya akan cukup layak digunakan setelah sedikit troubleshooting.

 
superwoou 2026-02-23

https://github.com/1rgs/claude-code-proxy
Apakah ada perbedaan dengan proxy seperti ini?

 
sugeuljin 2026-02-23

Terima kasih sudah memperkenalkan library yang bagus. Kalau saya tahu lebih awal, sepertinya saya bisa membuatnya dengan lebih nyaman 👍👍
Secara internal, penanganan konversi format input/output itu sendiri tampaknya tidak terlalu berbeda,
namun kalau mencari perbedaannya, library yang Anda perkenalkan berbasis self-hosting / Docker / Python / LiteLLM, sedangkan saya mengimplementasikannya secara serverless / AWS Lambda / TS / tanpa dependensi.

 
bsh998 2026-02-23

Kalau menghubungkan Gemini ke Claude Code, memang ada kemungkinan kena suspend.
Sepertinya Anda perlu waspada terhadap insiden suspend massal pada opencode.

 
sugeuljin 2026-02-23

Terima kasih atas komentarnya yang cepat. 🙌
Masalah penghentian Open Code (langganan Claude => integrasi Open Code) terjadi karena kunci paket berlangganan tetap yang diautentikasi dengan OAuth digunakan di perangkat lunak pihak ketiga, sehingga menimbulkan masalah. Jika digunakan seperti di atas, Anda perlu menerbitkan API key dan memakainya dengan skema bayar sesuai pemakaian, dan itu bukan pelanggaran terhadap syarat dan ketentuan.