- Dalam pekerjaan teknis, LLM terbuka masih memiliki biaya dalam hal performa, kompatibilitas, dan keandalan, tetapi belakangan kesenjangannya mengecil sehingga peluang untuk mengurangi ketergantungan pada model proprietari seperti Claude atau GPT makin besar
- Dulu Linux berisiko untuk pekerjaan profesional karena kompatibilitas MS Office, format file khusus, dan ekosistem open source yang belum matang, tetapi penyebaran web app dan kematangan ekosistem telah sangat mengurangi pengorbanan tersebut
- Per 21 Juni 2026, posisi teratas Artificial Analysis intelligence leaderboard ditempati model API proprietari seperti Claude dan GPT, dan Claude code serta API utama masih unggul dalam kemudahan penggunaan dan kepercayaan di dalam organisasi
- Model terbuka bisa digunakan melalui penyedia model atau pihak ketiga seperti OpenRouter, tetapi ada kekhawatiran privasi dan berbagi data; jika dijalankan sendiri, privasi membaik tetapi muncul beban biaya, kompleksitas, dan kecepatan
- Penerapan ID verification oleh Claude membuat biaya untuk berhenti memakai model papan atas kembali dipertimbangkan, tetapi karena model terbuka sudah mendekat hingga hanya tertinggal beberapa bulan dari yang terdepan, penurunan produktivitas jangka pendek mungkin bukan hambatan yang menentukan
Posisi LLM terbuka saat ini dilihat dari biaya perpindahan ke Linux
- Dulu menggunakan Linux bisa menimbulkan risiko profesional bahkan dalam pekerjaan teknis
- Dokumen Word atau PowerPoint bisa saja tidak dirender dengan benar
- Ada situasi ketika harus mempercayai hasil ekspor dari Open Office
- Sulit membuka format file khusus dengan mudah sehingga kolaborasi bisa menjadi susah
- Proyek open source yang berusaha mengejar fitur perangkat lunak arus utama memiliki banyak bagian yang masih kasar
- Sekarang, perangkat lunak produktivitas sering tersedia sebagai web app, dan Linux serta perangkat lunak open source telah matang sehingga kesenjangannya menyempit
- Perangkat lunak untuk bidang tertentu seperti CAD mungkin masih memerlukan Windows
- Namun Linux dan open source tidak lagi menuntut pengorbanan besar untuk pekerjaan umum seperti dulu
Biaya yang masih harus ditanggung pengguna model terbuka
- Bagi pengguna LLM terbuka, masih ada penalti yang jelas
- Per 21 Juni 2026, Claude dan GPT berada di posisi atas Artificial Analysis intelligence leaderboard
- Bukan hanya performa, Claude code dan API utama juga kuat dalam kompatibilitas dan kemudahan penggunaan
- Mengirim kueri LLM ke OpenAI dan Anthropic telah memperoleh tingkat kepercayaan yang dapat diterima banyak orang
- Jalur menggunakan model terbuka lewat API disertai masalah kepercayaan
- Model bisa disajikan langsung oleh penyedianya atau oleh pihak ketiga seperti OpenRouter
- Untuk mengirim panggilan API yang memuat data klien atau data rahasia, ada rasa tidak aman yang lebih besar dari sisi privasi dan berbagi data
- Jika mengirim permintaan ke Deepseek atau OpenRouter, terlepas dari risiko nyatanya, kekhawatirannya bisa lebih besar
- Menjalankan sendiri mengurangi masalah privasi, tetapi menambah beban biaya, kompleksitas, dan kecepatan
- Bisa dijalankan secara lokal atau di cloud
- Menjalankan sendiri disertai setidaknya dua dari tiga masalah berikut: mahal, rumit, atau relatif lambat
Verifikasi ID Claude yang menjadi pemicu perpindahan
- Penerapan identity verification oleh Claude mempercepat keputusan untuk berpindah
- Safeguards baru pada model terbaru dan situasi terkait Mythos belakangan juga dipandang sebagai tanda bahwa pengalaman pengguna bisa memburuk
- Jika tidak menerima ID verification, kerugian profesional karena kehilangan akses ke model papan atas tetap menjadi masalah utama
- Perpindahan ke model terbuka dinilai jauh lebih dekat dibanding kesenjangan Linux dan Windows pada 2008
- Sudah ada lingkungan untuk menjalankan berbagai model terbuka secara lokal maupun di cloud
- Sudah ada coding harness untuk model terbuka
- Model terbuka telah sangat mendekati model terdepan dan biasanya hanya tertinggal beberapa bulan
- Produktivitas mungkin turun dalam jangka pendek, tetapi seperti berpindah dari Matlab ke GNU Octave pada masa riset, ini dianggap bukan hambatan yang menentukan
1 komentar
Komentar Hacker News
Itulah tepatnya alasan saya memakai aturan routing berikut di eurouter.ai untuk semua permintaan
Memang mahal, tetapi setidaknya secara hukum privasi data terjamin. Saya lebih percaya ini daripada Anthropic, OpenAI, atau OpenRouter
Secara pribadi, saya sulit menerima secara moral penggunaan alat AI dari AS, dan saya tidak ingin membayar mereka untuk mendukung kejahatan yang mereka terlibat di dalamnya[1]
[1]: https://news.ycombinator.com/item?id=48512339
Bagian yang membuat saya keberatan dengan red line Anthropic adalah frasa “of Americans”. Jadi apakah itu berarti mereka bebas melakukan apa saja terhadap seluruh dunia beradab lainnya? Apakah tidak masalah membuat negara-negara sekutu di luar AS menjadi tidak stabil lewat pengujian yang dimanipulasi atau kebocoran data dalam machine learning?
Yang lebih aneh lagi, mereka mengklaim model mengikuti https://www.anthropic.com/constitution dan bahwa isinya sudah tertanam di model. Namun system prompt Claude Code dan cowork mengulangi butir-butir seperti ini lagi. Jika memang benar-benar tertanam, seharusnya itu tidak perlu
Dengan prompt engineering yang cukup pada Claude versi API, Anda bisa membuatnya bertindak seperti pendukung Hitler, dan itu bertentangan langsung dengan klaim mereka. Khususnya Opus 4.7 dengan senang hati membuat propaganda yang menargetkan kelompok minoritas tertentu, tetapi pada 4.8 saya belum melihat keberhasilan yang sama. Akhir-akhir ini saya lebih tertarik pada penyalahgunaan kemampuan siber model, jadi saya tidak terlalu mendorong jauh ke arah itu
Sejak awal, kesimpulannya adalah bahwa strategi Anthropic murni pengelolaan citra, dan melihat banyaknya dukungan terhadap perusahaan itu, bisa dibilang strategi tersebut cukup berhasil
Saya melihat eurouter.ai, dan usulannya tampak sangat buruk
Harga dengan markup 15% untuk akun gratis juga tidak masuk akal, dan ada batas 1000 permintaan per bulan kecuali Anda membayar 40€ per bulan. Namun saya tidak paham nilai persis apa yang mereka berikan
Untuk DeepSeek-V4-Pro hanya ada satu penyedia, yaitu TensorX, dan biaya pembacaan cache lebih dari 100 kali lebih mahal daripada DeepSeek ($0.44 vs $0.003625). Khususnya di eurouter.ai saya bahkan tidak bisa menemukan informasi biaya token cache, jadi saya harus melihat situs web TensorX
Bahkan kata “kejahatan” pun terasa kurang kuat
“AI-assisted targeting in the Gaza Strip” - https://en.wikipedia.org/wiki/AI-assisted_targeting_in_the_G...
“Palantir allegedly enables Israel's AI targeting in Gaza, raising concerns over war crimes” - https://www.business-humanrights.org/de/neuste-meldungen/pal...
“What The Wounds Are Telling Us” - https://www.volkskrant.nl/kijkverder/v/2025/gunshot-palestin...
Saya jadi penasaran dengan alternatif lain untuk OpenRouter, lalu mencari-cari sebentar
EURouter (Amsterdam): https://www.eurouter.ai/pricing
Eden AI (Prancis): https://www.edenai.co/pricing
nexos.ai (Lithuania): https://nexos.ai/pricing/
Requesty (Jerman): https://www.requesty.ai/pricing
Cortecs (Austria): https://cortecs.ai/pricing
Nordference (Estonia): https://nordference.ai/pricing
Rasanya mereka benar-benar bermunculan seperti jamur. Saya belum pernah memakainya secara langsung, jadi saya tidak merekomendasikan satu pun, tetapi tampaknya ada pilihan bagi orang yang membutuhkannya
Jika keamanan data benar-benar menjadi kekhawatiran, pada akhirnya tampaknya tidak ada solusi selain menerima konsekuensinya dan melakukan self-hosting
Menarik melihat orang-orang menyingkirkan model berbobot terbuka hanya karena dianggap “tertinggal beberapa bulan” dibanding model tertutup.
Saya tahu laju perkembangan LLM sangat cepat, tetapi jika Opus dan GPT beberapa bulan lalu benar-benar setara dengan model berbobot terbuka saat ini, tidak ada alasan untuk tidak beralih. Terutama jika Anda memang sudah memakai model-model itu sejak beberapa bulan lalu.
Basis kodenya juga tidak berubah, jadi tinggal pakai model berbobot terbuka. Jangan memindahkan tiang gawang.
Jadi tidak ada masalah sama sekali memakai Kimi-2.7, GLM-5.2, dan Deepseek-v4. Kita sudah cukup dekat dengan batas atas, dan sekarang sebagian besar peningkatan tampaknya datang dari perbaikan harness yang membuat penalaran atau pemanggilan alat sedikit lebih baik, serta reinforcement learning yang sedikit lebih baik.
Saya masih belum yakin bahwa bahkan model berbobot terbuka terbaik saat ini pun setara dengan Opus dari beberapa bulan lalu. Saya tahu benchmark mengatakan begitu dan ekspektasi saya juga tinggi, tetapi pengalaman penggunaan nyata saya tidak sesuai dengan benchmark tersebut.
Saya melakukan banyak tugas yang bahkan membuat Opus 4.8 kesulitan. Dalam situasi di mana LLM tercanggih pun belum sepenuhnya sampai ke sana, saya tidak punya motivasi untuk pindah ke model yang lebih tertinggal.
Moat-nya terlalu datar, paling cuma setara bonus +1 makanan, +1 produksi. Kalau ada jalan, +1 emas.
Hal yang menakjubkan dari model-model ini adalah bahwa pada dasarnya mereka telah mendistilasi internet menjadi bentuk yang bisa dimasukkan ke mesin lokal, lalu dapat ditanyai dengan bahasa alami.
Teknologi dan hardware membaik lebih cepat daripada laju pertumbuhan basis pengetahuan yang perlu didistilasi, jadi tampaknya tak terhindarkan bahwa model lokal yang benar-benar berguna akan menjadi mungkin.
Sikap tulisan ini terasa cukup mengejutkan. Di satu sisi, ia dimulai dengan kisah menerima Linux dan perangkat lunak bebas/open source lainnya, padahal inti FOSS adalah memungkinkan pengguna memahami dan memodifikasi perangkat lunak yang mereka jalankan.
Namun sisanya adalah cerita tentang memakai LLM, alat yang tidak bisa dimodifikasi ataupun dipahami oleh penulis. Matriks floating-point raksasa, dalam penilaian paling murah hati, hanya bisa disejajarkan dengan kode yang sudah dikompilasi, dan dalam praktiknya kadang lebih mudah memahami perangkat lunak tertutup dengan mendekompilasinya.
Ditambah lagi, dalam kebanyakan kasus, untuk menjalankan model “terbuka” pun dibutuhkan hardware yang sulit ditanggung. Saya tidak tahu bagaimana kita bisa sampai di titik ini dari tempat yang dulu memuji kebebasan perangkat lunak.
Judulnya berbicara dengan nada pasti, tetapi di isi tertulis “semoga diminimalkan”.
Saya memakai beberapa langganan, menguji berbagai penyedia LLM lewat OpenRouter per token, dan juga menjalankan model berbobot terbuka secara lokal.
Saya masih sulit setuju. Model Anthropic dan OpenAI memang jauh lebih baik daripada yang lain. Model berbobot terbuka secara umum terasa terlalu dioptimalkan untuk benchmark, dan pengalaman nyata sangat berbeda dari yang disiratkan benchmark.
Saat mengatakan pengalaman seperti ini, saya sering kena downvote karena itu bukan kenyataan yang ingin didengar orang saat ini, tetapi untuk pekerjaan kompleks memang begitulah faktanya.
Saya pikir untuk banyak tugas yang mudah, model berbobot terbuka sudah cukup jika ditangani pengguna yang berpengalaman. Jika itu jenis pekerjaan yang bisa diserahkan ke junior dengan sedikit pengawasan, model apa pun bisa melakukannya.
Tetapi dalam banyak tugas yang saya kerjakan, bahkan Opus 4.8 Max pun tetap harus saya awasi dengan cermat, diberi arahan, dan ditinjau. Fable juga begitu, hanya tidak separah itu.
Saat mencoba model berbobot terbuka yang besar, di lokal kecepatannya tidak masuk akal pada tingkat kuantisasi yang masih bisa ditoleransi, jadi akhirnya dipakai lewat hosting. Untuk tugas besar, waktu terasa makin lama karena kita membakar token sambil menunggu output yang kemungkinan besar tetap akan dibuang. Saya berharap level itu segera tercapai, tetapi sekarang belum.
Claude baru mulai terasa layak dipakai untuk coding setelah mencapai 4.6. Setelah itu memang masih ada tambahan fitur yang bagus untuk dimiliki, tetapi jika Sonnet 4.6 dan Opus berbobot terbuka, rasanya saya tidak akan butuh apa-apa lagi.
Keyakinan itu makin kuat setelah sedikit mencoba Fable.
Saya ingin lebih terbiasa dengan inferensi lokal, tetapi tidak punya hardware, jadi saya mulai memikirkan sesuatu seperti koperasi lokal yang tampaknya jarang dibahas.
Dari sisi ekonomi, mungkin masuk akal jika beberapa orang bergabung untuk menjalankan hardware bagus dan model terbuka, tetapi saya belum pernah melihat pembahasan seperti itu. Jadi saya bertanya-tanya apakah saya yang melewatkannya.
Akan sangat keren jika ada layanan yang membantu orang-orang yang ingin ikut model seperti itu untuk saling menemukan.
Bahkan sekarang ada postingan di bagian teratas /r/localllama yang membahas hitungan persis ini: https://www.reddit.com/r/LocalLLaMA/comments/1ubrcwj/tokenom...
Singkatnya, menjalankan GLM 5.2 butuh setidaknya sekitar 20 ribu dolar, dan akan terasa menyakitkan lambatnya dibanding versi cloud-hosted. Bahkan dengan asumsi server menghitung token 24 jam sehari, tetap butuh bertahun-tahun untuk mencapai titik impas.
Satu-satunya alasan menjalankannya secara lokal adalah jika privasi data penuh adalah prioritas utama. Untuk itu, Anda pada dasarnya membayar premi yang tinggi.
Memang begitu, tapi OpenAI juga harganya sama. z.ai itu US$18 per bulan. Kenapa harus bayar itu kalau OpenAI US$20 per bulan?
Sementara itu Z.ai Lite (US$18/bulan) memberi sekitar 80 kali untuk GLM 5.2 dalam kasus terburuk. Itu berdasarkan jam non-puncak, dan jam puncaknya adalah pukul 02.00–06.00 waktu New York. Jadi Z.ai bisa memberi batas yang lebih tinggi dengan harga yang lebih murah
(https://codeberg.org/mutablecc/calculate-ai-cost/src/branch/...)
Ada masa ketika Linux jelas sangat mumpuni, tetapi untuk membuatnya enak dipakai perlu banyak oprek dan usaha tambahan, sehingga mudah merasa seperti pembangkang saat memakainya
Namun dari pengalaman saya, model terbuka masih belum sampai ke titik itu, baik dari sisi kemampuan maupun kebutuhan operasional. GLM5.2 memang terlihat mumpuni, tetapi untuk menjalankannya pada tingkat kemampuan seperti itu kemungkinan perlu klaster GPU yang sangat besar
Kalau Anda mengakses model terbuka lewat API hosting, jadinya tidak berbeda dengan memakai model tertutup lewat API hosting. Dibandingkan saat memakai Linux 15 tahun lalu, insentifnya runtuh
Jangan salah paham. Saya ingin bisa puas menjalankan model lokal, tetapi sekarang belum waktunya
Intinya adalah karena tidak dikendalikan oleh satu pihak tunggal, Anda tidak bisa dikenai enshittification. Itu sudah pernah terjadi, sedang terjadi sekarang, dan akan terus terjadi
Dengan bobot terbuka, Anda tidak akan mudah digiring, dikunci, atau diputus aksesnya. Kalaupun ada perusahaan yang mencoba begitu, orang lain yang punya server farm bisa menerima Anda sebagai pelanggan, dan yang perlu diubah di alur kerja Anda hanya URL API dan key-nya
Anda tetap akan berbicara dengan model yang sama persis, dengan kepribadian dan pengetahuan yang sama
Saya agak setuju dengan arah besar tulisannya, tetapi ada dua hal
Pertama, dalam pengujian saya, model terbuka masih belum setara untuk bersaing dengan Claude Opus dalam pengembangan perangkat lunak dan pekerjaan terkait rekayasa, setidaknya untuk saat ini
Kedua, nikmati selagi masih ada. Saya akan benar-benar terkejut kalau sekitar akhir tahun ini model-model terbuka seperti ini tidak dinyatakan “ilegal” dengan dalih keamanan. Saya menyebutnya dalih karena pendorong utamanya kemungkinan besar adalah penangkapan regulasi dan proteksionisme industri