Startup AI Asia meluncurkan model pengganti Anthropic Mythos

(techcrunch.com)

1 poin oleh GN⁺ 4 jam lalu | 1 komentar | Bagikan ke WhatsApp

Ketika pembatasan akses ke Mythos·Fable 5 oleh pemerintah AS berkepanjangan, Sakana AI dari Jepang dan 360 dari Tiongkok masing-masing membidik kekosongan yang muncul dengan Fugu dan Tulongfeng/Yitianzhen
Fugu dari Sakana AI diperkenalkan sebagai model yang mampu bersaing dengan Fable 5 dan Mythos Preview, serta dirancang sebagai model untuk agen yang mengoordinasikan API dari berbagai model
Tulongfeng dari 360 berfokus pada penemuan otomatis kerentanan perangkat lunak, sementara Yitianzhen berfokus pada otomatisasi pertahanan siber dan respons insiden
Sakana AI mengatakan waktu peluncurannya kebetulan, tetapi tetap menonjolkan “frontier capability without export control risk” sambil membidik perusahaan Jepang dan lembaga pemerintah
Pentingnya model AS masih tetap ada, tetapi pembatasan ekspor menjadi pemicu yang mempercepat hadirnya alternatif regional dari Tokyo dan perusahaan-perusahaan Tiongkok yang disesuaikan dengan bahasa dan konteks lokal

Kekosongan model akibat pembatasan ekspor Anthropic

Reuters melaporkan bahwa perusahaan keamanan siber Tiongkok 360 pada hari Rabu memperkenalkan Tulongfeng
- 360 menyatakan bahwa Tulongfeng dapat menandingi Mythos, model AI khusus keamanan siber dari Anthropic
- Mythos dan versi yang lebih dibatasi, Fable 5, saat ini tidak disediakan untuk pengguna non-AS karena kebijakan pemerintahan Trump
Awal pekan yang sama, Sakana AI yang berbasis di Tokyo meluncurkan Fugu, yang berarti ikan buntal dalam bahasa Jepang
- Fugu disebut “setara dengan model terdepan seperti Fable 5 dan Mythos Preview dari Anthropic”
- Model ini dirancang untuk agen dan dapat mengoordinasikan akses API ke model lain
Kedua produk tersebut muncul dua minggu setelah perintah pemerintah AS terkait Anthropic diumumkan

Strategi Fugu dari Sakana AI

Juru bicara Sakana AI mengatakan bahwa tumpang tindih antara peluncuran Fugu dan pembatasan ekspor Mythos/Fable adalah “entirely coincidental”
- Namun, situs web perusahaan mempromosikan “frontier capability without export control risk”
- Sakana AI menjelaskan bahwa Fugu telah dikembangkan sejak tahun lalu, dan riset terkait dipresentasikan pada ICLR musim semi tahun ini
Perusahaan ini didirikan bersama pada 2023 oleh David Ha dan Llion Jones yang sebelumnya di Google, serta Ren Ito yang sebelumnya di Mercari dan Stability AI
- Perusahaan membuat model AI generatif berbiaya rendah yang bekerja baik dengan dataset kecil dan dioptimalkan untuk bahasa Jepang serta budaya Jepang
Target pelanggan Fugu adalah perusahaan Jepang dan lembaga pemerintah yang ingin mengurangi paparan terhadap kontrol ekspor yang makin ketat
- Sakana AI tidak melihat ini sebagai arus Asia yang akan meninggalkan AI AS secara permanen
- Seorang juru bicara mengatakan, “U.S. models remain important to Asia”
Dalam tulisan untuk Project Syndicate, Ren Ito berpendapat bahwa prioritas pertama pemerintah federal AS seharusnya menjaga akses bagi sekutu dekat, dan bahwa AI bukan teknologi yang ditimbun melainkan teknologi yang dikembangkan bersama
Di X, David Ha menulis, “Orchestration Models are the next frontier, beyond bigger models”
- Ia menilai bergantung pada satu penyedia untuk infrastruktur nasional itu berisiko, dan kontrol ekspor terbaru membuat risiko itu tidak bisa lagi diabaikan
- Ia menulis, “Access to top models can disappear overnight”, sembari menggambarkan kecerdasan kolektif sebagai lindung nilai praktis terhadap konsentrasi kekuasaan

AI keamanan 360 dan logika aset strategis

Menurut laporan Reuters dan Quartz, 360 memperkenalkan dua alat keamanan AI
- Tulongfeng: dirancang untuk secara otomatis menemukan kerentanan perangkat lunak
- Yitianzhen: dibuat untuk mengotomatiskan pertahanan siber dan respons insiden
Menurut laporan Reuters, pendiri 360 Zhou Hongyi memandang AI pendeteksi kerentanan sebagai aset strategis nasional
- Ia menyoroti risiko “one-way transparency” ketika hanya sebagian pihak yang memiliki akses ke kemampuan deteksi kerentanan tingkat lanjut
360 tidak menanggapi permintaan komentar dari TechCrunch

Pertumbuhan Anthropic dan naiknya alternatif regional

Anthropic sebelumnya mengatakan bahwa pada Mei 2026 pendapatan tahunan yang disetahunkan telah melampaui 47 miliar dolar AS
- Tidak diungkap seberapa besar ketergantungannya pada pelanggan korporat di Asia
Dalam beberapa minggu setelah perintah ekspor berlaku, Sakana AI dan 360 masuk mengisi ruang kosong yang ditinggalkan oleh pembatasan akses ke model Anthropic
Bahkan jika perusahaan-perusahaan AS dapat memulihkan kepercayaan setelah larangan berakhir, alternatif regional yang dilatih untuk lebih memahami bahasa lokal dan nuansa setempat sudah mulai mengisi kekosongan itu

1 komentar

GN⁺ 4 jam lalu

Opini Hacker News

Saya mencoba model Fugu untuk pekerjaan nyata di C# dan Unity dengan MCP serta OpenCode, tetapi satu kali ulasan sistem tema dan rencana perubahan warna langsung menghabiskan batas 5 jam pada paket $20
Saya naik ke paket $100 untuk melihat hasil implementasinya, tetapi hasilnya lebih buruk daripada Opus dan sangat lambat; batas 5 jam yang baru juga habis, dan 35% dari batas mingguan terpakai, tetapi hasilnya masih jauh dari level yang biasanya dicapai Opus dengan waktu dan biaya yang jauh lebih sedikit
Silakan nilai sendiri informasi ini, tetapi tampaknya seperti pemborosan uang
- Fugu bukan model independen, melainkan arsitektur yang memanggil beberapa model SaaS yang sudah ada seperti OpenAI dan Anthropic di belakang layar, lalu menggabungkan responsnya untuk membuat hasil
  Mereka mengklaim bahwa setelah mengombinasikan hasil dari beberapa model AI lalu membuat hasil akhir dengan model proprietary mereka sendiri, kualitasnya menjadi lebih baik daripada satu model backend saja, tetapi saya meragukan apakah model mereka sendiri itu benar-benar ada dan cukup mumpuni
  Bahkan jika klaimnya benar, ini tampaknya mudah diimplementasikan dengan membuat sisi klien seperti Claude Code menghasilkan hasil akhir menggunakan model dengan performa serupa model latar belakang, dan layanan ini terasa mencurigakan
- Dari posisi saya yang menyediakan layanan serupa untuk Godot, bukan Unity, masuk akal jika model kelas atas seperti Opus membuat paket $20 habis untuk satu prompt
  Jika membayar harga API apa adanya dan tidak mampu menanggung subsidi 10x, jadinya memang begitu
- Saya menguji Fable di Cursor, lalu meminta ide agar situs web data yang saya buat terlihat tidak terlalu “seperti Claude”; dalam 10 menit ia menghabiskan $40 dan menghasilkan styling CSS paling tidak berguna dan paling terasa seperti Claude
  Situs web itu sendiri dibuat dengan Opus, jadi bisa dibilang hasilnya lebih buruk daripada Opus
  Saya juga mengalami hal yang sama dengan model Amerika, jadi mungkin model-model Asia itu juga sejenis Mythos
- Penasaran Unity MCP mana yang dipakai
  Saya sedang mencoba MCP resmi, dan ingin tahu apa yang dipakai orang lain
  Yang terkenal dari coplay mengalami konflik paket di tempat saya
- Untuk pencarian/riset web juga mirip, dan buruk dibandingkan Opus
  Separuhnya terlewat, dan separuh sisanya berupa informasi lama atau tidak diverifikasi
Fugu Ultra tampaknya sebenarnya bukan model, melainkan sistem yang merutekan ke beberapa model, lebih mirip harness cloud, dan terlihat mirip Fusion dari OpenRouter
“Bukan satu model raksasa, Fugu adalah sistem orkestrasi multi-agen terlatih. Ini adalah model bahasa yang dilatih untuk merutekan tugas ke kumpulan model dasar yang dapat diganti-ganti dan memanggil instance dirinya sendiri secara rekursif.” - https://openrouter.ai/sakana/fugu-ultra
[0] https://sakana.ai/fugu/
[1] https://openrouter.ai/openrouter/fusion
Istilah “Mythos-like” mulai terasa menjengkelkan
Pengguna umum tidak punya cara membandingkannya selain melihat benchmark
- “Mythos-like” hanya berarti dihype berlebihan oleh rumor, dan di sini istilah itu digunakan dengan tepat
- Startup AI Asia juga membuat klaim berani sementara tidak ada cara nyata untuk membandingkannya, dan inti campur tangan Trump bisa dilihat sebagai upaya mencegah distilasi Faible
- Bukankah tidak ada benchmark publik juga?
Jika tidak ada benchmark yang dapat dipercaya, kemiripan mereka dengan Mythos hanya berarti sama-sama menerima teks sebagai input dan menghasilkan teks sebagai output
- Sekarang saya hampir tidak melihat benchmark lagi
  Ketika ada model baru, saya langsung mencobanya pada codebase perangkat lunak sistem proprietary berskala besar kami dan produk rilis nyata, atau proyek yang suatu saat akan dirilis
  Model mana yang membuat pekerjaan lebih baik atau lebih cepat cukup jelas, dan saat ini saya cukup beruntung punya anggaran token yang bisa dipakai sebanyak yang diperlukan
  Saya tidak butuh benchmark, evaluasi, pemasaran, atau system card; di web saya hanya membaca tips, cara kerja praktik, dan kabar rilis
  Saya berbagi pengalaman dengan rekan kerja, tetapi selebihnya hanyalah noise
- Jika ia dihype berlebihan seperti Mythos, itu juga bisa ditambahkan ke daftar “Mythos-like”
  Yang mungkin kurang hanyalah adegan CEO memperingatkan dunia bahwa “model kami terlalu berbahaya untuk dirilis ke internet, jadi seseorang harus menghentikannya sebelum terlambat”
- Ada benchmark di makalahnya: https://arxiv.org/abs/2606.21228
Daftar investornya mengesankan: https://sakana.ai/company-info/?lang=en
Beberapa hari lalu juga masuk headline HN dan komentarnya lebih dari 100: https://news.ycombinator.com/item?id=48624782
- Apakah perusahaan-perusahaan ini pernah merilis model sebelumnya?
  Sulit dipercaya mereka tiba-tiba merilis model setara Mythos
  DeepSeek, Z.ai, Alibaba/Qwen sudah jauh lebih lama mengerjakannya dan selama 18 bulan terakhir terus merilis model yang performanya meningkat stabil
  Sulit dipercaya perusahaan-perusahaan baru tiba-tiba mengeluarkan model setara Mythos tanpa rilis sebelumnya
- Tahun lalu juga ada penarikan klaim yang cukup memalukan
  https://techcrunch.com/2025/02/21/sakana-walks-back-claims-t...
Sebelum tahun ini berakhir, sepertinya akan ada pelarangan LLM asing dengan alasan “kekhawatiran keselamatan”
Itu tidak akan bergantung pada performa sebenarnya
Namun Anthropic sudah menetapkan baseline untuk sistem sejenis Mythos, dan apa pun yang memenuhi standar yang didefinisikan longgar itu kemungkinan akan diperlakukan sebagai berbahaya bagi publik
- Secara nyata, bagaimana itu bisa bekerja?
- Kalau begitu, selamat tinggal teknologi Amerika dan selamat datang Tiongkok
  Tidak ada yang akan menunggu, dan jin yang sudah keluar tidak bisa dimasukkan kembali ke botol
- Tidak masuk akal berbicara seolah-olah tidak ada bahaya nyata meskipun model berkembang
  Rasanya seperti hidup di realitas lain, di mana pada titik ini hanya Claude yang tampaknya mengatakan hal cerdas
  Hampir semua tulisan manusia terlihat seperti halusinasi dan omong kosong performatif
Kalau dilihat secara sinis, selama modelnya cukup bagus, akan sulit membantah klaim bahwa itu setara Mythos
Karena sekarang Mythos sudah tidak bisa digunakan
- Seperti apa sih Mythos itu?
  Saya penasaran sebagai orang yang dulu tidak punya akses
Kesan pertama saya adalah “kalau tidak ada benchmark pihak ketiga, enyahlah”
Secara pribadi saya belum pernah mendengar kedua perusahaan ini
Apa kami diminta percaya begitu saja bahwa mereka setara dengan model-model terbaik di pasar?
Sakana menjelaskan modelnya sebagai “Orchestration Model”; apakah itu berarti sebenarnya mereka merangkai beberapa model?
- Apakah membuat model yang bagus memang sesulit itu, atau apakah kuncinya adalah skala sumber daya yang dimasukkan ke pelatihan?
  Saya benar-benar bertanya karena tidak tahu
  Tentu ini bukan hal sepele, tetapi apakah membangunnya di atas teknik-teknik lama yang sudah diketahui membutuhkan pengetahuan rahasia kelas dunia?
  Rasanya masih ada banyak buah yang menggantung rendah untuk dieksplorasi, dan waktu serta sumber daya menjadi faktor pembatas
- Komentar-komentar pada tulisan rilis yang baru-baru ini muncul di HN cenderung melihatnya lebih mirip OpenRouter daripada model sungguhan
- Menurut kesan saya, benar begitu
  Tampaknya mereka mengklaim strukturnya bukan campuran model baru, melainkan semacam perekat yang ditempelkan secara dinamis saat itu juga
  Reaksi saat itu juga bisa dilihat di sini: https://news.ycombinator.com/item?id=48624782 (6 hari lalu, 244 poin, 133 komentar)
- Apakah Anthropic memberikan benchmark pihak ketiga?
  Apakah waktu itu kalian juga berkata begitu?
  Itu memang penting, tetapi sikapnya keliru
Saya orang sederhana: kalau tidak ada benchmark di https://arena.ai/leaderboard, berarti 100% penipuan
- Bagaimana kalau dibandingkan dengan ARC AGI?
Seperti banyak komentar di sini, saya juga menguji Fugu dan beberapa model lain, dan model-model itu cukup mahal
$20 tidak cukup untuk menyelesaikan seluruh workflow, sementara dengan Opus bisa
Tentu saja, kalau menginginkan hasil terbaik, Opus pun mungkin perlu prompt yang lebih dipoles sejak awal, tetapi sejauh ini itulah pengalaman saya
Tes berikutnya akan saya lakukan dengan sistem agentic dan melihat performanya

Startup AI Asia meluncurkan model pengganti Anthropic Mythos

Kekosongan model akibat pembatasan ekspor Anthropic

Strategi Fugu dari Sakana AI

AI keamanan 360 dan logika aset strategis

Pertumbuhan Anthropic dan naiknya alternatif regional

Bacaan terkait

1 komentar

Opini Hacker News