1 poin oleh GN⁺ 4 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • Ketika pembatasan akses ke Mythos·Fable 5 oleh pemerintah AS berkepanjangan, Sakana AI dari Jepang dan 360 dari Tiongkok masing-masing membidik kekosongan yang muncul dengan Fugu dan Tulongfeng/Yitianzhen
  • Fugu dari Sakana AI diperkenalkan sebagai model yang mampu bersaing dengan Fable 5 dan Mythos Preview, serta dirancang sebagai model untuk agen yang mengoordinasikan API dari berbagai model
  • Tulongfeng dari 360 berfokus pada penemuan otomatis kerentanan perangkat lunak, sementara Yitianzhen berfokus pada otomatisasi pertahanan siber dan respons insiden
  • Sakana AI mengatakan waktu peluncurannya kebetulan, tetapi tetap menonjolkan “frontier capability without export control risk” sambil membidik perusahaan Jepang dan lembaga pemerintah
  • Pentingnya model AS masih tetap ada, tetapi pembatasan ekspor menjadi pemicu yang mempercepat hadirnya alternatif regional dari Tokyo dan perusahaan-perusahaan Tiongkok yang disesuaikan dengan bahasa dan konteks lokal

Kekosongan model akibat pembatasan ekspor Anthropic

  • Reuters melaporkan bahwa perusahaan keamanan siber Tiongkok 360 pada hari Rabu memperkenalkan Tulongfeng
    • 360 menyatakan bahwa Tulongfeng dapat menandingi Mythos, model AI khusus keamanan siber dari Anthropic
    • Mythos dan versi yang lebih dibatasi, Fable 5, saat ini tidak disediakan untuk pengguna non-AS karena kebijakan pemerintahan Trump
  • Awal pekan yang sama, Sakana AI yang berbasis di Tokyo meluncurkan Fugu, yang berarti ikan buntal dalam bahasa Jepang
    • Fugu disebut “setara dengan model terdepan seperti Fable 5 dan Mythos Preview dari Anthropic”
    • Model ini dirancang untuk agen dan dapat mengoordinasikan akses API ke model lain
  • Kedua produk tersebut muncul dua minggu setelah perintah pemerintah AS terkait Anthropic diumumkan

Strategi Fugu dari Sakana AI

  • Juru bicara Sakana AI mengatakan bahwa tumpang tindih antara peluncuran Fugu dan pembatasan ekspor Mythos/Fable adalah “entirely coincidental
    • Namun, situs web perusahaan mempromosikan “frontier capability without export control risk”
    • Sakana AI menjelaskan bahwa Fugu telah dikembangkan sejak tahun lalu, dan riset terkait dipresentasikan pada ICLR musim semi tahun ini
  • Perusahaan ini didirikan bersama pada 2023 oleh David Ha dan Llion Jones yang sebelumnya di Google, serta Ren Ito yang sebelumnya di Mercari dan Stability AI
    • Perusahaan membuat model AI generatif berbiaya rendah yang bekerja baik dengan dataset kecil dan dioptimalkan untuk bahasa Jepang serta budaya Jepang
  • Target pelanggan Fugu adalah perusahaan Jepang dan lembaga pemerintah yang ingin mengurangi paparan terhadap kontrol ekspor yang makin ketat
    • Sakana AI tidak melihat ini sebagai arus Asia yang akan meninggalkan AI AS secara permanen
    • Seorang juru bicara mengatakan, “U.S. models remain important to Asia”
  • Dalam tulisan untuk Project Syndicate, Ren Ito berpendapat bahwa prioritas pertama pemerintah federal AS seharusnya menjaga akses bagi sekutu dekat, dan bahwa AI bukan teknologi yang ditimbun melainkan teknologi yang dikembangkan bersama
  • Di X, David Ha menulis, “Orchestration Models are the next frontier, beyond bigger models
    • Ia menilai bergantung pada satu penyedia untuk infrastruktur nasional itu berisiko, dan kontrol ekspor terbaru membuat risiko itu tidak bisa lagi diabaikan
    • Ia menulis, “Access to top models can disappear overnight”, sembari menggambarkan kecerdasan kolektif sebagai lindung nilai praktis terhadap konsentrasi kekuasaan

AI keamanan 360 dan logika aset strategis

  • Menurut laporan Reuters dan Quartz, 360 memperkenalkan dua alat keamanan AI
    • Tulongfeng: dirancang untuk secara otomatis menemukan kerentanan perangkat lunak
    • Yitianzhen: dibuat untuk mengotomatiskan pertahanan siber dan respons insiden
  • Menurut laporan Reuters, pendiri 360 Zhou Hongyi memandang AI pendeteksi kerentanan sebagai aset strategis nasional
    • Ia menyoroti risiko “one-way transparency” ketika hanya sebagian pihak yang memiliki akses ke kemampuan deteksi kerentanan tingkat lanjut
  • 360 tidak menanggapi permintaan komentar dari TechCrunch

Pertumbuhan Anthropic dan naiknya alternatif regional

  • Anthropic sebelumnya mengatakan bahwa pada Mei 2026 pendapatan tahunan yang disetahunkan telah melampaui 47 miliar dolar AS
    • Tidak diungkap seberapa besar ketergantungannya pada pelanggan korporat di Asia
  • Dalam beberapa minggu setelah perintah ekspor berlaku, Sakana AI dan 360 masuk mengisi ruang kosong yang ditinggalkan oleh pembatasan akses ke model Anthropic
  • Bahkan jika perusahaan-perusahaan AS dapat memulihkan kepercayaan setelah larangan berakhir, alternatif regional yang dilatih untuk lebih memahami bahasa lokal dan nuansa setempat sudah mulai mengisi kekosongan itu

1 komentar

 
GN⁺ 4 jam lalu
Opini Hacker News
  • Saya mencoba model Fugu untuk pekerjaan nyata di C# dan Unity dengan MCP serta OpenCode, tetapi satu kali ulasan sistem tema dan rencana perubahan warna langsung menghabiskan batas 5 jam pada paket $20
    Saya naik ke paket $100 untuk melihat hasil implementasinya, tetapi hasilnya lebih buruk daripada Opus dan sangat lambat; batas 5 jam yang baru juga habis, dan 35% dari batas mingguan terpakai, tetapi hasilnya masih jauh dari level yang biasanya dicapai Opus dengan waktu dan biaya yang jauh lebih sedikit
    Silakan nilai sendiri informasi ini, tetapi tampaknya seperti pemborosan uang

    • Fugu bukan model independen, melainkan arsitektur yang memanggil beberapa model SaaS yang sudah ada seperti OpenAI dan Anthropic di belakang layar, lalu menggabungkan responsnya untuk membuat hasil
      Mereka mengklaim bahwa setelah mengombinasikan hasil dari beberapa model AI lalu membuat hasil akhir dengan model proprietary mereka sendiri, kualitasnya menjadi lebih baik daripada satu model backend saja, tetapi saya meragukan apakah model mereka sendiri itu benar-benar ada dan cukup mumpuni
      Bahkan jika klaimnya benar, ini tampaknya mudah diimplementasikan dengan membuat sisi klien seperti Claude Code menghasilkan hasil akhir menggunakan model dengan performa serupa model latar belakang, dan layanan ini terasa mencurigakan
    • Dari posisi saya yang menyediakan layanan serupa untuk Godot, bukan Unity, masuk akal jika model kelas atas seperti Opus membuat paket $20 habis untuk satu prompt
      Jika membayar harga API apa adanya dan tidak mampu menanggung subsidi 10x, jadinya memang begitu
    • Saya menguji Fable di Cursor, lalu meminta ide agar situs web data yang saya buat terlihat tidak terlalu “seperti Claude”; dalam 10 menit ia menghabiskan $40 dan menghasilkan styling CSS paling tidak berguna dan paling terasa seperti Claude
      Situs web itu sendiri dibuat dengan Opus, jadi bisa dibilang hasilnya lebih buruk daripada Opus
      Saya juga mengalami hal yang sama dengan model Amerika, jadi mungkin model-model Asia itu juga sejenis Mythos
    • Penasaran Unity MCP mana yang dipakai
      Saya sedang mencoba MCP resmi, dan ingin tahu apa yang dipakai orang lain
      Yang terkenal dari coplay mengalami konflik paket di tempat saya
    • Untuk pencarian/riset web juga mirip, dan buruk dibandingkan Opus
      Separuhnya terlewat, dan separuh sisanya berupa informasi lama atau tidak diverifikasi
  • Fugu Ultra tampaknya sebenarnya bukan model, melainkan sistem yang merutekan ke beberapa model, lebih mirip harness cloud, dan terlihat mirip Fusion dari OpenRouter
    “Bukan satu model raksasa, Fugu adalah sistem orkestrasi multi-agen terlatih. Ini adalah model bahasa yang dilatih untuk merutekan tugas ke kumpulan model dasar yang dapat diganti-ganti dan memanggil instance dirinya sendiri secara rekursif.” - https://openrouter.ai/sakana/fugu-ultra
    [0] https://sakana.ai/fugu/
    [1] https://openrouter.ai/openrouter/fusion

  • Istilah “Mythos-like” mulai terasa menjengkelkan
    Pengguna umum tidak punya cara membandingkannya selain melihat benchmark

    • “Mythos-like” hanya berarti dihype berlebihan oleh rumor, dan di sini istilah itu digunakan dengan tepat
    • Startup AI Asia juga membuat klaim berani sementara tidak ada cara nyata untuk membandingkannya, dan inti campur tangan Trump bisa dilihat sebagai upaya mencegah distilasi Faible
    • Bukankah tidak ada benchmark publik juga?
  • Jika tidak ada benchmark yang dapat dipercaya, kemiripan mereka dengan Mythos hanya berarti sama-sama menerima teks sebagai input dan menghasilkan teks sebagai output

    • Sekarang saya hampir tidak melihat benchmark lagi
      Ketika ada model baru, saya langsung mencobanya pada codebase perangkat lunak sistem proprietary berskala besar kami dan produk rilis nyata, atau proyek yang suatu saat akan dirilis
      Model mana yang membuat pekerjaan lebih baik atau lebih cepat cukup jelas, dan saat ini saya cukup beruntung punya anggaran token yang bisa dipakai sebanyak yang diperlukan
      Saya tidak butuh benchmark, evaluasi, pemasaran, atau system card; di web saya hanya membaca tips, cara kerja praktik, dan kabar rilis
      Saya berbagi pengalaman dengan rekan kerja, tetapi selebihnya hanyalah noise
    • Jika ia dihype berlebihan seperti Mythos, itu juga bisa ditambahkan ke daftar “Mythos-like”
      Yang mungkin kurang hanyalah adegan CEO memperingatkan dunia bahwa “model kami terlalu berbahaya untuk dirilis ke internet, jadi seseorang harus menghentikannya sebelum terlambat”
    • Ada benchmark di makalahnya: https://arxiv.org/abs/2606.21228
  • Daftar investornya mengesankan: https://sakana.ai/company-info/?lang=en
    Beberapa hari lalu juga masuk headline HN dan komentarnya lebih dari 100: https://news.ycombinator.com/item?id=48624782

    • Apakah perusahaan-perusahaan ini pernah merilis model sebelumnya?
      Sulit dipercaya mereka tiba-tiba merilis model setara Mythos
      DeepSeek, Z.ai, Alibaba/Qwen sudah jauh lebih lama mengerjakannya dan selama 18 bulan terakhir terus merilis model yang performanya meningkat stabil
      Sulit dipercaya perusahaan-perusahaan baru tiba-tiba mengeluarkan model setara Mythos tanpa rilis sebelumnya
    • Tahun lalu juga ada penarikan klaim yang cukup memalukan
      https://techcrunch.com/2025/02/21/sakana-walks-back-claims-t...
  • Sebelum tahun ini berakhir, sepertinya akan ada pelarangan LLM asing dengan alasan “kekhawatiran keselamatan”
    Itu tidak akan bergantung pada performa sebenarnya
    Namun Anthropic sudah menetapkan baseline untuk sistem sejenis Mythos, dan apa pun yang memenuhi standar yang didefinisikan longgar itu kemungkinan akan diperlakukan sebagai berbahaya bagi publik

    • Secara nyata, bagaimana itu bisa bekerja?
    • Kalau begitu, selamat tinggal teknologi Amerika dan selamat datang Tiongkok
      Tidak ada yang akan menunggu, dan jin yang sudah keluar tidak bisa dimasukkan kembali ke botol
    • Tidak masuk akal berbicara seolah-olah tidak ada bahaya nyata meskipun model berkembang
      Rasanya seperti hidup di realitas lain, di mana pada titik ini hanya Claude yang tampaknya mengatakan hal cerdas
      Hampir semua tulisan manusia terlihat seperti halusinasi dan omong kosong performatif
  • Kalau dilihat secara sinis, selama modelnya cukup bagus, akan sulit membantah klaim bahwa itu setara Mythos
    Karena sekarang Mythos sudah tidak bisa digunakan

    • Seperti apa sih Mythos itu?
      Saya penasaran sebagai orang yang dulu tidak punya akses
  • Kesan pertama saya adalah “kalau tidak ada benchmark pihak ketiga, enyahlah”
    Secara pribadi saya belum pernah mendengar kedua perusahaan ini
    Apa kami diminta percaya begitu saja bahwa mereka setara dengan model-model terbaik di pasar?
    Sakana menjelaskan modelnya sebagai “Orchestration Model”; apakah itu berarti sebenarnya mereka merangkai beberapa model?

    • Apakah membuat model yang bagus memang sesulit itu, atau apakah kuncinya adalah skala sumber daya yang dimasukkan ke pelatihan?
      Saya benar-benar bertanya karena tidak tahu
      Tentu ini bukan hal sepele, tetapi apakah membangunnya di atas teknik-teknik lama yang sudah diketahui membutuhkan pengetahuan rahasia kelas dunia?
      Rasanya masih ada banyak buah yang menggantung rendah untuk dieksplorasi, dan waktu serta sumber daya menjadi faktor pembatas
    • Komentar-komentar pada tulisan rilis yang baru-baru ini muncul di HN cenderung melihatnya lebih mirip OpenRouter daripada model sungguhan
    • Menurut kesan saya, benar begitu
      Tampaknya mereka mengklaim strukturnya bukan campuran model baru, melainkan semacam perekat yang ditempelkan secara dinamis saat itu juga
      Reaksi saat itu juga bisa dilihat di sini: https://news.ycombinator.com/item?id=48624782 (6 hari lalu, 244 poin, 133 komentar)
    • Apakah Anthropic memberikan benchmark pihak ketiga?
      Apakah waktu itu kalian juga berkata begitu?
      Itu memang penting, tetapi sikapnya keliru
  • Saya orang sederhana: kalau tidak ada benchmark di https://arena.ai/leaderboard, berarti 100% penipuan

    • Bagaimana kalau dibandingkan dengan ARC AGI?
  • Seperti banyak komentar di sini, saya juga menguji Fugu dan beberapa model lain, dan model-model itu cukup mahal
    $20 tidak cukup untuk menyelesaikan seluruh workflow, sementara dengan Opus bisa
    Tentu saja, kalau menginginkan hasil terbaik, Opus pun mungkin perlu prompt yang lebih dipoles sejak awal, tetapi sejauh ini itulah pengalaman saya
    Tes berikutnya akan saya lakukan dengan sistem agentic dan melihat performanya