OpenMythos: Hipotesis arsitektur Claude Mythos yang direkonstruksi lewat riset terbuka, atau hype AI lainnya
(flamehaven.space)Gambaran umum
- OpenMythos diperkenalkan sebagai eksperimen arsitektur teoretis yang mencoba merekonstruksi struktur mirip Claude Mythos berdasarkan riset terbuka
- Tulisan ini tidak memandang OpenMythos itu sendiri sebagai sekadar “slop”
- Sebaliknya, tulisan ini menggunakan OpenMythos sebagai contoh untuk membahas bagaimana di komunitas AI, README, ringkasan AI, penyebaran lewat YouTube/Reddit, dan bintang GitHub membentuk keyakinan publik lebih dulu daripada verifikasi
- Tulisan ini menyebut fenomena tersebut sebagai “sheepwave”
- Di sini, sheepwave bukan berarti ketidaktahuan atau rasa ingin tahu sederhana, melainkan fenomena ketika narasi yang secara teknis terdengar masuk akal dan secara emosional menarik mengeras menjadi keyakinan kolektif sebelum diverifikasi
- Argumen utamanya bukan bahwa “OpenMythos tidak menarik”, melainkan bahwa masalahnya ada pada cara artefak riset yang menarik dikonsumsi seolah-olah sebagai terobosan arsitektur yang sudah terbukti
Apa itu OpenMythos
- OpenMythos bukan model yang menyalin langsung atau membocorkan Claude Mythos milik Anthropic
- Pengembangnya mengatakan bahwa OpenMythos bukan reimplementasi Claude Mythos yang telah terverifikasi, melainkan eksperimen arsitektur teoretis yang menggabungkan alur riset terbuka.
- Alasan OpenMythos mendapat perhatian adalah karena nama Claude Mythos sendiri sudah menyimpan aura misteri
- Arsitektur lengkap Claude Mythos tidak dipublikasikan, dan komunitas pun memiliki pertanyaan “apa yang ada di dalamnya?”
- OpenMythos mengisi ruang kosong itu dengan bentuk “mungkin strukturnya seperti ini”
- Di internet, kalimat “berhasil merekonstruksi Claude Mythos” menyebar jauh lebih cepat daripada “eksperimen arsitektur kedalaman rekursif spekulatif berbasis riset terbuka”
Mengapa OpenMythos cepat mendapat perhatian
- OpenMythos sekaligus menyentuh berbagai harapan yang memang sudah ingin dipercayai komunitas AI
- Harapan terhadap efisiensi parameter
- Gagasan bahwa model kedalaman rekursif yang lebih kecil dapat mencapai kualitas mirip Transformer berkedalaman tetap yang lebih besar adalah pesan yang sangat kuat
- Narasi “bisa menjadi lebih dalam tanpa harus menjadi lebih besar” terdengar menarik bagi komunitas yang lelah dengan biaya GPU dan struktur yang berpusat pada frontier lab
- Arsitektur berbentuk loop
- Komputasi berulang tampak secara visual “seperti sedang berpikir”
- Namun, komputasi berulang melalui bobot bersama tidak sama dengan kemampuan penalaran nyata atau perilaku adaptif
- Harapan terhadap perangkat keras pribadi/kecil
- Kombinasi struktur kedalaman rekursif dan kompresi cache ala MLA menimbulkan harapan bahwa model kecil pun dapat terasa seperti model yang lebih besar
- Tetapi dalam praktiknya masih ada persoalan rekayasa seperti biaya penanganan cabang, perilaku memori, stabilitas pelatihan, efisiensi kernel, akurasi dependensi, dan throughput
- Nama Claude Mythos itu sendiri
- Saat Anthropic belum mengungkap struktur lengkapnya, OpenMythos memberi “bentuk” yang diinginkan komunitas
- Kata kunci arsitektur AI terkini seperti MoE, MLA, LTI, ACT, dan struktur kedalaman rekursif terkumpul dalam satu repositori
- Karena itu, OpenMythos sulit dianggap remeh hanya sebagai overheat kosong
- Justru karena ada ide nyata di dalamnya, hype itu bisa menjadi lebih kuat
Cara kerja Sheepwave
- Tulisan ini menjelaskan reaksi di sekitar OpenMythos dalam tiga tahap
- Tahap keyakinan
- Orang-orang melihat petunjuk seperti Claude Mythos, open source, struktur kedalaman rekursif, dan efisiensi parameter, lalu lebih dulu bereaksi pada kemungkinannya
- Pada tahap ini, yang dikonsumsi lebih dulu adalah “kemungkinan yang terdengar masuk akal”, bukan jalur pelatihan nyata atau apakah performanya bisa direproduksi
- Tahap amplifikasi
- YouTube, Reddit, newsletter, posting sosial, dan ringkasan AI mengulang versi cerita yang paling kuat
- Pada tahap ini tidak diperlukan reproduksi benchmark atau verifikasi jalur pelatihan
- Yang penting adalah “cerita yang menyebar dengan baik”
- Tahap kecurigaan di level kode
-
Para analis kode mengkloning repositori, lalu memeriksa skrip pelatihan, jalur router, logika ACT, penanganan cabang MoE, dan konfigurasi konteks besar
-
Namun tahap ini biasanya datang terlambat
-
Struktur ini adalah masalah asimetri informasi
- Satu kalimat seperti “model 770M menghasilkan performa setara kelas 1.3B” menyebar dengan cepat
- Sebaliknya, pertanyaan seperti “apakah klaim efisiensi itu benar-benar direproduksi di repositori ini, apakah penanganan cabang MoE bertahan pada skala besar, atau apakah nilai bias router benar-benar diperbarui di skrip pelatihan” memerlukan code review yang panjang
-
Satu kalimat bisa menjadi posting, sedangkan kalimat lain membutuhkan review
-
Karena itu, yang tertinggal dalam ingatan publik adalah klaim sederhana, sementara hasil audit mudah menjadi catatan kaki yang datang terlambat
Mengapa Sheepwave kali ini berbeda
-
Hype kali ini melibatkan AI assistant
-
Jika tautan GitHub diberikan ke AI, AI dapat membaca README, struktur file, istilah arsitektur, dan referensi yang tampak meyakinkan, lalu membuat ringkasan yang persuasif
-
Ini berguna, tetapi bukan verifikasi
-
AI assistant dalam lingkungan chat umum biasanya tidak melakukan hal-hal berikut
- reproduksi pelatihan multi-GPU
- reproduksi kurva benchmark
- mengamati apakah keseimbangan router tetap terjaga dalam pelatihan jangka panjang
- mengukur throughput MoE
- memeriksa inisialisasi dan perilaku memori pada konfigurasi konteks besar
-
Karena itu, reaksi “bahkan AI pun terkesan” bisa jadi bukan respons terhadap verifikasi kode nyata, melainkan terhadap README dan struktur permukaan repositori
-
Pembedaan inti dalam tulisan ini adalah sebagai berikut
- Ada kalanya AI terkesan oleh kode
- Ada juga kalanya AI terkesan oleh README
- Keduanya bukan hal yang sama
-
Hype kali ini bukan hype tentang “agen yang bertindak”, melainkan hype tentang “arsitektur yang tampak seperti sedang berpikir”
-
Hype arsitektur semacam ini cenderung tidak runtuh karena kegagalan demo yang dramatis, melainkan memperlihatkan kelemahannya secara sunyi di titik-titik seperti jalur pelatihan, reproduksi benchmark, fungsi loss, status integrasi, dan jalur eksekusi
Hasil audit di level sumber
-
Tulisan ini juga menyajikan hasil audit di level sumber terhadap OpenMythos
-
Audit ini membandingkan implementasi model, skrip pelatihan, konfigurasi varian model, tokenizer, pengujian, file dependensi, dan klaim dalam README dengan jalur kode yang benar-benar ada
-
Hasil audit menilai bahwa OpenMythos bukan hype kosong (Empty slop)
-
Ada elemen yang memang benar-benar diimplementasikan
- Struktur Prelude + Recurrent Block + Coda memang ada
- Stabilisasi rekursif ala LTI dinilai sebagai salah satu elemen implementasi yang kuat
- Kompresi cache ala MLA terhubung dengan masalah pemrosesan konteks panjang
- Logika penghentian ala ACT juga ada
- Struktur kedalaman rekursif dapat dimasukkan dalam pembahasan tentang penskalaan, alokasi komputasi, iterasi, memori, dan routing
-
Namun proyek ini masih jauh dari tingkat kesiapan operasional yang disiratkan oleh narasi publik
Perbedaan utama yang ditemukan dalam audit
-
Klaim efisiensi 770M vs 1.3B
- Ini lebih mendekati klaim atau kutipan eksternal, bukan hasil yang direproduksi di repositori
- Karena itu, lebih tepat melihatnya sebagai “kutipan, bukan hasil”
-
Routing MoE
- Logika routing memang ada, tetapi terdapat penanganan cabang Python yang bertingkat sehingga harus dilihat sebagai risiko throughput pada skala besar
- Ini bukan pernyataan bahwa hal tersebut “pasti mustahil”, melainkan risiko yang memerlukan profiling nyata
-
Keseimbangan router
- Mekanisme bias router memang diekspos, tetapi tidak terlihat jalur yang secara eksplisit memperbaruinya dalam skrip pelatihan yang dibagikan
- Dalam pelatihan jangka panjang, risiko ketidakseimbangan beban bisa meningkat
-
Logika penghentian ACT
- Logika penghentian ala ACT memang ada
- Namun jalur pelatihan yang dibagikan tidak menyertakan ponder loss yang eksplisit ataupun term regularisasi komputasi
- Head penghentian mungkin menerima gradien secara tidak langsung melalui language model loss, tetapi tidak ada fungsi objektif yang secara langsung mendorong penghentian adaptif yang efisien
-
Modul MoDA
- Modul ini ada sebagai file eksperimen terpisah, tetapi sulit dianggap telah terintegrasi ke model utama
-
Varian model besar
- Konfigurasi 100B+ atau konteks 1M lebih dekat ke konfigurasi yang berorientasi target daripada pengaturan yang benar-benar siap dipakai, karena strukturnya langsung membuat buffer RoPE
Masalah label riset
- OpenMythos lebih tepat dipandang sebagai rekonstruksi teoretis atau artefak riset, bukan model operasional
- Label ini sendiri sah
- Proyek riset memang dapat mencakup jalur pelatihan yang belum lengkap, struktur eksperimental, dan integrasi yang belum selesai
- Masalahnya adalah label riset dan hype publik bekerja dengan bahasa yang berbeda
Perbedaan antara label riset dan hype publik
-
Label riset: “ini adalah eksperimen teoretis”
- Hype publik: “ini akan mengubah masa depan AI”
-
Label riset: “ini adalah rekonstruksi berdasarkan riset terbuka dan estimasi”
- Hype publik: “seseorang telah mereimplementasikan Claude Mythos”
-
Label riset: “ini adalah arsitektur untuk dieksplorasi”
- Hype publik: “model kecil sekarang bisa berpikir seperti model besar”
-
Tulisan ini menjelaskan perbedaan itu dengan kalimat: “proyek berbicara dalam bahasa riset, tetapi respons publik menerjemahkannya ke dalam bahasa kedatangan”
Tiga lapisan untuk menilai repositori AI
- Tulisan ini berpendapat bahwa saat menilai repositori open source AI, kita perlu memisahkan tiga lapisan
- Narasi (Narrative)
- Apa yang dikatakan oleh README, tulisan penjelas, dan posting sosial
- Mekanisme (Mechanism)
- Struktur yang benar-benar diimplementasikan oleh kode
- Jalur operasional (Operational path)
-
Kemampuan yang benar-benar didukung oleh jalur pelatihan, jalur eksekusi, dan jalur evaluasi
-
Sebagian besar hype AI menyatukan ketiga lapisan ini menjadi satu
-
Due diligence rekayasa yang baik justru memisahkan ketiganya
Kesimpulan
- OpenMythos bukan sesuatu yang patut diabaikan atau diejek
- OpenMythos adalah artefak riset yang berguna, menarik, dan memiliki implikasi teknis
- Namun ini bukan bukti bahwa arsitektur saja sudah berhasil menaklukkan batasan skala
- README adalah titik awal, bukan akhir dari verifikasi
- Kesimpulan tulisan ini diringkas sebagai “README bukan garis pantai. Jalur kode-lah garis pantainya”
- Tulisan terkait mencakup analisis sheepwave secara penuh dan laporan audit level sumber terpisah untuk OpenMythos v0.5.0
https://flamehaven.space/writing/…
Belum ada komentar.