1 poin oleh flamehaven01 3 jam lalu | Belum ada komentar. | Bagikan ke WhatsApp

Gambaran umum

  • OpenMythos diperkenalkan sebagai eksperimen arsitektur teoretis yang mencoba merekonstruksi struktur mirip Claude Mythos berdasarkan riset terbuka
  • Tulisan ini tidak memandang OpenMythos itu sendiri sebagai sekadar “slop”
  • Sebaliknya, tulisan ini menggunakan OpenMythos sebagai contoh untuk membahas bagaimana di komunitas AI, README, ringkasan AI, penyebaran lewat YouTube/Reddit, dan bintang GitHub membentuk keyakinan publik lebih dulu daripada verifikasi
  • Tulisan ini menyebut fenomena tersebut sebagai “sheepwave”
  • Di sini, sheepwave bukan berarti ketidaktahuan atau rasa ingin tahu sederhana, melainkan fenomena ketika narasi yang secara teknis terdengar masuk akal dan secara emosional menarik mengeras menjadi keyakinan kolektif sebelum diverifikasi
  • Argumen utamanya bukan bahwa “OpenMythos tidak menarik”, melainkan bahwa masalahnya ada pada cara artefak riset yang menarik dikonsumsi seolah-olah sebagai terobosan arsitektur yang sudah terbukti

Apa itu OpenMythos

  • OpenMythos bukan model yang menyalin langsung atau membocorkan Claude Mythos milik Anthropic
  • Pengembangnya mengatakan bahwa OpenMythos bukan reimplementasi Claude Mythos yang telah terverifikasi, melainkan eksperimen arsitektur teoretis yang menggabungkan alur riset terbuka.
  • Alasan OpenMythos mendapat perhatian adalah karena nama Claude Mythos sendiri sudah menyimpan aura misteri
  • Arsitektur lengkap Claude Mythos tidak dipublikasikan, dan komunitas pun memiliki pertanyaan “apa yang ada di dalamnya?”
  • OpenMythos mengisi ruang kosong itu dengan bentuk “mungkin strukturnya seperti ini”
  • Di internet, kalimat “berhasil merekonstruksi Claude Mythos” menyebar jauh lebih cepat daripada “eksperimen arsitektur kedalaman rekursif spekulatif berbasis riset terbuka”

Mengapa OpenMythos cepat mendapat perhatian

  • OpenMythos sekaligus menyentuh berbagai harapan yang memang sudah ingin dipercayai komunitas AI
  1. Harapan terhadap efisiensi parameter
  • Gagasan bahwa model kedalaman rekursif yang lebih kecil dapat mencapai kualitas mirip Transformer berkedalaman tetap yang lebih besar adalah pesan yang sangat kuat
  • Narasi “bisa menjadi lebih dalam tanpa harus menjadi lebih besar” terdengar menarik bagi komunitas yang lelah dengan biaya GPU dan struktur yang berpusat pada frontier lab
  1. Arsitektur berbentuk loop
  • Komputasi berulang tampak secara visual “seperti sedang berpikir”
  • Namun, komputasi berulang melalui bobot bersama tidak sama dengan kemampuan penalaran nyata atau perilaku adaptif
  1. Harapan terhadap perangkat keras pribadi/kecil
  • Kombinasi struktur kedalaman rekursif dan kompresi cache ala MLA menimbulkan harapan bahwa model kecil pun dapat terasa seperti model yang lebih besar
  • Tetapi dalam praktiknya masih ada persoalan rekayasa seperti biaya penanganan cabang, perilaku memori, stabilitas pelatihan, efisiensi kernel, akurasi dependensi, dan throughput
  1. Nama Claude Mythos itu sendiri
  • Saat Anthropic belum mengungkap struktur lengkapnya, OpenMythos memberi “bentuk” yang diinginkan komunitas
  1. Kata kunci arsitektur AI terkini seperti MoE, MLA, LTI, ACT, dan struktur kedalaman rekursif terkumpul dalam satu repositori
  • Karena itu, OpenMythos sulit dianggap remeh hanya sebagai overheat kosong
  • Justru karena ada ide nyata di dalamnya, hype itu bisa menjadi lebih kuat

Cara kerja Sheepwave

  • Tulisan ini menjelaskan reaksi di sekitar OpenMythos dalam tiga tahap
  1. Tahap keyakinan
  • Orang-orang melihat petunjuk seperti Claude Mythos, open source, struktur kedalaman rekursif, dan efisiensi parameter, lalu lebih dulu bereaksi pada kemungkinannya
  • Pada tahap ini, yang dikonsumsi lebih dulu adalah “kemungkinan yang terdengar masuk akal”, bukan jalur pelatihan nyata atau apakah performanya bisa direproduksi
  1. Tahap amplifikasi
  • YouTube, Reddit, newsletter, posting sosial, dan ringkasan AI mengulang versi cerita yang paling kuat
  • Pada tahap ini tidak diperlukan reproduksi benchmark atau verifikasi jalur pelatihan
  • Yang penting adalah “cerita yang menyebar dengan baik”
  1. Tahap kecurigaan di level kode
  • Para analis kode mengkloning repositori, lalu memeriksa skrip pelatihan, jalur router, logika ACT, penanganan cabang MoE, dan konfigurasi konteks besar

  • Namun tahap ini biasanya datang terlambat

  • Struktur ini adalah masalah asimetri informasi

    • Satu kalimat seperti “model 770M menghasilkan performa setara kelas 1.3B” menyebar dengan cepat
    • Sebaliknya, pertanyaan seperti “apakah klaim efisiensi itu benar-benar direproduksi di repositori ini, apakah penanganan cabang MoE bertahan pada skala besar, atau apakah nilai bias router benar-benar diperbarui di skrip pelatihan” memerlukan code review yang panjang
  • Satu kalimat bisa menjadi posting, sedangkan kalimat lain membutuhkan review

  • Karena itu, yang tertinggal dalam ingatan publik adalah klaim sederhana, sementara hasil audit mudah menjadi catatan kaki yang datang terlambat

Mengapa Sheepwave kali ini berbeda

  • Hype kali ini melibatkan AI assistant

  • Jika tautan GitHub diberikan ke AI, AI dapat membaca README, struktur file, istilah arsitektur, dan referensi yang tampak meyakinkan, lalu membuat ringkasan yang persuasif

  • Ini berguna, tetapi bukan verifikasi

  • AI assistant dalam lingkungan chat umum biasanya tidak melakukan hal-hal berikut

    • reproduksi pelatihan multi-GPU
    • reproduksi kurva benchmark
    • mengamati apakah keseimbangan router tetap terjaga dalam pelatihan jangka panjang
    • mengukur throughput MoE
    • memeriksa inisialisasi dan perilaku memori pada konfigurasi konteks besar
  • Karena itu, reaksi “bahkan AI pun terkesan” bisa jadi bukan respons terhadap verifikasi kode nyata, melainkan terhadap README dan struktur permukaan repositori

  • Pembedaan inti dalam tulisan ini adalah sebagai berikut

    • Ada kalanya AI terkesan oleh kode
    • Ada juga kalanya AI terkesan oleh README
    • Keduanya bukan hal yang sama
  • Hype kali ini bukan hype tentang “agen yang bertindak”, melainkan hype tentang “arsitektur yang tampak seperti sedang berpikir”

  • Hype arsitektur semacam ini cenderung tidak runtuh karena kegagalan demo yang dramatis, melainkan memperlihatkan kelemahannya secara sunyi di titik-titik seperti jalur pelatihan, reproduksi benchmark, fungsi loss, status integrasi, dan jalur eksekusi

Hasil audit di level sumber

  • Tulisan ini juga menyajikan hasil audit di level sumber terhadap OpenMythos

  • Audit ini membandingkan implementasi model, skrip pelatihan, konfigurasi varian model, tokenizer, pengujian, file dependensi, dan klaim dalam README dengan jalur kode yang benar-benar ada

  • Hasil audit menilai bahwa OpenMythos bukan hype kosong (Empty slop)

  • Ada elemen yang memang benar-benar diimplementasikan

    • Struktur Prelude + Recurrent Block + Coda memang ada
    • Stabilisasi rekursif ala LTI dinilai sebagai salah satu elemen implementasi yang kuat
    • Kompresi cache ala MLA terhubung dengan masalah pemrosesan konteks panjang
    • Logika penghentian ala ACT juga ada
    • Struktur kedalaman rekursif dapat dimasukkan dalam pembahasan tentang penskalaan, alokasi komputasi, iterasi, memori, dan routing
  • Namun proyek ini masih jauh dari tingkat kesiapan operasional yang disiratkan oleh narasi publik

Perbedaan utama yang ditemukan dalam audit

  • Klaim efisiensi 770M vs 1.3B

    • Ini lebih mendekati klaim atau kutipan eksternal, bukan hasil yang direproduksi di repositori
    • Karena itu, lebih tepat melihatnya sebagai “kutipan, bukan hasil”
  • Routing MoE

    • Logika routing memang ada, tetapi terdapat penanganan cabang Python yang bertingkat sehingga harus dilihat sebagai risiko throughput pada skala besar
    • Ini bukan pernyataan bahwa hal tersebut “pasti mustahil”, melainkan risiko yang memerlukan profiling nyata
  • Keseimbangan router

    • Mekanisme bias router memang diekspos, tetapi tidak terlihat jalur yang secara eksplisit memperbaruinya dalam skrip pelatihan yang dibagikan
    • Dalam pelatihan jangka panjang, risiko ketidakseimbangan beban bisa meningkat
  • Logika penghentian ACT

    • Logika penghentian ala ACT memang ada
    • Namun jalur pelatihan yang dibagikan tidak menyertakan ponder loss yang eksplisit ataupun term regularisasi komputasi
    • Head penghentian mungkin menerima gradien secara tidak langsung melalui language model loss, tetapi tidak ada fungsi objektif yang secara langsung mendorong penghentian adaptif yang efisien
  • Modul MoDA

    • Modul ini ada sebagai file eksperimen terpisah, tetapi sulit dianggap telah terintegrasi ke model utama
  • Varian model besar

    • Konfigurasi 100B+ atau konteks 1M lebih dekat ke konfigurasi yang berorientasi target daripada pengaturan yang benar-benar siap dipakai, karena strukturnya langsung membuat buffer RoPE

Masalah label riset

  • OpenMythos lebih tepat dipandang sebagai rekonstruksi teoretis atau artefak riset, bukan model operasional
  • Label ini sendiri sah
  • Proyek riset memang dapat mencakup jalur pelatihan yang belum lengkap, struktur eksperimental, dan integrasi yang belum selesai
  • Masalahnya adalah label riset dan hype publik bekerja dengan bahasa yang berbeda

Perbedaan antara label riset dan hype publik

  • Label riset: “ini adalah eksperimen teoretis”

    • Hype publik: “ini akan mengubah masa depan AI”
  • Label riset: “ini adalah rekonstruksi berdasarkan riset terbuka dan estimasi”

    • Hype publik: “seseorang telah mereimplementasikan Claude Mythos”
  • Label riset: “ini adalah arsitektur untuk dieksplorasi”

    • Hype publik: “model kecil sekarang bisa berpikir seperti model besar”
  • Tulisan ini menjelaskan perbedaan itu dengan kalimat: “proyek berbicara dalam bahasa riset, tetapi respons publik menerjemahkannya ke dalam bahasa kedatangan”

Tiga lapisan untuk menilai repositori AI

  • Tulisan ini berpendapat bahwa saat menilai repositori open source AI, kita perlu memisahkan tiga lapisan
  1. Narasi (Narrative)
  • Apa yang dikatakan oleh README, tulisan penjelas, dan posting sosial
  1. Mekanisme (Mechanism)
  • Struktur yang benar-benar diimplementasikan oleh kode
  1. Jalur operasional (Operational path)
  • Kemampuan yang benar-benar didukung oleh jalur pelatihan, jalur eksekusi, dan jalur evaluasi

  • Sebagian besar hype AI menyatukan ketiga lapisan ini menjadi satu

  • Due diligence rekayasa yang baik justru memisahkan ketiganya

Kesimpulan

  • OpenMythos bukan sesuatu yang patut diabaikan atau diejek
  • OpenMythos adalah artefak riset yang berguna, menarik, dan memiliki implikasi teknis
  • Namun ini bukan bukti bahwa arsitektur saja sudah berhasil menaklukkan batasan skala
  • README adalah titik awal, bukan akhir dari verifikasi
  • Kesimpulan tulisan ini diringkas sebagai “README bukan garis pantai. Jalur kode-lah garis pantainya”
  • Tulisan terkait mencakup analisis sheepwave secara penuh dan laporan audit level sumber terpisah untuk OpenMythos v0.5.0
    https://flamehaven.space/writing/…

Belum ada komentar.

Belum ada komentar.