Egregore v5.0: Mesin Kognitif Homeostasis Otonom Geometri Topologis Berdimensi Tinggi Berbasis PyTorch
(github.com/PJHkorea)Sebagai riset pribadi, saya mengembangkan proyek lapisan kognitif (Egregore v5.0) yang memadukan gimmick fisika matematis/teori medan kuantum ke dalam fungsi objektif deep learning dan struktur manifold, serta mendokumentasikan prosesnya.
Karena sering kali saya memulai dengan pendekatan kognitif terlebih dahulu lalu melengkapinya setelah itu, kemungkinan besar akan ada peningkatan versi tambahan secara cukup sering.
Lebih dari sekadar prototipe sederhana, tulisan ini memuat proses troubleshooting dan penyempurnaan arsitektur yang saya alami saat mengembangkannya dari v1.0 hingga v5.0 untuk membangun infrastruktur yang benar-benar dapat berjalan di lingkungan pelatihan terdistribusi berskala besar.
Di setiap dokumen README, saya juga menambahkan keterbatasan saya dan proses untuk melampauinya.
Poin utama implementasi dan refactoring
-
Morphing manifold yang dapat didiferensiasikan di seluruh rentang: Tanpa percabangan kondisional (If-Else), transisi topologis antara manifold bola (Sphere) dan torus (Torus) dipetakan sepenuhnya melalui kombinasi fungsi kontinu Sigmoid/Tanh.
-
Penerapan fungsi kerugian topologis gabungan tiga elemen (Advanced Topological Loss): Untuk mencegah keruntuhan topologis (Topological Collapse), yaitu bobot yang bias dan melekat pada bidang tertentu, serta mode collapse, saya menggabungkan secara polinomial curvature alignment loss, entropi informasi Casimir (maksimalisasi Shannon Entropy), dan panjang busur geodesik manifold Riemann (
torch.acos). -
Penetapan guardrail Zero-NaN dan memori untuk penggunaan nyata: Saya memaksakan penanganan
torch.clampuntuk mencegah divergensi turunan fungsi trigonometri invers, injeksi EPSILON untuk mencegah ledakan turunan akar, pencegahan ledakaninfpada fungsiexp, serta castingfloat(loss.item())untuk memblokir kebocoran memori (Memory Leak). -
Isolasi laju belajar per lapisan (LLRD): Dengan pelacakan alamat memori berbasis
id(), laju belajar parameter gerbang topologis diisolasi dan dikendalikan 100 kali lebih rendah daripada backbone umum untuk memastikan stabilitas pelatihan.
Saya juga mendokumentasikan dalam bahasa Korea dan Inggris analisis penyebab kegagalan dari “paradigma fisika matematis yang ditolak (Rejected Paradigms)” selama upaya implementasi, seperti integral lintasan Feynman dan persamaan Jarzynski.
Semoga ini dapat menjadi arah yang baik bagi mereka yang tertarik pada implementasi PyTorch praktis untuk geometri informasi (Information Geometry) atau AI berbasis fisika (PINN).
Proyek ini mengikuti lisensi GPLv3, sebuah prinsip copyleft open source yang kuat.
4 komentar
Saya membacanya dengan menarik. Ada beberapa hal pada detail implementasi yang mengganjal, jadi saya ingin bertanya.
Dead-zone pada kerugian geodesik
acos+clampAnda menghitung panjang busur geodesik dengan
torch.acos, tetapi turunanacosdivergen saat input mendekati ±1. Anda mengatakan ini ditahan denganclamp. Namun, pada bagian transisi topologis ketika bola dan torus hampir berimpit, nilai hasil perkalian dalam akan konvergen ke ±1; pada saat itu, jikaclampaktif, bukankah gradien untuk suku tersebut menjadi 0 sehingga sinyal pembelajaran menghilang? Ini terlihat seperti struktur di mana justru pada batas topologis yang paling bermakna pembelajaran berhenti. Bagaimana Anda menangani dead-zone ini?Konflik tanda antara suku penyelarasan kurvatur vs suku maksimisasi entropi
Tekanan untuk menyelaraskan dan mengonvergensikan kurvatur serta tekanan entropi untuk meratakan distribusi adalah tujuan yang secara langsung saling bersaing di atas manifold. Bergantung pada rasio bobotnya, solusi optimal bisa berubah sepenuhnya; bagaimana Anda menentukan rasio ini? Apakah ada kemungkinan satu sisi mendominasi sehingga suku lainnya pada praktiknya hanya berfungsi sebagai regularisasi noise — apakah Anda punya hasil ablation dengan masing-masing suku dihilangkan?
Definisi "entropi informasi Casimir"
Casimir berasal dari konteks fisika, sedangkan entropi Shannon adalah besaran dalam teori informasi; namun di kode, pada akhirnya ini terlihat seperti perhitungan entropi Shannon standar atas distribusi bobot. Apakah penamaan "Casimir" memang merujuk pada suku tersendiri yang benar-benar diberikan secara matematis, atau hanya nama yang ditempelkan pada regularisasi entropi biasa? Jika yang pertama, bisakah Anda menunjukkan rumus bentuk tertutup untuk suku tersebut?
acos+ dead-zone dariclampmargin = 0.95
leaky_slope = 0.01
leaky_cos = torch.where(
torch.abs(x) < margin * bound,
x, # 1. Di zona aman (di bawah 0.95), pelestarian jarak geodesik linear yang sempurna
torch.sign(x) * (margin * bound + leaky_slope * (torch.abs(x) - margin * bound)) # 2. Soft bending saat memasuki permukaan batas
)
return torch.clamp(leaky_cos, min=-bound, max=bound)
Konflik tanda antara suku penyelarasan kelengkungan vs suku pemaksimalan entropi
Dengan distribusi keseimbangan dinamis 2:1 antara gaya tarik dan gaya tolak, dan pada arsitektur terbaru beralih ke rantai operasi
F.log_softmaxyang menjamin stabilitas numerik yang ekstrem, kami membuat nilai loss tidak melonjak dan tetap dapat berdampingan bahkan di bawah tekanan konflik tanda.Entropi informasi Casimir
Rumusnya sendiri memang entropi Shannon
Meski begitu, alasan suku ini diberi nama 'Casimir' adalah karena sumber distribusi probabilitas tempat entropi ini dihitung berasal dari keluaran filter yang meniru efek fisika Casimir
Rumus bentuk tertutupnya telah saya revisi dan kembangkan di README.
https://github.com/PJHkorea/Egregore/blob/main/README.md
Terima kasih banyak. Berkat Anda yang sudah mengeceknya, saya sekali lagi membuat perubahan pada implementasinya.
https://github.com/PJHkorea/Egregore/…
Saya telah merevisinya ke versi tersebut. Terima kasih banyak sekali. Anda memberi saya inspirasi yang luar biasa.
Akhir-akhir ini saya sering melihat hal seperti ini, apakah ada orang yang melakukan spam dengan agen yang diberi prompt seperti, "membuat sesuatu yang terdengar seperti karya pakar lalu mempostingnya ke situs-situs komunitas"?
Maaf. Saya bersikap agak dogmatis karena mengerjakan ini secara mandiri.
Akan saya perbaiki