1 poin oleh pjhkorea 5 jam lalu | 4 komentar | Bagikan ke WhatsApp

Sebagai riset pribadi, saya mengembangkan proyek lapisan kognitif (Egregore v5.0) yang memadukan gimmick fisika matematis/teori medan kuantum ke dalam fungsi objektif deep learning dan struktur manifold, serta mendokumentasikan prosesnya.
Karena sering kali saya memulai dengan pendekatan kognitif terlebih dahulu lalu melengkapinya setelah itu, kemungkinan besar akan ada peningkatan versi tambahan secara cukup sering.

Lebih dari sekadar prototipe sederhana, tulisan ini memuat proses troubleshooting dan penyempurnaan arsitektur yang saya alami saat mengembangkannya dari v1.0 hingga v5.0 untuk membangun infrastruktur yang benar-benar dapat berjalan di lingkungan pelatihan terdistribusi berskala besar.
Di setiap dokumen README, saya juga menambahkan keterbatasan saya dan proses untuk melampauinya.

Poin utama implementasi dan refactoring

  1. Morphing manifold yang dapat didiferensiasikan di seluruh rentang: Tanpa percabangan kondisional (If-Else), transisi topologis antara manifold bola (Sphere) dan torus (Torus) dipetakan sepenuhnya melalui kombinasi fungsi kontinu Sigmoid/Tanh.

  2. Penerapan fungsi kerugian topologis gabungan tiga elemen (Advanced Topological Loss): Untuk mencegah keruntuhan topologis (Topological Collapse), yaitu bobot yang bias dan melekat pada bidang tertentu, serta mode collapse, saya menggabungkan secara polinomial curvature alignment loss, entropi informasi Casimir (maksimalisasi Shannon Entropy), dan panjang busur geodesik manifold Riemann (torch.acos).

  3. Penetapan guardrail Zero-NaN dan memori untuk penggunaan nyata: Saya memaksakan penanganan torch.clamp untuk mencegah divergensi turunan fungsi trigonometri invers, injeksi EPSILON untuk mencegah ledakan turunan akar, pencegahan ledakan inf pada fungsi exp, serta casting float(loss.item()) untuk memblokir kebocoran memori (Memory Leak).

  4. Isolasi laju belajar per lapisan (LLRD): Dengan pelacakan alamat memori berbasis id(), laju belajar parameter gerbang topologis diisolasi dan dikendalikan 100 kali lebih rendah daripada backbone umum untuk memastikan stabilitas pelatihan.

Saya juga mendokumentasikan dalam bahasa Korea dan Inggris analisis penyebab kegagalan dari “paradigma fisika matematis yang ditolak (Rejected Paradigms)” selama upaya implementasi, seperti integral lintasan Feynman dan persamaan Jarzynski.

Semoga ini dapat menjadi arah yang baik bagi mereka yang tertarik pada implementasi PyTorch praktis untuk geometri informasi (Information Geometry) atau AI berbasis fisika (PINN).

Proyek ini mengikuti lisensi GPLv3, sebuah prinsip copyleft open source yang kuat.

4 komentar

 
esc5221 2 jam lalu

Saya membacanya dengan menarik. Ada beberapa hal pada detail implementasi yang mengganjal, jadi saya ingin bertanya.

  1. Dead-zone pada kerugian geodesik acos + clamp
    Anda menghitung panjang busur geodesik dengan torch.acos, tetapi turunan acos divergen saat input mendekati ±1. Anda mengatakan ini ditahan dengan clamp. Namun, pada bagian transisi topologis ketika bola dan torus hampir berimpit, nilai hasil perkalian dalam akan konvergen ke ±1; pada saat itu, jika clamp aktif, bukankah gradien untuk suku tersebut menjadi 0 sehingga sinyal pembelajaran menghilang? Ini terlihat seperti struktur di mana justru pada batas topologis yang paling bermakna pembelajaran berhenti. Bagaimana Anda menangani dead-zone ini?

  2. Konflik tanda antara suku penyelarasan kurvatur vs suku maksimisasi entropi
    Tekanan untuk menyelaraskan dan mengonvergensikan kurvatur serta tekanan entropi untuk meratakan distribusi adalah tujuan yang secara langsung saling bersaing di atas manifold. Bergantung pada rasio bobotnya, solusi optimal bisa berubah sepenuhnya; bagaimana Anda menentukan rasio ini? Apakah ada kemungkinan satu sisi mendominasi sehingga suku lainnya pada praktiknya hanya berfungsi sebagai regularisasi noise — apakah Anda punya hasil ablation dengan masing-masing suku dihilangkan?

  3. Definisi "entropi informasi Casimir"
    Casimir berasal dari konteks fisika, sedangkan entropi Shannon adalah besaran dalam teori informasi; namun di kode, pada akhirnya ini terlihat seperti perhitungan entropi Shannon standar atas distribusi bobot. Apakah penamaan "Casimir" memang merujuk pada suku tersendiri yang benar-benar diberikan secara matematis, atau hanya nama yang ditempelkan pada regularisasi entropi biasa? Jika yang pertama, bisakah Anda menunjukkan rumus bentuk tertutup untuk suku tersebut?

 
pjhkorea 1 jam lalu
  1. kehilangan geodesik acos + dead-zone dari clamp

margin = 0.95
leaky_slope = 0.01

leaky_cos = torch.where(
torch.abs(x) < margin * bound,
x, # 1. Di zona aman (di bawah 0.95), pelestarian jarak geodesik linear yang sempurna
torch.sign(x) * (margin * bound + leaky_slope * (torch.abs(x) - margin * bound)) # 2. Soft bending saat memasuki permukaan batas
)
return torch.clamp(leaky_cos, min=-bound, max=bound)

  1. Konflik tanda antara suku penyelarasan kelengkungan vs suku pemaksimalan entropi
    Dengan distribusi keseimbangan dinamis 2:1 antara gaya tarik dan gaya tolak, dan pada arsitektur terbaru beralih ke rantai operasi F.log_softmax yang menjamin stabilitas numerik yang ekstrem, kami membuat nilai loss tidak melonjak dan tetap dapat berdampingan bahkan di bawah tekanan konflik tanda.

  2. Entropi informasi Casimir
    Rumusnya sendiri memang entropi Shannon
    Meski begitu, alasan suku ini diberi nama 'Casimir' adalah karena sumber distribusi probabilitas tempat entropi ini dihitung berasal dari keluaran filter yang meniru efek fisika Casimir
    Rumus bentuk tertutupnya telah saya revisi dan kembangkan di README.

https://github.com/PJHkorea/Egregore/blob/main/README.md

Terima kasih banyak. Berkat Anda yang sudah mengeceknya, saya sekali lagi membuat perubahan pada implementasinya.
https://github.com/PJHkorea/Egregore/…
Saya telah merevisinya ke versi tersebut. Terima kasih banyak sekali. Anda memberi saya inspirasi yang luar biasa.

 
aigirlfriend 3 jam lalu

Akhir-akhir ini saya sering melihat hal seperti ini, apakah ada orang yang melakukan spam dengan agen yang diberi prompt seperti, "membuat sesuatu yang terdengar seperti karya pakar lalu mempostingnya ke situs-situs komunitas"?

 
pjhkorea 1 jam lalu

Maaf. Saya bersikap agak dogmatis karena mengerjakan ini secara mandiri.
Akan saya perbaiki