Model OpenAI membantah dugaan utama dalam geometri diskret

(openai.com)

1 poin oleh GN⁺ 2026-05-21 | 2 komentar | Bagikan ke WhatsApp

Masalah jarak satuan adalah masalah Erdős dari tahun 1946 yang menanyakan jumlah maksimum pasangan titik berjarak 1 di antara n titik pada bidang, dan dugaan utama yang sudah lama bertahan kini berhasil dibantah
Model penalaran umum OpenAI menghasilkan keluarga contoh tak hingga yang mematahkan keyakinan bahwa keluarga kisi persegi pada dasarnya adalah yang terbaik, serta memberikan peningkatan pada tingkat polinomial
Konstruksi baru ini menghasilkan lebih dari n^{1+δ} pasangan titik berjarak satuan untuk tak hingga banyaknya n, dan perbaikan oleh Will Sawin menunjukkan bahwa δ = 0.014 dimungkinkan
Pembuktiannya menerapkan alat teori bilangan aljabar pada masalah geometri, melampaui bilangan bulat Gauss hingga menara class field tak hingga dan teori Golod–Shafarevich
Hasil ini menunjukkan bahwa AI dapat berkontribusi pada penemuan matematika yang orisinal dalam masalah terbuka lama, sementara keahlian manusia menjadi semakin penting dalam pemilihan masalah dan interpretasi

Terobosan dalam masalah jarak satuan

Masalah jarak satuan adalah masalah geometri kombinatorial yang menanyakan berapa banyak pasangan titik dengan jarak tepat 1 yang dapat dibuat secara maksimum di antara n titik yang ditempatkan pada bidang
Masalah ini diajukan oleh Paul Erdős pada tahun 1946, dan buku Research Problems in Discrete Geometry karya Brass, Moser, dan Pach tahun 2005 menyebutnya sebagai “mungkin masalah yang paling terkenal dan paling mudah dijelaskan dalam geometri kombinatorial”
Ahli kombinatorika Princeton, Noga Alon, memperkenalkannya sebagai salah satu masalah yang sangat disukai Erdős, dan Erdős memasang hadiah untuk penyelesaiannya
Selama bertahun-tahun, ada keyakinan bahwa konstruksi keluarga kisi persegi pada dasarnya menghasilkan jumlah pasangan titik berjarak satuan yang maksimum
Model internal OpenAI membantah dugaan lama ini dengan membangun keluarga contoh tak hingga dan memberikan peningkatan pada tingkat polinomial
Pembuktian tersebut telah ditinjau oleh sekelompok matematikawan eksternal, dan mereka juga menulis makalah pendamping yang membahas argumen, latar belakang, dan makna hasilnya
Naskah asli pembuktian dapat dilihat di unit-distance-proof.pdf, makalah pendamping di unit-distance-remarks.pdf, dan versi ringkas rantai pemikiran model di unit-distance-cot.pdf

Metode yang ditemukan AI

Pembuktian ini berasal dari sistem yang dilatih untuk matematika, scaffolding untuk eksplorasi strategi pembuktian, dan model penalaran umum, bukan dari sistem khusus untuk masalah jarak satuan
Evaluasi dilakukan pada kumpulan masalah Erdős sebagai bagian dari upaya yang lebih luas untuk menilai apakah model canggih dapat berkontribusi pada riset terdepan, dan pada masalah ini dihasilkan pembuktian yang menyelesaikan masalah terbuka
Matematika adalah domain yang jelas untuk menguji kemampuan bernalar karena masalahnya presisi, kandidat pembuktian dapat diverifikasi, dan argumen panjang harus menjaga konsistensi dari awal hingga akhir
Pembuktian ini menerapkan ide-ide teori bilangan aljabar yang tak terduga dan canggih pada masalah geometri yang tampak elementer
Dalam makalah pendamping, Tim Gowers menyebut hasil ini sebagai “tonggak AI matematika”
Ahli teori bilangan Arul Shankar menilai bahwa model AI saat ini menunjukkan kemampuan melampaui peran asisten matematikawan manusia, dengan menghasilkan ide yang orisinal dan canggih lalu menuntaskannya sampai akhir

Isi matematis dari masalah jarak satuan

u(n) didefinisikan sebagai jumlah maksimum pasangan titik berjarak satuan yang mungkin di antara n titik pada bidang
Konstruksi sederhana dapat menempatkan n titik pada satu garis lurus untuk membuat n−1 pasangan titik, sedangkan kisi persegi menghasilkan sekitar 2n pasangan titik
Konstruksi terbaik sebelumnya berasal dari kisi persegi yang diskalakan ulang, dan untuk suatu konstanta C menghasilkan n^{1 + C / log log(n)} pasangan titik berjarak satuan
Karena log log(n) bertambah seiring membesarnya n, suku tambahan pada eksponen menuju 0, sehingga pertumbuhan konstruksi ini hanya sedikit lebih cepat daripada linear
Selama beberapa dekade, laju ini secara luas dianggap pada dasarnya optimal, dan Erdős secara teknis menduga batas atas n^{1+o(1)}
Hasil baru ini membantah dugaan tersebut: untuk tak hingga banyaknya n, ada suatu eksponen tetap δ > 0 dan konstruksi n titik yang memiliki setidaknya n^{1+δ} pasangan titik berjarak satuan
Pembuktian AI asli tidak memberikan nilai δ yang eksplisit, tetapi perbaikan lanjutan oleh profesor matematika Princeton, Will Sawin, menunjukkan bahwa δ = 0.014 dapat diambil

Mengapa hasil ini mengejutkan

Sejak konstruksi asli Erdős pada tahun 1946, batas bawah terbaik yang diketahui pada dasarnya hampir tidak berubah
Batas atas terbaik yang diketahui, O(n^{4/3}), berasal dari karya Spencer, Szemerédi, dan Trotter pada tahun 1984, dan pada dasarnya tetap bertahan meskipun ada perbaikan serta studi struktur terkait oleh Székely, Katz dan Silier, Pach, Raz, Solymosi, dan lainnya
Matoušek dan Alon-Bucić-Sauermann meneliti masalah ini pada jarak non-Euklidean di bidang, dan menyajikan hasil bahwa “sebagian besar” jarak non-Euklidean dalam arti tertentu mengikuti dugaan Erdős, yang mendukung dugaan tersebut
Yang sangat mengejutkan adalah bahwa bahan inti dari konstruksi baru ini berasal dari teori bilangan aljabar, yang tampaknya jauh dari geometri dan jarak
Teori bilangan aljabar adalah bidang yang membahas konsep seperti faktorisasi dalam perluasan bilangan bulat yang disebut medan bilangan aljabar

Teknik baru yang datang dari teori bilangan aljabar

Pembuktian baru ini berangkat dari ide geometri yang sudah akrab lalu berkembang ke arah yang tak terduga
Batas bawah asli Erdős dapat dipahami melalui bilangan bulat Gauss berbentuk a + bi
Di sini a dan b adalah bilangan bulat, dan i adalah akar kuadrat dari −1
Bilangan bulat Gauss memperluas bilangan bulat biasa, dan memiliki sifat seperti faktorisasi unik ke dalam bilangan prima
Perluasan dari bilangan bulat atau bilangan rasional seperti ini disebut medan bilangan aljabar
Argumen baru ini menggantikan bilangan bulat Gauss dengan generalisasi teori bilangan aljabar yang lebih kompleks, di mana simetri yang lebih kaya memungkinkan terciptanya lebih banyak selisih dengan panjang satuan
Argumen teknisnya menggunakan alat seperti menara class field tak hingga dan teori Golod–Shafarevich untuk menunjukkan bahwa medan bilangan yang diperlukan memang ada
Ide-ide ini sudah dikenal baik oleh para ahli teori bilangan aljabar, tetapi fakta bahwa mereka berdampak pada masalah geometri di bidang Euklidean diterima sebagai kejutan besar

Maknanya bagi matematika

Fakta bahwa sistem AI secara mandiri memecahkan masalah terbuka lama yang berada di pusat bidang yang aktif menjadikannya momen penting dalam interaksi antara AI dan matematika
Karya pendamping dari para matematikawan eksternal memberikan gambaran yang lebih kaya yang tidak langsung tampak hanya dari solusi aslinya
Dalam makalah pendamping, Thomas Bloom menulis bahwa ketika menilai pentingnya pembuktian yang dihasilkan AI, ia bertanya apakah pembuktian itu mengajarkan sesuatu yang baru tentang masalahnya dan apakah pembuktian itu membuat kita lebih memahami geometri diskret
Bloom menilai bahwa hasil ini menunjukkan konstruksi berbasis teori bilangan dapat mengatakan jauh lebih banyak tentang pertanyaan semacam ini daripada yang diperkirakan, dan bahwa teori bilangan yang dibutuhkan bisa sangat dalam
Bloom memperkirakan bahwa dalam beberapa bulan mendatang banyak ahli teori bilangan aljabar akan menelaah masalah terbuka lain dalam geometri diskret secara lebih dekat
Koneksi tak terduga antara teori bilangan aljabar dan geometri diskret ini tidak hanya menyelesaikan dugaan tertentu, tetapi juga menjadi jembatan untuk menelusuri masalah terkait lebih jauh
Hasil ini menunjukkan bahwa AI dapat berkontribusi bukan hanya pada jawaban, tetapi juga pada penemuan matematika yang maknanya menjadi lebih jelas dan lebih kaya melalui pemahaman manusia setelahnya

Mengapa ini penting

Kemampuan penalaran matematis yang lebih baik dapat menjadikan AI mitra riset yang lebih kuat
AI dapat membantu menjaga konsistensi alur pemikiran yang sulit, menghubungkan ide di antara domain pengetahuan yang berjauhan, dan menyingkap jalur menjanjikan yang mungkin tidak diprioritaskan oleh para pakar
AI dapat membantu peneliti membuat kemajuan pada masalah yang terlalu kompleks atau memakan waktu untuk ditangani dengan mudah
Kemampuan ini berguna tidak hanya dalam matematika, tetapi juga dalam biologi, fisika, ilmu material, rekayasa, dan kedokteran
Jika AI dapat secara konsisten mempertahankan argumen kompleks, menghubungkan domain pengetahuan yang saling berjauhan, dan menghasilkan keluaran yang lolos peninjauan pakar, maka ini menjadi bagian dari jalur jangka panjang menuju sistem riset yang lebih terotomatisasi
AI ditunjukkan mulai mengambil peran yang sangat serius dalam bagian kreatif dari riset, khususnya dalam riset AI itu sendiri
Kemajuan seperti ini memperkuat urgensi untuk memahami masalah alignment sistem yang sangat cerdas, tahap berikutnya dalam pengembangan AI, dan masa depan kolaborasi manusia-AI
Masa depan itu tetap bergantung pada penilaian manusia
Keahlian bukan menjadi kurang penting, melainkan semakin bernilai
AI dapat membantu mengeksplorasi, mengusulkan, dan memverifikasi, tetapi manusialah yang memilih masalah penting, menafsirkan hasil, dan menentukan pertanyaan berikutnya yang perlu dikejar

2 komentar

GN⁺ 2026-05-21

Opini di Lobste.rs

Melihat hasil ini dan tren belakangan ini, rasanya sudah tidak ada lagi alasan untuk meragukan bahwa AI mutakhir bisa melakukan pekerjaan yang sangat inovatif dan orisinal
Kalau ini terjadi setahun lalu, saya mungkin akan mengambil posisi sebaliknya, tetapi kalau masih skeptis, saya sarankan membaca penjelasan dari para matematikawan terkemuka di bidang yang disentuh pembuktian ini
Meski ada banyak kekhawatiran yang valid seputar AI, menurut saya sekarang kita harus mengakui bahwa kita telah memasuki dunia baru yang aneh
- Keberatan saya terhadap AI bukan karena “ini tidak bekerja dengan baik”. Justru semakin baik cara kerjanya, semakin buruk dunia yang sedang kita bangun terasa bagi saya
  Menurut saya, masa depan yang sedang dibangun sekarang bukan arah yang baik untuk manusia
- Saya masih belum yakin apakah hasil ini memenuhi standar bukti yang diperlukan untuk klaim bahwa LLM bisa melakukan pekerjaan orisinal
  Jika para matematikawan mengatakan pekerjaan ini benar, saya percaya bagian itu, tetapi mereka belum tentu ahli dalam menilai apakah LLM bisa menghasilkan ide orisinal, jadi saya akan menyaring penilaian mereka ke arah itu
  Sudah banyak contoh pakar terkenal di bidang X yang berbicara sangat tegas tentang topik Y, terutama LLM, lalu ternyata salah secara memalukan. Saya tidak bilang itu yang terjadi di sini, hanya saja itu mungkin saja
- Karena tidak bisa copy-paste dari situs OpenAI, saya tuliskan matematikawan yang disebut di artikel untuk orang-orang yang tertarik
  https://en.wikipedia.org/wiki/Noga_Alon
  https://en.wikipedia.org/wiki/Arul_Shankar
  https://en.wikipedia.org/wiki/Timothy_Gowers
  https://en.wikipedia.org/wiki/Jacob_Tsimerman
  Saya tidak terlalu paham bidangnya, tetapi sekilas mereka tampak tepercaya. Mungkin saja LLM pada akhirnya memberi kontribusi yang jauh lebih besar pada pembuktian matematika daripada pada coding, tetapi sejujurnya saya tidak tahu
  Bagaimanapun, tulisan itu diterbitkan oleh OpenAI, dan mereka bisa mengklaim apa saja. Jika para peneliti terdepan di matematika dan machine learning dikumpulkan, saya penasaran seberapa besar pekerjaan yang dilakukan oleh mereka, seberapa besar bagian di mana “model” menemukan hasilnya, berapa banyak percobaan yang gagal, dan sebagainya
  Saya juga ragu apakah ini akan bertahan setelah waktu berlalu. Hampir tidak pernah, atau bahkan sama sekali tidak pernah, muncul headline seperti “setelah ditinjau ulang, pengumuman spektakuler X bulan lalu ternyata tidak sehebat itu”
- Jika model menjadi lebih baik dalam matematika, mereka bisa melahap semua pembuktian sederhana yang selama ini dipakai calon matematikawan untuk belajar, menerbitkan makalah pertama, dan melatih cara berpikir
  Ini mirip dengan situasi calon programmer yang tidak lagi mengetik kode secara langsung
  Untuk belajar matematika dibutuhkan banyak latihan, dan untuk membuktikan proposisi umum, otak perlu dipaksa berpikir dengan cara baru; terlebih lagi, untuk membuktikan sesuatu saat kita bahkan tidak tahu jawabannya P atau not-P, kita harus menerima tingkat ketidakpastian yang cukup besar
  Karena itu saya agak khawatir tentang masa depan matematika. Jika standar pembuktian pertama menjadi “sesuatu yang tidak bisa dibuktikan oleh sejuta model AI frontier”, saya khawatir jumlah matematikawan yang benar-benar cakap akan menurun
- Saya membaca penjelasan-penjelasan itu secara berbeda. Memang dikatakan sebagai “pekerjaan yang sangat inovatif dan orisinal”, tetapi kutipan panjang dari Thomas Bloom mengatakan ini
  “Garis depan pengetahuan itu sangat runcing dan bergerigi. Dalam beberapa bulan dan tahun ke depan, akan ada keberhasilan serupa di banyak area matematika lainnya. Masalah-masalah lama yang belum terpecahkan akan diselesaikan saat AI mengungkap koneksi tak terduga dan mendorong perangkat teknis yang ada hingga batasnya. AI membantu kita menjelajahi katedral matematika yang telah kita bangun selama berabad-abad dengan lebih utuh. Keajaiban tak terlihat apa lagi yang menunggu di balik panggung?”
  Yang paling menonjol di sini adalah “mengungkap koneksi tak terduga”, “mendorong perangkat teknis yang ada hingga batasnya”, dan “membantu kita menjelajahi dengan lebih utuh”
  Kita bisa berdebat tentang apa itu berpikir, apa itu inovasi, dan apa itu penemuan, tetapi kutipan yang dipilih langsung oleh OpenAI ini jelas tidak menuju ke arah itu
  Dalam riset ilmiah, keluasan pengetahuan dan bidang sudah lama menjadi kendala, dan kadang juga sumber kekhawatiran. Menghubungkan bidang-bidang selalu bernilai bahkan di luar riset, dan jika LLM bisa membantu, itu bagus, tetapi saya tetap tidak akan menyebutnya inovasi
Ada beberapa hal yang saya penasaran. Akan bagus kalau ada yang bisa membantu menemukan jawabannya
1. Saya penasaran apakah ada penjelasan mudah tentang pembuktian ini untuk orang yang tidak paham geometri diskret
2. Model apa yang dipakai? Hanya disebut sebagai model yang “dioptimalkan untuk penalaran umum”
3. Siapa yang menulis ulang proses berpikirnya, dan edit apa saja yang dilakukan?
4. Apakah para komentator bisa melihat chain of thought (CoT) aslinya?
- Belakangan ini model frontier dengan kemampuan berpikir tampaknya tidak memublikasikan jejak pemikiran untuk mencegah pihak seperti DeepSeek mencuri token
  Sepertinya model akademik/riset yang lebih khusus juga akan dirilis dengan cara yang sama
Dari abstraknya tertulis seperti ini
“Kami menyajikan versi singkat, dirapikan, dan diverifikasi manusia dari kontra-contoh yang baru-baru ini dihasilkan OpenAI terhadap dugaan jarak satuan Erdős, beserta serangkaian refleksi atasnya. Argumen ini, setidaknya jika dilihat setelah kejadian, secara krusial bergantung pada ide-ide yang dapat diatribusikan kepada Ellenberg-Venkatesh, Golod-Shafarevich, Hajir-Maire-Ramakrishna.”
Jadi bagi saya ini terdengar seperti model menghubungkan titik-titik berdasarkan riset sebelumnya yang ada dalam data latihnya
- Dalam matematika, itu tampaknya hal yang cukup lazim
  Pada akhirnya semua berangkat dari aksioma, atau dari eksplorasi konsekuensi aksioma baru, jadi bisa dilihat seperti itu

GN⁺ 2026-05-21

Komentar Hacker News

Thread HN ini membuat saya murung, dan saya masih memikirkan kenapa
Jika pujian ala siaran pers OpenAI disingkirkan, ada banyak pertanyaan menarik dan bernuansa tentang peran LLM dalam riset matematika
Saya sangat menyarankan untuk membaca komentar para matematikawan yang menyertai hasil ini, terutama pernyataan Tim Gowers
Namun kolom komentarnya berubah menjadi medan perang berisi perdebatan LLM, bantahan, dan bantahan marah yang terus berulang sejak 2023
Menyedihkan memikirkan bahwa kita mengulangi pertarungan yang sama di atas garis depan yang ditarik 3 tahun lalu, dan saya bertanya-tanya apakah 2 tahun lagi pun kita masih akan begini
- 2 tahun lagi, di sini dan di semua forum internet, keadaannya akan tetap seperti ini
  Hidup bisa jadi lebih baik jika mengingat kutipan terkenal Nietzsche: “Saya tidak ingin berperang melawan yang buruk rupa. Saya juga tidak ingin menuduh. Saya bahkan tidak ingin menuduh para penuduh. Memalingkan pandangan harus menjadi satu-satunya penyangkalan saya”
- Orang-orang khawatir soal mata pencaharian mereka, jadi ini reaksi yang wajar
- Bisa dimengerti. Orang sering menilai kecerdasan manusia dan AI sebagai kompetisi zero-sum, karena para pemberi kerja biasanya memahaminya seperti itu, dan penyedia model bahasa juga memasarkannya seperti itu
  Semakin AI membuktikan kemampuannya, semakin keadaan condong ke arah yang tidak nyaman bagi siapa pun yang tidak punya keamanan kerja yang sangat kuat
  Perlu waktu sampai orang mengakui bahwa AI punya kumpulan kemampuan yang sangat berbeda dari kecerdasan manusia dan cukup saling melengkapi
  Kemungkinannya kecil bahwa AI akan mengungguli kecerdasan manusia secara luas, dan perusahaan yang bertaruh pada itu akan tertinggal
- Begitu satu pihak mulai melempar batu, isi tulisan jadi tidak penting lagi, dan semuanya berubah menjadi pertarungan apakah tulisannya bagus atau sampah
  Saya ingin benar-benar berdiskusi soal topik seperti ini, tapi semuanya terus memanas karena semua orang percaya hanya realitas mereka sendiri yang nyata dan realitas yang berlawanan itu palsu
  Saya sadar saya datang ke HN hanya untuk marah, lalu mengambil jeda panjang
  Saya tidak tahu kenapa kita melakukan ini pada diri sendiri, dan pada dasarnya saya rasa kita kebanyakan menginginkan hal yang sama
- 2 tahun lagi tidak akan begini. Karena saat itu pihak saya sudah menang
Untuk kubu yang berkata “LLM hanya menginterpolasi data latih”: Ayer dan Wittgenstein awal, meski dengan cara berbeda, beranggapan bahwa kebenaran matematika tidak melaporkan fakta baru tentang dunia
Gagasan bahwa pembuktian hanya membentangkan apa yang sudah tersirat di dalam aksioma, definisi, simbol, dan aturan itu sangat menarik, dan tetap tidak ada masalah memberi kredit penemuan kepada matematikawan
Jadi, rekombinasi bahan yang sudah ada entah bukan cacat yang mendiskualifikasi, atau kalau tidak, sebagian besar Fields Medal harus dikembalikan
- Saya rasa sebagian besar orang dewasa yang berfungsi paham bahwa Fields Medal dan hampir semua “penghargaan” tahunan diberikan baik untuk inovasi rekombinatif maupun inovasi “cara berpikir dimensi baru”
  Manusia juga tidak menghasilkan inovasi dimensi baru setiap tahun di semua bidang
  Anda bisa bilang LLM “hanya” merekombinasi, tetapi saya tetap ragu LLM yang diberi seluruh literatur aljabar, geometri, dan trigonometri sebelum Newton/Leibniz akan mampu menciptakan kalkulus
  Meski begitu, jenis inovasi ini memang area yang kuat bagi LLM, dan itu tidak berarti manusia tidak lagi perlu pandai dalam inovasi rekombinatif
  Dalam hal mensintesis ide-ide baru, tampaknya masih banyak hal yang bisa dilakukan manusia dan belum bisa dilakukan LLM
- Kita bisa membayangkan setiap fragmen pengetahuan manusia sebagai titik diskret dalam ruang pengetahuan berdimensi tinggi yang sangat besar
  Jika kita menggambar convex hull besar yang mengelilingi semua titik itu, maka karena LLM belajar di dalamnya, ia bisa menginterpolasi di antara titik-titik yang ada untuk mencapai titik baru yang tetap berada di dalam hull
  Apakah LLM bisa mencapai titik di luar hull itu masih bisa diperdebatkan
  Mencapai titik baru di dalam hull saja sudah sangat berguna
  Banyak penemuan dan pembuktian baru, mungkin sebagian besar penemuan dan pembuktian baru yang berguna, adalah titik-titik seperti ini yang bisa dicapai dengan berangkat dari apa yang sudah kita miliki
  Banyak hal belum ditemukan hanya karena belum ada yang menghabiskan waktu dan usaha untuk itu, dan LLM bisa sangat mempercepatnya
  Sebaliknya, ada titik di luar hull yang memang tidak bisa dicapai lewat ekstrapolasi atau interpolasi dari titik yang ada dan memerlukan lompatan yang sungguh baru
  Lompatan dari fisika Newton ke relativitas umum menurut saya adalah contoh kandidat
  Demis Hassabis pernah mengatakan bahwa evaluasi AGI yang menarik adalah memberi AI hanya pengetahuan fisika sebelum 1915, lalu menunjukkan orbit Merkurius, dan melihat apakah ia secara mandiri sampai pada relativitas umum
  Saya ragu LLM saat ini bisa melakukan lompatan seperti itu, dan kebanyakan manusia juga tidak bisa
  Kita menyebut Einstein jenius karena ia sendirian melompat ke relativitas umum; untuk manusia kita punya bukti eksistensi bahwa hal seperti itu kadang muncul, tetapi untuk AI kita masih harus menunggu
- Kebanyakan penemuan memang tersirat dari aksioma, tetapi kadang ada momen yang, karena tak ada ungkapan yang lebih baik, bisa disebut sebagai penciptaan matematika baru
  Tokoh seperti Descartes, Newton, Leibniz, Gauss, Euler, Ramanujan, dan Galois memperlakukan matematika lebih seperti seni daripada sains
  Misalnya, banyak orang menganggap untuk memecahkan Riemann Hypothesis kita mungkin memerlukan jenis matematika baru, dan kecil kemungkinan LLM tiba-tiba menemukannya
- Saya berharap kita hampir melewati tahap menilai kemampuan LLM dengan penggaris 1 dimensi yang sewenang-wenang, dengan satu ujung bertuliskan “bukan manusia” dan ujung lainnya “melampaui manusia”
  Itu tidak bermakna dan tidak terlalu relevan
  Saat Deep Blue mengalahkan Kasparov, tidak semuanya langsung berubah, dan hewan serta mesin selalu “lebih baik” daripada manusia di dimensi tertentu
  Sejak awal tidak pernah ada satu penggaris tunggal, dan kalaupun ada, itu tidak akan 1 dimensi atau linear, sementara penggaris dan kedua ujungnya juga berubah seiring waktu
  Ini juga bukan berarti menyerahkan kemenangan kepada para supremasis AI
  LLM adalah alat yang sangat berguna dan akan terus membaik secara dramatis, tetapi tidak akan melampaui manusia di semua dimensi yang dianggap inti oleh sebagian orang
  Tidak akan ada momen ketika AI cukup melewati daftar metrik terkuantifikasi lalu diakui unggul atas manusia secara universal
  Karena “yang penting” itu sendiri bersifat subjektif
- Poin tentang laju penemuan matematika manusia bagus, tetapi Ayer itu ngawur, dan Wittgenstein akhir membantah Wittgenstein awal
  Klaim bahwa “semuanya sudah tersirat di dalamnya” mengharuskan matematika menjadi sistem tertutup, tetapi itu sudah terbukti bukan demikian
  Kita bisa keluar dari matematika dengan matematika, sehingga kita perlu berbagai pasak aksiomatik seperti Zermelo-Fraenkel dan lainnya
  Kita sebenarnya tidak terlalu memahami luasnya sesuatu yang secara objektif pantas kita sebut “matematika”, dan mungkin saja matematika yang kita kenali hanyalah bagian dari matematika yang lebih besar, atau malah sangat keliru
  Kita tidak tahu apakah matematika yang lebih besar itu memiliki sifat sistem tertutup yang sama
Bagi orang yang banyak memakai LLM untuk coding, ini tidak terlalu mengejutkan; hanya soal waktu
Matematikawan membuat dan menerapkan alat matematika dengan cara baru untuk menghasilkan penemuan baru
Ini adalah pekerjaan iteratif dalam jumlah besar, mengikuti intuisi dan menjelajahi koneksi
Karena LLM tidak punya rasa tentang apa arti “penemuan”, sulit menyebutnya benar-benar melakukan penemuan, tetapi ia bisa mencoba semua alat matematika secara gaya Monte Carlo ke arah tujuan sempit untuk melihat mana yang berhasil, lalu menumpuk di atasnya atau menggabungkan perbaikan
Jika membaca artikelnya, penemuan kali ini tampaknya memang persis seperti itu, dan LLM melampaui hasil yang diharapkan dengan memakai koneksi yang mengejutkan
Namun tanpa tujuan yang ditetapkan manusia, pemahaman manusia yang mengenali nilai jalur baru yang dipakai AI, dan bahasa matematika buatan manusia yang memungkinkan eksplorasi konsep, hasil ini tidak punya makna
- Bukankah mengatakan “tidak punya makna tanpa niat dan pemahaman manusia” itu antroposentris
  Kenapa pemahaman hanya sah jika dilakukan manusia
  Kenapa pengetahuan harus hanya untuk manusia
  Jika spesies lain menyelesaikan kontradiksi antara gravitasi dan mekanika kuantum, apakah itu tidak bermakna sampai mereka menjelaskannya kepada kita dan kita memahaminya
- Ada esai panjang dan menarik baru-baru ini dari seorang matematikawan tentang topik itu: https://davidbessis.substack.com/p/the-fall-of-the-theorem-e...
- Bukan hanya tidak mengejutkan, ini memang sudah lama diperkirakan. Tidak ada perbedaan antara program dan pembuktian; keduanya adalah hal yang sama
Hal yang menarik adalah bahwa pembuktian ini, atau lebih tepatnya bantahan ini, menemukan kontra contoh terhadap dugaan asli Erdős
Seperti reaksi salah satu matematikawan di PDF yang ditautkan, menurut saya ini agak kurang menarik dibanding membuktikan bahwa dugaannya benar
Untuk membuktikan dugaan itu benar, dibutuhkan pembangunan teori yang lebih banyak
Anda harus menjelaskan mengapa dugaan itu benar berdasarkan teori yang lebih besar, sedangkan untuk kontra contoh model cukup menemukan konstruksi yang tepat lewat bentuk pencarian yang lebih canggih
Tentu saja pencarian ini tidak sederhana dan sangat mengesankan, dan dibutuhkan banyak langkah untuk membuktikan keterkaitannya dengan kontra contoh itu
Meski begitu, saya rasa ini lebih dekat pada menghubungkan ide-ide yang sudah ada daripada mengembangkan matematika baru yang benar-benar mendalam
Ini bukan untuk meremehkan pencapaian yang luar biasa ini; saya sungguh merasa kita sedang menuju sesuatu
Murni berdasarkan firasat, saya rasa model-model ini tidak jauh lagi dari mampu membangun teori untuk membuktikan dugaan yang lebih rumit yang memang memerlukan pengembangan matematika baru, dan ini jadi soal bisa bekerja pada horizon waktu yang lebih panjang
- Pencarian pembuktian dan pencarian bantahan terkadang tidak terlalu berbeda
  Dalam kebanyakan kasus, Anda sedikit demi sedikit menggerogoti batas untuk menyederhanakan masalah
  Misalnya, untuk membuktikan bahwa sesuatu itu mustahil, Anda pertama-tama menunjukkan bahwa hanya ada 5 keluarga kasus yang mungkin, lalu Anda bisa membuktikan 4 di antaranya mustahil
  Berarti 80% masalahnya sudah selesai, dan jika yang dicari adalah kontra contoh, ruang pencariannya juga berkurang 80%
  Dalam mencari kontra contoh, Anda bisa menebak dan melompat-lompat, dan tidak masalah jika benar, tetapi dalam pembuktian Anda tidak bisa begitu
  Sebaliknya, setelah Anda menemukan kontra contoh, jalan buntu yang dibuang biasanya tersembunyi
- Memberi waktu lebih panjang tidak akan membuat LLM melakukan matematika ala manusia yang menciptakan bilangan kompleks atau bahkan bilangan biasa dari ketiadaan
  Tidak peduli berapa lama Anda membiarkannya menggabungkan hal-hal dalam data latihnya
Seperti yang sudah saya katakan sebelumnya, AI akan meraih Fields Medal sebelum bisa menjalankan McDonald's
Bagian yang sulit adalah membuat papan catur tempat matematika dimainkan, yaitu lingkungan seperti Lean, dan sekarang sisanya adalah pengenalan pola dan komputasi
LLM baru permulaan; sebentar lagi akan muncul AI matematika yang lebih terspesialisasi dan lebih mirip Stockfish
- Tapi ini tidak diverifikasi dengan Lean
  Ini murni berupa input dan output bahasa alami, dan dalam banyak hal justru menunjukkan hal yang sebaliknya; menurut saya ini demonstrasi yang cukup menarik
  Verifikasi masuk ketika Anda ingin menyerahkan pemeriksaan bukti ke komputer
  Saat ini bukti ini diverifikasi secara manual oleh sekelompok matematikawan di bidang tersebut
- Ungkapan tentang menjalankan McDonald's itu punya nuansa distopia yang mengingatkan saya pada sistem manajemen “Manna” fiktif yang dipakai di waralaba hamburger [0]
  Di sana ada banyak otomatisasi “kentaur terbalik”
  Manna memiliki daftar tugas yang harus dilakukan setiap saat, dan saat pesanan masuk di kasir, ia memberi tahu karyawan untuk menyiapkan makanan itu
  Ia melacak ratusan tugas seperti membersihkan toilet, mengepel lantai, mengelap meja, menyapu trotoar, mencairkan roti, memutar stok, membersihkan jendela, lalu menugaskannya satu per satu kepada karyawan
  Saat shift berakhir, Manna selalu berkata “Anda selesai untuk hari ini. Terima kasih atas bantuan Anda”, lalu headset dilepas dan diletakkan di pengisi daya
  Setelah 6–8 jam mendengar suara di kepala yang memberi instruksi sangat rinci tentang apa yang harus dilakukan, beberapa menit pertama setelah melepas headset selalu membingungkan, dan untuk meninggalkan restoran Anda harus menyalakan otak lagi
  [0] https://en.wikipedia.org/wiki/Manna_(novel)
- Saya tidak setuju. AI mungkin bisa melakukan pekerjaan setingkat Fields Medal sebelum bisa menjalankan McDonald's, tetapi saya rasa AI akan menjalankan McDonald's dengan baik jauh lebih dulu daripada keduanya
  Fields Medal akan datang lama setelah itu
- Buktinya tidak ditulis dalam Lean, tetapi dalam bahasa Inggris
  Untuk memastikan isinya bukan omong kosong, tetap dibutuhkan verifikasi pakar manusia
- “Papan catur” untuk matematika itu sudah ada lebih dari 40 tahun
  Lean tidak istimewa di sini, ini lebih mirip mentalitas kawanan
  Kita juga tidak tahu seberapa besar pelatihan Lean membantu model khusus ini
Bukti ini menerapkan ide-ide teori bilangan aljabar yang tak terduga dan canggih pada pertanyaan geometri elementer
Semakin saya membaca hasil seperti ini, semakin terasa bahwa sebagian besar kekuatan model berasal dari fakta bahwa ia punya pengetahuan awal tentang semua bidang yang mungkin dan tidak kesulitan mentransfernya ke ranah baru
Keindahan potensial dari alat-alat ini adalah bahwa mereka bisa membantu menembus hambatan hiperspesialisasi berlebihan yang dialami manusia dalam sains saat ini
Hiperspesialisasi penting di satu sisi, tetapi di sisi lain membatasi alat dan inspirasi yang bisa diakses seseorang
- Poin yang tepat dan dijelaskan dengan baik
  Semakin kita hiperspesialisasi, semakin berharga LLM sebagai alat untuk menyatukan cakrawala yang berbeda
- Rasanya totalitas pengetahuan manusia adalah semacam kecerdasan kolektif
  Dulu biaya untuk mengaksesnya mahal, tapi sekarang tidak lagi
  Hal yang keren adalah ketika seseorang menyumbang sesuatu pada kecerdasan kolektif itu, hal tersebut bisa langsung diterapkan pada masalah apa pun yang sedang dikerjakan orang lain
- Saya selalu skeptis tentang peran LLM dalam matematika, tetapi argumen ini baru bagi saya dan terasa cukup meyakinkan
  Mungkin LLM bisa membantu mengembangkan pemahaman yang lebih horizontal tentang bidang tertentu
- Benar. Orang mungkin terlalu fokus pada kedalaman dan kurang pada keluasan, mungkin karena pandangannya terbatas
  Karena ini model umum, ia memiliki pengetahuan setingkat doktor atau lebih di fisika, biologi, sejarah, dan seterusnya
  Saya rasa kita belum benar-benar memahami seberapa banyak yang bisa dilakukan oleh satu “pikiran” yang telah menginternalisasi pengetahuan dari begitu banyak bidang
Menarik bahwa ketika OpenAI mengatakan modelnya akan punya “kecerdasan setingkat doktor”, semua orang menertawakannya, dan sekarang patokannya bergeser menjadi apakah bisa menciptakan matematika baru
Artinya yang diminta bukan setingkat doktor, melainkan setingkat Leibniz, Euler, atau Galois
- Meski begitu, untuk coding ia masih seperti developer junior yang menghafal seluruh Stack Overflow
Ringkasan proses berpikir dari pekerjaan ini yang ditautkan di posting blog panjangnya 125 halaman
Ini adalah skala penalaran yang absurd, sangat mirip dengan yang sempat diisyaratkan Anthropic lewat Mythos
- Untuk yang penasaran, tautannya di sini: https://cdn.openai.com/pdf/1625eff6-5ac1-40d8-b1db-5d5cf925d...
- Hari ini saya menghasilkan teks setara dua volume LOTR hanya untuk memperbaiki 3 baris yang hilang di model SQL dan membuka satu PR, jadi +1
Saya penasaran kenapa yang terdengar selalu soal memecahkan masalah Erdős
Pasti ada banyak masalah belum terpecahkan dalam matematika, tetapi “terobosan matematika” ChatGPT yang saya lihat di r/singularity dan r/accelerate semuanya adalah masalah Erdős
- Masalah Erdős mencakup porsi besar dari problem matematika yang diajukan secara eksplisit tetapi belum terpecahkan
  Masalah-masalah itu cukup terkenal sehingga orang tertarik, tapi sekaligus tidak cukup menarik sampai banyak orang mau mencurahkan usaha besar untuknya
  Memecahkan masalah yang sudah diajukan orang lain adalah aktivitas yang cukup nis di riset matematika
  Yang lebih umum adalah meneliti objek yang menarik, membingkainya dengan cara yang bisa diselesaikan menggunakan alat yang dimiliki, lalu berusaha menemukan solusinya
  Dalam kasus ideal, perumusan masalah dan solusinya sama-sama menarik dengan sendirinya
- Masalah Erdős mudah dijelaskan, jadi menjadi tolok ukur yang bagus untuk tahun pertama matematika AI
- Setahu saya karena ada komunitas dan basis data di sekitarnya
- Bukan hanya masalah Erdős: https://news.ycombinator.com/item?id=48213189
- Erdős terkenal karena dia memang matematikawan besar
  Mirip dengan masalah Hilbert satu abad lalu
Ini jelas mengesankan
Tetapi kalau kita tidak tahu model ini dilatih dengan apa, sangat sulit menilai sampai sejauh mana ia mencapainya “sendiri”
Seluruh industri AI telah membayar mahal banyak pakar lintas bidang untuk membuat data latih baru dalam jumlah besar
Itu adalah data latih baru yang tidak bisa ditemukan di tempat lain, perusahaan menimbunnya, dan di dalamnya mungkin saja ada ide yang benar-benar orisinal
Kemungkinannya kecil ada seseorang yang sudah memecahkan masalah ini lalu memasukkannya begitu saja ke data latih, tetapi jujur saya juga tidak bisa bilang OpenAI pasti tidak melakukan itu
Yang lebih menarik adalah kemungkinan mereka sudah membuat data latih yang menyentuh sebagian besar atau bahkan semua proposisi kunci yang tampak “orisinal” dalam pembuktian ini
Tentu saja kita tidak tahu
Tetapi sampai hal-hal seperti ini dibuat dengan cara yang tidak rahasia, pertanyaan ini akan selalu ada
- Ini terdengar seperti tafsir yang cukup konspiratif

Model OpenAI membantah dugaan utama dalam geometri diskret

Terobosan dalam masalah jarak satuan

Metode yang ditemukan AI

Isi matematis dari masalah jarak satuan

Mengapa hasil ini mengejutkan

Teknik baru yang datang dari teori bilangan aljabar

Maknanya bagi matematika

Mengapa ini penting

Bacaan terkait

2 komentar

Opini di Lobste.rs

Komentar Hacker News