- Masalah lama bahwa nilai minimum Erdős sum dari primitive set adalah 1 dan mendekati nilai itu saat elemennya menuju tak hingga, kini diterima sebagai telah terpecahkan lewat solusi yang dibuat oleh GPT-5.4 Pro
- Solusi tersebut adalah hasil yang diperoleh Liam Price dari satu kali prompt lalu diunggah ke erdosproblems.com, dan setelah itu cepat menarik perhatian melalui peninjauan Kevin Barreto dan para ahli
- Pembuktian ini menempuh jalur yang berbeda dari pendekatan awal yang biasanya dipilih orang, dan menonjol karena secara tak terduga menggabungkan rumus yang sudah dikenal di bidang terkait ke masalah ini
- Bukti asli dari ChatGPT terlalu kasar untuk dipakai begitu saja, sehingga para ahli terlebih dahulu menyaring inti idenya untuk memahaminya lalu merapikannya menjadi bentuk yang lebih pendek dan tertata
- Fakta bahwa pendekatan baru dari LLM berhasil pada masalah yang bahkan matematikawan ternama pun tidak dapat pecahkan dapat mengubah cara memandang struktur bilangan besar dan sudut pandang yang mengelompokkan masalah-masalah serupa
Masalah dan cara penyelesaiannya
- primitive set adalah himpunan bilangan bulat di mana tidak ada satu pun bilangan dalam himpunan yang habis dibagi oleh bilangan lain dalam himpunan itu
- Erdős mendefinisikan Erdős sum yang dihitung untuk himpunan semacam ini, dan menganggap skor tersebut menurun ketika bilangan-bilangan dalam himpunan makin besar
- Dugaan bahwa nilai minimumnya tepat 1, dan bahwa nilainya mendekati angka itu saat elemen-elemen himpunan menuju tak hingga, telah lama bertahan
- Solusi kali ini adalah hasil yang diterima Liam Price setelah memberi satu prompt ke GPT-5.4 Pro, lalu diunggah ke erdosproblems.com
- Tanpa mengetahui latar belakang sejarah masalahnya, Price mencoba memasukkan masalah Erdős ke AI dan memperoleh solusi yang tampak benar
- Setelah itu ia meninjaunya bersama Kevin Barreto, dan para ahli yang dihubungi pun cepat memberi perhatian
- Sebelumnya juga ada laporan bahwa AI telah menyelesaikan beberapa Erdős problems, tetapi tingkat pentingnya dan kesulitannya sangat berbeda-beda antar masalah, sehingga tidak sempurna sebagai tolok ukur kemampuan matematika, dan cukup banyak solusi yang ternyata tidak senovel yang terlihat
- Hasil kali ini dipandang berbeda karena menangani masalah yang bahkan matematikawan ternama belum bisa selesaikan, serta memakai metode yang tidak digunakan pada masalah sejenis
Mengapa dinilai berbeda
- Saat memecahkan masalah ini, orang-orang umumnya memilih pendekatan awal yang mirip, tetapi solusi LLM kali ini masuk melalui jalur yang sepenuhnya berbeda
- Ia mengambil rumus yang sudah terkenal di bidang matematika terkait, tetapi merupakan kombinasi yang sebelumnya tidak terpikir untuk diterapkan pada masalah seperti ini
- Terence Tao menilai bahwa masalah itu sendiri mungkin sebenarnya lebih mudah dari yang dibayangkan, dan bahwa pada pendekatan awal ada semacam mental block
- Jared Lichtman menjelaskan bahwa bukti asli ChatGPT dalam bentuk aslinya sangat kasar, sehingga diperlukan proses dari ahli untuk memilah maksud yang ingin disampaikan dan memahaminya
- Kini Lichtman dan Tao telah merapikan bukti itu menjadi lebih singkat, sehingga wawasan inti dari LLM tampak lebih jelas
- Lompatan kali ini dapat mengarah pada cara berpikir baru dalam memandang bilangan besar dan strukturnya
- Pentingnya dalam jangka panjang masih terlalu dini untuk dipastikan, tetapi hal ini diterima sebagai pendekatan yang mendukung intuisi bahwa masalah-masalah serupa saling terhubung dalam satu kerangka
1 komentar
Komentar Hacker News
https://archive.ph/2w4fi
Paul Erdős adalah matematikawan yang sangat terkenal dan cukup eksentrik, yang menjalani sebagian besar hidupnya pada abad ke-20
Ia punya kebiasaan mencari dan mencatat masalah yang sedang digeluti para matematikawan, dengan tingkat kesulitan yang sangat luas, mulai dari setara PR mahasiswa sarjana saat ini hingga masalah kelas Fields Medal jika berhasil dipecahkan
Benang merah yang menyatukan masalah-masalah ini adalah bahwa salah satu orang paling cerdas dalam 100 tahun terakhir tidak bisa langsung menjawabnya
Belakangan ini, orang membuat pembuktian masalah-masalah seperti ini dengan LLM dan memakainya seperti benchmark, dan setiap kali model baru keluar selalu ada beberapa lagi yang berhasil dipecahkan
Masalah ini sebelumnya juga sudah ditelaah oleh banyak matematikawan ahli, dan pembuktian yang muncul disebut mengejutkan, elegan, bahkan menunjukkan koneksi baru
Penyelesaian masalah Erdős oleh ChatGPT sebelumnya umumnya kurang mengesankan, lebih mirip penelusuran literatur atau memecahkan masalah yang relatif mudah tetapi terlantar
Kalau membaca prompt-nya, jadi penasaran apakah dorongan seperti
tidak harus konvensionalikut berperan dalam keberhasilannya[1] https://chatgpt.com/share/69dd1c83-b164-8385-bf2e-8533e9baba9c
Prompt yang sebenarnya adalah seperti ini
Diminta untuk tidak melakukan pencarian internet, lalu mencoba membuat pembuktian atau bantahan yang tidak sepele, baru, dan kreatif untuk masalah number theory and primitive sets
Diminta pembuktian atau bantahan unconditional yang lengkap, dan ditegaskan lagi bahwa klaim seperti itu mungkin memerlukan unsur yang tidak biasa dan kreatif
Lalu ada label
Thought for 80m 17shttps://chatgpt.com/share/69dd1c83-b164-8385-bf2e-8533e9baba9c
lalu mengajukan bahwa ia akan membuktikan
w(a)= 1/alog(a)danuniformly for every primitive A⊂[x,∞), ∑w(a)≤1+O(1/log(x))Ia mengklaim ini adalah kesimpulan yang lebih kuat daripada
1+o(1)yang dimintahttps://chatgpt.com/share/69ed8e24-15e8-83ea-96ac-784801e4a6ec
https://chatgpt.com/share/69ed83b1-3704-8322-bcf2-322aa85d7a99
Tapi aku tidak cukup paham matematika untuk menilai apakah ini benar-benar pembuktian yang valid
Kemajuan sains sering terjadi ketika teknik X dari satu bidang dibawa untuk dipakai pada masalah Y di bidang lain, dan LLM tampaknya lebih kuat daripada manusia dalam membuat koneksi lintas bidang seperti ini
Karena ia mengetahui jauh lebih banyak teori dan pendekatan daripada yang bisa diketahui satu orang, dan juga tidak perlu khawatir terlihat bodoh di depan rekan-rekannya
Kemampuan untuk menggeneralisasi pengetahuan dan menerapkannya ke domain lain
Dalam pekerjaan seperti ini, LLM jauh lebih baik daripada manusia, dan mungkin selama ini orang salah menggolongkannya sebagai kreativitas
Tidak bisa dibilang menghasilkan terobosan besar, tapi rasanya beberapa kali aku mendapat wawasan yang cukup layak untuk ditulis jadi whitepaper
Proses mencoba menghubungkan korelasi lintas bidang itu sendiri cukup menyenangkan sebagai eksperimen LLM
Waktu kecil aku juga dulu membaca satu halaman sekaligus, lalu pada suatu titik berubah menjadi membaca kata demi kata dan baris demi baris, dan mode itu menetap
Saat kuliah, pernah ada masa ketika persepsi yang lebih dalam, lebih luas, dan lebih nonlinier sempat terbuka dalam area jurusan matematikaku, tapi aku tidak yakin apakah itu karena keterampilan otak kiri atau karena otak kanan lebih ikut bekerja
Dalam pemikiran berurutan seperti ini LLM jelas akan melampaui kita, jadi aku penasaran apakah manusia harus lebih mendorong ke sisi right-brainness yang tersisa, atau AI akan sampai ke sana juga lebih cepat
AI adalah rekan kolaborasi aneh favoritku
Beberapa masalah Erdős pada akhirnya nyaris menjadi sepele jika memakai teknik canggih yang dikembangkan kemudian
Salah satu profesorku pernah menjadi rekan penulis Erdős, dan ia sangat bangga karena bisa menjadikan masalah Erdős yang sempat tak terpecahkan selama beberapa waktu sebagai soal kuis mahasiswa sarjana
Jadi contoh kali ini tampak sebagai bukti bahwa modelnya memang benar-benar lebih kuat
Karena LLM generasi sebelumnya tidak bisa memecahkan masalah ini
Karena itu hasil kali ini tampak lebih menjanjikan
Sebab kini ada garis pendekatan baru yang layak dievaluasi untuk masalah-masalah serupa
Pada titik ini rasanya bagus kalau ada satu repo GitHub yang berisi banyak masalah dry lab yang belum terpecahkan, lalu dibuat harness untuk menjalankan semuanya setiap kali model baru keluar
[1] https://github.com/teorth/erdosproblems
Tulisan ini juga membahas salah satu di antaranya yang berhasil dipecahkan
Bagian
teks asli pembuktian dari ChatGPT sebenarnya cukup buruk, dan perlu disaring oleh pakar untuk memahami apa yang ingin disampaikanterasa persis sama dengan perasaanku setiap kali membaca makalah matematikaKalau ini adalah masalah berusia 60 tahun, aku sempat berpikir mungkin sebenarnya sudah pernah terpecahkan secara tidak langsung, dan model ini hanya berhasil menemukan silang-informasinya
Setelah melihat situsnya, hampir tidak ada jejak diskusi manusia sebelumnya, dan komentar-komentar terbaru pun hanya membahas bahwa GPT yang menemukannya, jadi aku makin merasa begitu
Kalau memang masalah 60 tahun, kukira akan ada diskusi yang lebih lama, jadi aku penasaran apakah ada sesuatu yang terlewat dariku
Tetap saja ini penemuan yang hebat, dan tampaknya ada lebih banyak masalah serupa yang layak diperiksa ulang dengan GPT
Manusia, dan juga mesin yang dibuat manusia, umumnya memecahkan masalah dengan cara akumulatif
Karena terus membangun di atas fondasi yang sudah ada, kita mudah terjebak dalam pola pikir akibat kecenderungan untuk tidak ingin menciptakan ulang roda
Jadi tidak terlalu mengejutkan kalau LLM yang naif mengajukan pendekatan yang tidak pernah dicoba para ahli
Dalam kasus terbatas seperti ini, LLM bisa sangat berguna sebagai pemberi pendekatan alternatif, dan tidak harus selalu benar; cukup dengan menawarkan alternatif, ia sudah bisa mengguncang papan permainan
Hanya saja aku kurang tahu nilai praktis dari masalah Erdős ini sendiri
Kalau ada yang bertanya apakah ini bukti bahwa LLM bukan barang tak berguna, itu terdengar seperti bertanya pada tahun 1928 apakah teori bilangan layak diberi investasi jutaan dolar
Pada masa itu jawabannya mungkin
tidak, dan silakan keluar dari kantorku