1 poin oleh GN⁺ 6 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • Masalah lama bahwa nilai minimum Erdős sum dari primitive set adalah 1 dan mendekati nilai itu saat elemennya menuju tak hingga, kini diterima sebagai telah terpecahkan lewat solusi yang dibuat oleh GPT-5.4 Pro
  • Solusi tersebut adalah hasil yang diperoleh Liam Price dari satu kali prompt lalu diunggah ke erdosproblems.com, dan setelah itu cepat menarik perhatian melalui peninjauan Kevin Barreto dan para ahli
  • Pembuktian ini menempuh jalur yang berbeda dari pendekatan awal yang biasanya dipilih orang, dan menonjol karena secara tak terduga menggabungkan rumus yang sudah dikenal di bidang terkait ke masalah ini
  • Bukti asli dari ChatGPT terlalu kasar untuk dipakai begitu saja, sehingga para ahli terlebih dahulu menyaring inti idenya untuk memahaminya lalu merapikannya menjadi bentuk yang lebih pendek dan tertata
  • Fakta bahwa pendekatan baru dari LLM berhasil pada masalah yang bahkan matematikawan ternama pun tidak dapat pecahkan dapat mengubah cara memandang struktur bilangan besar dan sudut pandang yang mengelompokkan masalah-masalah serupa

Masalah dan cara penyelesaiannya

  • primitive set adalah himpunan bilangan bulat di mana tidak ada satu pun bilangan dalam himpunan yang habis dibagi oleh bilangan lain dalam himpunan itu
    • Erdős mendefinisikan Erdős sum yang dihitung untuk himpunan semacam ini, dan menganggap skor tersebut menurun ketika bilangan-bilangan dalam himpunan makin besar
    • Dugaan bahwa nilai minimumnya tepat 1, dan bahwa nilainya mendekati angka itu saat elemen-elemen himpunan menuju tak hingga, telah lama bertahan
  • Solusi kali ini adalah hasil yang diterima Liam Price setelah memberi satu prompt ke GPT-5.4 Pro, lalu diunggah ke erdosproblems.com
    • Tanpa mengetahui latar belakang sejarah masalahnya, Price mencoba memasukkan masalah Erdős ke AI dan memperoleh solusi yang tampak benar
    • Setelah itu ia meninjaunya bersama Kevin Barreto, dan para ahli yang dihubungi pun cepat memberi perhatian
  • Sebelumnya juga ada laporan bahwa AI telah menyelesaikan beberapa Erdős problems, tetapi tingkat pentingnya dan kesulitannya sangat berbeda-beda antar masalah, sehingga tidak sempurna sebagai tolok ukur kemampuan matematika, dan cukup banyak solusi yang ternyata tidak senovel yang terlihat
    • Hasil kali ini dipandang berbeda karena menangani masalah yang bahkan matematikawan ternama belum bisa selesaikan, serta memakai metode yang tidak digunakan pada masalah sejenis

Mengapa dinilai berbeda

  • Saat memecahkan masalah ini, orang-orang umumnya memilih pendekatan awal yang mirip, tetapi solusi LLM kali ini masuk melalui jalur yang sepenuhnya berbeda
    • Ia mengambil rumus yang sudah terkenal di bidang matematika terkait, tetapi merupakan kombinasi yang sebelumnya tidak terpikir untuk diterapkan pada masalah seperti ini
  • Terence Tao menilai bahwa masalah itu sendiri mungkin sebenarnya lebih mudah dari yang dibayangkan, dan bahwa pada pendekatan awal ada semacam mental block
  • Jared Lichtman menjelaskan bahwa bukti asli ChatGPT dalam bentuk aslinya sangat kasar, sehingga diperlukan proses dari ahli untuk memilah maksud yang ingin disampaikan dan memahaminya
    • Kini Lichtman dan Tao telah merapikan bukti itu menjadi lebih singkat, sehingga wawasan inti dari LLM tampak lebih jelas
  • Lompatan kali ini dapat mengarah pada cara berpikir baru dalam memandang bilangan besar dan strukturnya
    • Pentingnya dalam jangka panjang masih terlalu dini untuk dipastikan, tetapi hal ini diterima sebagai pendekatan yang mendukung intuisi bahwa masalah-masalah serupa saling terhubung dalam satu kerangka

1 komentar

 
GN⁺ 6 jam lalu
Komentar Hacker News
  • https://archive.ph/2w4fi

  • Paul Erdős adalah matematikawan yang sangat terkenal dan cukup eksentrik, yang menjalani sebagian besar hidupnya pada abad ke-20
    Ia punya kebiasaan mencari dan mencatat masalah yang sedang digeluti para matematikawan, dengan tingkat kesulitan yang sangat luas, mulai dari setara PR mahasiswa sarjana saat ini hingga masalah kelas Fields Medal jika berhasil dipecahkan
    Benang merah yang menyatukan masalah-masalah ini adalah bahwa salah satu orang paling cerdas dalam 100 tahun terakhir tidak bisa langsung menjawabnya
    Belakangan ini, orang membuat pembuktian masalah-masalah seperti ini dengan LLM dan memakainya seperti benchmark, dan setiap kali model baru keluar selalu ada beberapa lagi yang berhasil dipecahkan

    • Melihat reaksi para matematikawan, bukti Erdős kali ini tampak seperti tonggak yang cukup istimewa
      Masalah ini sebelumnya juga sudah ditelaah oleh banyak matematikawan ahli, dan pembuktian yang muncul disebut mengejutkan, elegan, bahkan menunjukkan koneksi baru
      Penyelesaian masalah Erdős oleh ChatGPT sebelumnya umumnya kurang mengesankan, lebih mirip penelusuran literatur atau memecahkan masalah yang relatif mudah tetapi terlantar
      Kalau membaca prompt-nya, jadi penasaran apakah dorongan seperti tidak harus konvensional ikut berperan dalam keberhasilannya
      [1] https://chatgpt.com/share/69dd1c83-b164-8385-bf2e-8533e9baba9c
    • Yang dibahas artikel ini adalah kasus memecahkan masalah yang memang belum terpecahkan, jadi tentu termasuk kategori yang lebih sulit
  • Prompt yang sebenarnya adalah seperti ini
    Diminta untuk tidak melakukan pencarian internet, lalu mencoba membuat pembuktian atau bantahan yang tidak sepele, baru, dan kreatif untuk masalah number theory and primitive sets
    Diminta pembuktian atau bantahan unconditional yang lengkap, dan ditegaskan lagi bahwa klaim seperti itu mungkin memerlukan unsur yang tidak biasa dan kreatif
    Lalu ada label Thought for 80m 17s
    https://chatgpt.com/share/69dd1c83-b164-8385-bf2e-8533e9baba9c

    • Saat dijalankan dengan 5.5 Pro, Extended Thinking, dalam 17 menit hasilnya mengatakan bahwa bound yang diajukan benar dan konstanta 1 itu sharp,
      lalu mengajukan bahwa ia akan membuktikan w(a)= 1/alog(a) dan uniformly for every primitive A⊂[x,∞), ∑w(a)≤1+O(1/log(x))
      Ia mengklaim ini adalah kesimpulan yang lebih kuat daripada 1+o(1) yang diminta
      https://chatgpt.com/share/69ed8e24-15e8-83ea-96ac-784801e4a6ec
    • Dalam kasusku, dengan Pro butuh 20 menit
      https://chatgpt.com/share/69ed83b1-3704-8322-bcf2-322aa85d7a99
      Tapi aku tidak cukup paham matematika untuk menilai apakah ini benar-benar pembuktian yang valid
    • Aku juga mencoba prompt yang sama dengan free plan, dan hasilnya jauh di bawah itu
  • Kemajuan sains sering terjadi ketika teknik X dari satu bidang dibawa untuk dipakai pada masalah Y di bidang lain, dan LLM tampaknya lebih kuat daripada manusia dalam membuat koneksi lintas bidang seperti ini
    Karena ia mengetahui jauh lebih banyak teori dan pendekatan daripada yang bisa diketahui satu orang, dan juga tidak perlu khawatir terlihat bodoh di depan rekan-rekannya

    • Menurutku, inilah yang disebut reasoning
      Kemampuan untuk menggeneralisasi pengetahuan dan menerapkannya ke domain lain
    • Sebagian besar pekerjaan intelektual sebenarnya lebih dekat ke intellectual labor, yaitu menggabungkan banyak informasi di satu tempat
      Dalam pekerjaan seperti ini, LLM jauh lebih baik daripada manusia, dan mungkin selama ini orang salah menggolongkannya sebagai kreativitas
    • Aku sendiri juga benar-benar memakainya dengan cara seperti ini
      Tidak bisa dibilang menghasilkan terobosan besar, tapi rasanya beberapa kali aku mendapat wawasan yang cukup layak untuk ditulis jadi whitepaper
      Proses mencoba menghubungkan korelasi lintas bidang itu sendiri cukup menyenangkan sebagai eksperimen LLM
    • Peradaban telah banyak terdorong oleh cara left-brained/sequential/language based, dan komputer serta AI tampak seperti puncaknya
      Waktu kecil aku juga dulu membaca satu halaman sekaligus, lalu pada suatu titik berubah menjadi membaca kata demi kata dan baris demi baris, dan mode itu menetap
      Saat kuliah, pernah ada masa ketika persepsi yang lebih dalam, lebih luas, dan lebih nonlinier sempat terbuka dalam area jurusan matematikaku, tapi aku tidak yakin apakah itu karena keterampilan otak kiri atau karena otak kanan lebih ikut bekerja
      Dalam pemikiran berurutan seperti ini LLM jelas akan melampaui kita, jadi aku penasaran apakah manusia harus lebih mendorong ke sisi right-brainness yang tersisa, atau AI akan sampai ke sana juga lebih cepat
    • Untuk melihat contoh representatif teknik dari satu bidang yang diterapkan ke bidang lain, cari Langlands project
  • AI adalah rekan kolaborasi aneh favoritku

  • Beberapa masalah Erdős pada akhirnya nyaris menjadi sepele jika memakai teknik canggih yang dikembangkan kemudian
    Salah satu profesorku pernah menjadi rekan penulis Erdős, dan ia sangat bangga karena bisa menjadikan masalah Erdős yang sempat tak terpecahkan selama beberapa waktu sebagai soal kuis mahasiswa sarjana

    • Menambahkan satu hal dari sudut ini, masalah-masalah itu pada dasarnya sudah hampir semuanya dicoba ke LLM
      Jadi contoh kali ini tampak sebagai bukti bahwa modelnya memang benar-benar lebih kuat
      Karena LLM generasi sebelumnya tidak bisa memecahkan masalah ini
    • Menurut Tao, pendekatan klasik yang sudah ada untuk masalah ini tampak seperti jalan buntu, tetapi pada saat yang sama begitu jelas sehingga itu adalah langkah pertama yang pasti dicoba semua orang
      Karena itu hasil kali ini tampak lebih menjanjikan
      Sebab kini ada garis pendekatan baru yang layak dievaluasi untuk masalah-masalah serupa
  • Pada titik ini rasanya bagus kalau ada satu repo GitHub yang berisi banyak masalah dry lab yang belum terpecahkan, lalu dibuat harness untuk menjalankan semuanya setiap kali model baru keluar

    • Sebenarnya Terence Tao dan matematikawan lain memang sedang mengelola repositori seperti itu, dan aktif memakainya untuk mencari solusi dengan LLM
      [1] https://github.com/teorth/erdosproblems
    • Itu secara harfiah memang Erdős problems itu sendiri
      Tulisan ini juga membahas salah satu di antaranya yang berhasil dipecahkan
  • Bagian teks asli pembuktian dari ChatGPT sebenarnya cukup buruk, dan perlu disaring oleh pakar untuk memahami apa yang ingin disampaikan terasa persis sama dengan perasaanku setiap kali membaca makalah matematika

  • Kalau ini adalah masalah berusia 60 tahun, aku sempat berpikir mungkin sebenarnya sudah pernah terpecahkan secara tidak langsung, dan model ini hanya berhasil menemukan silang-informasinya
    Setelah melihat situsnya, hampir tidak ada jejak diskusi manusia sebelumnya, dan komentar-komentar terbaru pun hanya membahas bahwa GPT yang menemukannya, jadi aku makin merasa begitu
    Kalau memang masalah 60 tahun, kukira akan ada diskusi yang lebih lama, jadi aku penasaran apakah ada sesuatu yang terlewat dariku
    Tetap saja ini penemuan yang hebat, dan tampaknya ada lebih banyak masalah serupa yang layak diperiksa ulang dengan GPT

  • Manusia, dan juga mesin yang dibuat manusia, umumnya memecahkan masalah dengan cara akumulatif
    Karena terus membangun di atas fondasi yang sudah ada, kita mudah terjebak dalam pola pikir akibat kecenderungan untuk tidak ingin menciptakan ulang roda
    Jadi tidak terlalu mengejutkan kalau LLM yang naif mengajukan pendekatan yang tidak pernah dicoba para ahli
    Dalam kasus terbatas seperti ini, LLM bisa sangat berguna sebagai pemberi pendekatan alternatif, dan tidak harus selalu benar; cukup dengan menawarkan alternatif, ia sudah bisa mengguncang papan permainan
    Hanya saja aku kurang tahu nilai praktis dari masalah Erdős ini sendiri
    Kalau ada yang bertanya apakah ini bukti bahwa LLM bukan barang tak berguna, itu terdengar seperti bertanya pada tahun 1928 apakah teori bilangan layak diberi investasi jutaan dolar
    Pada masa itu jawabannya mungkin tidak, dan silakan keluar dari kantorku