1 poin oleh GN⁺ 2 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • Masalah jarak satuan adalah masalah Erdős dari tahun 1946 yang menanyakan jumlah maksimum pasangan titik berjarak 1 di antara n titik pada bidang, dan dugaan utama yang sudah lama bertahan kini berhasil dibantah
  • Model penalaran umum OpenAI menghasilkan keluarga contoh tak hingga yang mematahkan keyakinan bahwa keluarga kisi persegi pada dasarnya adalah yang terbaik, serta memberikan peningkatan pada tingkat polinomial
  • Konstruksi baru ini menghasilkan lebih dari n^{1+δ} pasangan titik berjarak satuan untuk tak hingga banyaknya n, dan perbaikan oleh Will Sawin menunjukkan bahwa δ = 0.014 dimungkinkan
  • Pembuktiannya menerapkan alat teori bilangan aljabar pada masalah geometri, melampaui bilangan bulat Gauss hingga menara class field tak hingga dan teori Golod–Shafarevich
  • Hasil ini menunjukkan bahwa AI dapat berkontribusi pada penemuan matematika yang orisinal dalam masalah terbuka lama, sementara keahlian manusia menjadi semakin penting dalam pemilihan masalah dan interpretasi

Terobosan dalam masalah jarak satuan

  • Masalah jarak satuan adalah masalah geometri kombinatorial yang menanyakan berapa banyak pasangan titik dengan jarak tepat 1 yang dapat dibuat secara maksimum di antara n titik yang ditempatkan pada bidang
  • Masalah ini diajukan oleh Paul Erdős pada tahun 1946, dan buku Research Problems in Discrete Geometry karya Brass, Moser, dan Pach tahun 2005 menyebutnya sebagai “mungkin masalah yang paling terkenal dan paling mudah dijelaskan dalam geometri kombinatorial”
  • Ahli kombinatorika Princeton, Noga Alon, memperkenalkannya sebagai salah satu masalah yang sangat disukai Erdős, dan Erdős memasang hadiah untuk penyelesaiannya
  • Selama bertahun-tahun, ada keyakinan bahwa konstruksi keluarga kisi persegi pada dasarnya menghasilkan jumlah pasangan titik berjarak satuan yang maksimum
  • Model internal OpenAI membantah dugaan lama ini dengan membangun keluarga contoh tak hingga dan memberikan peningkatan pada tingkat polinomial
  • Pembuktian tersebut telah ditinjau oleh sekelompok matematikawan eksternal, dan mereka juga menulis makalah pendamping yang membahas argumen, latar belakang, dan makna hasilnya
  • Naskah asli pembuktian dapat dilihat di unit-distance-proof.pdf, makalah pendamping di unit-distance-remarks.pdf, dan versi ringkas rantai pemikiran model di unit-distance-cot.pdf

Metode yang ditemukan AI

  • Pembuktian ini berasal dari sistem yang dilatih untuk matematika, scaffolding untuk eksplorasi strategi pembuktian, dan model penalaran umum, bukan dari sistem khusus untuk masalah jarak satuan
  • Evaluasi dilakukan pada kumpulan masalah Erdős sebagai bagian dari upaya yang lebih luas untuk menilai apakah model canggih dapat berkontribusi pada riset terdepan, dan pada masalah ini dihasilkan pembuktian yang menyelesaikan masalah terbuka
  • Matematika adalah domain yang jelas untuk menguji kemampuan bernalar karena masalahnya presisi, kandidat pembuktian dapat diverifikasi, dan argumen panjang harus menjaga konsistensi dari awal hingga akhir
  • Pembuktian ini menerapkan ide-ide teori bilangan aljabar yang tak terduga dan canggih pada masalah geometri yang tampak elementer
  • Dalam makalah pendamping, Tim Gowers menyebut hasil ini sebagai “tonggak AI matematika”
  • Ahli teori bilangan Arul Shankar menilai bahwa model AI saat ini menunjukkan kemampuan melampaui peran asisten matematikawan manusia, dengan menghasilkan ide yang orisinal dan canggih lalu menuntaskannya sampai akhir

Isi matematis dari masalah jarak satuan

  • u(n) didefinisikan sebagai jumlah maksimum pasangan titik berjarak satuan yang mungkin di antara n titik pada bidang
  • Konstruksi sederhana dapat menempatkan n titik pada satu garis lurus untuk membuat n−1 pasangan titik, sedangkan kisi persegi menghasilkan sekitar 2n pasangan titik
  • Konstruksi terbaik sebelumnya berasal dari kisi persegi yang diskalakan ulang, dan untuk suatu konstanta C menghasilkan n^{1 + C / log log(n)} pasangan titik berjarak satuan
  • Karena log log(n) bertambah seiring membesarnya n, suku tambahan pada eksponen menuju 0, sehingga pertumbuhan konstruksi ini hanya sedikit lebih cepat daripada linear
  • Selama beberapa dekade, laju ini secara luas dianggap pada dasarnya optimal, dan Erdős secara teknis menduga batas atas n^{1+o(1)}
  • Hasil baru ini membantah dugaan tersebut: untuk tak hingga banyaknya n, ada suatu eksponen tetap δ > 0 dan konstruksi n titik yang memiliki setidaknya n^{1+δ} pasangan titik berjarak satuan
  • Pembuktian AI asli tidak memberikan nilai δ yang eksplisit, tetapi perbaikan lanjutan oleh profesor matematika Princeton, Will Sawin, menunjukkan bahwa δ = 0.014 dapat diambil

Mengapa hasil ini mengejutkan

  • Sejak konstruksi asli Erdős pada tahun 1946, batas bawah terbaik yang diketahui pada dasarnya hampir tidak berubah
  • Batas atas terbaik yang diketahui, O(n^{4/3}), berasal dari karya Spencer, Szemerédi, dan Trotter pada tahun 1984, dan pada dasarnya tetap bertahan meskipun ada perbaikan serta studi struktur terkait oleh Székely, Katz dan Silier, Pach, Raz, Solymosi, dan lainnya
  • Matoušek dan Alon-Bucić-Sauermann meneliti masalah ini pada jarak non-Euklidean di bidang, dan menyajikan hasil bahwa “sebagian besar” jarak non-Euklidean dalam arti tertentu mengikuti dugaan Erdős, yang mendukung dugaan tersebut
  • Yang sangat mengejutkan adalah bahwa bahan inti dari konstruksi baru ini berasal dari teori bilangan aljabar, yang tampaknya jauh dari geometri dan jarak
  • Teori bilangan aljabar adalah bidang yang membahas konsep seperti faktorisasi dalam perluasan bilangan bulat yang disebut medan bilangan aljabar

Teknik baru yang datang dari teori bilangan aljabar

  • Pembuktian baru ini berangkat dari ide geometri yang sudah akrab lalu berkembang ke arah yang tak terduga
  • Batas bawah asli Erdős dapat dipahami melalui bilangan bulat Gauss berbentuk a + bi
  • Di sini a dan b adalah bilangan bulat, dan i adalah akar kuadrat dari −1
  • Bilangan bulat Gauss memperluas bilangan bulat biasa, dan memiliki sifat seperti faktorisasi unik ke dalam bilangan prima
  • Perluasan dari bilangan bulat atau bilangan rasional seperti ini disebut medan bilangan aljabar
  • Argumen baru ini menggantikan bilangan bulat Gauss dengan generalisasi teori bilangan aljabar yang lebih kompleks, di mana simetri yang lebih kaya memungkinkan terciptanya lebih banyak selisih dengan panjang satuan
  • Argumen teknisnya menggunakan alat seperti menara class field tak hingga dan teori Golod–Shafarevich untuk menunjukkan bahwa medan bilangan yang diperlukan memang ada
  • Ide-ide ini sudah dikenal baik oleh para ahli teori bilangan aljabar, tetapi fakta bahwa mereka berdampak pada masalah geometri di bidang Euklidean diterima sebagai kejutan besar

Maknanya bagi matematika

  • Fakta bahwa sistem AI secara mandiri memecahkan masalah terbuka lama yang berada di pusat bidang yang aktif menjadikannya momen penting dalam interaksi antara AI dan matematika
  • Karya pendamping dari para matematikawan eksternal memberikan gambaran yang lebih kaya yang tidak langsung tampak hanya dari solusi aslinya
  • Dalam makalah pendamping, Thomas Bloom menulis bahwa ketika menilai pentingnya pembuktian yang dihasilkan AI, ia bertanya apakah pembuktian itu mengajarkan sesuatu yang baru tentang masalahnya dan apakah pembuktian itu membuat kita lebih memahami geometri diskret
  • Bloom menilai bahwa hasil ini menunjukkan konstruksi berbasis teori bilangan dapat mengatakan jauh lebih banyak tentang pertanyaan semacam ini daripada yang diperkirakan, dan bahwa teori bilangan yang dibutuhkan bisa sangat dalam
  • Bloom memperkirakan bahwa dalam beberapa bulan mendatang banyak ahli teori bilangan aljabar akan menelaah masalah terbuka lain dalam geometri diskret secara lebih dekat
  • Koneksi tak terduga antara teori bilangan aljabar dan geometri diskret ini tidak hanya menyelesaikan dugaan tertentu, tetapi juga menjadi jembatan untuk menelusuri masalah terkait lebih jauh
  • Hasil ini menunjukkan bahwa AI dapat berkontribusi bukan hanya pada jawaban, tetapi juga pada penemuan matematika yang maknanya menjadi lebih jelas dan lebih kaya melalui pemahaman manusia setelahnya

Mengapa ini penting

  • Kemampuan penalaran matematis yang lebih baik dapat menjadikan AI mitra riset yang lebih kuat
  • AI dapat membantu menjaga konsistensi alur pemikiran yang sulit, menghubungkan ide di antara domain pengetahuan yang berjauhan, dan menyingkap jalur menjanjikan yang mungkin tidak diprioritaskan oleh para pakar
  • AI dapat membantu peneliti membuat kemajuan pada masalah yang terlalu kompleks atau memakan waktu untuk ditangani dengan mudah
  • Kemampuan ini berguna tidak hanya dalam matematika, tetapi juga dalam biologi, fisika, ilmu material, rekayasa, dan kedokteran
  • Jika AI dapat secara konsisten mempertahankan argumen kompleks, menghubungkan domain pengetahuan yang saling berjauhan, dan menghasilkan keluaran yang lolos peninjauan pakar, maka ini menjadi bagian dari jalur jangka panjang menuju sistem riset yang lebih terotomatisasi
  • AI ditunjukkan mulai mengambil peran yang sangat serius dalam bagian kreatif dari riset, khususnya dalam riset AI itu sendiri
  • Kemajuan seperti ini memperkuat urgensi untuk memahami masalah alignment sistem yang sangat cerdas, tahap berikutnya dalam pengembangan AI, dan masa depan kolaborasi manusia-AI
  • Masa depan itu tetap bergantung pada penilaian manusia
  • Keahlian bukan menjadi kurang penting, melainkan semakin bernilai
  • AI dapat membantu mengeksplorasi, mengusulkan, dan memverifikasi, tetapi manusialah yang memilih masalah penting, menafsirkan hasil, dan menentukan pertanyaan berikutnya yang perlu dikejar

1 komentar

 
GN⁺ 2 jam lalu
Komentar Hacker News
  • Thread HN ini membuat saya murung, dan saya masih memikirkan kenapa
    Jika pujian ala siaran pers OpenAI disingkirkan, ada banyak pertanyaan menarik dan bernuansa tentang peran LLM dalam riset matematika
    Saya sangat menyarankan untuk membaca komentar para matematikawan yang menyertai hasil ini, terutama pernyataan Tim Gowers
    Namun kolom komentarnya berubah menjadi medan perang berisi perdebatan LLM, bantahan, dan bantahan marah yang terus berulang sejak 2023
    Menyedihkan memikirkan bahwa kita mengulangi pertarungan yang sama di atas garis depan yang ditarik 3 tahun lalu, dan saya bertanya-tanya apakah 2 tahun lagi pun kita masih akan begini

    • 2 tahun lagi, di sini dan di semua forum internet, keadaannya akan tetap seperti ini
      Hidup bisa jadi lebih baik jika mengingat kutipan terkenal Nietzsche: “Saya tidak ingin berperang melawan yang buruk rupa. Saya juga tidak ingin menuduh. Saya bahkan tidak ingin menuduh para penuduh. Memalingkan pandangan harus menjadi satu-satunya penyangkalan saya”
    • Orang-orang khawatir soal mata pencaharian mereka, jadi ini reaksi yang wajar
    • Bisa dimengerti. Orang sering menilai kecerdasan manusia dan AI sebagai kompetisi zero-sum, karena para pemberi kerja biasanya memahaminya seperti itu, dan penyedia model bahasa juga memasarkannya seperti itu
      Semakin AI membuktikan kemampuannya, semakin keadaan condong ke arah yang tidak nyaman bagi siapa pun yang tidak punya keamanan kerja yang sangat kuat
      Perlu waktu sampai orang mengakui bahwa AI punya kumpulan kemampuan yang sangat berbeda dari kecerdasan manusia dan cukup saling melengkapi
      Kemungkinannya kecil bahwa AI akan mengungguli kecerdasan manusia secara luas, dan perusahaan yang bertaruh pada itu akan tertinggal
    • Begitu satu pihak mulai melempar batu, isi tulisan jadi tidak penting lagi, dan semuanya berubah menjadi pertarungan apakah tulisannya bagus atau sampah
      Saya ingin benar-benar berdiskusi soal topik seperti ini, tapi semuanya terus memanas karena semua orang percaya hanya realitas mereka sendiri yang nyata dan realitas yang berlawanan itu palsu
      Saya sadar saya datang ke HN hanya untuk marah, lalu mengambil jeda panjang
      Saya tidak tahu kenapa kita melakukan ini pada diri sendiri, dan pada dasarnya saya rasa kita kebanyakan menginginkan hal yang sama
    • 2 tahun lagi tidak akan begini. Karena saat itu pihak saya sudah menang
  • Untuk kubu yang berkata “LLM hanya menginterpolasi data latih”: Ayer dan Wittgenstein awal, meski dengan cara berbeda, beranggapan bahwa kebenaran matematika tidak melaporkan fakta baru tentang dunia
    Gagasan bahwa pembuktian hanya membentangkan apa yang sudah tersirat di dalam aksioma, definisi, simbol, dan aturan itu sangat menarik, dan tetap tidak ada masalah memberi kredit penemuan kepada matematikawan
    Jadi, rekombinasi bahan yang sudah ada entah bukan cacat yang mendiskualifikasi, atau kalau tidak, sebagian besar Fields Medal harus dikembalikan

    • Saya rasa sebagian besar orang dewasa yang berfungsi paham bahwa Fields Medal dan hampir semua “penghargaan” tahunan diberikan baik untuk inovasi rekombinatif maupun inovasi “cara berpikir dimensi baru”
      Manusia juga tidak menghasilkan inovasi dimensi baru setiap tahun di semua bidang
      Anda bisa bilang LLM “hanya” merekombinasi, tetapi saya tetap ragu LLM yang diberi seluruh literatur aljabar, geometri, dan trigonometri sebelum Newton/Leibniz akan mampu menciptakan kalkulus
      Meski begitu, jenis inovasi ini memang area yang kuat bagi LLM, dan itu tidak berarti manusia tidak lagi perlu pandai dalam inovasi rekombinatif
      Dalam hal mensintesis ide-ide baru, tampaknya masih banyak hal yang bisa dilakukan manusia dan belum bisa dilakukan LLM
    • Kita bisa membayangkan setiap fragmen pengetahuan manusia sebagai titik diskret dalam ruang pengetahuan berdimensi tinggi yang sangat besar
      Jika kita menggambar convex hull besar yang mengelilingi semua titik itu, maka karena LLM belajar di dalamnya, ia bisa menginterpolasi di antara titik-titik yang ada untuk mencapai titik baru yang tetap berada di dalam hull
      Apakah LLM bisa mencapai titik di luar hull itu masih bisa diperdebatkan
      Mencapai titik baru di dalam hull saja sudah sangat berguna
      Banyak penemuan dan pembuktian baru, mungkin sebagian besar penemuan dan pembuktian baru yang berguna, adalah titik-titik seperti ini yang bisa dicapai dengan berangkat dari apa yang sudah kita miliki
      Banyak hal belum ditemukan hanya karena belum ada yang menghabiskan waktu dan usaha untuk itu, dan LLM bisa sangat mempercepatnya
      Sebaliknya, ada titik di luar hull yang memang tidak bisa dicapai lewat ekstrapolasi atau interpolasi dari titik yang ada dan memerlukan lompatan yang sungguh baru
      Lompatan dari fisika Newton ke relativitas umum menurut saya adalah contoh kandidat
      Demis Hassabis pernah mengatakan bahwa evaluasi AGI yang menarik adalah memberi AI hanya pengetahuan fisika sebelum 1915, lalu menunjukkan orbit Merkurius, dan melihat apakah ia secara mandiri sampai pada relativitas umum
      Saya ragu LLM saat ini bisa melakukan lompatan seperti itu, dan kebanyakan manusia juga tidak bisa
      Kita menyebut Einstein jenius karena ia sendirian melompat ke relativitas umum; untuk manusia kita punya bukti eksistensi bahwa hal seperti itu kadang muncul, tetapi untuk AI kita masih harus menunggu
    • Kebanyakan penemuan memang tersirat dari aksioma, tetapi kadang ada momen yang, karena tak ada ungkapan yang lebih baik, bisa disebut sebagai penciptaan matematika baru
      Tokoh seperti Descartes, Newton, Leibniz, Gauss, Euler, Ramanujan, dan Galois memperlakukan matematika lebih seperti seni daripada sains
      Misalnya, banyak orang menganggap untuk memecahkan Riemann Hypothesis kita mungkin memerlukan jenis matematika baru, dan kecil kemungkinan LLM tiba-tiba menemukannya
    • Saya berharap kita hampir melewati tahap menilai kemampuan LLM dengan penggaris 1 dimensi yang sewenang-wenang, dengan satu ujung bertuliskan “bukan manusia” dan ujung lainnya “melampaui manusia”
      Itu tidak bermakna dan tidak terlalu relevan
      Saat Deep Blue mengalahkan Kasparov, tidak semuanya langsung berubah, dan hewan serta mesin selalu “lebih baik” daripada manusia di dimensi tertentu
      Sejak awal tidak pernah ada satu penggaris tunggal, dan kalaupun ada, itu tidak akan 1 dimensi atau linear, sementara penggaris dan kedua ujungnya juga berubah seiring waktu
      Ini juga bukan berarti menyerahkan kemenangan kepada para supremasis AI
      LLM adalah alat yang sangat berguna dan akan terus membaik secara dramatis, tetapi tidak akan melampaui manusia di semua dimensi yang dianggap inti oleh sebagian orang
      Tidak akan ada momen ketika AI cukup melewati daftar metrik terkuantifikasi lalu diakui unggul atas manusia secara universal
      Karena “yang penting” itu sendiri bersifat subjektif
    • Poin tentang laju penemuan matematika manusia bagus, tetapi Ayer itu ngawur, dan Wittgenstein akhir membantah Wittgenstein awal
      Klaim bahwa “semuanya sudah tersirat di dalamnya” mengharuskan matematika menjadi sistem tertutup, tetapi itu sudah terbukti bukan demikian
      Kita bisa keluar dari matematika dengan matematika, sehingga kita perlu berbagai pasak aksiomatik seperti Zermelo-Fraenkel dan lainnya
      Kita sebenarnya tidak terlalu memahami luasnya sesuatu yang secara objektif pantas kita sebut “matematika”, dan mungkin saja matematika yang kita kenali hanyalah bagian dari matematika yang lebih besar, atau malah sangat keliru
      Kita tidak tahu apakah matematika yang lebih besar itu memiliki sifat sistem tertutup yang sama
  • Bagi orang yang banyak memakai LLM untuk coding, ini tidak terlalu mengejutkan; hanya soal waktu
    Matematikawan membuat dan menerapkan alat matematika dengan cara baru untuk menghasilkan penemuan baru
    Ini adalah pekerjaan iteratif dalam jumlah besar, mengikuti intuisi dan menjelajahi koneksi
    Karena LLM tidak punya rasa tentang apa arti “penemuan”, sulit menyebutnya benar-benar melakukan penemuan, tetapi ia bisa mencoba semua alat matematika secara gaya Monte Carlo ke arah tujuan sempit untuk melihat mana yang berhasil, lalu menumpuk di atasnya atau menggabungkan perbaikan
    Jika membaca artikelnya, penemuan kali ini tampaknya memang persis seperti itu, dan LLM melampaui hasil yang diharapkan dengan memakai koneksi yang mengejutkan
    Namun tanpa tujuan yang ditetapkan manusia, pemahaman manusia yang mengenali nilai jalur baru yang dipakai AI, dan bahasa matematika buatan manusia yang memungkinkan eksplorasi konsep, hasil ini tidak punya makna

    • Bukankah mengatakan “tidak punya makna tanpa niat dan pemahaman manusia” itu antroposentris
      Kenapa pemahaman hanya sah jika dilakukan manusia
      Kenapa pengetahuan harus hanya untuk manusia
      Jika spesies lain menyelesaikan kontradiksi antara gravitasi dan mekanika kuantum, apakah itu tidak bermakna sampai mereka menjelaskannya kepada kita dan kita memahaminya
    • Ada esai panjang dan menarik baru-baru ini dari seorang matematikawan tentang topik itu: https://davidbessis.substack.com/p/the-fall-of-the-theorem-e...
    • Bukan hanya tidak mengejutkan, ini memang sudah lama diperkirakan. Tidak ada perbedaan antara program dan pembuktian; keduanya adalah hal yang sama
  • Hal yang menarik adalah bahwa pembuktian ini, atau lebih tepatnya bantahan ini, menemukan kontra contoh terhadap dugaan asli Erdős
    Seperti reaksi salah satu matematikawan di PDF yang ditautkan, menurut saya ini agak kurang menarik dibanding membuktikan bahwa dugaannya benar
    Untuk membuktikan dugaan itu benar, dibutuhkan pembangunan teori yang lebih banyak
    Anda harus menjelaskan mengapa dugaan itu benar berdasarkan teori yang lebih besar, sedangkan untuk kontra contoh model cukup menemukan konstruksi yang tepat lewat bentuk pencarian yang lebih canggih
    Tentu saja pencarian ini tidak sederhana dan sangat mengesankan, dan dibutuhkan banyak langkah untuk membuktikan keterkaitannya dengan kontra contoh itu
    Meski begitu, saya rasa ini lebih dekat pada menghubungkan ide-ide yang sudah ada daripada mengembangkan matematika baru yang benar-benar mendalam
    Ini bukan untuk meremehkan pencapaian yang luar biasa ini; saya sungguh merasa kita sedang menuju sesuatu
    Murni berdasarkan firasat, saya rasa model-model ini tidak jauh lagi dari mampu membangun teori untuk membuktikan dugaan yang lebih rumit yang memang memerlukan pengembangan matematika baru, dan ini jadi soal bisa bekerja pada horizon waktu yang lebih panjang

    • Pencarian pembuktian dan pencarian bantahan terkadang tidak terlalu berbeda
      Dalam kebanyakan kasus, Anda sedikit demi sedikit menggerogoti batas untuk menyederhanakan masalah
      Misalnya, untuk membuktikan bahwa sesuatu itu mustahil, Anda pertama-tama menunjukkan bahwa hanya ada 5 keluarga kasus yang mungkin, lalu Anda bisa membuktikan 4 di antaranya mustahil
      Berarti 80% masalahnya sudah selesai, dan jika yang dicari adalah kontra contoh, ruang pencariannya juga berkurang 80%
      Dalam mencari kontra contoh, Anda bisa menebak dan melompat-lompat, dan tidak masalah jika benar, tetapi dalam pembuktian Anda tidak bisa begitu
      Sebaliknya, setelah Anda menemukan kontra contoh, jalan buntu yang dibuang biasanya tersembunyi
    • Memberi waktu lebih panjang tidak akan membuat LLM melakukan matematika ala manusia yang menciptakan bilangan kompleks atau bahkan bilangan biasa dari ketiadaan
      Tidak peduli berapa lama Anda membiarkannya menggabungkan hal-hal dalam data latihnya
  • Seperti yang sudah saya katakan sebelumnya, AI akan meraih Fields Medal sebelum bisa menjalankan McDonald's
    Bagian yang sulit adalah membuat papan catur tempat matematika dimainkan, yaitu lingkungan seperti Lean, dan sekarang sisanya adalah pengenalan pola dan komputasi
    LLM baru permulaan; sebentar lagi akan muncul AI matematika yang lebih terspesialisasi dan lebih mirip Stockfish

    • Tapi ini tidak diverifikasi dengan Lean
      Ini murni berupa input dan output bahasa alami, dan dalam banyak hal justru menunjukkan hal yang sebaliknya; menurut saya ini demonstrasi yang cukup menarik
      Verifikasi masuk ketika Anda ingin menyerahkan pemeriksaan bukti ke komputer
      Saat ini bukti ini diverifikasi secara manual oleh sekelompok matematikawan di bidang tersebut
    • Ungkapan tentang menjalankan McDonald's itu punya nuansa distopia yang mengingatkan saya pada sistem manajemen “Manna” fiktif yang dipakai di waralaba hamburger [0]
      Di sana ada banyak otomatisasi “kentaur terbalik”
      Manna memiliki daftar tugas yang harus dilakukan setiap saat, dan saat pesanan masuk di kasir, ia memberi tahu karyawan untuk menyiapkan makanan itu
      Ia melacak ratusan tugas seperti membersihkan toilet, mengepel lantai, mengelap meja, menyapu trotoar, mencairkan roti, memutar stok, membersihkan jendela, lalu menugaskannya satu per satu kepada karyawan
      Saat shift berakhir, Manna selalu berkata “Anda selesai untuk hari ini. Terima kasih atas bantuan Anda”, lalu headset dilepas dan diletakkan di pengisi daya
      Setelah 6–8 jam mendengar suara di kepala yang memberi instruksi sangat rinci tentang apa yang harus dilakukan, beberapa menit pertama setelah melepas headset selalu membingungkan, dan untuk meninggalkan restoran Anda harus menyalakan otak lagi
      [0] https://en.wikipedia.org/wiki/Manna_(novel)
    • Saya tidak setuju. AI mungkin bisa melakukan pekerjaan setingkat Fields Medal sebelum bisa menjalankan McDonald's, tetapi saya rasa AI akan menjalankan McDonald's dengan baik jauh lebih dulu daripada keduanya
      Fields Medal akan datang lama setelah itu
    • Buktinya tidak ditulis dalam Lean, tetapi dalam bahasa Inggris
      Untuk memastikan isinya bukan omong kosong, tetap dibutuhkan verifikasi pakar manusia
    • “Papan catur” untuk matematika itu sudah ada lebih dari 40 tahun
      Lean tidak istimewa di sini, ini lebih mirip mentalitas kawanan
      Kita juga tidak tahu seberapa besar pelatihan Lean membantu model khusus ini
  • Bukti ini menerapkan ide-ide teori bilangan aljabar yang tak terduga dan canggih pada pertanyaan geometri elementer
    Semakin saya membaca hasil seperti ini, semakin terasa bahwa sebagian besar kekuatan model berasal dari fakta bahwa ia punya pengetahuan awal tentang semua bidang yang mungkin dan tidak kesulitan mentransfernya ke ranah baru
    Keindahan potensial dari alat-alat ini adalah bahwa mereka bisa membantu menembus hambatan hiperspesialisasi berlebihan yang dialami manusia dalam sains saat ini
    Hiperspesialisasi penting di satu sisi, tetapi di sisi lain membatasi alat dan inspirasi yang bisa diakses seseorang

    • Poin yang tepat dan dijelaskan dengan baik
      Semakin kita hiperspesialisasi, semakin berharga LLM sebagai alat untuk menyatukan cakrawala yang berbeda
    • Rasanya totalitas pengetahuan manusia adalah semacam kecerdasan kolektif
      Dulu biaya untuk mengaksesnya mahal, tapi sekarang tidak lagi
      Hal yang keren adalah ketika seseorang menyumbang sesuatu pada kecerdasan kolektif itu, hal tersebut bisa langsung diterapkan pada masalah apa pun yang sedang dikerjakan orang lain
    • Saya selalu skeptis tentang peran LLM dalam matematika, tetapi argumen ini baru bagi saya dan terasa cukup meyakinkan
      Mungkin LLM bisa membantu mengembangkan pemahaman yang lebih horizontal tentang bidang tertentu
    • Benar. Orang mungkin terlalu fokus pada kedalaman dan kurang pada keluasan, mungkin karena pandangannya terbatas
      Karena ini model umum, ia memiliki pengetahuan setingkat doktor atau lebih di fisika, biologi, sejarah, dan seterusnya
      Saya rasa kita belum benar-benar memahami seberapa banyak yang bisa dilakukan oleh satu “pikiran” yang telah menginternalisasi pengetahuan dari begitu banyak bidang
  • Menarik bahwa ketika OpenAI mengatakan modelnya akan punya “kecerdasan setingkat doktor”, semua orang menertawakannya, dan sekarang patokannya bergeser menjadi apakah bisa menciptakan matematika baru
    Artinya yang diminta bukan setingkat doktor, melainkan setingkat Leibniz, Euler, atau Galois

    • Meski begitu, untuk coding ia masih seperti developer junior yang menghafal seluruh Stack Overflow
  • Ringkasan proses berpikir dari pekerjaan ini yang ditautkan di posting blog panjangnya 125 halaman
    Ini adalah skala penalaran yang absurd, sangat mirip dengan yang sempat diisyaratkan Anthropic lewat Mythos

  • Saya penasaran kenapa yang terdengar selalu soal memecahkan masalah Erdős
    Pasti ada banyak masalah belum terpecahkan dalam matematika, tetapi “terobosan matematika” ChatGPT yang saya lihat di r/singularity dan r/accelerate semuanya adalah masalah Erdős

    • Masalah Erdős mencakup porsi besar dari problem matematika yang diajukan secara eksplisit tetapi belum terpecahkan
      Masalah-masalah itu cukup terkenal sehingga orang tertarik, tapi sekaligus tidak cukup menarik sampai banyak orang mau mencurahkan usaha besar untuknya
      Memecahkan masalah yang sudah diajukan orang lain adalah aktivitas yang cukup nis di riset matematika
      Yang lebih umum adalah meneliti objek yang menarik, membingkainya dengan cara yang bisa diselesaikan menggunakan alat yang dimiliki, lalu berusaha menemukan solusinya
      Dalam kasus ideal, perumusan masalah dan solusinya sama-sama menarik dengan sendirinya
    • Masalah Erdős mudah dijelaskan, jadi menjadi tolok ukur yang bagus untuk tahun pertama matematika AI
    • Setahu saya karena ada komunitas dan basis data di sekitarnya
    • Bukan hanya masalah Erdős: https://news.ycombinator.com/item?id=48213189
    • Erdős terkenal karena dia memang matematikawan besar
      Mirip dengan masalah Hilbert satu abad lalu
  • Ini jelas mengesankan
    Tetapi kalau kita tidak tahu model ini dilatih dengan apa, sangat sulit menilai sampai sejauh mana ia mencapainya “sendiri”
    Seluruh industri AI telah membayar mahal banyak pakar lintas bidang untuk membuat data latih baru dalam jumlah besar
    Itu adalah data latih baru yang tidak bisa ditemukan di tempat lain, perusahaan menimbunnya, dan di dalamnya mungkin saja ada ide yang benar-benar orisinal
    Kemungkinannya kecil ada seseorang yang sudah memecahkan masalah ini lalu memasukkannya begitu saja ke data latih, tetapi jujur saya juga tidak bisa bilang OpenAI pasti tidak melakukan itu
    Yang lebih menarik adalah kemungkinan mereka sudah membuat data latih yang menyentuh sebagian besar atau bahkan semua proposisi kunci yang tampak “orisinal” dalam pembuktian ini
    Tentu saja kita tidak tahu
    Tetapi sampai hal-hal seperti ini dibuat dengan cara yang tidak rahasia, pertanyaan ini akan selalu ada

    • Ini terdengar seperti tafsir yang cukup konspiratif