Pengenalan mathstodon.xyz
- mathstodon.xyz adalah bagian dari jejaring sosial terdesentralisasi berbasis Mastodon, berupa sebuah instance untuk pengguna yang terkait dengan matematika.
- Mendukung rendering LaTeX di antarmuka web.
- Admin: Christian Lawson-Perfect (@christianp)
- Statistik server: 3 ribu pengguna aktif
Eksperimen GPT-o1 oleh Terence Tao
- GPT-o1: versi GPT baru dari OpenAI yang melakukan tahap penalaran awal sebelum eksekusi LLM.
- Eksperimen 1: dalam jawaban atas pertanyaan matematika yang ambigu, model ini secara tepat mengidentifikasi Cramer's theorem dan memberikan jawaban yang memuaskan.
- Pada versi sebelumnya, konsep terkait memang disebutkan tetapi detailnya keliru.
- Eksperimen 2: saat ditantang dengan masalah analisis yang kompleks, model ini berhasil menurunkan solusi yang benar dengan banyak petunjuk dan pengarahan, tetapi tidak dapat menghasilkan sendiri ide konseptual utama dan membuat beberapa kesalahan.
- Ada peningkatan dibanding model sebelumnya, tetapi masih belum memadai.
- Dengan beberapa peningkatan lagi ke depan, ada kemungkinan model ini berguna untuk pekerjaan tingkat riset.
- Eksperimen 3: dalam tugas memformalkan hasil di Lean, model ini memahami masalah dengan baik dan melakukan dekomposisi awal dengan baik, tetapi karena kurangnya informasi Lean terbaru, ada beberapa kesalahan dalam kodenya.
- Bisa sangat berguna dalam IDE terintegrasi yang menggabungkan model khusus untuk Lean dan Mathlib.
Diskusi tambahan
- Perkembangan alat AI: diharapkan akan muncul ekosistem alat AI yang mampu menangani berbagai pekerjaan riset.
- Saat ini LLM besar serbaguna mendapat sorotan, tetapi model open source ringan yang disesuaikan untuk aplikasi tertentu juga diperkirakan akan memainkan peran penting.
- Perbandingan AI dengan mahasiswa pascasarjana: pembahasan tentang apakah alat AI dapat memberi kontribusi setingkat mahasiswa pascasarjana.
- Saat ini masih membutuhkan lebih banyak upaya daripada mahasiswa pascasarjana, tetapi dalam beberapa tahun ke depan rasio itu mungkin turun menjadi 1 atau kurang.
# Ringkasan GN⁺
- Terence Tao menguji model GPT-o1 baru dari OpenAI untuk mengevaluasi kemampuan pemecahan masalah matematisnya.
- GPT-o1 menunjukkan peningkatan dibanding versi sebelumnya, tetapi masih memiliki beberapa keterbatasan.
- Dengan beberapa peningkatan lagi ke depan, ada kemungkinan model ini berguna untuk pekerjaan tingkat riset.
- Diharapkan akan muncul ekosistem di mana berbagai alat AI dapat mendukung pekerjaan riset.
- Saat ini LLM besar serbaguna mendapat sorotan, tetapi model open source ringan yang disesuaikan untuk aplikasi tertentu juga diperkirakan akan memainkan peran penting.
1 komentar
Komentar Hacker News
Ada harapan bahwa jika GPT disetel untuk Lean (alat bantu pembuktian) seperti untuk Python, model ini akan menjadi lebih berguna untuk matematika tingkat riset
Bayangkan kembali ke tahun 2019 lalu membaca tulisan bahwa pengalaman berinteraksi dengan Alexa itu "mirip seperti memberi arahan kepada mahasiswa pascasarjana yang biasa saja tetapi tidak sepenuhnya tidak kompeten"
Model o1 sangat mengejutkan
Pengalaman dengan model O1 sangat beragam
Hal baru dari LLM adalah bahwa pada berbagai topik, model ini "mirip seperti memberi arahan kepada mahasiswa pascasarjana yang biasa saja tetapi tidak sepenuhnya tidak kompeten"
Manusia juga bisa mendapat manfaat dari jenis penalaran "chain of thought"
Setuju dengan pendapat Terence Tao
Ada antusiasme untuk kembali mempelajari matematika sebagai hobi mandiri
Pendapat Terence Tao terasa mengejutkan
Daniel Litt terkesan dengan o1-preview, tetapi sejauh ini belum beruntung dalam memecahkan masalah matematika yang menarik