- GPTZero mendeteksi lebih dari 50 kesalahan sitasi dan informasi penulis palsu dalam makalah yang diajukan ke ICLR 2026
- Setiap makalah diverifikasi bersama tautan OpenReview untuk memastikan apakah benar-benar ada dan apakah sitasinya cocok
- Dalam banyak kasus, ditemukan penulis yang tidak ada, tahun yang salah, dan judul makalah yang berbeda
- Beberapa makalah sebagian cocok dengan makalah asli, tetapi metadata rinci telah terdistorsi
- Ini menjadi contoh yang menunjukkan bahwa masalah halusinasi yang dihasilkan AI (hallucination) juga menyebar ke naskah akademik yang diajukan
Hasil deteksi halusinasi ICLR 2026 oleh GPTZero
- GPTZero melakukan verifikasi otomatis terhadap kutipan dan informasi penulis pada makalah yang diajukan ke ICLR 2026
- Untuk setiap makalah, ditampilkan tautan OpenReview, tautan verifikasi GPTZero, dan informasi sitasi
- Hasil verifikasi menemukan lebih dari 50 sitasi palsu atau penulis yang tidak ada
Contoh kasus halusinasi yang menonjol
- Makalah TamperTok memang ada, tetapi seluruh informasi penulisnya salah
- Makalah MixtureVitae cocok untuk 3 penulis pertama, tetapi 7 penulis sisanya tidak ada
- OrtSAE, Principled Policy Optimization, IMPQ dan lainnya tidak cocok dengan makalah asli dari sisi judul atau penulis
- PDMBench memiliki makalah serupa, tetapi tahun dan judulnya berbeda
- C3-OWD, GRF-LLM dan lainnya diklasifikasikan sebagai kecocokan sebagian
Kasus yang sama sekali tidak cocok
- Catch-Only-One, TopoMHC, ThinkGeo, Reflexion, LOSI dan lainnya tidak memiliki makalah yang disitasi
- SAFE-LLM, Typed Chain-of-Thought, MANTA dan lainnya memiliki makalah serupa, tetapi metadata tidak cocok
- AI-Assisted Medical Triage Assistant, QUART, KARMA dan lainnya mengutip makalah yang sama sekali tidak terkait
Metode verifikasi dan jenis hasil
- GPTZero membandingkan setiap sitasi dengan basis data nyata (misalnya arXiv, NeurIPS, ICLR, ACL, dan lainnya)
- Hasilnya diklasifikasikan sebagai “ada”, “kecocokan sebagian”, “tidak cocok”, “penulis palsu”, dan sebagainya
- Beberapa entri ditandai sebagai makalah nyata ada, tetapi penulis, tahun, dan judul semuanya berbeda
Makna dan implikasi
- Banyak naskah yang diajukan ke ICLR 2026 memuat begitu saja masalah halusinasi pada teks yang dihasilkan AI
- Dalam proses penulisan makalah akademik, kebutuhan akan alat otomatis untuk verifikasi fakta semakin menonjol
- Hasil deteksi GPTZero menunjukkan perlunya memperkuat sistem verifikasi keandalan konten yang dihasilkan AI
Belum ada komentar.