3 poin oleh GN⁺ 2025-12-08 | Belum ada komentar. | Bagikan ke WhatsApp
  • GPTZero mendeteksi lebih dari 50 kesalahan sitasi dan informasi penulis palsu dalam makalah yang diajukan ke ICLR 2026
  • Setiap makalah diverifikasi bersama tautan OpenReview untuk memastikan apakah benar-benar ada dan apakah sitasinya cocok
  • Dalam banyak kasus, ditemukan penulis yang tidak ada, tahun yang salah, dan judul makalah yang berbeda
  • Beberapa makalah sebagian cocok dengan makalah asli, tetapi metadata rinci telah terdistorsi
  • Ini menjadi contoh yang menunjukkan bahwa masalah halusinasi yang dihasilkan AI (hallucination) juga menyebar ke naskah akademik yang diajukan

Hasil deteksi halusinasi ICLR 2026 oleh GPTZero

  • GPTZero melakukan verifikasi otomatis terhadap kutipan dan informasi penulis pada makalah yang diajukan ke ICLR 2026
    • Untuk setiap makalah, ditampilkan tautan OpenReview, tautan verifikasi GPTZero, dan informasi sitasi
    • Hasil verifikasi menemukan lebih dari 50 sitasi palsu atau penulis yang tidak ada

Contoh kasus halusinasi yang menonjol

  • Makalah TamperTok memang ada, tetapi seluruh informasi penulisnya salah
  • Makalah MixtureVitae cocok untuk 3 penulis pertama, tetapi 7 penulis sisanya tidak ada
  • OrtSAE, Principled Policy Optimization, IMPQ dan lainnya tidak cocok dengan makalah asli dari sisi judul atau penulis
  • PDMBench memiliki makalah serupa, tetapi tahun dan judulnya berbeda
  • C3-OWD, GRF-LLM dan lainnya diklasifikasikan sebagai kecocokan sebagian

Kasus yang sama sekali tidak cocok

  • Catch-Only-One, TopoMHC, ThinkGeo, Reflexion, LOSI dan lainnya tidak memiliki makalah yang disitasi
  • SAFE-LLM, Typed Chain-of-Thought, MANTA dan lainnya memiliki makalah serupa, tetapi metadata tidak cocok
  • AI-Assisted Medical Triage Assistant, QUART, KARMA dan lainnya mengutip makalah yang sama sekali tidak terkait

Metode verifikasi dan jenis hasil

  • GPTZero membandingkan setiap sitasi dengan basis data nyata (misalnya arXiv, NeurIPS, ICLR, ACL, dan lainnya)
    • Hasilnya diklasifikasikan sebagai “ada”, “kecocokan sebagian”, “tidak cocok”, “penulis palsu”, dan sebagainya
    • Beberapa entri ditandai sebagai makalah nyata ada, tetapi penulis, tahun, dan judul semuanya berbeda

Makna dan implikasi

  • Banyak naskah yang diajukan ke ICLR 2026 memuat begitu saja masalah halusinasi pada teks yang dihasilkan AI
  • Dalam proses penulisan makalah akademik, kebutuhan akan alat otomatis untuk verifikasi fakta semakin menonjol
  • Hasil deteksi GPTZero menunjukkan perlunya memperkuat sistem verifikasi keandalan konten yang dihasilkan AI

Belum ada komentar.

Belum ada komentar.