1 poin oleh GN⁺ 2024-07-18 | 1 komentar | Bagikan ke WhatsApp

xLSTMTime: Long-term Time Series Forecasting With xLSTM

  • Dalam beberapa tahun terakhir, model berbasis transformer telah menunjukkan kinerja menonjol dalam peramalan deret waktu multivariat jangka panjang (LTSF). Namun, model ini menghadapi masalah seperti kebutuhan komputasi yang tinggi, kesulitan menangkap dinamika temporal, dan pengelolaan dependensi jangka panjang
  • Kemunculan LTSF-Linear dengan struktur linear sederhana menunjukkan hasil yang melampaui model berbasis transformer, sehingga mendorong evaluasi ulang terhadap kegunaan transformer dalam peramalan deret waktu
  • Sebagai tanggapan, makalah ini menyajikan hasil penerapan arsitektur terbaru, extended LSTM (xLSTM), pada LTSF. xLSTM memiliki potensi yang cocok untuk LTSF, termasuk exponential gating dan struktur memori termodifikasi dengan kapasitas lebih tinggi
  • Arsitektur LTSF yang kami adopsi, xLSTMTime, melampaui pendekatan saat ini. Hasil perbandingan kinerja berbagai model mutakhir dengan xLSTMTime pada beberapa dataset dunia nyata membuktikan kemampuan prediksinya yang unggul
  • Temuan kami menunjukkan bahwa arsitektur rekuren yang telah disempurnakan dapat menjadi alternatif kompetitif terhadap model berbasis transformer untuk tugas LTSF, serta berpotensi mendefinisikan ulang lanskap peramalan deret waktu

Ringkasan GN⁺

  • Makalah ini memperkenalkan xLSTM untuk mengatasi keterbatasan model berbasis transformer dan menunjukkan kinerja unggul dalam peramalan deret waktu jangka panjang
  • xLSTMTime membuktikan kemampuan prediksi yang melampaui model sebelumnya melalui exponential gating dan struktur memori yang dimodifikasi
  • Riset ini kembali menyoroti potensi arsitektur rekuren dalam peramalan deret waktu dan menawarkan alternatif baru terhadap model berbasis transformer
  • Proyek dengan fungsi serupa mencakup Prophet dari Facebook dan DeepAR dari Amazon

1 komentar

 
GN⁺ 2024-07-18
Komentar Hacker News
  • Dalam beberapa tahun terakhir, model berbasis transformer menonjol dalam peramalan deret waktu multivariat jangka panjang
    • Namun, secara umum belum jelas apakah model ini benar-benar lebih baik daripada model non-deep learning
  • Saya bekerja membangun model nowcasting dan peramalan di bidang ekonomi (inflasi, PDB, dll.) dan keuangan (seperti likuiditas pasar)
    • Saya setuju dengan pendapat bahwa model transformer memang unggul, tetapi model tipe LSTM juga masih sangat berguna
  • Saya penasaran apakah ini ada kaitannya dengan model prediksi cuaca Google yang menggunakan AI
  • Sayang sekali tautan dataset di makalahnya tidak berfungsi
    • Semoga diperbaiki
  • Ini dipasarkan sebagai alat peramalan, tetapi saya penasaran apakah ini tidak bisa diterapkan untuk klasifikasi peristiwa dalam deret waktu
  • Model deret waktu deep learning terbaik digunakan secara internal dan tidak dipublikasikan di hedge fund
  • Peramalan deret waktu bekerja paling baik di domain yang deterministik
    • Tidak ada teknik LLM/AI/deep learning/machine learning yang dipublikasikan yang bekerja dengan baik di pasar saham
    • Saya sudah mencoba semuanya, tetapi tidak berhasil
  • Jika metode peramalan deret waktu seseorang benar-benar efektif, mereka tidak akan mempublikasikannya
  • Saya sempat salah membacanya sebagai XSLT
  • Sudah terbayang akan ada orang yang kehilangan semua uangnya karena mencoba memprediksi saham dengan alat ini