xLSTMTime: Long-term Time Series Forecasting With xLSTM
- Dalam beberapa tahun terakhir, model berbasis transformer telah menunjukkan kinerja menonjol dalam peramalan deret waktu multivariat jangka panjang (LTSF). Namun, model ini menghadapi masalah seperti kebutuhan komputasi yang tinggi, kesulitan menangkap dinamika temporal, dan pengelolaan dependensi jangka panjang
- Kemunculan LTSF-Linear dengan struktur linear sederhana menunjukkan hasil yang melampaui model berbasis transformer, sehingga mendorong evaluasi ulang terhadap kegunaan transformer dalam peramalan deret waktu
- Sebagai tanggapan, makalah ini menyajikan hasil penerapan arsitektur terbaru, extended LSTM (xLSTM), pada LTSF. xLSTM memiliki potensi yang cocok untuk LTSF, termasuk exponential gating dan struktur memori termodifikasi dengan kapasitas lebih tinggi
- Arsitektur LTSF yang kami adopsi, xLSTMTime, melampaui pendekatan saat ini. Hasil perbandingan kinerja berbagai model mutakhir dengan xLSTMTime pada beberapa dataset dunia nyata membuktikan kemampuan prediksinya yang unggul
- Temuan kami menunjukkan bahwa arsitektur rekuren yang telah disempurnakan dapat menjadi alternatif kompetitif terhadap model berbasis transformer untuk tugas LTSF, serta berpotensi mendefinisikan ulang lanskap peramalan deret waktu
Ringkasan GN⁺
- Makalah ini memperkenalkan xLSTM untuk mengatasi keterbatasan model berbasis transformer dan menunjukkan kinerja unggul dalam peramalan deret waktu jangka panjang
- xLSTMTime membuktikan kemampuan prediksi yang melampaui model sebelumnya melalui exponential gating dan struktur memori yang dimodifikasi
- Riset ini kembali menyoroti potensi arsitektur rekuren dalam peramalan deret waktu dan menawarkan alternatif baru terhadap model berbasis transformer
- Proyek dengan fungsi serupa mencakup Prophet dari Facebook dan DeepAR dari Amazon
1 komentar
Komentar Hacker News
Memang benar bahwa dalam beberapa tahun terakhir model berbasis transformer mendapat perhatian dalam prediksi deret waktu jangka panjang multivariat, tetapi saya ragu apakah secara umum model itu lebih baik daripada model non-deep learning
Sejauh yang saya pahami, tidak demikian, meski saya tidak mengikuti bidang ini dengan sangat dekat
Model deep learning kuat dalam mempelajari musiman, tetapi cenderung kurang baik menangani tren atau guncangan yang kompleks
Data ekonomi dan keuangan sering kali memiliki musiman yang sederhana dan tren yang kompleks, jadi deep learning tampaknya cukup tertinggal
Saya setuju dengan makalah ini. Arsitektur deret waktu deep learning yang bagus yang pernah saya pakai lebih mirip perluasan sederhana dari MLP atau recurrent neural network seperti DeepAR atau N-BEATS, sedangkan arsitektur berbasis transformer benar-benar buruk, termasuk foundation model berbasis transformer yang belakangan ini banyak bermunculan
Namun, di antara model deep learning sendiri, perbedaan kinerjanya sangat besar, seperti transformer, LSTM dua arah, MLP biasa, VAE, dan lainnya
Menurutnya, arsitektur berbasis transformer cenderung memberikan performa yang cukup baik pada tugas deret waktu dengan usaha yang relatif lebih sedikit dibandingkan model tree
Sejauh yang saya pahami, jika parameternya dituning dengan cukup, model berbasis tree biasanya bisa mengalahkan transformer. Namun, model seperti TimeGPT menarik untuk implementasi cepat karena memberi performa yang cukup baik tanpa tuning yang luas
Sebagian pekerjaan saya memang membuat model nowcasting dan prediksi di bidang ekonomi. Saya menangani indikator ekonomi seperti inflasi dan PDB serta indikator keuangan seperti likuiditas pasar
Saya belum sempat membaca makalahnya, tetapi saya sepenuhnya setuju dengan nada umumnya bahwa “transformer hebat untuk hal-hal yang memang dikuasainya, tetapi model keluarga LSTM juga masih sangat bernilai”
Apa hubungannya ini dengan model prediksi cuaca berbasis AI milik Google?
https://deepmind.google/discover/blog/graphcast-ai-model-for...
Sebagai catatan, Graphcast mengungguli semua prediksi tunggal global tradisional, setidaknya untuk prediksi pola global skala besar. Untuk metrik seperti Z500, kira-kira pada rentang lead time 3–10 hari
ECMWF memiliki AIFS, turunan dari Graphcast, dan kemungkinan besar akan memasukkannya, atau sesuatu yang serupa, ke lingkungan operasional dalam beberapa tahun
Jika dipasarkan sebagai alat prediksi, apakah ini tidak berlaku untuk klasifikasi event dalam deret waktu?
Sayang sekali tautan dataset di makalah tidak berfungsi. Semoga diperbaiki
Model deret waktu deep learning terbaik kemungkinan ada secara tertutup di internal hedge fund
Metode yang bekerja baik di hedge fund pun bisa buruk di domain lain yang jumlah datanya, sifat datanya, dan inductive bias yang dibutuhkannya lebih sedikit atau berbeda
Prediksi deret waktu bekerja paling baik di domain deterministik
Tidak ada teknik LLM, AI, deep learning, atau machine learning terbuka yang efektif untuk pasar saham. Benar-benar tidak ada. Saya sudah mencoba semuanya
Kalau metode prediksi deret waktu seseorang benar-benar berhasil, mereka tidak akan mempublikasikannya
Saya salah membacanya sebagai XSLT
Saya menantikan hari ketika seseorang mencoba memprediksi saham dengan ini lalu kehilangan seluruh hartanya