7 poin oleh GN⁺ 21 hari lalu | 1 komentar | Bagikan ke WhatsApp
  • TimesFM adalah model pra-pelatihan skala besar untuk peramalan deret waktu yang dikembangkan oleh Google Research, menggunakan arsitektur decoder-only
  • Versi terbaru 2.5 mendukung 200 juta parameter, panjang konteks 16k, dan prediksi horizon hingga 1k
  • Mencakup berbagai fitur seperti continuous quantile forecast, input kovariat (XReg), dan backend Flax·PyTorch
  • Model tersedia melalui Hugging Face dan juga dapat digunakan lewat integrasi ke BigQuery
  • Sebagai model fondasi serbaguna untuk prediksi data deret waktu, model ini menawarkan skalabilitas dan efisiensi untuk riset maupun praktik

Gambaran TimesFM

  • TimesFM(Time Series Foundation Model) adalah model pra-pelatihan untuk peramalan deret waktu yang dikembangkan oleh Google Research
  • Berdasarkan makalah ICML 2024 “A decoder-only foundation model for time-series forecasting”
  • Checkpoint model disediakan melalui koleksi Hugging Face, dan juga terintegrasi secara resmi ke BigQuery
  • Versi terbukanya bukan produk resmi Google

Versi model dan pembaruan utama

  • Versi terbaru adalah TimesFM 2.5; versi sebelumnya (1.0, 2.0) disimpan di direktori v1 dan dapat dipasang dengan timesfm==1.3.0
  • Pembaruan 15 September 2025

    • Rilis model TimesFM 2.5
    • Jumlah parameter diperkecil menjadi 200M (kurang dari setengah dibanding 500M sebelumnya)
    • Panjang konteks diperluas menjadi 16k (naik dari 2048)
    • Mendukung continuous quantile forecast hingga horizon 1k, dengan quantile head 30M opsional
    • Indikator frequency dihapus
    • forecasting flags baru ditambahkan
    • inference API ditingkatkan
    • Item yang akan ditambahkan ke depan
      1. Dukungan model versi Flax (inferensi lebih cepat)
      2. Pemulihan dukungan kovariat (covariate)
      3. Penyempurnaan docstring, dokumentasi, dan notebook
  • Pembaruan 29 Oktober 2025

    • Dukungan input kovariat (covariate) melalui XReg ditambahkan kembali ke TimesFM 2.5

Cara instalasi

  • Clone repositori GitHub lalu gunakan uv untuk membuat virtual environment dan memasang paket
    • Backend opsional yang dapat dipasang: torch, flax, xreg
    • Bergantung pada OS dan akselerator (CPU, GPU, TPU, Apple Silicon), dapat memilih PyTorch atau JAX(Flax)

Contoh kode

  • Disediakan contoh pemuatan model TimesFM 2.5 berbasis PyTorch (200M parameter)
    • Menggunakan timesfm.TimesFM_2p5_200M_torch.from_pretrained("google/timesfm-2.5-200m-pytorch")
    • Melalui ForecastConfig, dapat mengatur normalisasi input (normalize_inputs), penggunaan continuous quantile head, pemaksaan nilai positif (infer_is_positive), dan perbaikan quantile crossing (fix_quantile_crossing)
    • Saat memanggil forecast(), dua hasil dikembalikan: point forecast dan quantile forecast
      • point_forecast.shape: (2, 12)
      • quantile_forecast.shape: (2, 12, 10) — mencakup rata-rata dan quantile 10~90

1 komentar

 
GN⁺ 21 hari lalu
Komentar Hacker News
  • Konsep model deret waktu yang umum terasa agak aneh
    Sulit membayangkan bagaimana model yang sama bisa secara andal memprediksi harga telur di Italia dan inflasi global sekaligus
    Selain itu, jika dasar prediksinya tidak dijelaskan, hasilnya juga sulit dipercaya

    • Sebenarnya model seperti ini bukan memprediksi harga telur atau inflasi itu sendiri, melainkan menguraikan data deret waktu menjadi tren, musiman, dan residual
      Peristiwa non-musiman seperti perang di Timur Tengah yang memengaruhi inflasi tidak akan bisa ditangkap model
    • Menurut pemahaman saya, data latih sintetis membantu menangkap pola deret waktu abstrak yang muncul lintas domain
      Menurut lampiran 8 makalahnya, mereka membuat data sintetis dengan model statistik tradisional seperti tren linear, ARMA, dan pola musiman sinus-kosinus
      Pada akhirnya ini tetap arsitektur Transformer, jadi seperti LLM, ia menemukan pola spesifik masalah berdasarkan konteks input
    • Saat bekerja di Google Ads, saya menggunakan peramalan deret waktu untuk memprediksi kemungkinan kampanye iklan mencapai targetnya
      Banyak pengiklan hanya menarik garis lurus dari angka saat ini, tetapi itu tidak akurat karena hari dalam minggu dan musiman tidak diperhitungkan
      Sebaliknya, model deret waktu jauh lebih akurat, dan jika dilatih pada seluruh data kampanye, model itu bisa memberikan interval kepercayaan 95%
    • Hukum Benford(Benford’s law) juga bisa diterapkan
      Tanda dan eksponen berubah lambat, jadi itu bisa diprediksi, lalu bagian mantisanya diperkirakan dengan hukum Benford
    • Sebagai pendekatan, ada
      • dekomposisi (decomposition): menemukan bentuk umum dari transformasi Fourier untuk memisahkan faktor-faktor dasarnya
      • memorization: mempelajari pola yang berulang di banyak domain (mis. power law)
      • multitask: memanfaatkan keterkaitan antar-domain seperti cuaca dan listrik
  • Akan lebih baik jika judulnya menambahkan (2024)
    Ini bukan berita baru karena sudah pernah diperkenalkan di blog Google Research

    • Tetapi ada pembaruan besar pada akhir 2025
  • Postingan blog terkait bisa dilihat di halaman TimesFM di GitHub

    • Mungkin yang ingin ditautkan adalah artikel blog Google Research ini
    • Saya penasaran dengan total waktu training GPU-nya
      Dibandingkan LLM kelihatannya jauh lebih kecil, jadi saya ingin tahu apakah peneliti individu atau lab universitas juga bisa melatihnya
    • Di Chrome iOS, itu terbuka sebagai konten yang sama dengan repositori GitHub yang dikirimkan
  • Sebagai referensi, ada proyek serupa seperti Nixtla dan Prophet

  • Ada pertanyaan, “Bisa dijelaskan di level ELI5? Dan berapa banyak titik data yang bisa dibaca?”

  • Saya penasaran apakah deret waktu diberikan hanya sebagai kumpulan angka tanpa konteks
    Tampaknya model melihat data lalu menebak kategorinya (harga saham, tren pencarian, dll.) dan kemudian membuat prediksi yang sesuai
    Tetapi sepertinya akan lemah pada kategori yang tidak ada dalam data latih
    Secara pribadi saya lebih suka model sederhana seperti ARIMA atau model berbasis teori

    • Meski begitu, seperti LLM yang memprediksi token berikutnya dari aliran token panjang, model ini juga bisa bekerja seperti itu
      Kuncinya adalah seberapa jauh arsitektur dan metode pelatihannya bisa digeneralisasi
  • Model ini sudah dirilis sejak beberapa bulan lalu, jadi saya penasaran apakah sudah ada yang benar-benar membangun sesuatu berdasarkan model ini

  • Jika ada deret waktu historis radiasi matahari dan prakiraan cuaca, apakah mungkin memakai prakiraan cuaca masa depan untuk memprediksi harga listrik
    Dengan kata lain, apakah data pada waktu X dari satu deret waktu bisa dipakai untuk memprediksi waktu X pada deret waktu lain, atau model ini hanya menangani pola dalam satu deret waktu saja

    • Di makalahnya tertulis fokusnya adalah pada forecasting
      Tetapi jika data latihnya sedikit, mungkin model hanya belajar pola “naik ke kanan”, jadi tampaknya tetap ada keterbatasan
  • Saya melewatkan proyek ini, apakah ada kompetisi terkait
    Deret waktu dan ML selalu terasa sulit, jadi saya ingin mencobanya sendiri

  • Secara pribadi saya merasa LLM + pandas + loop eksperimen sendiri bisa memberi hasil lebih baik daripada model ini

    • Kalau begitu ya tinggal dicoba saja
      Bukan berarti batasnya sudah pasti, malah saya rasa kemungkinan besar klaim itu salah