8 poin oleh unohee 2026-03-31 | 3 komentar | Bagikan ke WhatsApp

Memperkenalkan VELA, model bahasa yang dioptimalkan untuk pasar saham Korea (KOSPI+KOSDAQ).

Model ini di-fine-tune dari basis Qwen2.5-7B-Instruct dengan pipeline SFT + DPO.

Alasan dibuat
LLM finansial yang ada sebelumnya sering mengalami halusinasi pada istilah pasar Korea,
dan memiliki masalah language leak yang membuat respons tiba-tiba beralih ke bahasa Tionghoa/Inggris di tengah jawaban.
VELA secara terfokus memperbaiki dua masalah ini dengan DPO.

Data pelatihan

  • SFT: 36.713 sampel / 2.135 emiten (klasifikasi berita, sinyal lonjakan/penurunan tajam, laporan perusahaan sekuritas, tool calling, analisis sektor/makro, dll.)
  • DPO: 24.779 pasangan (menghapus leak bahasa Tionghoa/Inggris, penyelarasan format Reasoning Trace)

Format output

  1. Reasoning Trace – proses berpikir bertahap dalam format JSON (search → analyze → confidence)
  2. Synthesis Report – laporan riset 7 bagian (ringkasan, indikator, aliran dana, dampak berita, risiko, opini investasi)

Performa (berdasarkan RTX 3060 12GB)

Format Kecepatan Kapasitas Chinese Leak
Q4_K_M 36 tok/s 4.4GB 0/5 CLEAN
Q8_0 25 tok/s 7.6GB 0/5 CLEAN

Perhatian: dalam penggunaan nyata, Anda harus menyediakan sumber berita dan data yang tepat kepada model. Jika tidak ada sumber yang akurat, halusinasi dapat terjadi. Dirancang untuk digunakan bersama https://github.com/unohee/vela-framework.

Antarmuka yang didukung
llama-cpp-python / Ollama / vLLM / Transformers / MLX

Lisensi: Apache 2.0

🤗 https://huggingface.co/intrect/VELA

Harga pasar real-time dipasok melalui API eksternal, dan VELA dirancang sebagai lapisan inferensi di atasnya.
Ini bertujuan untuk penyediaan informasi, bukan saran investasi.

3 komentar

 
310writer 2026-04-06

Luar biasa ^^

 
ahiou 2026-04-01

Keren! Dengan 7B juga stabil?

 
unohee 2026-04-01

Dibandingkan ukuran modelnya, tugas-tugas dasar jelas lebih baik daripada model dasar. Sepertinya benchmark-nya juga perlu saya unggah!