LLM Agen 7B Parameter yang Dioptimalkan untuk Analisis Berita Pasar Saham Korea dan Riset Investasi
(huggingface.co)Memperkenalkan VELA, model bahasa yang dioptimalkan untuk pasar saham Korea (KOSPI+KOSDAQ).
Model ini di-fine-tune dari basis Qwen2.5-7B-Instruct dengan pipeline SFT + DPO.
Alasan dibuat
LLM finansial yang ada sebelumnya sering mengalami halusinasi pada istilah pasar Korea,
dan memiliki masalah language leak yang membuat respons tiba-tiba beralih ke bahasa Tionghoa/Inggris di tengah jawaban.
VELA secara terfokus memperbaiki dua masalah ini dengan DPO.
Data pelatihan
- SFT: 36.713 sampel / 2.135 emiten (klasifikasi berita, sinyal lonjakan/penurunan tajam, laporan perusahaan sekuritas, tool calling, analisis sektor/makro, dll.)
- DPO: 24.779 pasangan (menghapus leak bahasa Tionghoa/Inggris, penyelarasan format Reasoning Trace)
Format output
- Reasoning Trace – proses berpikir bertahap dalam format JSON (
search → analyze → confidence) - Synthesis Report – laporan riset 7 bagian (ringkasan, indikator, aliran dana, dampak berita, risiko, opini investasi)
Performa (berdasarkan RTX 3060 12GB)
| Format | Kecepatan | Kapasitas | Chinese Leak |
|---|---|---|---|
| Q4_K_M | 36 tok/s | 4.4GB | 0/5 CLEAN |
| Q8_0 | 25 tok/s | 7.6GB | 0/5 CLEAN |
Perhatian: dalam penggunaan nyata, Anda harus menyediakan sumber berita dan data yang tepat kepada model. Jika tidak ada sumber yang akurat, halusinasi dapat terjadi. Dirancang untuk digunakan bersama https://github.com/unohee/vela-framework.
Antarmuka yang didukung
llama-cpp-python / Ollama / vLLM / Transformers / MLX
Lisensi: Apache 2.0
🤗 https://huggingface.co/intrect/VELA
Harga pasar real-time dipasok melalui API eksternal, dan VELA dirancang sebagai lapisan inferensi di atasnya.
Ini bertujuan untuk penyediaan informasi, bukan saran investasi.
3 komentar
Luar biasa ^^
Keren! Dengan 7B juga stabil?
Dibandingkan ukuran modelnya, tugas-tugas dasar jelas lebih baik daripada model dasar. Sepertinya benchmark-nya juga perlu saya unggah!