Trump-Saith: Feed analisis real-time pernyataan Trump dan dampaknya pada ekonomi Korea
(trump-saith.com)Halo! Saya membuat layanan bernama 'Trump-Saith' yang menganalisis secara real-time dampak pernyataan mantan Presiden Trump terhadap ekonomi dan pasar Korea, lalu menyajikannya kepada pengguna.
Situs web: https://trump-saith.com/ (https://trump-saith.com/)
Fitur utama: pengumpulan pernyataan Trump secara real-time -> ringkasan bahasa Korea oleh LLM -> analisis dampak ekonomi -> penyajian feed setelah deduplikasi
💡 Mengapa saya membuatnya?
Belakangan ini, hanya dengan satu pernyataan dari Trump, pasar saham domestik dan nilai tukar sering bergejolak. Namun, teks asli dari Truth Social dan sumber lain sulit diikuti, sementara berita konvensional cenderung lebih lambat karena harus melalui proses pengolahan.
Karena itu, saya memulai proyek ini dengan gagasan untuk "mengumpulkan pernyataan langsung secepat mungkin, lalu menampilkan hanya inti yang penting dari sudut pandang developer dan investor."
🛠️ Tech stack dan arsitektur
Karena ini komunitas developer, saya ingin membagikan cara implementasinya. Saya membangun pipeline dengan 4 layer independen.
-
Data Collection (Python, APScheduler)
API Truth Social dan kanal RSS dimonitor setiap 1 menit untuk mengumpulkan data mentah.
Data yang terkumpul disimpan secara permanen di Oracle DB, lalu diteruskan secara asinkron ke layer berikutnya melalui Redis Streams. -
Analysis (Gemini 2.0 Flash)
Teks asli yang dikumpulkan dianalisis menggunakan model Gemini 2.0 Flash.
Bukan sekadar terjemahan, sistem ini mengekstrak ringkasan dan kata kunci dari sudut pandang 'dampak terhadap ekonomi/pasar Korea'. (ringkasan 3-5 kalimat) -
Deduplication (Sentence-Transformers, Qdrant)
Menangani pernyataan dengan isi yang sama yang dikumpulkan dari berbagai kanal.
Embedding kalimat dibuat dengan model all-MiniLM-L6-v2, lalu duplikasi difilter di Qdrant (Vector DB) berdasarkan ambang cosine similarity 0.85. -
API & Feed
Pada akhirnya, data yang telah dibersihkan disediakan kepada klien.
✨ Pembeda
Kecepatan: sebelum artikel berita terbit, analisis dimulai segera setelah teks asli pernyataan Trump diposting.
Analisis konteks: melalui prompt LLM, sistem menurunkan makna dari pertanyaan seperti "apa arti pernyataan ini bagi industri semikonduktor atau otomotif Korea?"
Feed bersih: dengan deduplikasi berbasis kemiripan, noise berupa berita yang sama muncul berulang kali dapat diminimalkan.
🚀 Rencana ke depan
Saat ini saya sedang memperluas kanal pengumpulan, dan ke depannya berencana menambahkan fitur push notification real-time untuk kata kunci tertentu (misalnya Samsung Electronics, tarif, dll.).
Saya berharap ini bisa menjadi bantuan kecil bagi siapa pun yang tertarik pada persimpangan antara IT dan ekonomi. Masukan selalu saya sambut!
Terima kasih.
8 komentar
Meledak 403
Terima kasih! Saya sudah mendaftarkan proyeknya!
"mantan" presiden
Saya belum sempat meninjaunya dengan teliti..!
Sepertinya ini tulisan yang dibuat oleh model dengan data pelatihan dari 2021.01 ~ 2025.01 wkwk
Keren
Tapi, apakah analisis dampak ekonomi yang dimaksud itu berupa satu-dua kalimat per kartu seperti ringkasan?
Kalau bukan, di layar saya saat ini tidak muncul informasi yang disebut analisis dampak.
Saat ini tidak ditampilkan secara terpisah.
Sepertinya perlu kita diskusikan apakah analisis dampaknya bisa lebih diperkuat di ringkasan.
Terima kasih!