MCP YouTube Intelligence — Server MCP untuk menganalisis video YouTube secara efisien dalam penggunaan token
(github.com/JangHyuckYun)Ini adalah server MCP yang memproses subtitle YouTube di sisi server (ringkasan/entitas/topik/analisis sentimen) sehingga hanya hasil yang sudah dikompresi yang dikirim ke klien LLM.
Alasan dibuat:
Saya meneliti sekitar 80 server MCP YouTube yang sudah ada, dan semuanya melempar subtitle mentah
langsung ke LLM. Untuk satu video berdurasi 20 menit, konsumsi token sekitar ~15.000 token dapat
dikurangi menjadi ringkasan sekitar ~200-500 token, dan bahkan laporan lengkap pun menjadi sekitar ~3.000 token.
Karena dirancang dengan mempertimbangkan penggunaan lewat Claude skills, tool ini juga bisa digunakan melalui CLI.
Fitur utama:
- Laporan terstruktur (ringkasan + topik + entitas + komentar sekaligus)
- 9 tool MCP + CLI (
mcp-yt) - Ringkasan LLM gratis melalui integrasi Ollama/vLLM
- Pemantauan RSS channel
- Kamus 200+ entitas dalam bahasa Korea/Inggris
- Cache SQLite
pip install mcp-youtube-intelligence
Bisa langsung dihubungkan dari Claude Desktop, Cursor, dan Claude Code.
GitHub: https://github.com/JangHyuckYun/mcp-youtube-intelligence
PyPI: https://pypi.org/project/mcp-youtube-intelligence/
4 komentar
Jelas tampaknya ada trade-off sambil mengurangi jumlah token, tetapi saya tidak bisa menemukan bagian itu di README!
Belakangan ini konteks dasarnya 200k, jadi saya penasaran dengan penurunan kualitas akibat kehilangan kompresi.
Halo!
Ringkasan ekstraktif (tanpa LLM) secara terasa kira-kira ada di level 6/10 dibandingkan versi asli. Memang bisa mengambil kalimat-kalimat inti, tetapi keterkaitan konteksnya lemah.
Ringkasan LLM (seperti Ollama) jauh lebih baik, dan saat saya mengujinya dengan beberapa video perkenalan maupun video terkait pengembangan, hasilnya tampak sudah cukup untuk memahami isinya. Namun, terkadang angka-angka detail atau nuansa yang halus bisa hilang.
Kalau konteksnya 200k, untuk satu video tunggal yang relatif pendek seperti 30 menit sampai 1 jam, versi asli lebih baik.
Saya rasa untuk pemrosesan massal ratusan video atau analisis berulang, pendekatan ini bisa menghabiskan lebih sedikit token sambil mengekstrak hanya poin-poin pentingnya.
(Misalnya: analisis seluruh channel kompetitor, analisis 100 video YouTuber ekonomi, dll.)
Saya akan mencoba mengujinya lagi di README dengan video yang lebih beragam, lalu menambahkan hasil benchmark serta trade-off-nya dengan lebih jelas!
Terima kasih banyak atas jawaban yang begitu tulus!! Semoga proyeknya membuahkan hasil!!
Hehe, ya terima kasih!