ocap - perekam berperforma tinggi yang merekam segala hal di desktop
(github.com/open-world-agents)Ini adalah perekam open-source ocap (Omnimodal CAPture) yang awalnya dibuat untuk mengumpulkan data desktop guna pelatihan agen AI, tetapi juga dapat digunakan untuk keperluan umum.
Alat perekam yang sudah ada seperti OBS biasanya hanya menyimpan video atau tidak dapat menyimpan berbagai jenis data secara tersinkronisasi. Untuk pelatihan AI, dibutuhkan data yang tersinkronisasi hingga mencakup "kapan pengguna menekan tombol apa, ke mana mouse digerakkan, dan jendela mana yang sedang aktif". Proyek ini dibuat untuk menyelesaikan masalah tersebut.
Fitur:
- Merekam video layar + audio + event keyboard/mouse + event jendela dengan sinkronisasi hingga tingkat nanodetik
- Encoding akselerasi perangkat keras (H265/HEVC, NVIDIA GPU)
- Mulai/akhiri perekaman dengan satu perintah:
ocap my-recording→ Ctrl+C - Logika inti ada dalam satu file Python (~400 baris) sehingga mudah dikustomisasi
- Berbasis GStreamer sehingga strukturnya dapat diperluas ke Linux/macOS
- Output: .mkv (video) + .mcap (log event, format MCAP yang sudah tervalidasi di bidang robotika)
Instalasi:
conda install open-world-agents::gstreamer-bundle
pip install ocap
Atau unduh zip dari halaman rilis lalu jalankan run.bat.
Awalnya ini dikembangkan untuk proyek riset D2E (https://worv-ai.github.io/d2e/) yang melatih Embodied AI menggunakan data desktop, tetapi karena juga bisa dipakai sebagai alat perekam desktop serbaguna, proyek ini dipisahkan menjadi paket tersendiri.
Saat ini hanya mendukung lingkungan Windows + NVIDIA GPU, tetapi dukungan untuk GPU AMD/Intel atau OS lain dirancang agar cukup dengan mengubah pipeline GStreamer.
GitHub: https://github.com/open-world-agents/ocap
PyPI: https://pypi.org/project/ocap/
Belum ada komentar.