- Segment Anything Model 2 adalah model untuk menyelesaikan masalah segmentasi visual yang dapat diprompt pada gambar dan video
- Memperlakukan gambar sebagai video dengan satu frame untuk memperluasnya ke video
- Menggunakan arsitektur transformer sederhana dengan streaming memory untuk pemrosesan video real-time
- Membangun data engine yang meningkatkan model dan data melalui interaksi pengguna untuk mengumpulkan dataset SA-V
- Memberikan performa yang kuat di berbagai tugas dan domain visual
- Dataset Segment Anything Video (SA-V) juga dirilis
- Terdiri dari 50.583 video yang beragam dan 642.036 mask segmentasi spatio-temporal berkualitas tinggi (Masklet)
- Lisensi CC by 4.0
2 komentar
Segment Anything Model (SAM): model AI Meta yang dapat mengekstrak objek apa pun dari gambar
SAM.cpp - implementasi Segment Anything Model milik Meta dalam C/C++ murni
Komentar Hacker News
Tertarik pada peningkatan mIoU dan kecepatan pemrosesan gambar hingga 6x
Tim Segment Anything merilis model SAM 2
Pernah membahas SAM 1
Ingin melatih model untuk mengklasifikasikan frame video dan menemukan frame tertentu
Sangat menyukai loss function SAM
Demo web-nya sangat rapi
Model SAM pertama adalah yang paling berguna
Demo riset tidak bisa digunakan di Illinois dan Texas
Ada kekhawatiran tentang penggunaan militer
Hasil yang luar biasa