1 poin oleh GN⁺ 2025-02-10 | 1 komentar | Bagikan ke WhatsApp

1 komentar

 
GN⁺ 2025-02-10
Komentar Hacker News
  • Ini adalah penjelasan tentang berbagai kotak alat demo

    • Segment Anything 2: membuat cutout video dan efek visual yang menyenangkan hanya dengan beberapa klik
    • Seamless Translation: dapat merasakan suara sendiri terdengar dalam bahasa lain
    • Animated Drawings: menghidupkan sketsa gambar tangan menjadi animasi
    • Audiobox: membuat cerita audio menggunakan suara dan bunyi yang dihasilkan AI
  • Seamless Translation cukup mengagumkan

    • ketika pengguna yang fasih berbahasa Inggris dan Spanyol merekam kalimat dalam bahasa Inggris lalu mendengarkan keluaran bahasa Spanyol yang dihasilkan, suaranya hampir sama dengan suara Spanyol mereka sendiri
    • hanya saja, bahasa Spanyol pengguna itu mengandung lebih banyak ungkapan khas Kastilia
  • Saya penasaran kenapa judulnya ditulis Aidemos

  • Saya penasaran dengan arah riset AI Meta

    • saya memahami tujuan Google dan MSFT, tetapi saya kurang tahu apa tujuan akhir Meta
  • Demo Seamless Translation sangat bagus

    • suara terjemahannya mirip dengan suara asli penggunanya
    • akan luar biasa jika fitur ini bisa diwujudkan secara real-time
  • Meta memahami secara mendalam dampak GPT-3 dan ChatGPT

    • model hanyalah titik awal, dan UX yang memanfaatkan model itulah yang menunjukkan kecerdasan
    • ini terutama menonjol pada model visual
    • menarik bahwa SAM2 mengatakan ia "bisa melihat apa saja"
    • sangat mengesankan melihat bola sepak diklik lalu model melacaknya dengan mulus di video bahkan saat tertutup
  • Tidak semua demo disertakan

    • misalnya, demo Meta Motivo tidak ada (model kontrol humanoid)
  • Muncul pesan "Situs tidak tersedia di wilayah Anda saat ini"

  • Saya penasaran di mana semua tautan ke model-model itu berada

  • Menarik, tetapi saya berharap Meta menjelaskan dengan lebih jelas apa yang sebenarnya mereka inginkan

    • kemungkinan artinya adalah "tolong berikan data In the Wild agar model bisa dilatih lebih lanjut"
  • Beberapa tahun lalu saya pernah menggunakan teknologi estimasi usia

    • pengguna mengunggah gambar dan membantu menyelaraskan 10% titik landmark wajah, lalu estimator dijalankan
    • jika hasilnya salah, mereka meminta koreksi untuk perbaikan
    • tetap keren, tetapi tidak terlalu mengesankan dibanding pengalaman sebelumnya