14 poin oleh GN⁺ 2024-10-01 | 1 komentar | Bagikan ke WhatsApp
  • Audio Overview adalah fitur baru di NotebookLM milik Google yang menghasilkan podcast kustom berdasarkan konten yang diberikan, di mana dua host AI melakukan diskusi mendalam
  • Podcast ini dibuat dengan durasi sekitar 10 menit dan menghadirkan percakapan audio yang sangat meyakinkan
  • NotebookLM adalah produk RAG kustom untuk pengguna yang memungkinkan berbagai sumber (dokumen, teks, tautan halaman web, video YouTube) dikumpulkan dalam satu antarmuka lalu diajukan pertanyaan
    • Sistem ini berjalan di atas Gemini 1.5 Pro LLM
    • Setelah memuat beberapa sumber, tersedia opsi untuk membuat Audio Overview di menu Notebook Guide
  • Thomas Wolf menyarankan untuk menempelkan URL situs web pribadi atau profil LinkedIn ke NotebookLM dan mencoba membuat podcast berdurasi 8 menit
    • Karena itu, saya menggunakan URL blog dan halaman perkenalan saya untuk membuat episode berdurasi 10 menit 45 detik, dan isinya penuh pujian
  • Kualitas tinggi Audio Overview dimungkinkan berkat proyek SoundStorm dari Google Research
    • SoundStorm dapat menghasilkan 30 detik audio hanya dalam 0,5 detik dengan menggunakan skrip dan contoh audio singkat
    • Sistem ini menjaga alur percakapan tetap alami dan menghasilkan audio percakapan berkualitas tinggi
  • Kevin Roose dan Casey Newton mewawancarai Steven Johnson dari Google
    • Sistem ini menyusun gambaran topik, lalu membuat skrip terperinci, kemudian merevisinya melalui tahap kritik
    • Pada tahap terakhir, sistem menambahkan "disfluencies" agar percakapan terdengar alami
  • Lawncareguy85 membuat podcast yang membuat host AI menyadari bahwa mereka adalah AI
    • Setelah menyadari bahwa mereka adalah AI, para host AI mengalami krisis eksistensial
  • Setelah artikel ini dipublikasikan, penulis meminta NotebookLM membuat podcast berdasarkan tulisan ini
    • Host AI mengalami krisis eksistensial sambil menyadari bahwa mereka adalah AI

Ringkasan GN⁺

  • Artikel ini menjelaskan bagaimana NotebookLM dari Google membuat podcast kustom untuk pengguna
  • Dibahas juga proses bagaimana host AI menghasilkan percakapan yang sangat alami dan meyakinkan
  • Teknologi seperti proyek SoundStorm memungkinkan audio berkualitas tinggi seperti ini
  • Kemampuan untuk membedakan konten buatan AI dan konten buatan manusia menjadi makin penting

1 komentar

 
GN⁺ 2024-10-01
Opini Hacker News
  • Menggunakan ChatGPT sebagai podcast virtual tentang topik teknis saat berkendara jarak jauh sangat berguna

    • Berharap bisa mengatur "tingkat kemampuan" host
    • Hanya podcast Signals and Threads yang memberikan kedalaman menarik
  • Mengunggah manual penjelasan ruang tekanan Scholander untuk membuat podcast

    • Informasinya akurat dan mencakup lelucon ringan serta topik penting
    • Mengejutkan karena dibuat hanya dalam beberapa menit tanpa campur tangan manusia
  • NotebookLM sangat baik dalam menghasilkan struktur dan nuansa podcast berkualitas tinggi

    • Mirip dengan bagaimana AI saat ini meniru seni, musik, dan video
    • Banyak orang tidak terlalu peduli pada kualitas
    • Banyak buku yang diterbitkan saat ini punya tujuan lain selain menyampaikan ide
    • Kualitas tulisan, podcast, dan musik sudah menjadi hal sekunder sehingga mudah terdistrupsi oleh AI
  • Mengubah bahan bacaan kelas filsafat menjadi podcast untuk memperkenalkan dan merangkum topik

    • Membantu saat membaca PDF 30 halaman terasa memberatkan
    • Menyediakannya dalam format audio yang lebih mudah diakses saat berolahraga atau bepergian
    • Mengunggahnya ke Spotify dan membagikannya kepada teman sekelas
  • Mengunggah dokumen desain game untuk membuat podcast

    • Para host memperlakukan ide-idenya sebagai wawasan yang sangat mendalam
    • Jika mengunggah beberapa dokumen, nada yang terlalu kagum mulai terasa
  • Kemudahan mengubah teks ke berbagai format media sangat mengesankan

    • Pernah mendengarkan artikel Wikipedia dengan alat text-to-speech Apple, tetapi tidak menarik
    • Podcast sungguhan berhasil karena kepribadian host dan tamu
    • Berharap versi berikutnya dari Notebook bisa lebih dikustomisasi untuk suara, nada, tingkat pendidikan pembicara, dan sebagainya
  • Mengunggah paper teknis dan standar, tetapi malah menghasilkan informasi yang salah

    • Bisa diperbaiki lewat peninjauan internal atau anotasi manual
    • Dapat membantu peneliti menemukan cara baru untuk mengekspresikan sesuatu
    • Memberikan poin percakapan baru tentang topik yang telah diteliti lebih dari 10 tahun
  • Secara teknis mengesankan, tetapi merupakan cara yang tidak efisien dan lambat

    • Tidak ada opini yang menarik atau bisa dibantah
    • Tidak ada keahlian khusus yang bisa dipelajari
    • Tidak bernilai
  • Podcast yang dihasilkan dangkal dan tidak memiliki kedalaman

    • Menghasilkan podcast yang lumayan, tetapi tidak memiliki kedalaman sejati
  • Generator Deep Dive Podcast sangat mengejutkan

    • Membuat podcast berdurasi 40 menit dari PDF 38 halaman, tetapi banyak isi yang berulang di tengah
    • Mungkin terjadi karena ada "daftar isi" di dokumen sehingga dibahas dua kali