1 poin oleh GN⁺ 9 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • Dengan generasi on-demand real-time, setiap halaman dibuat sebagai gambar, dan saat objek di dalam gambar diklik, layar baru akan dihasilkan untuk menjelajah lebih dalam
  • Layar beroperasi sebagai antarmuka berpusat pada piksel tanpa HTML atau kolom input, bahkan teks pun dirender langsung sebagai piksel oleh model gambar
  • Informasi halaman dibuat dengan menggunakan agentic web search bersama pengetahuan dunia dari model gambar, dan disebut memiliki tingkat akurasi yang mirip dengan yang diharapkan dari ChatGPT, Gemini, dan Claude
  • Fitur live video stream menganimasikan gambar penjelajahan dan membuat transisi lebih mulus, tetapi saat ini disembunyikan di balik toggle karena sulit diprediksi dan boros sumber daya
  • Untuk sekarang ini lebih mendekati alat eksplorasi dan pembelajaran eksperimental, tetapi ketika akurasi dan performa model gambar dan video meningkat, ini dapat berkembang menjadi lingkungan yang mencakup lebih banyak data nyata, interaksi, pelaksanaan tugas, hingga penyimpanan data

Ikhtisar

  • Ini adalah browser visual tak terbatas yang bekerja dengan generasi on-demand real-time, menyusun setiap halaman yang didatangi pengguna sebagai gambar
  • Di layar tidak ada HTML, kode, tautan tertentu, atau kolom input, dan ketika objek di dalam gambar diklik, gambar baru akan dibuat untuk menjelajahi objek tersebut lebih dalam
  • Web dibangun ulang bukan sebagai kumpulan dokumen dan elemen UI, melainkan sebagai antarmuka berpusat pada piksel yang dihasilkan di layar

Cara kerja dan arah pengembangan

  • Semua teks di layar juga dirender langsung sebagai piksel oleh model gambar, tanpa menambahkan overlay teks terpisah di atas gambar
    • Akibatnya, teks kadang bisa tampil tidak sempurna atau berada di posisi yang salah, dan disebutkan bahwa hal ini dapat membaik seiring peningkatan model
  • Informasi di dalam gambar dibuat dengan menggunakan agentic web search bersama pengetahuan dunia milik model gambar itu sendiri
    • Walau kadang bisa tidak akurat, ini diperkenalkan sebagai titik awal yang berguna dan biasanya didasarkan pada data nyata dari internet
    • Disebutkan bahwa akurasi faktualnya mirip dengan tingkat yang dapat diharapkan saat menggunakan ChatGPT, Gemini, dan Claude
  • Alih-alih layar yang didominasi teks dan kotak warna, tujuannya adalah menghadirkan pengalaman komputasi yang menyampaikan informasi melalui ekspresi visual yang kaya
  • Dipandang bahwa hanya dengan kode dan aturan yang tetap, ide yang kompleks dan rinci sulit disampaikan, sehingga ditekankan arah untuk memilih bentuk ekspresi yang paling efektif sesuai konteks, seperti satu kata, ilustrasi, atau rendering realistis
  • live video stream adalah fitur eksperimental yang mengubah gambar statis menjadi aliran video yang lebih berkesinambungan, menganimasikan tiap gambar penjelajahan dan membuat transisi di antaranya lebih mulus
    • Perilakunya saat ini agak sulit diprediksi dan juga boros sumber daya, sehingga ditempatkan di balik toggle yang bisa dinyalakan dan dimatikan
    • Disebutkan bahwa saat ini digunakan gabungan model pembuatan video kustom yang sangat dioptimalkan dan dua sistem pembuatan gambar, dengan rencana untuk mengintegrasikannya menjadi satu sistem di masa depan
  • Saat ini dirancang sebagai alat eksplorasi dan pembelajaran eksperimental, tetapi ketika akurasi dan performa model gambar dan video meningkat, ini dapat berkembang menjadi halaman yang mencakup lebih banyak data nyata, dapat berinteraksi, menjalankan tugas secara langsung, dan menyimpan datanya sendiri
    • Sebagai contoh, dari sekadar meneliti perjalanan berikutnya lalu melakukan pemesanan di tempat lain, ini bisa berubah menjadi menangani seluruh proses di dalam Flipbook
    • Disebutkan bahwa tugas yang saat ini memerlukan aplikasi dan situs web terpisah, ke depannya dapat lebih banyak ditangani di dalam lingkungan yang tampak dan bekerja seperti Flipbook
  • Tidak akan diputar di browser yang tidak mendukung video tersemat
  • Demo menggunakan video yang telah dibuat sebelumnya dan telah diedit demi kecepatan

1 komentar

 
GN⁺ 9 jam lalu
Komentar Hacker News
  • Ini benar-benar menakjubkan. Aku mengunggah diagram sistem hidroponik yang kutemukan entah dari mana,
    lalu ia membuatkan diagram berkualitas tinggi terpisah untuk detail seperti perpipaan, suplai nutrisi, dan pengkabelan listrik
    Memang tidak sepenuhnya akurat, tapi aku sangat suka konsepnya

  • Aku memintanya membuat diagram spesifikasi torsi suspensi mobil, dan karena itu topik yang kukenal, saat kucek
    ternyata hampir semuanya tergambar dengan benar dan angka torsinya juga tepat
    Aku bisa mengeklik komponen satu per satu untuk memperbesar dan melihat spesifikasi tambahan
    Ini demo paling mengesankan yang kulihat setelah sekian lama, dan rasanya bisa dipakai seperti manual servis Haynes yang hidup

    • Aku mencoba memintanya merancang sistem tenaga surya 12V untuk gudang kebun, dan hanya gambaran besarnya yang benar, sisanya semua salah
      Yang benar cuma bahwa dibutuhkan panel surya, charge controller, baterai, dan beban; pengkabelannya sama sekali tidak masuk akal
      Begitu masuk ke detail seperti pengaturan charge controller, semuanya langsung runtuh
      Ini jelas tidak bisa dipakai sebagai informasi yang benar-benar diandalkan, tapi sebagai tontonan tetap menarik dan implementasinya mengesankan
    • Aku berencana membuat gudang sepeda dari pintu tua di halaman belakang, jadi aku memintanya membuat desain
      hasilnya cuma gudang biasa dengan upcycled door ditempelkan begitu saja
      Bahkan tidak terlihat di mana sepedanya masuk, dan yang ditampilkan cuma struktur yang bahkan tidak mirip bentuk akhir yang sebenarnya
      Sama seperti demo AI lain, kelihatannya meyakinkan di permukaan, tapi sistemnya pada dasarnya tidak memahami apa yang sedang dilakukannya
    • Aku sudah mencobanya sendiri
      Aku memintanya memberi label komponen di ruang mesin Jeep Wrangler JK dan awalnya keluar diagram yang tampak meyakinkan
      Tapi reservoir minyak rem ada di sisi sebaliknya, dan di tempat itu justru ditempeli label tangki overflow coolant, sementara tangki overflow yang sebenarnya tergambar tapi tidak diberi label
      Posisi baterainya juga salah, bagian atas grill depan ditulis sebagai tutup filter oli, dan posisi lubang pengisian oli juga salah
      Setengah baterai diberi label sebagai fuse box, sementara fuse box yang asli tergambar dengan benar di sisi seberangnya tapi tanpa label
      Tangki cairan washer kaca depan juga muncul sebagai dua buah yang saling menempel
      Saat mengeklik tangki coolant yang salah label itu, aku dibawa ke halaman lain, dan kali ini posisinya benar tapi bentuk tangkinya sama sekali berbeda, plus tutup radiator diletakkan di atas tangki itu
      Padahal seharusnya berada di atas radiator
      Orang yang paham akan bisa menemukan cacat di setiap bagiannya, tapi di mata orang yang tidak tahu, ini terlihat cukup meyakinkan; rasanya persis seperti kisah LLM
    • Aku memintanya membuat diagram internal Mac Pro 5,1 saat unitnya sedang terbongkar total di atas meja, dan
      sekilas tampilannya memang mirip Mac Pro, tapi semua elemen visualnya salah
      Teksnya juga hanya terlihat benar pada pandangan pertama, dan isi setelah diklik pun hampir semuanya salah
      Memang terlihat keren, tapi sudah lama aku tidak melihat AI terus-menerus salah separah ini sejak 2023
    • Aku memasukkan "your mom", lalu ia membuat sesuatu seperti plasenta yang ditumpangkan di atas linimasa sosial historis keibuan
      Yang ini kusetujui
  • Proyeknya keren, tapi aku selalu penasaran dari mana datangnya sumber daya dan uang untuk membuat hal seperti ini lalu menjalankannya sebagai layanan publik
    Mungkin mereka punya GPU sendiri atau memakai API GPT/Gemini dengan inferensi bersubsidi perusahaan,
    tapi sebagai orang yang hidup hemat, aku masih sulit membayangkannya

    • Sayangnya, ini benar-benar dibayar dari kantong sendiri
      Sama sekali tidak menyangka akan meledak sebesar ini
    • Setelah kena sekali HN hug of death lalu dapat tagihan biaya inferensi $50.000 dalam semalam, sepertinya layanan ini akan segera turun
    • Bisa jadi terafiliasi dengan universitas, mungkin?
    • Kalau dipikir-pikir, menghabiskan uang untuk hobi bukan hal yang aneh
      Ada yang membelanjakan uang untuk game, melukis, atau woodworking,
      dan ada juga yang memakai sisa anggaran waktu luang dari gaji level FAANG untuk proyek seni GenAI alih-alih alkohol atau olahraga
      Mungkin itu bukan seleramu, tapi semua orang biasanya punya setidaknya satu pos pengeluaran yang di mata orang lain tampak mewah
    • Aku juga hampir tidak jadi mencoba sama sekali karena alasan serupa
      Di sini itu disebut immigrant mentality, bukan sebagai hinaan, tapi lebih ke sikap hemat khas orang yang harus memulai hidup dari nol
      Selain itu juga sangat lambat, jadi pada akhirnya aku tidak menunggu
      Bukan menyalahkan pembuatnya, cuma memang benar-benar terlalu lambat
  • Awalnya kukira ini bukan diagram, melainkan halaman web itu sendiri yang dibuat secara real-time
    Aku selalu tertarik pada masa depan ketika aplikasi dibuat seketika sesuai kebutuhan pengguna,
    jadi aku penasaran apakah sudah ada contoh nyata yang benar-benar membangun hal seperti itu

  • Muncul pengaturan seperti Mac Neo, 2 chip M4 quantum, solid state battery, dan graphene connector
    https://flipbook.page/n/942776fea47c4274a9a4589134924ef5

  • Muncul Sneed's Feed and Seed. Bahkan ada tulisan Formerly Chuck's
    https://flipbook.page/n/4a5e1797903b478c876a35e64c6c57fe

    • Aku menelusuri riwayat kepemilikannya, dan ternyata nama keluarga terakhirnya ditulis sebagai Chuck's Feed and Seed
      Kalau ini berhasil tepat, aku benar-benar akan sangat kagum
    • Menurutku ini sungguh salah satu lelucon terbaik di The Simpsons
  • Sepertinya ini tidak ada di dalam data pelatihannya
    https://flipbook.page/n/d739a0bbc3664ba2aad331c90fef7406

  • Idenya menarik, tapi sekarang hampir semuanya gagal
    Mungkin karena HN hug of death
    Muncul 429 RESOURCE_EXHAUSTED bersama Gemini generateContent request failed,
    lalu ada pesan yang menyuruh memeriksa paket dan informasi penagihan karena kuota saat ini terlampaui
    Tautan ke informasi batas yang lebih rinci juga ditampilkan

  • Demo di halaman utama menampilkan Paris Travel Overview / Visiting Notre Dame, jadi
    aku mencobanya dengan beberapa kota dan tempat yang benar-benar pernah kukunjungi
    Titik-titik minatnya sendiri kadang dikenali dengan benar, tapi hubungan posisi spasial antartempat benar-benar kacau
    Bahkan tidak mendekati kenyataan

  • Ini tampak seperti produk yang cukup mahal untuk terkena HN hug of death
    Video sampel yang diunggah di tweet benar-benar keren
    Hanya saja sekarang tidak berjalan dengan baik, jadi aku akan menunggunya sampai trafiknya reda lalu mencobanya lagi beberapa hari lagi