1 poin oleh GN⁺ 3 jam lalu | 1 komentar | Bagikan ke WhatsApp
  • Muncul dugaan publik bahwa produk data room milik Nico bukan hasil buatan sendiri, melainkan tampaknya diambil dari kode open source dan berlisensi enterprise milik Papermark
  • Isu utamanya adalah apakah terjadi pelanggaran hak cipta dan lisensi, dan pihak yang mengajukan tuduhan menuntut agar produk tersebut segera diturunkan
  • Kasus ini memicu kritik keras bahwa ini bukan soal “bergerak cepat dan merusak sesuatu”, melainkan lebih dekat ke penipuan
  • Kontroversi atas produk tersebut juga disertai pandangan bahwa kecurigaan bisa merembet ke bisnis Nico lainnya
  • Garry Tan, Jared Friedman, dan Y Combinator ikut ditandai, sehingga isu ini juga meluas menjadi masalah reputasi komunitas YC

Dugaan Pencurian Kode Papermark

  • Muncul tuduhan publik bahwa produk data room milik Nico tampaknya tidak dikembangkan sendiri, melainkan diambil dari kode open source dan berlisensi enterprise milik Papermark
  • Pihak yang mengajukan masalah menilai hal ini sulit dianggap sekadar pengembangan produk cepat atau “vibe coding”, dan melihat adanya kemungkinan pelanggaran hak cipta serta lisensi
  • Tuntutannya jelas
    • Produk tersebut harus segera diturunkan
    • Jika pelanggaran tersebut benar terjadi, tindakan ini bisa dianggap lebih serius daripada sekadar kesalahan biasa

Kritik yang Meluas

  • Kritik tidak berhenti pada satu produk data room milik Nico, tetapi juga mempertanyakan kredibilitas keseluruhan bisnisnya
  • Dengan ditandainya Garry Tan, Jared Friedman, dan Y Combinator, isu ini melampaui sengketa antarindividu dan terhubung dengan reputasi komunitas YC
  • Berdasarkan informasi yang saat ini dipublikasikan, fokusnya masih pada tuduhan dan tuntutan tersebut, sementara verifikasi tambahan atau bantahan belum disediakan

1 komentar

 
GN⁺ 3 jam lalu
Komentar Hacker News
  • Jika screenshot halaman web dimasukkan ke alat seperti Figma Make, alat itu bisa membuat replika yang cukup mirip
    Dari screenshot-nya memang terasa seperti itu, sangat mirip tetapi tidak sepenuhnya sama. Kemungkinan besar banyak teks yang sama juga karena itu. Fakta bahwa mereka bahkan tidak menyerahkan penulisan ulang teks kepada alat teks generatif cuma menunjukkan kecerobohan

  • Melihat komentar Twitter lain, tampaknya mereka menyuruh AI untuk meniru Papermark
    Ada jejak pada komentar AI yang menunjukkan bahwa halaman itu disejajarkan agar sesuai dengan “reference”
    https://xcancel.com/ffumarola/status/2070479755892371713#m

  • Respons mereka seperti ini:

    The team that made dataroom has stated that they did not use any of papermark’s code and that dataroom was made from scratch with inspiration from existing document sharing softwares, and that this post’s allegations of us stealing code are false. [...]
    Dari screenshot-nya, jelas bahwa baik desain maupun teksnya hampir menyalin seluruh halaman apa adanya. Sikap pendiri Nico Laqua yang pada dasarnya hanya menjawab, “kami tidak menyalin kodenya,” tanpa mengambil tanggung jawab apa pun, menunjukkan standar moral dirinya dan perusahaannya dengan sangat jelas. Mungkin ini tidak cukup kuat untuk dijadikan gugatan, tetapi tetap saja itu bukan hal yang benar
    https://x.com/nico_laqua/status/2070158170937581951

    • Beberapa tahun lalu saya pernah menjalani wawancara saat Corgi merekrut insinyur pertamanya, dan saya benar-benar tidak cocok dengan Nico; meski cuma screening via telepon, itu adalah salah satu wawancara paling tidak mulus yang pernah saya alami
      Jadi, saya tidak akan terlalu terkejut kalau Nico sungguh menganggap “kami tidak menyalin kode” sebagai pembelaan yang masuk akal. Itu tampak seperti aturan yang jelas baginya, dan tipe “shape rotator” yang ekstrem sering kesulitan menghadapi area abu-abu seperti hukum. Dalam praktiknya, pelanggaran hak cipta sering kali seperti standar untuk mengenali pornografi: kalau melihatnya, Anda langsung tahu
    • Dia juga orang yang dulu membanggakan kerja akhir pekan dan membandingkan perusahaan asuransinya yang biasa-biasa saja dengan Proyek Manhattan
      Di tempat lain, dia juga pernah mengklaim bahwa perusahaan/industri ini adalah penerapan AI terpenting di dunia. Saya tidak ragu mereka meniru, dan setidaknya dia bukan orang yang bisa dipercaya
      https://x.com/nico_laqua/status/2061130574358773852?s=20
    • Alasan mengapa ini “mungkin tidak cukup untuk digugat” terutama karena proyek open source jarang sekali menggugat
      Jika mereka melakukan ini pada perusahaan yang lebih suka menggugat, kemungkinan besar mereka akan digugat, dan peluang kalah-menangnya mungkin sekitar 50 banding 50. Sulit mengatakan apakah ini akan dinilai sebagai penyalinan elemen kreatif/artistik atau sekadar peniruan cara kerja, tetapi meski meniru fungsi itu boleh-boleh saja, jika pengalaman pengguna ditiru mentah-mentah, itu cepat menjadi pelanggaran hak cipta
    • Fakta bahwa Nico terus mendorong kebohongan ini saja sudah cukup untuk menunjukkan seperti apa orangnya
    • Desainnya adalah shadcn, sebuah sistem desain yang sangat populer dengan lisensi MIT
      Teksnya juga menurut saya cukup mendekati isi standar yang wajar diperkirakan untuk solusi data room berbasis materi nyata
  • Bisa jelaskan sedikit lebih banyak latar belakang thread ini? Saya sama sekali tidak tahu siapa Nico, apa itu Papermark, dan apa yang mereka lakukan
    Terlepas dari itu, tampaknya orang makin terbiasa bukan hanya meniru solusi atau proyek yang sudah ada lewat vibe coding, tetapi juga “mencuri” kode open source dan memakainya sesuka hati tanpa mematuhi prasyarat moral, etis, dan hukum dari open source. Rasanya pelanggaran open source kini makin banyak terjadi di mana-mana tanpa konsekuensi hukum yang berarti

    • Betul. Sekarang jadi jauh lebih mudah
      Selain itu, banyak pengembang baru yang masuk hanya lewat AI tidak memahami atau tidak peduli bahwa FOSS bukan soal gratis seperti bir, melainkan soal kebebasan.
      Saya mengerjakan pustaka GPL3 yang mem-parsing file data biner untuk sampler audio perangkat keras. Seseorang membuat aplikasi di atas pustaka saya yang bisa melakukan berbagai hal, dan ia mematuhi lisensi GPL3.
      Namun baru-baru ini ada orang yang menyalin aplikasi itu sepenuhnya dengan vibe coding, lalu memasang situs web dan tautan pembelian sekitar 60 dolar. Itu salinan yang sangat terang-terangan, hanya warnanya yang berbeda sementara UI-nya persis sama, dan sama sekali tidak mematuhi ketentuan GPL3. Pengelola menurunkan postingan itu dari daftar dan memblokir pengembang aplikasi tiruan tersebut, dan komunitas forum mendukung pengembang aplikasi asli. Permintaan penghapusan DMCA juga dikirim, dan beberapa hari kemudian situs salinan itu diturunkan.
      Pengembang aplikasi asli beruntung karena praktis hanya ada satu forum utama tempat postingan tentang produsen itu muncul, dan para pengelolanya juga tidak suka hal-hal terkait AI. Ironisnya, pengembang aplikasi asli itu sendiri juga melakukan semua pekerjaannya dengan vibe coding. Tanpa forum dan para pengelola itu, pengembang aplikasi asli maupun saya sebagai pengelola pustaka GPL3 itu kemungkinan besar benar-benar akan tamat.
      Sentralisasi punya kelebihan. Tanpa itu, saya tidak begitu melihat alternatif selain semua orang kembali ke source tertutup atau muncul gerakan publik yang memaksa pembahasan tentang menghormati pekerjaan orang lain. Sampai sekarang kita bergantung pada reputasi dan sistem reaksi balik komunitas
    • Hakim dan pemerintah berpihak pada perusahaan dan memusuhi konsumen serta warga
      Perusahaan makin terbiasa lolos setelah melakukan apa saja. “Bergerak cepat dan hancurkan” awalnya bicara soal teknologi, tetapi sekarang sudah menjadi sikap terhadap hukum. Uber memopulerkan arus ini, dan sekarang semua orang melakukan hal yang sama. AI yang melanggar hukum hak cipta juga bagian dari arus itu.
      Dengan pola pikir baru bahwa hukum adalah untuk para pecundang, sepertinya kita akan menghadapi masa-masa sulit
    • Kalau para pencuri terbesar sedang menuju valuasi perusahaan miliaran dolar, mau berharap apa lagi
      Sekarang harus dianggap bahwa pada dasarnya semua hal di internet bisa diambil sesuka hati oleh siapa saja
    • Jika ini adalah kompetisi pemenang-mengambil-semua menuju kecerdasan super umum, dan jika mereka yakin kecerdasan super umum akan berujung pada dominasi dunia absolut, tentu mereka tidak akan merasa perlu terikat pada hukum yang ada sekarang, terutama aturan hak kekayaan intelektual yang sederhana
      Karena satu-satunya cara untuk pasti kalah adalah tidak ikut bermain
    • Perusahaan yang menangani dokumen pelanggan atau mitra eksternal biasanya memakai data room seperti DocSend by Dropbox untuk berbagi dan menerima dokumen dengan kontrol akses, analitik, dan fitur audit
      Papermark adalah alternatif open source untuk DocSend. Bisa dipakai self-hosted atau hosted, sehingga jauh lebih hemat biaya dibanding DocSend dan cukup populer.
      Corgi adalah startup asuransi yang didanai YC, yang menjual asuransi ke startup YC lain. Nico adalah pendirinya. Baru-baru ini mereka menggalang 100 juta dolar dengan valuasi sekitar 3 miliar dolar, dan saat ini merupakan salah satu perusahaan yang sangat didorong oleh YC.
      Underwriting asuransi membutuhkan banyak dokumen, jadi Corgi membayar ribuan dolar per bulan untuk DocSend. Entah kenapa, Corgi tampaknya membentuk tim beranggotakan 12 orang untuk membuat alternatif DocSend mereka sendiri bernama Dataroom. Lalu Corgi memutuskan memosisikannya sebagai DocSend yang lebih murah, mulai dari 10 dolar per bulan, dan menjadikannya produk SaaS di pasar yang sudah ramai.
      Papermark segera menyadari bahwa Dataroom milik Corgi memakai banyak frasa dan struktur yang sama dengan produk open source mereka. Karena itu mereka menilai Corgi mengambil hasil kerja Papermark tanpa atribusi. Corgi membantah dan mengatakan bahwa adanya kecocokan sampai tingkat kata di antara produk-produknya hanyalah kebetulan semata.
      Startup YC lain, Delve, juga ketahuan benar-benar melakukan apa yang dicurigai pada Corgi, bahkan lebih banyak lagi, dan akhirnya dikeluarkan dari YC
  • Menurut saya logikanya kira-kira ada dua

    1. Pengembang tidak menyalin kode secara manual
    2. Semua perangkat lunak di area yang sama saling meniru
      Tapi petunjuk terbesar di sini adalah layout dan frasa yang identik pada kedua produk. Menginstruksikan LLM dengan “buat produk ini dan hasilkan salinan 1:1” menurut definisi yang masuk akal tetaplah penyalinan. Mengklaim tidak ada yang disalin sama sekali itu tidak masuk akal
    • Keduanya dari luar tampak seperti boilerplate ShadCN: https://ui.shadcn.com/blocks
      ShadCN adalah sistem desain paling populer yang dipilih AI secara otomatis lebih dari 90% kasus, dan di platform seperti lovable juga nyaris menjadi default
    • Sepertinya itu inti dari perkara Google vs Oracle
      Google menyalin API tetapi mempertahankan implementasi secara clean room, dan pada akhirnya ini diputuskan secara tegas sebagai fair use. Jika fair use berlaku pada objek yang seketat reimplementasi API, maka bisa dianggap juga berlaku pada objek yang jauh lebih kabur seperti penyalinan UI atau layout
    • Dia mengklaim bahwa kodenya tidak disalin
  • Saya tidak paham kenapa orang masih serius memakai yang dulu bernama Twitter

  • Bahkan jika, seperti yang mereka katakan, mereka tidak menyalin-tempel kode, pada praktiknya bisa jadi LLM mereproduksi kode yang sama berdasarkan hasil crawling repositori dan tidak menghormati lisensinya
    Ini tampak seperti perkara perdata yang cocok diputuskan pengadilan. Pembelaan mereka terlihat seperti, “Kami hanya menyuruh LLM mereproduksi karya Anda, jadi bukan ‘kami’ yang menyalin kodenya.” Tetap terasa mencurigakan

  • Lisensi yang menjadi pokok masalah: https://github.com/papermark/papermark?tab=License-1-ov-file
    Ini adalah AGPL, yang pada dasarnya berarti source code harus dibuka bahkan ketika pengguna berinteraksi dengan software melalui jaringan. Proyek yang menggunakan kode tersebut juga harus berlisensi AGPL.
    Ada cara untuk memisahkannya dan menghindarinya. Misalnya, hanya karena memakai server autentikasi AGPL bukan berarti kode yang berisi logika bisnis juga harus ikut terdampak.
    Terutama jika melihat kontroversi di masa lalu, seharusnya ada cara untuk merancang produk agar sesuai dengan lisensinya.
    Namun ini semua berangkat dari asumsi bahwa kodenya действительно disalin, dan kita tidak mengetahuinya dengan pasti. Kelihatannya memang sangat mirip, tetapi bagaimana penegakannya akan berjalan juga tidak begitu jelas.

    • Untuk menegakkannya, kemungkinan besar harus lewat gugatan, dan ini sepertinya akan menjadi isu yang lebih besar daripada sekadar masalah Corgi saja
      Masalah hak cipta terkait model-model seperti ini benar-benar kacau
  • Industri teknologi akan melakukan apa saja untuk menormalkan pencurian lalu menyebutnya sebagai inovasi

  • Ini langkah yang sangat khas ala startup YC