Model Phi-2 Microsoft diubah ke lisensi MIT
(huggingface.co)- Pada commit
7e10f3edi repositori Hugging Face untuk Phi-2, tiga file LICENSE, NOTICE.md, dan README.md berubah sehingga penandaan lisensi beralih ke MIT - LICENSE baru diganti dengan teks lengkap MIT License, yang secara luas mengizinkan penggunaan, penyalinan, modifikasi, distribusi, pelisensian ulang, dan penjualan
- Berbagai ketentuan dalam Microsoft Research License sebelumnya dihapus, termasuk larangan reverse engineering, pembatasan hosting mandiri, pemrosesan data pribadi, arbitrase, dan pembatasan ganti rugi
- Metadata README menggunakan
license: mitalih-alihlicense_name: microsoft-research-license, sementara tautan LICENSE lama tetap dipertahankan - NOTICE.md baru memberi tahu flash-attention sebagai komponen pihak ketiga, serta memuat lisensi BSD 3-Clause dan frasa yang mengizinkan reverse engineering terbatas untuk tujuan debugging perubahan pada pustaka LGPL
File yang berubah dalam commit
- Commit pada repositori
microsoft/phi-2di Hugging Face ditampilkan sebagai “Upload 3 files”, dan file yang diubah adalah LICENSE, NOTICE.md, dan README.md - Di Browse files, Anda dapat melihat daftar file pada keadaan commit tersebut
LICENSE: diganti dari Microsoft Research License ke MIT License
- File LICENSE diubah dengan menghapus teks lisensi lama dan menggantinya dengan teks lengkap MIT License
- LICENSE baru memuat MIT License setelah frasa
PhyAGI.danCopyright (c) Microsoft Corporation. - MIT License secara gratis mengizinkan hak-hak berikut kepada siapa pun yang memperoleh perangkat lunak dan file dokumentasi terkait
- penggunaan, penyalinan, modifikasi, penggabungan
- publikasi, distribusi, pelisensian ulang
- penjualan salinan perangkat lunak
- pemberian hak yang sama kepada pihak yang menerima perangkat lunak
- Syaratnya adalah pemberitahuan hak cipta dan pemberitahuan izin harus disertakan dalam semua salinan atau bagian substansial dari perangkat lunak
- Penafian jaminan disertakan dalam bentuk AS IS, dan tidak memberikan jaminan tersurat maupun tersirat, termasuk kelayakan jual, kesesuaian untuk tujuan tertentu, dan non-pelanggaran
- Pemegang hak cipta dan pemegang hak tidak menanggung klaim, kerugian, atau tanggung jawab yang timbul dari penggunaan perangkat lunak atau transaksi lainnya
Ketentuan pembatasan lama yang dihapus
- Sejumlah pembatasan dan ketentuan hukum pada LICENSE sebelumnya dihapus
- Ketentuan yang dihapus mencakup hal-hal berikut
- larangan reverse engineering, dekompilasi, dan disassembly atas materi
- larangan menghapus, mengurangi, memblokir, atau mengubah pemberitahuan dari Microsoft atau pemasok
- larangan penggunaan dengan cara yang melanggar hukum atau untuk membuat dan menyebarkan malware
- larangan berbagi, memublikasikan, mendistribusikan, menyewakan materi, menyediakan solusi hosting mandiri, dan mentransfer ke pihak ketiga
- Pembatasan terkait privasi juga dihapus
- data yang dapat mengidentifikasi individu tidak boleh digunakan selain untuk tujuan yang telah disetujui atau diberi persetujuan
- tidak boleh digunakan untuk menghubungi individu
- data pribadi beserta cadangan dan salinannya harus dimusnahkan segera setelah penelitian selesai
- Ketentuan yang menyatakan bahwa pemberian modifikasi kepada Microsoft berarti memberikan lisensi yang luas kepada Microsoft juga dihapus
- Selain itu, ketentuan tentang publikasi, umpan balik, pembatasan ekspor, layanan dukungan, arbitrase di AS dan pengabaian gugatan kelompok, hukum yang berlaku, hak konsumen, penafian jaminan, serta pembatasan ganti rugi juga dihapus
Perubahan metadata README
- Penandaan lisensi pada frontmatter README.md berubah
- Item yang dihapus adalah sebagai berikut
license:license_name: microsoft-research-license
- Item baru adalah
license: mit license_link: https://huggingface.co/microsoft/phi-2/resolve/main/LICENSEtetap dipertahankan- Item
inference: falsedanlanguage: - entetap dipertahankan dalam diff yang ditampilkan
NOTICE.md dan pemberitahuan komponen pihak ketiga
- File NOTICE.md yang baru dimulai dengan frasa “NOTICES AND INFORMATION” dan “Do Not Translate or Localize”
- Microsoft menyatakan bahwa perangkat lunak ini memuat materi pihak ketiga
- Sebagian kode open source Microsoft tersedia di
https://3rdpartysource.microsoft.com, atau dapat diminta dengan mengirim cek atau wesel pos sebesar US $5.00 disertai nama produk, nama komponen open source, platform, dan nomor versi - Terlepas dari ketentuan lain, perangkat lunak ini dapat di-reverse engineer sejauh yang diperlukan untuk melakukan debugging atas perubahan pada pustaka yang dilisensikan di bawah GNU Lesser General Public License
- Komponen yang disertakan mencakup flash-attention
- Pemberitahuan flash-attention memuat BSD 3-Clause License
- saat mendistribusikan ulang source, pemberitahuan hak cipta, daftar syarat, dan penafian harus dipertahankan
- saat mendistribusikan ulang dalam bentuk biner, pemberitahuan, syarat, dan penafian yang sama harus disertakan dalam dokumentasi atau materi lainnya
- tanpa izin tertulis sebelumnya, nama pemegang hak cipta atau kontributor tidak boleh digunakan untuk mempromosikan produk turunan
- Pemberitahuan BSD 3-Clause menyatakan bahwa perangkat lunak tersebut juga disediakan “AS IS” dan tidak bertanggung jawab atas kerugian langsung, tidak langsung, insidental, khusus, menghukum, maupun konsekuensial
1 komentar
Pendapat Hacker News
Sangat menggembirakan melihat model terbuka seperti ini bermunculan
Yang menarik, para “ahli etika” AI tampaknya ingin bertindak seperti kasta imam tinggi yang mengendalikan akses ke model machine learning atas nama keselamatan. Namun menurut saya, risiko terbesar AI justru ada pada orang-orang yang mengendalikan model tersebut, karena mereka bisa mengontrol dan menyensor apa yang boleh ditulis orang dengan model itu
Saya percaya model open source di tangan publik adalah pertahanan terbaik terhadap risiko AI yang sebenarnya, dan saya mengapresiasi Facebook, Microsoft, dan Mistral yang mendorong hal ini
Sebaiknya baca argumen sebenarnya, bukan ringkasan media sosial. Diskusinya jauh lebih mendalam daripada yang mungkin Anda kira, mencakup secara luas risiko-risiko yang dikhawatirkan, dan ada juga solusi-solusi yang diusulkan. Solusi-solusi itu lebih mungkin benar-benar berhasil daripada klaim bahwa ini adalah “pertahanan terbaik”
Banyak juga orang yang sama-sama menganggap penting demokratisasi alat-alat seperti ini dan penggunaannya yang aman serta etis
Berharap orang-orang yang berniat buruk akan mematuhi teks lisensi sejak awal memang bukan alat kontrol yang bagus. Itu hanya menghambat kemajuan dan inovasi orang-orang yang cukup beritikad baik untuk menaati hukum, sementara pihak-pihak dengan niat lain di tempat seperti Rusia, Korea Utara, dan Tiongkok, serta organisasi kriminal dan penipu, tidak akan terikat oleh gagasan semacam itu
Komunitas yang bekerja di bawah lisensi open source yang benar terus membesar, dan hal-hal menarik terjadi semakin cepat. Lisensi alternatif kurang efektif, memutus hubungan dengan komunitas itu, membuat kolaborasi lebih rumit, dan makin lama menjadi kelompok minoritas dalam riset secara keseluruhan. Karena itu lisensi semacam itu makin tidak bermakna
Jika hal ini diperbaiki, dari sudut pandang hukum kondisinya menjadi sederhana dan standar, sehingga komersialisasi, kolaborasi, dan riset menjadi lebih mudah. Microsoft tampaknya secara rasional mengakui ada nilai di sana dan sedang menyesuaikan diri dengan kenyataan
Sebelumnya lisensinya nonkomersial, jadi antusiasmenya sedikit mereda
Mengingat performa dan ukurannya, perubahan ke lisensi yang ramah komersial ini adalah peristiwa yang cukup besar
Yang penting dari model ini adalah kemampuan penalarannya yang bagus
Namun model ini sengaja tidak dilatih dengan dataset crawl web berskala besar agar tidak belajar cara membuat bom dan sebagainya, atau melakukan “hal buruk”
Jadi dibandingkan model dengan kelas ukuran yang sama, atau bahkan model dengan parameter lebih besar, ini adalah model yang “berpikir paling cerdas”, tetapi pengetahuan dunia dan pengetahuan umumnya relatif kurang
Ini mungkin berubah ke depan, tetapi menurut saya seperti itulah kondisinya saat ini
Karena saya ingin jawabannya didasarkan pada data yang saya berikan, bukan pada hal-hal yang dipelajarinya dari web
Banyak tugas tidak membutuhkan pengetahuan umum, dan khususnya dalam RAG keunggulan ini besar
Data lebih baik disediakan melalui pencarian, dan hasilnya jawaban yang “terlihat masuk akal dan cerdas, tetapi sepenuhnya salah” akan berkurang
Jika data bawaan lebih sedikit, model juga bisa dipakai lebih umum di luar ranah asisten chat. Karena sering kali kita ingin model hanya mengetahui data yang diberikan pengguna
Misalnya dalam game fantasi abad pertengahan, akan sangat aneh jika karakter tiba-tiba mulai membicarakan politik Amerika. Phi-2 pun tidak akan sepenuhnya menyelesaikan ini tanpa fine-tuning, tetapi intinya mengarah ke sana
Saya lebih penasaran dengan dataset daripada modelnya
Ini perubahan yang bagus, dan juga menunjukkan mengapa proyek open source independen itu penting
Sulit dipercaya bahwa rilis TinyLlama dengan lisensi Apache 2.0 tidak memengaruhi perubahan ini
Ini tampak seperti sinyal bahwa Phi-3 dan model generasi berikutnya akan membuat Phi-2 menjadi usang
Model ini cukup lama berada di peringkat atas; apa yang membuatnya begitu bagus?
Ini adalah model terbaik yang bisa dijalankan di perangkat sekecil ponsel sambil memberikan performa mendekati GPT-3.5
Arsitektur dan data pelatihannya juga menarik. Karena ini model sparse yang memakai data sintetis terkurasi, akurasinya jauh lebih tinggi daripada model yang dilatih dengan teks internet acak