- Dibuat dengan mereplikasi isi paper Orca dari Microsoft ke versi open source
- Sekitar 1 juta FLANv2 yang diperkaya dengan GPT-4 Completion
- Sekitar 3,5 juta FLANv2 yang diperkaya dengan GPT-3.4 Completion
- Mencakup seluruh 75k CoT yang ada di dataset FLAN-1m
- Saat ini sedang dilakukan fine-tuning terhadap seluruh bobot di atas fondasi LLaMA-13B, sehingga performanya akan menjadi mirip dengan milik Microsoft
- OpenOrca-LLaMA-13b kemungkinan bisa dirilis sekitar pertengahan Juli
- Sedang mencari sponsor komputasi GPU untuk menerapkan OpenOrca ke platform lain (Falcon, LLaMA, MPT, dll.)
2 komentar
Ups, tautannya 404 ya
Dataset-nya bisa Anda cek di Open-Orca/OpenOrca milik HuggingFace! :D
Oh, sepertinya tulisannya sudah dihapus.
Masih tersimpan di WaybackMachine.
https://web.archive.org/web/20230629002546/…
Tautannya sudah saya ubah ke tautan HuggingFace yang dibagikan.