speculative_decoding.c: kode C speculative decoding yang ditulis berdasarkan llama2.c
(github.com/mscheong01)Ini adalah kode inferensi speculative decoding sederhana yang diimplementasikan dalam C.
Saya menulisnya sebagai kode sederhana untuk tujuan pembelajaran, seperti llama2.c yang dijadikan dasar.
Berikutnya saya berencana mengimplementasikan beberapa paper yang lebih baru.
Belum ada komentar.