Jina AI merilis model embedding teks 8K open-source pertama di dunia

(jina.ai)

10 poin oleh GN⁺ 2023-10-27 | 1 komentar | Bagikan ke WhatsApp

Model embedding teks jina-embeddings-v2 yang mendukung panjang 8192 token
Bersaing dengan text-embedding-ada-002 milik OpenAI, dan menunjukkan performa yang lebih baik dalam benchmark untuk klasifikasi, reranking, pencarian, peringkasan, dan lainnya
Dibangun ulang dari nol, serta dapat digunakan di berbagai bidang dengan konteks 8k: analisis dokumen hukum, riset medis, analisis sastra, prediksi keuangan, AI percakapan, dan lain-lain
Dua model tersedia untuk diunduh di HuggingFace
- Base Model (0.27G): dirancang untuk tugas berat yang menuntut akurasi tinggi, seperti riset akademik atau analisis bisnis
- Small Model (0.07G): dibuat untuk aplikasi ringan seperti aplikasi mobile atau perangkat dengan sumber daya komputasi terbatas

1 komentar

GN⁺ 2023-10-27

Opini Hacker News

Jina AI telah merilis model embedding teks 8k open-source.
Beberapa pengguna mempertanyakan performa model ini, dan menunjukkan bahwa model tersebut menempati peringkat lebih rendah di leaderboard dibanding embedding OpenAI dan 14 kontribusi lainnya.
Jendela konteks 8k adalah fitur baru, tetapi sebagian pengguna meragukan kegunaannya, terutama jika mempertimbangkan batas 512 token.
Sementara sebagian besar benchmark menangani dokumen kecil, ada keraguan tentang performa model pada dokumen yang lebih besar.
Sebagian pengguna mengungkapkan antusiasme bahwa komunitas open-source semakin memperkecil jarak dengan "Open"AI.
Vektor embedding model baru ini berukuran setengah dari text-embedding-ada-002 (768 vs 1536), sehingga dapat menghemat ruang database dan mempercepat pencarian.
Muncul pertanyaan tentang use case untuk embedding 8k token, dan sebagian pengguna mengusulkan bahwa ini mungkin tidak terlalu berguna untuk RAG.
Seorang pengguna mengkuantisasi model untuk penggunaan onnx dan mengurangi ukuran file 4 kali lipat di transformers.js.
Model ini dibandingkan dengan model OpenAI, dengan dukungan multibahasa dan kemampuan menghitung koordinat yang sama untuk makna yang sama dalam bahasa berbeda.
Plugin llm-embed-jina yang baru telah dirilis ke alat LLM, sehingga memungkinkan akses ke model Jina yang baru.
Sebagian pengguna terkesan dengan pekerjaan ini, tetapi mempertanyakan cara terbaik memanfaatkan embedding 8k, dan menyarankan bahwa ini bisa berguna untuk pencocokan kemiripan kasar atau deteksi plagiarisme.
Karena pembatasan ekspor chip dan ketegangan antara AS/Tiongkok, muncul kekhawatiran tentang operasional Jina AI, yang memiliki kantor di Berlin dan Tiongkok.

Jina AI merilis model embedding teks 8K open-source pertama di dunia

Bacaan terkait

1 komentar

Opini Hacker News