Penjelajah persona orang Korea berbasis Nemotron-Personas-Korea
(microworld.dev)Ini adalah penjelajah persona orang Korea yang memanfaatkan dataset Nemotron-Personas-Korea yang dirilis oleh NVIDIA.
Dataset ini adalah dataset sintetis berskala 1 juta orang Korea, yang mencakup usia, pekerjaan, wilayah, hubungan keluarga, dan lainnya. Metode pembuatan dataset serta informasi statistik dijelaskan secara rinci di https://id.news.hada.io/topic?id=28919.
Fitur utama penjelajah persona adalah sebagai berikut.
-
Anda dapat mencari persona atau menemukan persona yang mirip. Kemiripan dibandingkan menggunakan model embedding Qwen.
-
Anda dapat memeriksa distribusi populasi persona di peta. Ini menggunakan informasi lokasi yang ada di dataset.
-
Anda dapat berbicara dengan persona. Persona dapat menjawab pertanyaan yang sangat sederhana.
Embedding 1024 dimensi diekstrak untuk seluruh dataset menggunakan model embedding Qwen 0.6, lalu dijadikan dataset Hugging Face. Karena kolom *_persona memiliki karakteristik nama yang berulang kali muncul, nilai embedding bisa memiliki bias terhadap nama.
- Hugging Face Nemotron-Personas-Korea-Qwen3-0.6B-embeddings
Belum ada komentar.