Charcuterie – Penjelajah Unicode Berbasis Kemiripan Visual
(charcuterie.elastiq.ch)- Alat untuk menjelajahi kumpulan karakter Unicode secara visual dan melihat glif, skrip, simbol, dan bentuk dari tiap karakter
- Memanfaatkan embedding SigLIP 2 untuk menganalisis kemiripan visual antar karakter dengan membandingkan glif dalam ruang vektor
- Pengguna dapat memahami hubungan morfologis antar karakter secara intuitif dan menjelajahi struktur Unicode
- Antarmuka dirancang untuk memberikan pengalaman penjelajahan yang berfokus pada visual agar sistem karakter yang kompleks lebih mudah dipahami
- Proyek ini masih terus dikembangkan dan menerima umpan balik serta dukungan donasi dari pengguna
Ikhtisar Charcuterie
- Sebuah penjelajah visual Unicode, alat untuk menelusuri kumpulan karakter dan melihat glif, skrip, simbol, dan bentuk yang terkait
- Untuk menganalisis kemiripan visual tiap karakter, proyek ini menanamkan glif yang dirender dengan SigLIP 2 dan membandingkannya dalam ruang vektor
- Pengguna dapat secara intuitif menelusuri hubungan bentuk antar karakter dan memahami struktur standar Unicode
- Proyek ini masih terus dikembangkan dan menerima dukungan melalui umpan balik serta donasi dari pengguna
2 komentar
https://charcuterie.elastiq.ch/#002D helaan napas
Komentar Hacker News
Saya paham bahwa trim otomatis pada kolom input umumnya merupakan default yang berguna, tetapi dalam kasus ini itu jadi merepotkan karena kita tidak bisa mencari spasi itu sendiri
Jadi rasanya akan bagus jika ditambahkan pengecualian seperti
if (trim(str)=="") return strAwalnya saya tidak sadar, tetapi kalau klik ikon pensil, kita bisa menggambar bentuk langsung untuk mencari alih-alih memakai teks
Konsep dan implementasinya benar-benar keren
Hanya saja, konsep UI “spotlight” ini agak membingungkan. Saat karakter diklik, area di sekitarnya disorot, lalu lanskap karakter serupa di sekitar karakter itu dimuat ulang. Jadi kita bisa menjelajahi lanskap kemiripan seperti ini, tetapi terasa seperti ada bagian dari metafora visualnya yang saya lewatkan
Keren banget sampai langsung saya bookmark. Dulu saya memakai EmojiDB untuk pencarian emoji berbasis vektor, dan sekarang saya berencana memakainya bersama ini
Situs saya ada di unicode-atlas.vercel.app
Saya tertawa melihat betapa banyaknya karakter ‘X’
Kalau melihat tautan charcuterie.elastiq.ch/#1100B, jadi bingung apakah yang dimaksud itu “Aegean Check Mark” atau “Old North Arabian letter Teh”
Benar-benar luar biasa. Saya lebih suka memakai karakter Unicode daripada gambar jika memungkinkan. Misalnya untuk panah, saya selalu kesulitan menemukan karakter yang tepat
Tetapi di sini kita bahkan bisa menggambar ‼ sendiri untuk mempersempit pilihan yang diinginkan. Sempurna. UX-nya juga intuitif, jadi langsung saya bookmark
Saya bahkan tidak tahu karakter ini ada: U+119A
Situs saya ada di unicode-atlas.vercel.app
Sepertinya ini mempertimbangkan lebih dari sekadar kemiripan visual sederhana. Kalau tidak, tidak ada alasan “@” dan “U+1F582 (BACK OF ENVELOPE)” bisa sedekat itu
Dan selama bertahun-tahun, bahkan puluhan tahun, saya berharap Word punya fitur seperti ini. Saya bisa menjelaskan simbol dengan kata-kata, tetapi UI-nya sangat merepotkan sehingga sulit menemukannya secara manual. Saya masih tidak percaya jendela “Insert Symbol” sampai sekarang belum punya fitur pencarian
Situs saya ada di unicode-atlas.vercel.app
Pencarian kanji bahasa Jepang tidak berfungsi
https://unicodeplus.com/U+2F8F memang bisa
tetapi https://unicodeplus.com/U+884C tidak berfungsi
Saya terkesan karena di kiri atas kita bisa menggambar karakter langsung untuk menemukan karakter serupa. Ini menunjukkan bahwa alat ini melakukan lebih dari sekadar lookup table sederhana
Situs saya ada di unicode-atlas.vercel.app
Standar Unicode tidak mendefinisikan bentuk visual untuk code point (kecuali beberapa contoh jenis emoji)
Jadi alat ini hanyalah visualisasi kemiripan glif dari font tertentu (yang bahkan tidak disebutkan dan tidak bisa diubah), bukan “penjelajahan visual” atas code point Unicode itu sendiri