2 poin oleh GN⁺ 2026-04-11 | 2 komentar | Bagikan ke WhatsApp
  • Alat untuk menjelajahi kumpulan karakter Unicode secara visual dan melihat glif, skrip, simbol, dan bentuk dari tiap karakter
  • Memanfaatkan embedding SigLIP 2 untuk menganalisis kemiripan visual antar karakter dengan membandingkan glif dalam ruang vektor
  • Pengguna dapat memahami hubungan morfologis antar karakter secara intuitif dan menjelajahi struktur Unicode
  • Antarmuka dirancang untuk memberikan pengalaman penjelajahan yang berfokus pada visual agar sistem karakter yang kompleks lebih mudah dipahami
  • Proyek ini masih terus dikembangkan dan menerima umpan balik serta dukungan donasi dari pengguna

Ikhtisar Charcuterie

  • Sebuah penjelajah visual Unicode, alat untuk menelusuri kumpulan karakter dan melihat glif, skrip, simbol, dan bentuk yang terkait
  • Untuk menganalisis kemiripan visual tiap karakter, proyek ini menanamkan glif yang dirender dengan SigLIP 2 dan membandingkannya dalam ruang vektor
  • Pengguna dapat secara intuitif menelusuri hubungan bentuk antar karakter dan memahami struktur standar Unicode
  • Proyek ini masih terus dikembangkan dan menerima dukungan melalui umpan balik serta donasi dari pengguna

2 komentar

 
GN⁺ 2026-04-11
Komentar Hacker News
  • Saya paham bahwa trim otomatis pada kolom input umumnya merupakan default yang berguna, tetapi dalam kasus ini itu jadi merepotkan karena kita tidak bisa mencari spasi itu sendiri
    Jadi rasanya akan bagus jika ditambahkan pengecualian seperti if (trim(str)=="") return str

    • Betul, itu masukan yang bagus
  • Awalnya saya tidak sadar, tetapi kalau klik ikon pensil, kita bisa menggambar bentuk langsung untuk mencari alih-alih memakai teks

  • Konsep dan implementasinya benar-benar keren
    Hanya saja, konsep UI “spotlight” ini agak membingungkan. Saat karakter diklik, area di sekitarnya disorot, lalu lanskap karakter serupa di sekitar karakter itu dimuat ulang. Jadi kita bisa menjelajahi lanskap kemiripan seperti ini, tetapi terasa seperti ada bagian dari metafora visualnya yang saya lewatkan

    • Itu cuma visualisasi yang keren
    • Selera estetikanya bagus, tapi desainnya kurang
  • Keren banget sampai langsung saya bookmark. Dulu saya memakai EmojiDB untuk pencarian emoji berbasis vektor, dan sekarang saya berencana memakainya bersama ini

    • Saya juga membuat alat serupa, dan menurut saya pribadi milik saya lebih enak dilihat dan lebih praktis untuk pencarian karakter. Alat OP cocok untuk dinikmati sebentar, tetapi kurang praktis
      Situs saya ada di unicode-atlas.vercel.app
  • Saya tertawa melihat betapa banyaknya karakter ‘X’
    Kalau melihat tautan charcuterie.elastiq.ch/#1100B, jadi bingung apakah yang dimaksud itu “Aegean Check Mark” atau “Old North Arabian letter Teh”

    • Area CJK sudah disatukan, tetapi ‘x’ tidak disatukan!
  • Benar-benar luar biasa. Saya lebih suka memakai karakter Unicode daripada gambar jika memungkinkan. Misalnya untuk panah, saya selalu kesulitan menemukan karakter yang tepat
    Tetapi di sini kita bahkan bisa menggambar ‼ sendiri untuk mempersempit pilihan yang diinginkan. Sempurna. UX-nya juga intuitif, jadi langsung saya bookmark
    Saya bahkan tidak tahu karakter ini ada: U+119A

    • Saya juga membuat alat serupa, dan menurut saya milik saya lebih enak dilihat dan berguna untuk pencarian karakter. Alat OP cocok untuk dinikmati sebentar, tetapi kurang praktis
      Situs saya ada di unicode-atlas.vercel.app
  • Sepertinya ini mempertimbangkan lebih dari sekadar kemiripan visual sederhana. Kalau tidak, tidak ada alasan “@” dan “U+1F582 (BACK OF ENVELOPE)” bisa sedekat itu
    Dan selama bertahun-tahun, bahkan puluhan tahun, saya berharap Word punya fitur seperti ini. Saya bisa menjelaskan simbol dengan kata-kata, tetapi UI-nya sangat merepotkan sehingga sulit menemukannya secara manual. Saya masih tidak percaya jendela “Insert Symbol” sampai sekarang belum punya fitur pencarian

    • Saya juga membuat alat serupa, dan menurut saya milik saya lebih enak dilihat dan praktis untuk menjelajahi karakter. Alat OP cocok untuk dinikmati sebentar, tetapi kurang praktis
      Situs saya ada di unicode-atlas.vercel.app
    • Setuju. Kalau Word punya fitur seperti ini, mencari simbol yang diinginkan pasti akan jauh lebih mudah
  • Pencarian kanji bahasa Jepang tidak berfungsi
    https://unicodeplus.com/U+2F8F memang bisa
    tetapi https://unicodeplus.com/U+884C tidak berfungsi

  • Saya terkesan karena di kiri atas kita bisa menggambar karakter langsung untuk menemukan karakter serupa. Ini menunjukkan bahwa alat ini melakukan lebih dari sekadar lookup table sederhana

    • Saya juga membuat alat serupa, dan menurut saya milik saya lebih enak dilihat dan lebih praktis untuk pencarian karakter. Alat OP cocok untuk dinikmati sebentar, tetapi kurang praktis
      Situs saya ada di unicode-atlas.vercel.app
  • Standar Unicode tidak mendefinisikan bentuk visual untuk code point (kecuali beberapa contoh jenis emoji)
    Jadi alat ini hanyalah visualisasi kemiripan glif dari font tertentu (yang bahkan tidak disebutkan dan tidak bisa diubah), bukan “penjelajahan visual” atas code point Unicode itu sendiri