4 poin oleh GN⁺ 2023-10-05 | 2 komentar | Bagikan ke WhatsApp
  • Membangun model machine learning (ML) generatif bernama 'FontoGen' untuk pembuatan font
  • Model menerima deskripsi font sebagai input dan menghasilkan file font sebagai output
  • Penulis terinspirasi oleh kebangkitan AI pada 2023 untuk mengeksplorasi pembuatan SVG dari teks, yang kemudian melahirkan ide pembuatan font
  • Model dibangun dengan merujuk pada paper IconShop2, dan ditemukan bahwa pembuatan font dapat dilakukan mirip seperti pembuatan SVG
  • Model ini adalah model sequence-to-sequence yang dilatih dengan urutan embedding teks yang diikuti embedding font
  • Embedding teks dibuat menggunakan model encoder BERT yang telah dipra-latih, dan embedding font dibuat dengan mengubah font menjadi urutan token
  • Model ini adalah transformer autoregresif encoder-only yang terdiri dari 16 layer dan 8 blok, dengan total 73,7 juta parameter
  • Penulis menggunakan atensi BigBird3 untuk berfokus pada prompt awal dan mengamati N token sebelumnya guna menangkap gaya dari beberapa glif sebelumnya
  • Model dilatih pada dataset 71k font unik yang deskripsinya diringkas menjadi beberapa kata kunci menggunakan GPT-3.5 untuk mewakili berbagai jenis penjelasan
  • Proses pelatihan memakan waktu 127 jam dan dihentikan ketika validation loss hampir tidak lagi membaik
  • Penulis meningkatkan performa hingga tiga kali lipat dengan memindahkan sebanyak mungkin proses ke tahap prapemrosesan dataset
  • Penulis mengusulkan potensi aplikasi di masa depan, seperti mengintegrasikan model ke editor font yang ada untuk menghasilkan semua glif lain berdasarkan satu glif tunggal buatan desainer

2 komentar

 
dbgus2028 2023-10-06

Buatkan aku font yang lucu

 
GN⁺ 2023-10-05
Komentar Hacker News
  • Penerjemah kode gpt-4 dapat mengonversi PNG hitam-putih dari glif menjadi SVG, dan ini dapat digunakan untuk membuat font bila digabungkan dengan model pembuat gambar.
  • Douglas Hofstadter, penulis Godel Escher Bach, percaya bahwa pembuatan font tidak mungkin dilakukan tanpa AI umum.
  • Proyek Letter Spirit bertujuan memodelkan kreativitas artistik dengan merancang jenis huruf bergaya konsisten yang disebut "gridfonts" yang dibatasi pada grid.
  • Ada kekhawatiran tentang presisi font yang dihasilkan oleh model ML, dengan masalah seperti garis yang tidak sepenuhnya paralel dan sudut yang tidak tepat 90 derajat.
  • Pendekatan yang merepresentasikan piksel sebagai bin unik 150x150 dianggap tidak ideal; sebagai gantinya, disarankan menggunakan convnet dan melacak keluarannya.
  • Dengan pendekatan seperti ini, pembuatan font baru, terutama font yang sangat bergaya, bisa menjadi lebih layak diwujudkan.
  • Modelnya berupa ckpt, bukan safetensor, yang dapat memengaruhi apakah sebagian pengguna akan mencobanya.
  • Meskipun model difusi kesulitan menggambar teks, metode ini bekerja dengan baik untuk aplikasi ini.