- Membangun model machine learning (ML) generatif bernama 'FontoGen' untuk pembuatan font
- Model menerima deskripsi font sebagai input dan menghasilkan file font sebagai output
- Penulis terinspirasi oleh kebangkitan AI pada 2023 untuk mengeksplorasi pembuatan SVG dari teks, yang kemudian melahirkan ide pembuatan font
- Model dibangun dengan merujuk pada paper IconShop2, dan ditemukan bahwa pembuatan font dapat dilakukan mirip seperti pembuatan SVG
- Model ini adalah model sequence-to-sequence yang dilatih dengan urutan embedding teks yang diikuti embedding font
- Embedding teks dibuat menggunakan model encoder BERT yang telah dipra-latih, dan embedding font dibuat dengan mengubah font menjadi urutan token
- Model ini adalah transformer autoregresif encoder-only yang terdiri dari 16 layer dan 8 blok, dengan total 73,7 juta parameter
- Penulis menggunakan atensi BigBird3 untuk berfokus pada prompt awal dan mengamati N token sebelumnya guna menangkap gaya dari beberapa glif sebelumnya
- Model dilatih pada dataset 71k font unik yang deskripsinya diringkas menjadi beberapa kata kunci menggunakan GPT-3.5 untuk mewakili berbagai jenis penjelasan
- Proses pelatihan memakan waktu 127 jam dan dihentikan ketika validation loss hampir tidak lagi membaik
- Penulis meningkatkan performa hingga tiga kali lipat dengan memindahkan sebanyak mungkin proses ke tahap prapemrosesan dataset
- Penulis mengusulkan potensi aplikasi di masa depan, seperti mengintegrasikan model ke editor font yang ada untuk menghasilkan semua glif lain berdasarkan satu glif tunggal buatan desainer
2 komentar
Buatkan aku font yang lucu
Komentar Hacker News