LegoGPT - Pembuatan otomatis desain LEGO yang benar-benar bisa dirakit dari teks
(avalovelace1.github.io)- LegoGPT adalah proyek inovatif yang dapat menghasilkan struktur LEGO yang stabil dan benar-benar dapat dirakit hanya dari input teks
- Dengan membangun dataset StableText2Lego, proyek ini menyediakan lebih dari 47.000 struktur LEGO yang stabil secara fisik beserta deskripsi yang rinci
- Algoritmenya menerapkan validasi cepat dan rollback berbasis fisika untuk secara otomatis menghapus struktur yang tidak realistis
- Desain LEGO yang dihasilkan dapat benar-benar dirakit baik oleh manusia maupun robot, serta mendukung beragam ekspresi warna dan tekstur
- Sistem ini membuka kemungkinan baru di berbagai bidang seperti prototyping desain kreatif, pendidikan, dan aplikasi robotika
Pengenalan proyek
- LegoGPT adalah pendekatan pertama yang, berdasarkan prompt teks dari pengguna, menghasilkan struktur LEGO yang benar-benar dapat dirakit dan stabil secara fisik dengan cara yang sepenuhnya otomatis
- Proyek ini dibangun dengan dataset struktur LEGO berskala besar beserta deskripsi terperinci, dan menghasilkan keluaran yang memiliki stabilitas, keragaman, dan kualitas estetika bahkan dalam proses perakitan nyata
- Hasil pembuatan struktur LEGO telah diverifikasi secara eksperimental bahwa memang dapat dirakit langsung dengan tangan oleh manusia, atau dirakit secara otomatis dengan lengan robot
Dataset StableText2Lego
- Dataset StableText2Lego dibuat dengan memvoxelisasi bentuk dari mesh 3D ShapeNetCore, lalu menerapkan berbagai metode penempatan brick untuk hanya memilih struktur yang lolos verifikasi stabilitas fisik
- Dalam proses pembuatan data, setiap struktur dirender dari 24 sudut pandang, dan berdasarkan itu GPT-4o secara otomatis menghasilkan deskripsi yang mendetail
- Dataset yang dibangun dengan cara ini mencakup lebih dari 47.000 struktur LEGO dan lebih dari 28.000 objek 3D unik dengan beragam bentuk, struktur, dan tekstur
Pipeline LegoGPT
- Struktur LEGO ditokenisasi menjadi urutan token teks dengan metode dari bawah ke atas, raster-scan sebagai input
- Dengan memasangkan setiap urutan brick dan deskripsi bahasa alami, dilakukan fine-tuning pada model berbasis LLaMA-3.2-Instruct-1B untuk mempelajari pemetaan deskripsi-ke-urutan brick
- Pada tahap inferensi, LegoGPT secara bertahap menghasilkan struktur LEGO untuk prompt teks dengan cara memprediksi dan menambahkan brick satu per satu
- Setiap kali brick ditambahkan, dilakukan validasi terhadap format, keberadaan di library brick, dan ada tidaknya tabrakan, lalu setelah seluruh struktur selesai dibuat dilakukan verifikasi ulang stabilitas fisik
- Jika struktur akhir tidak stabil, sistem akan menghapus brick yang tidak stabil beserta semua brick yang ditambahkan setelahnya, lalu melakukan rollback hingga kondisi stabil sebelum menghasilkan ulang
Contoh pembuatan struktur LEGO langkah demi langkah
- "Perahu ramping dengan lambung panjang dan sempit"
- "Rak buku dengan rak horizontal"
- "Bangku dengan sandaran tangan tanpa sandaran punggung"
- Masing-masing contoh dihasilkan langkah demi langkah dari prompt teks menjadi struktur LEGO yang secara jelas mencerminkan karakteristik visualnya
Perakitan otomatis dengan robot
- Model LEGO yang dihasilkan diterapkan pada perakitan nyata menggunakan lengan robot dan didemonstrasikan dalam video 8x kecepatan
- Ini menunjukkan kemungkinan penerapan perakitan robot di dunia nyata untuk contoh seperti "Perahu ramping dengan lambung panjang dan sempit" dan "Gitar 6 senar asimetris"
Model LEGO bertekstur dan berwarna yang dihasilkan
- Sistem ini menyediakan desain LEGO yang dapat mengekspresikan tekstur, material, hingga efek estetika tertentu dalam prompt bahasa alami, seperti "bangku berlumut", "material cyberpunk gradien neon", dan "rak ruang baca bergaya Victoria"
- Bahkan warna yang beragam dan efek metalik seperti pada "Sunburst Les Paul with amber finish" juga dapat tercermin dalam rancangan LEGO hanya dari teks
Sitasi dan dukungan riset
- Tercantum informasi makalah dan penulis, serta lembaga yang mendukung riset ini, seperti Packard Foundation dan Amazon Faculty Award
- Proyek ini dijalankan dengan berbagai dukungan akademik dan industri, termasuk Microsoft Research PhD Fellowship untuk peneliti utamanya
Referensi proyek dan template
- Template situs ini memanfaatkan tata letak yang merujuk pada proyek Custom Diffusion dan DreamFusion
1 komentar
Komentar Hacker News
playsinlinepada tag video https://developer.mozilla.org/en-US/docs/…. Sayang sekali ini jadi default di iOS