- Eksperimen yang mengenali tulisan tangan di remarkable2, merespons berdasarkan gestur atau konten di layar, lalu menulis kembali ke layar
- Proyek yang mengeksplorasi interaksi antara tulisan tangan dan layar
Pengaturan/Instalasi
- Perlu mengatur variabel lingkungan seperti
OPENAI_API_KEY.
- Perlu memasang dan menjalankan biner di remarkable.
Cara penggunaan
ghostwriter harus dijalankan di remarkable.
- Gambar sesuatu di layar, lalu sentuh kanan atas untuk mengaktifkan fungsi bantuan.
- Selama pemrosesan, titik-titik akan digambar, dan Anda dapat melihat respons yang diketik atau digambar.
Status / Catatan perkembangan
- 2024-10-06: Proof of concept dasar selesai. Fitur menggambar kembali ke layar belum bekerja dengan baik.
- 2024-10-07: Gestur dasar dan indikator status diimplementasikan.
- 2024-10-10: Mulai menyiapkan keyboard virtual.
- 2024-10-20: Output teks dan mode lainnya diperkenalkan.
- 2024-10-21: Build rilis biner selesai.
- 2024-10-23: Refactoring kode dan rencana pengujian model Anthropic baru.
- 2024-11-02: Beralih ke penyediaan tool.
- 2024-11-07: Menambahkan Claude/Anthropic.
- 2024-11-22: Mulai membuat sketsa sistem evaluasi.
- 2024-12-02: Menambahkan tahap segmentasi gambar dasar.
- 2024-12-15: Integrasi engine.
- 2024-12-18: Menyelesaikan masalah upgrade sistem.
- 2024-12-19: Mencoba mode VLM di jaringan lokal.
- 2024-12-22: Mulai membangun sistem evaluasi.
- 2024-12-25: Menyederhanakan dan memperluas CLI.
- 2024-12-28: Peningkatan usability.
Ide
- Memicu permintaan lewat gestur atau konten.
- Memasukkan screenshot ke model vision, lalu menampilkan hasilnya di layar.
- Dapat mengirim event keyboard.
- Membangun sistem evaluasi dasar.
- Mengembangkan library prompt.
- Mengotomatiskan pengaturan awal.
- Menambahkan fitur pembuatan diagram.
- Menambahkan fungsi pencarian dan pengiriman informasi eksternal.
- Mengimplementasikan mode percakapan.
- Mencoba penggunaan VLM lokal di jaringan.
Referensi
- Memanfaatkan sumber daya dari Awesome reMarkable.
- Menerapkan teknik tangkapan layar dari reSnap.
- Mendapat inspirasi menggambar layar dari rmkit lamp.
- Menggunakan resvg untuk mengonversi SVG ke png.
- Menggunakan rM-input-devices untuk membuat perangkat input keyboard.
- Menemukan alur OCR→OpenAI→PDF→Device di reMarkableAI.
- rMAI adalah aplikasi terpisah yang menggunakan replicate sebagai layanan API model.
- Crazy Cow adalah tool yang mengubah teks menjadi sapuan pena.
1 komentar
Komentar Hacker News
Saya pembuat proyek ini. Proyek ini masih terus berjalan, dan wawasan terbesar adalah keterbatasan kesadaran spasial pada model visual
Keren sekali. Senang melihat orang-orang mengutak-atik aplikasi untuk tablet reMarkable
Andai tablet reMarkable tidak terlalu terkunci
Keren
Keren sekali. Saya akan mencobanya akhir pekan ini
Untuk para pembaca dokumen PDF, saya penasaran apakah ukuran 11 inci reMarkable sudah cukup
Saya suka proyek ini. Ada model difusi vektor; kalau model memutuskan untuk menggambar sesuatu, bagaimana kalau pekerjaan itu dialihdayakan melalui pemanggilan alat?
Kasus penggunaan yang menggabungkan input tulisan tangan dan LLM ini luar biasa
Saya memiliki tablet boox (tablet Android penuh dengan layar eink), dan hal seperti ini akan sangat cocok
Bagaimana dengan proyek ini di pembaca ebook Android-based Onyx Boox?