Llama-OCR: Teknologi untuk Mengubah Dokumen menjadi Markdown
(llamaocr.com)-
Pengenalan proyek
- Proyek ini adalah alat yang menggunakan
llama-ocrdanTogether AIOCRuntuk mengubah gambar menjadi Markdown terstruktur. - Pengguna dapat mengunggah gambar untuk mengekstrak teks dan mengubahnya ke format Markdown.
- Proyek ini adalah alat yang menggunakan
-
Fitur utama
- Menyediakan fitur unggah gambar
- Mengekstrak teks dari gambar dan mengubahnya menjadi Markdown
- Menyediakan gambar contoh agar pengguna dapat menguji fungsinya
-
Contoh kode
- Menyediakan contoh kode yang menggunakan library
llama-ocruntuk mengekstrak teks dari gambar - Menghasilkan Markdown dengan meneruskan path file gambar dan API key ke fungsi
ocr
- Menyediakan contoh kode yang menggunakan library
-
Pentingnya proyek ini
- Proyek ini meningkatkan efisiensi pekerjaan dokumentasi dengan menyediakan kemampuan untuk mengekstrak teks dari gambar dengan mudah dan mengubahnya menjadi Markdown.
- Dibandingkan dengan alat OCR yang sudah ada, proyek ini menawarkan kemudahan penggunaan dan fitur konversi ke Markdown.
1 komentar
Pendapat Hacker News
Penulis llama-ocr mengembangkan alat dengan API sederhana untuk mengubah gambar menjadi Markdown terstruktur. Ada rencana untuk menambahkan parsing PDF dan keluaran JSON ke depannya
Menggunakan llama3.2-vision untuk memproses formulir penawaran lelang amal, dan hasilnya cukup akurat meskipun tulisan tangannya kurang bagus
Model OCR umum tidak cocok untuk mendigitalkan teks pada foto keluarga, dan Gemini Flash adalah yang terbaik
Diragukan apakah ini cocok sebagai postingan "Show HN", dan kaitannya dengan nama Llama juga kurang jelas
Kalimat yang dihasilkan dengan algoritma genetik digambar sebagai lingkaran sungguhan, tetapi tidak dikenali sebagai teks
Mengunggah PDF multi-halaman, tetapi diberi tahu bahwa itu tidak didukung
Mengunggah tangkapan layar HN, tetapi kode Markdown tidak dihasilkan
OCR bahasa Jepang bekerja dengan baik melalui ChatGPT API
Pada struk Walmart, angka 9 salah dikenali sebagai 0