read-pdf2llm
Version:
High-performance PDF text extractor (with OCR fallback) for Node.js, optimized for LLM pipelines. Uses PDFium, Tesseract, and C++ addon.
22 lines (12 loc) • 546 B
Markdown
<div align="center">
# 📑 read-pdf2llm 📑
**Extração de texto de PDFs (com fallback OCR) de alta performance para Node.js, otimizado para pipelines LLM.**
</div>
----
**ESTOU TRABALHANDO NO BUILD**
Quem quiser ver a versão que roda diretamente no docker, basta acessar [esta branch](https://github.com/vitorric/read-pdf2llm/tree/feat/build-addon).
# License
Released under the MIT License.
----
Dúvidas, contribuições ou sugestões?
Abra uma [issue](https://github.com/vitorric/read-pdf2llm/issues) ou envie um PR!