Este proyecto implementa un pipeline de OCR utilizando la librería PaddleOCR para extraer texto de imágenes de manera eficiente, con soporte para el idioma español.
El sistema permite procesar imágenes individuales o carpetas completas, realizando un preprocesamiento interno (vía PaddleOCR) para detectar y reconocer texto con alta precisión. Está optimizado para ejecutarse en entornos locales de manera rápida gracias a la gestión de dependencias con uv.
- Python: 3.9 o superior.
- Herramientas:
uv.
Siga estos pasos para configurar el entorno de desarrollo:
cd proyecto_ocruv venv
source .venv/bin/activate # En macOS/Linux
# o .venv\Scripts\activate # En Windowsuv pip install -r requirements.txt
uv pip install -e . # Instala el proyecto en modo editableEl script src/inferencia.py es el punto de entrada principal.
python src/inferencia.py --imagen ruta/a/tu/imagen.pngpython src/inferencia.py --imagen ruta/a/imagen.png --salida resultado.txtpython src/inferencia.py --carpeta ruta/de/carpeta --salida carpeta_resultadosEntrada: Una imagen que contiene el texto "CAPÍTULO PRIMERO".
Comando:
python src/inferencia.py --imagen image.pngSalida en consola:
Procesando: image.png
--- TEXTO EXTRAÍDO ---
CAPÍTULO PRIMERO
Llegué a Liverpool el 18 marzo de 1867...
Existe una implementación alternativa utilizando EasyOCR en la rama easyocr.
Para consultar esta solución:
git checkout easyocr