Releases: Keyvanhardani/german-ocr
German-OCR-3 v0.2 — Compact German Vision-OCR (Apr 2026)
🇩🇪📄 German-OCR-3 v0.2 ist da!
Kompakte, lokal lauffähige Vision-OCR für deutsche Geschäftsdokumente. Aus dem Bild kommt strikt validiertes JSON — ohne Cloud, ohne Vendor-Lock-in.
In einer Zeile installiert:
ollama pull Keyvan/german-ocr-3
Highlights auf 200+ echten anonymisierten DE-Rechnungen:
- 100 % gültiges JSON
- 95 % Sender korrekt erkannt
- 0 % Halluzination
- 2.7 GB — läuft auf 4–6 GB VRAM, Nano sogar CPU-only
Zwei Editionen, beide Apache 2.0:
- Keyvan/german-ocr-nano (1.0 GB)
- Keyvan/german-ocr-3 (2.7 GB, empfohlen)
Auf Hugging Face als GGUF — direkt nutzbar via Ollama, llama.cpp und vLLM. Komplett offen für die Community.
Wer lieber gemanagt mit größeren Modellen und EU-Datenhaltung will: german-ocr.de — hosted API, keine eigene Hardware.
👉 Hugging Face: https://huggingface.co/Keyven/german-ocr-3
👉 Ollama: https://ollama.com/Keyvan/german-ocr-3
👉 GitHub: https://github.com/Keyvanhardani/German-OCR
👉 Hosted API: https://german-ocr.de
Feedback & ⭐ willkommen!
#OCR #GermanAI #Python #VisionLanguageModel #OpenSource #GermanOCR #DocumentAI #LocalLLM #HuggingFace #Ollama #NLP #Apache2 #DSGVO #EUAIAct
Bild-Quelle: Gemini
v0.6.0 - German-OCR 2B + llama.cpp Backend
What's New
German-OCR 2B Support
- New lightweight 2B model (1.5 GB) optimized for CPU/Edge
- Full llama.cpp backend integration
- ~23 tok/s on CPU, ~127 tok/s on GPU
Installation
# Standard
pip install german-ocr
# With llama.cpp support
pip install german-ocr[llamacpp]Usage
from german_ocr import GermanOCR
# Auto-detect backend
ocr = GermanOCR()
# Or specify llama.cpp
ocr = GermanOCR(backend="llamacpp")
text = ocr.extract("invoice.png")Hardware Support
- NVIDIA (CUDA)
- Apple Silicon (Metal)
- AMD/Intel (Vulkan)
- Intel NPU (OpenVINO)
- CPU (everywhere)
Links
- Ollama:
ollama pull Keyvan/german-ocr-2b - HuggingFace: https://huggingface.co/Keyven/german-ocr-2b-gguf
v0.5.1 - Logo & Model Branding Update
Änderungen
Logo Update
- Neues kompaktes Icon im README
Model Branding
- Alle Beispiele verwenden jetzt die offiziellen Modellnamen:
german-ocr-ultra- Maximale Präzisiongerman-ocr-pro- Schnell und zuverlässiggerman-ocr- DSGVO-konform, lokale Verarbeitung
Installation
pip install german-ocr==0.5.1Quick Start
from german_ocr import CloudClient
client = CloudClient(
api_key="gocr_xxxxxxxx",
api_secret="your_secret"
)
# German-OCR Ultra für maximale Präzision
result = client.analyze("dokument.pdf", model="german-ocr-ultra")
print(result.text)German-OCR 2B v2
German-OCR 2B v2
Kompaktes Vision-Language Modell für deutsche Dokumenten-OCR.
Highlights
- 100% Genauigkeit auf deutschen Dokumenten
- Nur 1.5 GB - läuft auf jedem Laptop
- GPU/NPU-Support: CUDA, Metal, Vulkan, OpenVINO
- Läuft auch komplett auf CPU
Performance
- GPU (RTX 4060): 127 tok/s
- CPU-only: 23 tok/s
Dateien
German-OCR-Engine.2B.gguf- LLM Engine (1.03 GB)German-OCR-Worker-2B.gguf- Vision Encoder (424 MB)
Installation
pip install german-ocr[llamacpp]from german_ocr import GermanOCR
ocr = GermanOCR(backend="llamacpp")
text = ocr.extract("rechnung.png")v0.5.0 - Model Branding
Preise aus README und SDK entfernt, URL korrigiert - Preise aus öffentlicher Dokumentation entfernt - Portal URL zu app.german-ocr.de korrigiert - Vorbereitung für PyPI Release Entwickelt bei Keyvan.ai
v0.4.0 - Cloud API Client
Features
- CloudClient für api.german-ocr.de Integration
- CLI Cloud-Support:
--cloud,--api-key,--output-format,--prompt - Output-Formate: json, markdown, text, n8n
- Progress-Callback für große PDFs
- Job-Cancellation Support
Installation
pip install german-ocr --upgradeVerwendung
CLI
# Cloud API
german-ocr --cloud --api-key YOUR_KEY rechnung.pdf --output-format json
# Lokal (wie bisher)
german-ocr rechnung.pngPython
from german_ocr import CloudClient
client = CloudClient(api_key="...")
result = client.analyze("dokument.pdf", output_format="json")
print(result.text)Entwickelt bei Keyvan.ai
v0.3.0
Turbo feat: Add German-OCR Turbo model support and multi-format output
v0.2.0
alpha Add files via upload