tags |
---|
htr |
Procédure qui consiste à prédire le contenu d’un texte à partir d’une image numérisée d’un document manuscrit ou imprimé en utilisant des outils informatiques.
Technologie le plus souvent basée sur l’utilisation d’algorithmes de machine learning et de deep learning.
Implique de pouvoir disposer de données d’entraînement, c’est-à-dire de contenus annotés manuellement à partir desquelles on entraîne la machine.
Domaine général de la reconnaissance automatique d’écriture (ATR).
Fondamentalement le domaine ne présente pas de réelles différences techniques.
Dans les tâches de reconnaissance de caractère imprimé (OCR), le taux de reconnaissance atteint largement 2%.
Dans les tâches de HTR, il s’agit d’écriture manuscrite : le taux d’erreur se situe entre 5 et 8%.
Logiciels OCR : Abby (Commercial), Tesseract 4, OCR4all, OCRD
Logiciels HTR : Transkribus (commercial), Kraken.
Optophone d’Edward Fournier d’Albe, 1914.
https://boowiki.info/art/des-aides-a-une-deficience-sensorielle/optophone.html
- 1951, Gustav Tauschek « Pattern Rcognition by Machine »
- 1970-1980 : amélioration des algorithmes d’OCR
- 1990 : OCR en recherche
- 2000 : apprentissage machine et modèles de deep learning avec les CNN
- 2000-2010 : Expérimentations HTR
- fin 2010 : recours augmenté avec Transkribus (Pylaia et HTR+) et eScriptorium
Jalons biblio
- Alex Graves et Jürgen Schmidhuber, « Offline Handwriting Recognition with Multidimensional Recurrent Neural Networks », Advances in Neural Information Processing Systems, 2008.
- Andreas Fischer, Emanuel Indermühle, Horst Bunke, [et al.], « Ground truth creation for handwriting recognition in historical documents », 2010.
- Projets pionniers : le projet Himanis (2015), le projet ANR Horae (2017) dirigés par Dominique Stutzmann
Conférences internationales
- ICDAR : International Conference on Document Analysis and Recognition
- HIP : Historical Document Imaging and Processing workshop
@todo
- Pinche, Ariane. 2024. « Kraken, eScriptorium et l’ATR (automatic text recognition) : Naviguer dans les océans de la Reconnaissance automatique d’Écriture ». Séminaire de l’Axe de recherche en histoire numérique du LARHRA, février 8. https://wiki-arhn.larhra.fr/lib/exe/fetch.php?media=seminaire:20240208_ariane_pinche.pdf.
Thibault Clérice. You Actually Look Twice At it (YALTAi): using an object detection approach instead of region segmentation within the Kraken engine. 2022. hal-03723208