Skip to content

Latest commit

 

History

History
59 lines (35 loc) · 2.64 KB

nHTR.md

File metadata and controls

59 lines (35 loc) · 2.64 KB
tags
htr

La reconnaissance automatique de texte

Procédure qui consiste à prédire le contenu d’un texte à partir d’une image numérisée d’un document manuscrit ou imprimé en utilisant des outils informatiques.

Technologie le plus souvent basée sur l’utilisation d’algorithmes de machine learning et de deep learning.

Implique de pouvoir disposer de données d’entraînement, c’est-à-dire de contenus annotés manuellement à partir desquelles on entraîne la machine.

Le domaine de l’ATR

Domaine général de la reconnaissance automatique d’écriture (ATR).

Fondamentalement le domaine ne présente pas de réelles différences techniques.

Dans les tâches de reconnaissance de caractère imprimé (OCR), le taux de reconnaissance atteint largement 2%.

Dans les tâches de HTR, il s’agit d’écriture manuscrite : le taux d’erreur se situe entre 5 et 8%.

Logiciels OCR : Abby (Commercial), Tesseract 4, OCR4all, OCRD

Logiciels HTR : Transkribus (commercial), Kraken.

Historique

Optophone d’Edward Fournier d’Albe, 1914.

https://boowiki.info/art/des-aides-a-une-deficience-sensorielle/optophone.html

  • 1951, Gustav Tauschek « Pattern Rcognition by Machine »
  • 1970-1980 : amélioration des algorithmes d’OCR
  • 1990 : OCR en recherche
  • 2000 : apprentissage machine et modèles de deep learning avec les CNN
  • 2000-2010 : Expérimentations HTR
  • fin 2010 : recours augmenté avec Transkribus (Pylaia et HTR+) et eScriptorium

Jalons biblio

  • Alex Graves et Jürgen Schmidhuber, « Offline Handwriting Recognition with Multidimensional Recurrent Neural Networks », Advances in Neural Information Processing Systems, 2008.
  • Andreas Fischer, Emanuel Indermühle, Horst Bunke, [et al.], « Ground truth creation for handwriting recognition in historical documents », 2010.
  • Projets pionniers : le projet Himanis (2015), le projet ANR Horae (2017) dirigés par Dominique Stutzmann

Conférences internationales

  • ICDAR : International Conference on Document Analysis and Recognition
  • HIP : Historical Document Imaging and Processing workshop

@todo

Références

Thibault Clérice. You Actually Look Twice At it (YALTAi): using an object detection approach instead of region segmentation within the Kraken engine. 2022. hal-03723208

https://harmoniseatr.hypotheses.org