Tesseract


Tesseract est un moteur de reconnaissance de texte en open source (OCR) disponible sous la licence Apache 2.0. Il peut être utilisé directement ou (pour les programmeurs) à l’aide d’une API pour extraire du texte imprimé à partir d’images. Il prend en charge une grande variété de langues.

Tesseract n’a pas d’interface graphique intégrée, mais plusieurs sont disponibles sur la page 3rdParty.

Voir notamment : Rescribe, un logiciel OCR qui utilise Tessaract comme système et peut être installé directement sur l’ordinateur : https://rescribe.xyz/rescribe/

Catégorie

  • Librairie logicielle

Étape

  • Pré-traitement

Types d'accès

  • Gratuit
  • Open source

Type de données

  • Texte

Niveau de complexité

Moyen


Site internet de l'outil