Tesseract
Tesseract est un moteur de reconnaissance de texte en open source (OCR) disponible sous la licence Apache 2.0. Il peut être utilisé directement ou (pour les programmeurs) à l’aide d’une API pour extraire du texte imprimé à partir d’images. Il prend en charge une grande variété de langues.
Tesseract n’a pas d’interface graphique intégrée, mais plusieurs sont disponibles sur la page 3rdParty.
Voir notamment : Rescribe, un logiciel OCR qui utilise Tessaract comme système et peut être installé directement sur l’ordinateur : https://rescribe.xyz/rescribe/
Catégorie
- Librairie logicielle
Étape
- Pré-traitement
Types d'accès
- Gratuit
- Open source
Type de données
- Texte
Niveau de complexité
Moyen
Site internet de l'outil