Il nous arrive souvent de tomber sur un document important, une lettre imprimée, un article de journal, un reçu, une facture ou tout autre type de texte que nous souhaitons conserver. Heureusement, ces textes précieux peuvent facilement être convertis en format numérique avec l'OCR (reconnaissance optique de caractères).
Tout ce que nous mettons « sur papier » est aujourd'hui sous forme numérique. En plus d'être simple à faire, convertir votre texte en format numérique ouvre de nombreuses possibilités. Par exemple, cela simplifie le processus de modification.
Après avoir numérisé vos textes avec un scanner, ou même un téléphone mobile, une question se pose. Comment extraire du texte d'une image avec l'OCR ? Il n'est pas nécessaire de tout retaper à la main, car la technologie OCR offre une solution simple et rapide. De plus, en utilisant un convertisseur OCR en ligne, le texte est numérisé en quelques instants. Découvrez ci-dessous comment convertir un document scanné en texte.
Comment numériser de vieux textes ?
Même s'il est facile de convertir vos vieux documents papier poussiéreux en format numérique, il reste quelques facteurs à prendre en compte pour obtenir de meilleurs résultats et performances OCR.
Pour obtenir les meilleurs résultats, le texte doit être clair et dactylographié. Prenez une photo nette du document que vous souhaitez convertir. Si vous voulez numériser un texte manuscrit, le résultat de la conversion dépendra de la lisibilité de l'écriture. Même dans ce cas, il ne sera pas parfait, car les textes manuscrits sont encore rarement interprétés correctement par l'OCR. Cependant, on peut s'attendre à des avancées technologiques dans ce domaine dans un avenir proche.
Puis-je améliorer la qualité du scan ?
Pour vous assurer que vos numérisations sont de haute qualité, augmentez le contraste entre le texte et l'arrière-plan. Pourquoi est-ce important ? Parce que des documents avec peu de contraste peuvent donner un mauvais OCR. En augmentant le contraste, l'OCR peut plus facilement distinguer le texte de l'arrière-plan. Si certaines parties du texte sont estompées, elles peuvent être corrigées par la suite.
Certains de vos scans sont-ils un peu « de travers » ? Ce ne sera pas un problème pour la plupart des programmes OCR, car ils peuvent gérer une légère inclinaison et distorsion. Lorsque l'option « redresser » est disponible, pensez à l'utiliser sur votre fichier.
Il est temps de convertir vos scans ou images en texte
Maintenant que vous connaissez tous les facteurs nécessaires, vous pouvez commencer à extraire le texte. Aujourd'hui, nous vous montrons deux options différentes que vous pouvez utiliser lors de l'extraction de texte à partir d'une image ou d'un scan avec l'OCR.
Convertir en TXT
TXT est un format simple. Il ne contient que du texte brut. Aucun formatage et aucune image. Si vous souhaitez extraire le texte d'un scan ou d'une image, c'est votre meilleure option. Les fichiers sont de petite taille et peuvent être ouverts dans n'importe quel programme d'édition de texte.
Convertir en Word
Convertir du texte en DOCX ou DOC est parfait pour les utilisateurs de Microsoft Word. L'avantage des documents Word ? L'opération OCR essaiera de conserver au mieux la mise en forme de l'original. Si des graphiques ou des images font partie du scan ou de l'image, cela s'applique à eux aussi. Pour obtenir les meilleurs résultats, sélectionnez toutes les langues contenues dans le fichier.
ASTUCE: OCR2Edit - Convertir en Word : lors de la conversion d'images ou de scans vers l'un des formats utilisés par le logiciel de traitement de texte Microsoft Word (DOC, DOCX), dans Paramètres OCR:
- Choisissez l’outil OCR Méthode (mise en page ou reconnaissance de texte).
- Choisir la langue de votre fichier pour améliorer l'OCR.
- Cochez la case - Améliorer l'OCR dans les paramètres optionnels pour améliorer la reconnaissance OCR (conversion du texte en monochrome).