Patrice Caillet, Animateur sur France Bleu, parle de FineReader 10 ABBYY FineReader 10 passe sur Radio France Bleu En savoir plus > |
Admettons que vous vouliez numériser un article ou un contrat sur papier, deux solutions se présentent a vous : soit vous passez un temps incalculable à le ressaisir et à corriger les erreurs de frappe, soit vous numérisez en une fraction de secondes (ou le photographiez avec un appareil photo numérique) ces mêmes documents et le passez sous la loupe de la technologie OCR.
Qu'est-ce que l´OCR au juste ?
Le mot OCR signifie "Reconnaissance Optique de Caractères", une technologie qui vous permet de convertir différents types de documents tels que les documents papiers scannés, les fichiers PDF ou les images d'appareils photos numériques, vers des formats modifiables et exploitables.
Le rôle d'un scanner est avant tout de numériser, c'est-à-dire, en vous restituant une image fidèle ou en N&B vos documents papiers mais ne pourra pas vous les convertir en formats modifiables et exploitables types Word ou Excel. De ce fait, il est nécessaire de posséder un logiciel OCR pour extraire et retravailler les données à partir de ces images ou de PDF d'images seulement voire d'appareils photos numériques, car ce logiciel vous restituera chaque caractère de l'image, pour vous reconstituer le mot entier, puis les phrases puis les textes pour enfin vous permettre de le retravailler.
Quelle technologie se cache derrière l'OCR?
Le mécanisme permettant à l'être humain de reconnaître les objets sont encore méconnus, mais les 3 principes de base qui le sous-tendent sont bien maîtrisés par les scientitfiques : intégrité, la détermination et l'adaptabilité (IPA*). Ces principes constituent le coeur de la technologies OCR d'ABBYY FineReader lui permettant de reproduire le processus de reconnaissance des êtres-vivants et des êtres humains.
Ce qui nous amène à nous intéresser de plus près à la façon dont l'OCR d'ABBYY FineReader reconnaît les textes. Avant toute chose, le programme analyse la structure de l'image du document, dont il divise la page en éléments distincts tels que les textes, les tableaux, les images... Les lignes sont définies en mots puis en caractères. Une fois que le caractère aura été isolé, le programme les compare avec un groupe de modèles d'images grâce auxquels des hypothèses sont avancées sur ce que représente le caractère. C'est sur cette base d'hypothèses que le programme analyse les différentes variantes des courbures des lignes en mots et de mots en caractères. Apres avoir procède passe en revu toutes ces hypothèses, le programme prend la décision de vous livrer un texte qu'il pensera être conforme à l'image reconnue.
En complément, ABBYY FineReader dispose de dictionnaie prenant en charge 38 langues. Cette option permet d'affiner l'analyse d'un niveau texte à un niveau mot. Grâce à la prise en charge du dictionnaire, le programme améliore la précision de la reconnaissance des documents et facilite les vérifications ultérieures de résultats.
Reconnaissance d'images d'appareils photos numeriques
Les images capturees a partir d'un appareil photo numerique different des documents ou de PDF d'images seulement. Souvent elles presentent des defauts tels que des distorsions aux angles, une faible exposition, rendant les textes difficiles a reconnaitre par la plupart des applications OCR. La derniere version d'ABBYY Fine Reader met a disposition une technologie specialement concue pour traiter des specificites des images d'appariles photos numeriques. Il propose une panoplie de fonctions pour ameliorer la qualite de ces images et par la meme occasion d'utiliser au mieux les capacites de votre appareil photo numerique.
Comment utiliser un logiciel OCR ?
ABBYY FineReader OCR est simple d'utilisation : le processus se decompose en 3 etapes : "ouvrir" (numeriser)le document, le "reconnaitre" puis le "sauvegarder" dans un format courant (DOC, RTF, XLS, PDF, HTML, TXT etc.) ou exporter les donnees directement vers une application de Microsoft Office telle que Microsoft Word, Excel ou Adobe Acrobat.
De plus, la toute derniere version d'ABBYY FineReader propose un mode automatique pour automatiser les taches recurrentes.
Quels bénéfices pouvez-vous tirer de l´OCR ?
L'OCR d'ABBYY FineReader, reproduit vos documents a l'identique. Cet OCR puissant et evolue vous fait gagner un temps considerable dans le traitement et la reutilisation de documents varies. Avec l'OCR d'ABBYY FineReader, vous allez pouvoir numeriser et retravailler ainsi que mettre a disposition des documents papiers a tous vos collegues. A travers cet outil, vous allez pouvoir extraire des textes de citations de livres, de magazines et creer vos propres documents sans devoir les ressaisir manuellement. Avec l'appareil photo numerique, vous pouvez capturer des donnees sur les affiches, posters, panneaux de signalisation et tout type de documents rencontres en chemin pour vos besoins particuliers. De la meme maniere, vous pouvez photographier des livres ou des documents si vous n'avez pas de scanner sous la main - typiquement en bibliotheque ou il est interdit de photocopier certains livres ou documents fragiles. Par la suite, convertissez l'image a l'un des nombreux formats modifiables offert par ABBYY FineReader ou vers PDF interrogeable pour vos archives. logiciels.
Au final, il ce processus ne vous prendra que quelques minutes et le tour est joue, ce pour des resultats identiques a l'original !
Les appareils photo numériques sont devenus de plus en plus utilisés et vraiment polyvalents. Ainsi, vous pouvez aussi utiliser votre appareil photo comme un scanneur portable pour capturer du texte de documents, livres, journaux, bannières, posters et autres supports. Avec ABBYY FineReader, vous pouvez convertir vos photos numériques en fichiers texte électroniques pour les éditer, archiver, créer de nouveau documents...
Dans quelles conditions puis-je utiliser mon appareil photo numérique pour capturer du texte ?
Un appareil photo numérique est une alternative idéale à un scanneur si vous ne voulez pas travailler avec un scanneur chaque fois que vous devez convertir un document en un fichier texte, surtout si vous ne le faites pas souvent. Les images prises avec un appareil photo numérique seront facilement ouverte par FineReader afin d´être traitées.
Si vous travaillez avec des livres, par exemple dans une bibliothèque, vous pouvez utiliser votre appareil photo numérique pour capturer du texte et des images et les traiter par la suite sur votre ordinateur. Ceci est valable pour les livres qui ne peuvent pas être scannés.
Quand vous vous déplacez en-dehors de votre bureau, vous pouvez numériser des documents importants pour ensuite les modifier, les archiver ou créer de nouveaux documents. Votre appareil photo numérique devient un scanneur portable.
Votre appareil photo peut aussi vous servir à capturer du texte en déplacement sur des bannières, des posters, des murs, des brochures d´horaire...
Enfin, n´oubliez jamais les droits d´auteur et la propriété intellectuelle lorsque vous capturez du texte ou des images.
Trucs&Astuces pour capturer du texte avec un appareil photo numérique
Il est important d´apprendre comment utiliser votre appareil photo numérique pour obtenir le meilleur résultat OCR. Chaque image est particulière par certains aspects mais ABBYY FineReader et sa technologie de reconnaissance adaptative pour les images numériques rend ces dernières compatibles avec l´OCR et l´édition dans un format texte.
Ainsi, si FineReader est installé sur votre ordinateur et si vous connaissez quelques astuces pour photographier des documents et des livres, vous obtiendrez des résultats de qualité.
Ces trucs et astuces sont les suivants:
Au niveau de votre appareil photo numérique
Utilisez un appareil photo numérique avec une résolution de 5 mégapixels ou plus équipés de préférence avec les options suivantes:
Trucs et Astuces généraux
Essayez de prendre 2 ou 3 prises du même document pour être sûr que vos mains sont immobiles et qu´une image ne soit pas floue ou qu´un bout du document ne manque pas.
Utilisez le mode "macro" ou "en gros plan" souvent indiqué par une icône de type fleur.
Positionnement de l´appareil et mise au point
Positionnez l´objectif parallèlement au plan du document.
Intégrez tout le document dans le cadre.
Centrez la prise de vue.
Utilisez le zoom de l´appareil pour bien encadrer de près le document.
Éclairage et flash
Vérifiez que l´éclairage est suffisant. Un éclairage naturel est le meilleur.
Désactivez le flash.
Si vous avez besoin du flash, essayez d´être à une distance de 50cm et recherchez une source supplémentaire de lumière.
N´utilisez pas le flash avec du papier glacé.
Autres astuces pour utilisateurs avancés
And finally, if you know your camera “inside out” and wish to improve your skills in photographing documents and books or wish to achieve good results in some special conditions, there are a few extra tips to follow:
Finalement, et si vous connaissez très bien votre appareil photo, tout en souhaitant obtenir de très bons résultats, même dans des conditions spéciales:
Utilisez la fonction "white balance". Si cette dernière est contrôlée manuellement, utilisez un morceau de papier pour la règler.
Activez la fonction anti-tremblement ou utilisez un trépied.
Dans de mauvaises conditions d´éclairage: