Translations:Addendum IV/6/fr: Difference between revisions

From Wiki
No edit summary
No edit summary
 
(2 intermediate revisions by the same user not shown)
Line 1: Line 1:
1. Utilisation du bon logiciel : Il doit être très précis, fiable et fonctionner avec plusieurs langues.
# '''Utilisation du bon logiciel''' : Il doit être très précis, fiable et fonctionner avec plusieurs langues.
2. Utilisation des bons paramètres de numérisation : Lorsque vous numérisez des documents, il est important de définir les bons paramètres dans les réglages de votre scanner. Le premier de ces paramètres est l’orientation. Assurez-vous que le document est placé correctement dans le scanner, en veillant à ce qu’il soit aligné avec précision, car une numérisation inclinée peut sérieusement affecter la précision du logiciel de reconnaissance optique de caractères (OCR). Testez et modifiez les paramètres jusqu’à obtenir le résultat souhaité.
# '''Utilisation des bons paramètres de numérisation''' : Lorsque vous numérisez des documents, il est important de définir les bons paramètres dans les réglages de votre scanner. Le premier de ces paramètres est l’orientation. Assurez-vous que le document est placé correctement dans le scanner, en veillant à ce qu’il soit aligné avec précision, car une numérisation inclinée peut sérieusement affecter la précision du logiciel de reconnaissance optique de caractères (OCR). Testez et modifiez les paramètres jusqu’à obtenir le résultat souhaité.
3. Réglage de la résolution : La meilleure résolution pour une OCR précise est de 300 PPP. Ce niveau de résolution permet au moteur d’OCR de travailler avec le double de points de référence par rapport à une résolution de 150 PPP.
# '''Réglage de la résolution''' : La meilleure résolution pour une OCR précise est de 300 PPP. Ce niveau de résolution permet au moteur d’OCR de travailler avec le double de points de référence par rapport à une résolution de 150 PPP.
4. Sélection du mode de couleur : Pour les documents défraîchis ou anciens, il est recommandé d’utiliser le mode couleur RVB afin de permettre au scanner de capturer intégralement le contenu du document physique. En général,
# '''Sélection du mode de couleur''' : Pour les documents défraîchis ou anciens, il est recommandé d’utiliser le mode couleur RVB afin de permettre au scanner de capturer intégralement le contenu du document physique. En général, cependant, la numérisation en mode niveaux de gris est la meilleure option pour la précision de l’OCR. Bien que le mode noir et blanc permette de numériser l’image plus rapidement, cela pourrait affecter la qualité de la reconnaissance de texte.
cependant, la numérisation en mode niveaux de gris est la meilleure option pour la précision de l’OCR. Bien que le mode noir et blanc permette de numériser l’image plus rapidement, cela pourrait affecter la qualité de la reconnaissance de texte.
# '''Réglages de la luminosité et du contraste''' : En ce qui concerne la luminosité, les deux extrêmes, trop élevée ou trop faible, peuvent négativement affecter la qualité et la précision de l’OCR. Pour cette raison, il est recommandé de régler la luminosité à 50 %. Néanmoins, cela dépend aussi du scanner lui-même et il faut donc s’attendre à une phase initiale d’essais et d’erreurs. En termes de contraste, le réglage le plus élevé est généralement préférable.
5. Réglages de la luminosité et du contraste : En ce qui concerne la luminosité, les deux extrêmes, trop élevée ou trop faible, peuvent négativement affecter la qualité et la précision de l’OCR. Pour cette raison, il est recommandé de régler la
# '''Correction de l’image et décontamination''' : Ces deux paramètres ont un impact considérable sur la qualité de la numérisation OCR. La correction d’image englobe des aspects tels que l’augmentation de la résolution, l’application de corrections de couleur et l’essai de différents réglages de contraste. La décontamination, quant à elle, implique la suppression de caractères non textuels tels que des icônes, des images non textuelles, des caractères inhabituels, etc. Ces deux aspects sont importants car ils permettent au logiciel d’OCR de « lire » le document avec plus de précision.
luminosité à 50 %. Néanmoins, cela dépend aussi du scanner lui-même et il faut donc s’attendre à une phase initiale d’essais et d’erreurs. En termes de contraste, le réglage le plus élevé est généralement préférable.
# '''Une relecture manuelle minutieuse''' : Selon le niveau de précision que vous souhaitez obtenir, une relecture manuelle peut être nécessaire. Si la précision est primordiale, cette étape est indispensable. Elle consiste essentiellement en une vérification humaine d’un échantillon de fichiers traités afin de s’assurer que les caractères numérisés sont correctement reconnus. C’est un processus fastidieux et minutieux, mais essentiel dans de nombreux cas.
6. Correction de l’image et décontamination : Ces deux paramètres ont un impact considérable sur la qualité de la numérisation OCR. La correction d’image englobe des aspects tels que l’augmentation de la résolution, l’application de corrections de couleur et l’essai de différents réglages de contraste. La décontamination, quant à elle, implique la suppression de caractères non textuels tels que des icônes, des images non textuelles, des caractères
inhabituels, etc. Ces deux aspects sont importants car ils permettent au logiciel d’OCR de « lire » le document avec plus de précision.
7. Une relecture manuelle minutieuse : Selon le niveau de précision que vous souhaitez obtenir, une relecture manuelle peut être nécessaire. Si la précision est primordiale, cette étape est indispensable. Elle consiste essentiellement en une vérification humaine d’un échantillon de fichiers traités afin de s’assurer que les caractères numérisés sont correctement reconnus. C’est un processus fastidieux et minutieux, mais essentiel dans de nombreux cas.

Latest revision as of 15:27, 11 March 2024

Information about message (contribute)
This message has no documentation. If you know where or how this message is used, you can help other translators by adding documentation to this message.
Message definition (Addendum IV)
# '''Using the Right Software''': Should be highly accurate, reliable, and work with multiple languages.
# '''Using the Right Scan Parameters''': When scanning documents, it is important to set the right parameters in your scanner settings. The foremost of these is orientation. Ensure that the document is fed into the scanner at the correct angle because a skewed scan can seriously affect '''[[Special:MyLanguage/Glossary of Key Terms and Concepts#Optical Character Recognition (OCR) Software|Optical Character Recognition]]''' (OCR) software accuracy. Test and tweak the settings until you achieve the desired result.
# '''Resolution Setting''': The best resolution for accurate OCR is 300 dpi. This level of resolution enables the OCR engine to work with twice the number of reference points versus 150 dpi.
# '''Color Mode Selection''': For discolored or old documents, RGB is the recommended color mode to enable the scanner to fully capture the contents of the physical document. In general, however, scanning in grayscale mode is the best option for OCR accuracy. Although the black and white mode helps the image be scanned at a faster rate, this could affect the quality of text recognition.
# '''Brightness and Contrast Adjustments''': For brightness, both extremes—too high and too low—can negatively affect OCR quality and accuracy. For that reason, 50% is the recommended brightness setting. However, this is also dependent on the scanner itself, so an initial trial and error phase may be expected. In terms of contrast, the highest setting is usually preferred.
# '''Image Correction and Decontamination''': These two components greatly impact the quality of OCR scanning. Image correction covers aspects such as increasing the resolution, applying color corrections, and trying out different contrast settings; decontamination involves the removal of non-text characters such as icons, non-text images, unusual characters, and so on. Both are important because they enable the OCR engine to “read” the document more accurately.
# '''Careful Manual Proofreading''': Depending on how accurate you want the end result to be, manual proofreading may be required—if accuracy is paramount, this is an indispensable step. It essentially involves human verification of a sample of processed files to ensure that the scanned characters are recognized correctly. It’s a tedious and painstaking process, but essential in many cases.
  1. Utilisation du bon logiciel : Il doit être très précis, fiable et fonctionner avec plusieurs langues.
  2. Utilisation des bons paramètres de numérisation : Lorsque vous numérisez des documents, il est important de définir les bons paramètres dans les réglages de votre scanner. Le premier de ces paramètres est l’orientation. Assurez-vous que le document est placé correctement dans le scanner, en veillant à ce qu’il soit aligné avec précision, car une numérisation inclinée peut sérieusement affecter la précision du logiciel de reconnaissance optique de caractères (OCR). Testez et modifiez les paramètres jusqu’à obtenir le résultat souhaité.
  3. Réglage de la résolution : La meilleure résolution pour une OCR précise est de 300 PPP. Ce niveau de résolution permet au moteur d’OCR de travailler avec le double de points de référence par rapport à une résolution de 150 PPP.
  4. Sélection du mode de couleur : Pour les documents défraîchis ou anciens, il est recommandé d’utiliser le mode couleur RVB afin de permettre au scanner de capturer intégralement le contenu du document physique. En général, cependant, la numérisation en mode niveaux de gris est la meilleure option pour la précision de l’OCR. Bien que le mode noir et blanc permette de numériser l’image plus rapidement, cela pourrait affecter la qualité de la reconnaissance de texte.
  5. Réglages de la luminosité et du contraste : En ce qui concerne la luminosité, les deux extrêmes, trop élevée ou trop faible, peuvent négativement affecter la qualité et la précision de l’OCR. Pour cette raison, il est recommandé de régler la luminosité à 50 %. Néanmoins, cela dépend aussi du scanner lui-même et il faut donc s’attendre à une phase initiale d’essais et d’erreurs. En termes de contraste, le réglage le plus élevé est généralement préférable.
  6. Correction de l’image et décontamination : Ces deux paramètres ont un impact considérable sur la qualité de la numérisation OCR. La correction d’image englobe des aspects tels que l’augmentation de la résolution, l’application de corrections de couleur et l’essai de différents réglages de contraste. La décontamination, quant à elle, implique la suppression de caractères non textuels tels que des icônes, des images non textuelles, des caractères inhabituels, etc. Ces deux aspects sont importants car ils permettent au logiciel d’OCR de « lire » le document avec plus de précision.
  7. Une relecture manuelle minutieuse : Selon le niveau de précision que vous souhaitez obtenir, une relecture manuelle peut être nécessaire. Si la précision est primordiale, cette étape est indispensable. Elle consiste essentiellement en une vérification humaine d’un échantillon de fichiers traités afin de s’assurer que les caractères numérisés sont correctement reconnus. C’est un processus fastidieux et minutieux, mais essentiel dans de nombreux cas.