Translations:Addendum IV/6/es: Difference between revisions

From Wiki
No edit summary
No edit summary
 
(One intermediate revision by the same user not shown)
Line 1: Line 1:
# '''Software adecuado''': Debe ser altamente preciso, confiable y trabajar con varios idiomas.
# '''Software adecuado''': Debe ser altamente preciso, confiable y trabajar con varios idiomas.
# '''Parámetros de escaneo correctos''': Al escanear documentos, es importante establecer los parámetros correctos en la configuración del escáner. El más importante
# '''Parámetros de escaneo correctos''': Al escanear documentos, es importante establecer los parámetros correctos en la configuración del escáner. El más importante de ellos es la orientación. Asegúrese de que el documento se introduzca en el escáner en el ángulo correcto porque un escaneo torcido puede afectar seriamente la precisión del software de reconocimiento óptico de caracteres (OCR). Pruebe y modifique la configuración hasta que logre el resultado deseado.
de ellos es la orientación. Asegúrese de que el documento se introduzca en el escáner en el ángulo correcto porque un escaneo torcido puede afectar seriamente la precisión del software de reconocimiento óptico de caracteres (OCR). Pruebe y modifique la configuración hasta que logre el resultado deseado.
# '''Configuración de resolución''': La mejor resolución para un OCR preciso es de 300 ppp. Esta resolución permite que el motor de OCR funcione con el doble de puntos de referencia en comparación con 150 ppp.
# '''Configuración de resolución''': La mejor resolución para un OCR preciso es de 300 ppp. Esta resolución permite que el motor de OCR funcione con el doble de puntos de referencia en comparación con 150 ppp.
# '''Selección del modo de color''': Para documentos descoloridos o antiguos, RGB es el modo de color recomendado, pues permite que el escáner capture completamente el contenido del documento físico. Sin embargo, en general, escanear en modo de escala de grises es la mejor opción para la precisión de OCR. Aunque el modo en blanco y negro ayuda a escanear la imagen a un ritmo más rápido, esto podría afectar la calidad del reconocimiento de texto.
# '''Selección del modo de color''': Para documentos descoloridos o antiguos, RGB es el modo de color recomendado, pues permite que el escáner capture completamente el contenido del documento físico. Sin embargo, en general, escanear en modo de escala de grises es la mejor opción para la precisión de OCR. Aunque el modo en blanco y negro ayuda a escanear la imagen a un ritmo más rápido, esto podría afectar la calidad del reconocimiento de texto.
# '''Ajustes de brillo y contraste''': En relación con el brillo, ambos extremos (demasiado alto y demasiado bajo) pueden afectar negativamente la calidad y la precisión del OCR. Es por ello que el 50% es la configuración de brillo recomendada. Sin embargo, esto también depende del propio escáner, por lo que se puede esperar una fase inicial de prueba y error. En términos de contraste, generalmente se prefiere la configuración más alta.
# '''Ajustes de brillo y contraste''': En relación con el brillo, ambos extremos (demasiado alto y demasiado bajo) pueden afectar negativamente la calidad y la precisión del OCR. Es por ello que el 50% es la configuración de brillo recomendada. Sin embargo, esto también depende del propio escáner, por lo que se puede esperar una fase inicial de prueba y error. En términos de contraste, generalmente se prefiere la configuración más alta.
# '''Corrección de imagen y descontaminación''': Estos dos componentes tienen un gran impacto en la calidad del escaneo de OCR. La corrección de imágenes cubre aspectos como aumentar la resolución, aplicar correcciones de color y probar diferentes configuraciones de contraste; mientras que la descontaminación implica la eliminación de caracteres que no son de texto como iconos, imágenes que no son de texto, caracteres inusuales, etc. Ambos son importantes porque permiten que el motor de OCR “lea” el documento con mayor precisión.
# '''Corrección de imagen y descontaminación''': Estos dos componentes tienen un gran impacto en la calidad del escaneo de OCR. La corrección de imágenes cubre aspectos como aumentar la resolución, aplicar correcciones de color y probar diferentes configuraciones de contraste; mientras que la descontaminación implica la eliminación de caracteres que no son de texto como iconos, imágenes que no son de texto, caracteres inusuales, etc. Ambos son importantes porque permiten que el motor de OCR “lea” el documento con mayor precisión.
# '''Corrección manual cuidadosa''': Dependiendo de qué tan preciso desee que sea el resultado final, es posible que se requiera o no una revisión manual. Si la
# '''Corrección manual cuidadosa''': Dependiendo de qué tan preciso desee que sea el resultado final, es posible que se requiera o no una revisión manual. Si la precisión es primordial, entonces este es un paso indispensable. Básicamente, implica la verificación humana de una muestra de archivos procesados para garantizar que los caracteres escaneados se reconozcan correctamente. Es un proceso tedioso y minucioso, pero esencial en muchos casos.
precisión es primordial, entonces este es un paso indispensable. Básicamente, implica la verificación humana de una muestra de archivos procesados para garantizar que los caracteres escaneados se reconozcan correctamente. Es un proceso tedioso y minucioso, pero esencial en muchos casos.

Latest revision as of 15:32, 11 March 2024

Information about message (contribute)
This message has no documentation. If you know where or how this message is used, you can help other translators by adding documentation to this message.
Message definition (Addendum IV)
# '''Using the Right Software''': Should be highly accurate, reliable, and work with multiple languages.
# '''Using the Right Scan Parameters''': When scanning documents, it is important to set the right parameters in your scanner settings. The foremost of these is orientation. Ensure that the document is fed into the scanner at the correct angle because a skewed scan can seriously affect '''[[Special:MyLanguage/Glossary of Key Terms and Concepts#Optical Character Recognition (OCR) Software|Optical Character Recognition]]''' (OCR) software accuracy. Test and tweak the settings until you achieve the desired result.
# '''Resolution Setting''': The best resolution for accurate OCR is 300 dpi. This level of resolution enables the OCR engine to work with twice the number of reference points versus 150 dpi.
# '''Color Mode Selection''': For discolored or old documents, RGB is the recommended color mode to enable the scanner to fully capture the contents of the physical document. In general, however, scanning in grayscale mode is the best option for OCR accuracy. Although the black and white mode helps the image be scanned at a faster rate, this could affect the quality of text recognition.
# '''Brightness and Contrast Adjustments''': For brightness, both extremes—too high and too low—can negatively affect OCR quality and accuracy. For that reason, 50% is the recommended brightness setting. However, this is also dependent on the scanner itself, so an initial trial and error phase may be expected. In terms of contrast, the highest setting is usually preferred.
# '''Image Correction and Decontamination''': These two components greatly impact the quality of OCR scanning. Image correction covers aspects such as increasing the resolution, applying color corrections, and trying out different contrast settings; decontamination involves the removal of non-text characters such as icons, non-text images, unusual characters, and so on. Both are important because they enable the OCR engine to “read” the document more accurately.
# '''Careful Manual Proofreading''': Depending on how accurate you want the end result to be, manual proofreading may be required—if accuracy is paramount, this is an indispensable step. It essentially involves human verification of a sample of processed files to ensure that the scanned characters are recognized correctly. It’s a tedious and painstaking process, but essential in many cases.
  1. Software adecuado: Debe ser altamente preciso, confiable y trabajar con varios idiomas.
  2. Parámetros de escaneo correctos: Al escanear documentos, es importante establecer los parámetros correctos en la configuración del escáner. El más importante de ellos es la orientación. Asegúrese de que el documento se introduzca en el escáner en el ángulo correcto porque un escaneo torcido puede afectar seriamente la precisión del software de reconocimiento óptico de caracteres (OCR). Pruebe y modifique la configuración hasta que logre el resultado deseado.
  3. Configuración de resolución: La mejor resolución para un OCR preciso es de 300 ppp. Esta resolución permite que el motor de OCR funcione con el doble de puntos de referencia en comparación con 150 ppp.
  4. Selección del modo de color: Para documentos descoloridos o antiguos, RGB es el modo de color recomendado, pues permite que el escáner capture completamente el contenido del documento físico. Sin embargo, en general, escanear en modo de escala de grises es la mejor opción para la precisión de OCR. Aunque el modo en blanco y negro ayuda a escanear la imagen a un ritmo más rápido, esto podría afectar la calidad del reconocimiento de texto.
  5. Ajustes de brillo y contraste: En relación con el brillo, ambos extremos (demasiado alto y demasiado bajo) pueden afectar negativamente la calidad y la precisión del OCR. Es por ello que el 50% es la configuración de brillo recomendada. Sin embargo, esto también depende del propio escáner, por lo que se puede esperar una fase inicial de prueba y error. En términos de contraste, generalmente se prefiere la configuración más alta.
  6. Corrección de imagen y descontaminación: Estos dos componentes tienen un gran impacto en la calidad del escaneo de OCR. La corrección de imágenes cubre aspectos como aumentar la resolución, aplicar correcciones de color y probar diferentes configuraciones de contraste; mientras que la descontaminación implica la eliminación de caracteres que no son de texto como iconos, imágenes que no son de texto, caracteres inusuales, etc. Ambos son importantes porque permiten que el motor de OCR “lea” el documento con mayor precisión.
  7. Corrección manual cuidadosa: Dependiendo de qué tan preciso desee que sea el resultado final, es posible que se requiera o no una revisión manual. Si la precisión es primordial, entonces este es un paso indispensable. Básicamente, implica la verificación humana de una muestra de archivos procesados para garantizar que los caracteres escaneados se reconozcan correctamente. Es un proceso tedioso y minucioso, pero esencial en muchos casos.