Digitalización, preparación digital e inserción

From Wiki
Revision as of 21:16, 18 March 2024 by DEV (talk | contribs)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Introducción

Ahora que hemos completado la etapa de planificación y organización y salimos al otro lado de manera segura, armados con el plan general, la tabla de la estructura del archivo, las descripciones del material y una decisión sobre el software y los medios de almacenamiento para el sistema de archivo digital, estamos preparados para la siguiente etapa. Aquí es donde ocurre la verdadera magia: la creación de nuestro archivo digital.

Junto con esta gran promesa que trae, esta etapa es también la más dinámica y compleja, así como la más exigente en recursos, experiencia y tecnología para la organización.

Nuestro objetivo en esta etapa es procesar y preparar todo el material seleccionado, tanto físico como nacido-digital, y prepararlo para la preservación digital. Esto significa que al final de esta etapa tendremos el material preparado, con respecto a todos los requisitos técnicos y de archivo necesarios, para transferirlo a nuestro sistema de archivo digital recién seleccionado. Esto incluye una serie de acciones que utilizan software y otras herramientas tecnológicas que deben aplicarse a nuestro material de origen seleccionado para poder archivarlo adecuadamente y preservarlo a largo plazo.

Además, si estamos trabajando para preservar digitalmente el material de origen que es en parte o en su totalidad físico, entonces esta etapa incluye un paso previo importante: la digitalización.

Digitalización

A través del proceso de digitalización, creamos copias digitales o “sustitutos” de los elementos físicos originales. Estas copias luego se procesan como objetos de archivo digital, se conservan y se hacen accesibles. Por lo tanto, nos centraremos en su preservación en lugar de los elementos físicos originales. Consulte el Anexo II para más información.

Hay diferentes tipos de objetos físicos que podríamos querer digitalizar y que podrían almacenarse en una variedad de medios. Pueden incluir texto, fotografías, dibujos, mapas, video, audio y otros tipos de contenido, almacenados en papel, casetes de audio, cinta de 16 mm o cualquier otro medio de almacenamiento físico o analógico.


También podrían incluir objetos como prendas de vestir, pancartas, efectos personales, etc.

Claramente, el tipo de material que necesitamos digitalizar definirá las decisiones importantes y específicas que se tomarán en el proceso, y cada organización las tomará de acuerdo con sus objetivos y capacidades. Sin embargo, también hay elementos generales del proceso que deben abordarse en todos los proyectos de digitalización. Este capítulo describe aquellos elementos de digitalización que son pertinentes para el proceso independientemente del tipo, contenido o medio de almacenamiento del material.

Noticias de última hora: La internalización puede costar más que la externalización.
Si las capacidades de la organización no son suficientes para los requisitos del proceso de digitalización, se debe considerar la decisión de subcontratar el proyecto. Esto puede determinar el éxito o el fracaso del programa. Iniciar la digitalización con preparación, capacidades y recursos inadecuados podría producir más daños que resultados, con poco o ningún valor a largo plazo. Por otro lado, una opción de externalización de calidad garantizada, bien planificada y ejecutada podría ahorrar una cantidad considerable de tiempo y esfuerzo. De este modo, internalizar la digitalización, con los diferentes costos que implica, puede costar más a la organización que externalizar el trabajo.

La digitalización es un proyecto de archivo importante y exigente en sí mismo, y requiere la debida atención, una planificación cuidadosa y una implementación dedicada. Dado que consideramos la digitalización como parte de un proceso más amplio de creación de un archivo digital, ya hemos discutido algunos de los problemas involucrados, principalmente en relación con las primeras etapas del proceso. Una descripción general del proceso de digitalización se muestra en la Figura 9a y 9b.

Figura 9a. Resumen de etapas y acciones en el proceso de digitalización
1. Planificación

Generales: por ejemplo, objetivo, resultados, marco de tiempo o recursos.

Logística y organizativa: por ejemplo, flujo de trabajo,

recursos, condiciones y espacio requerido.

Requisitos archivísticos y tecnológicos:

y denominación de sustitutos digitales,

equipos y metadatos.

Planificación para la preservación de elementos

físicos originales.

2. Preparación del material

Creación de inventario de material físico.

Revisión de material y selección de material

para digitalización.

Descripción del material.

Preparación de elementos físicos para la digitalización.

Figura 9b. Resumen de etapas y acciones en el proceso de digitalización
3. Elaboración de elementos archivísticos y tecnológicos del proceso

Definición de requisitos de digitalización

para sustitutos digitales: nombres de archivos,

selección de formato(s), estándar de calidad, colección de metadatos.

Obtención e instalación de equipos de digitalización,

software y soportes de almacenamiento.

Configuración de equipos para cumplir con los requisitos de digitalización,

pruebas y ajustes.

4. Implementación
  • Preparación de material.
  • Programación de procesos.
  • Digitalización
  • Control de calidad.
  • Post-procesamiento y OCR.
  • Almacenamiento y respaldo.

En los capítulos anteriores analizamos el desarrollo de un plan general, la creación de un inventario, así como la selección y descripción del material, que también son los primeros pasos del proceso de digitalización. Por lo tanto, habiendo cubierto ya los dos primeros, podemos retomar el proceso de digitalización al comienzo de la tercera etapa, con la preparación de los elementos archivísticos y tecnológicos del proceso.

Noticias de última hora: La digitalización se puede realizar a pequeña escala y con un presupuesto modesto.
Los proyectos de digitalización a pequeña escala deben ajustarse para adaptarse a capacidades y recursos modestos. Generalmente, eso significa que puede haber solo una o dos personas encargadas de realizar todos los pasos del proceso de digitalización, en una computadora y con recursos limitados. El proceso es ciertamente menos eficiente, menos confiable y más lento en esas condiciones, pero es factible y, en caso de que no haya otras opciones disponibles, es muy recomendable. Cualquier trabajo de digitalización que se pueda realizar puede ser muy importante, especialmente si el material es frágil y propenso al deterioro.

Especificación de una convención de nomenclatura para archivos digitalizados

El nombre de un archivo digital destinado a ser archivado y preservado no es solo un nombre. También es un descriptor muy importante de ese elemento en particular, que debe contener información que nos permita identificar qué es el elemento y qué contiene, así podremos ubicarlo en el archivo, administrarlo y preservarlo adecuadamente. Por lo tanto, un elemento importante de las especificaciones para el proceso de digitalización es el desarrollo y la aplicación de un conjunto consistente de reglas, la llamada “convención de nomenclatura”, para nombrar los sustitutos digitales que creemos a partir de elementos físicos.

No existen reglas universales para la denominación de archivos y cada organización debe desarrollar su propia convención de nomenclatura que mejor se adapte a sus necesidades. Sin embargo, el nombre de un sustituto digital siempre debe proporcionar una referencia, una conexión entre él y el elemento físico a partir del cual se creó mediante la digitalización. En principio, un nombre de archivo debe contener varios componentes que lo identifiquen como, por ejemplo, su número de identificación único, fecha de creación o una referencia a su contenido, o serie, subserie o carpeta de la que forma parte.

También debemos tener en cuenta que estos nombres de archivo deben ser procesados y entendidos principalmente por el software que usaremos para administrar nuestro archivo digital. Por lo tanto, nuestra principal preocupación al nombrar archivos es aplicar una convención que permita a nuestro sistema de archivo digital identificar correctamente el archivo y utilizar la información contenida en él. Sin embargo, muchos consideran que es una buena práctica incluir también un componente descriptivo en el nombre de un archivo, uno que también pueda ser entendido por humanos, por ejemplo, una referencia a su título o contenido.

Si bien, como se mencionó, no existen instrucciones estrictas para el desarrollo de una convención de nomenclatura, aún podemos identificar algunas recomendaciones básicas, algunas de las cuales se indican en la Figura 10.

Figura 10. Recomendaciones para una convención de nomenclatura de archivos
General Identifiers Standards
Utilizar una cantidad razonable de componentes para un nombre de archivo.

Los nombres deben ser lo más cortos posible, por lo que es recomendable utilizar abreviaturas.

Ser consistente en la aplicación de la convención de nomenclatura de archivos y no permitir excepciones.

Incluir identificadores clave como componentes de un nombre de archivo

(es decir, el número de identificación de del artículo).

Incluya componentes descriptivos como la fecha título o referencia a su contenido.

Utiliza sólo el alfabeto inglés

letras (a-z), números (0-9), guión (-) y guión bajo (_).

Las fechas deben introducirse en el formato estándar ISO (es decir, aaaa-dd-mm).

Especificación de formatos y calidad de archivo

Además del nombre de archivo de un sustituto digital, también se debe especificar su formato digital y el estándar de calidad con el que se digitalizará antes de que el proceso pueda comenzar en serio.

Dado que el mismo tipo de archivos, como documentos, fotografías o videos, se pueden almacenar en diferentes formatos digitales, debemos especificar qué formatos usaremos para los sustitutos digitales creados a partir de nuestros elementos físicos.

Puesto que estamos digitalizando material con el propósito de preservarlo a largo plazo, es importante que seleccionemos formatos que permitan su correcta visualización y uso en el futuro por nuevas generaciones de software. Para evitar que nuestros archivos digitalizados se vuelvan obsoletos, debemos elegir formatos que sean robustos y resistentes al cambio con el tiempo.

Esto significa que debemos buscar formatos que cumplan con los estándares necesarios, que estén bien establecidos y ampliamente utilizados, con comentarios sustanciales y positivos de los usuarios. Los formatos que seleccionemos también deben permitirnos agregar información y metadatos a los archivos y deberían tener un soporte estable, ya sea comercialmente o a través de una comunidad de código abierto.

Claramente, consideraremos diferentes conjuntos de formatos según el tipo de elementos que estemos digitalizando: documentos, fotografías, videos, etc. El alcance de las opciones de formato puede ser abrumador y no existe una solución ideal universal para cada tipo de contenido digitalizado. La selección, nuevamente, depende de las necesidades y circunstancias específicas del archivo. No obstante, existen formatos que han demostrado un alto nivel de robustez y resiliencia al cambio. La Figura 11 proporciona una descripción general de dichos formatos para los tipos de elementos físicos digitalizados con mayor frecuencia: documentos, imágenes, audio y video.

Figura 11. Descripción general de formatos digitales robustos para la digitalización de diferentes tipos de elementos físicos.
Tipo de elemento físico Formato de archivo digital robusto
Documentos PDF
Fotografías RAW or TIF
Diapositivas y negativos RAW or TIF
Audio WAV
Video MP4

Especificación de estándares de calidad para archivos digitalizados

Un elemento importante de las especificaciones que debemos hacer para el proceso de digitalización es el estándar de calidad con el que queremos y necesitamos digitalizar nuestros elementos físicos. Esto generalmente se conoce como la “resolución” de un documento, fotografía o video digitalizado. Una resolución más alta de un sustituto digital brindará una mejor experiencia de usuario, posibilidades más amplias para su uso y, en general, una mejor copia que un archivo de resolución más baja. Sin embargo, una resolución más alta también significa que el sustituto digital tendrá un tamaño digital más grande y ocupará más espacio en nuestros medios de almacenamiento.

Imagen compartida por FAMDEGUA, organización socia de GIJTR en Guatemala.

Por lo tanto, al especificar la resolución de los sustitutos digitales que crearemos, debemos sopesar los requisitos de su estándar de calidad, con la demanda que genera en términos de espacio de almacenamiento digital para nuestro archivo.

Como organizaciones de derechos humanos que trabajamos con material único e invaluable, podemos caer fácilmente en la tentación de digitalizar todo nuestro material en la resolución más alta posible, para garantizar la mejor calidad posible de los sustitutos digitales. Sin embargo, esto no sería factible ni sostenible, ya que crearía inmensas dificultades en el almacenamiento, pero también en el procesamiento y conservación de dichos archivos a largo plazo. Por lo tanto, las organizaciones necesitan hacer especificaciones de calidad de digitalización en línea con sus objetivos y capacidades. Como guía, la Tabla 12 proporciona una descripción general de lo que a menudo se considera niveles de calidad de resolución mínimos y óptimos para la digitalización de diferentes tipos de elementos físicos.

Figura 12. Descripción general de los niveles de calidad de resolución mínimos y óptimos para la digitalización de diferentes tipos de elementos físicos.
Tipo de elemento Calidad mínima Calidad óptima
Documentos 300 DPI 600 DPI
Fotografías 600 DPI 1,200+ DPI
Diapositivas y negativos 1,200 DPI 2,400+ DPI
Audio 16-bits and 44.1 KHz 24-bits and 96 KHz
video 1080P o 2 megapíxeles 2K+ o 4 megapíxeles

Metadatos: Descripción de archivos digitalizados

En la sección que trata sobre la planificación y organización de un archivo digital, discutimos el importante proceso de describir el material de archivo en varios de sus atributos relevantes y crear una conexión entre esas descripciones y el material, registrándolos en una tabla. Esto es necesario ya que nos permite buscar, ubicar e identificar elementos y grupos de elementos en función de esas descripciones, así como administrar, preservar y utilizar adecuadamente el material de archivo. El mismo principio se aplica a los sustitutos digitales.

Después de la digitalización, son los archivos digitales que creamos a partir de los originales físicos los que se convertirán en elementos de nuestro archivo digital. Por lo tanto, también deben describirse y tener sus descripciones adjuntas, para que luego se puedan encontrar, acceder y preservar.

Estas descripciones vinculadas de elementos de archivo se conocen como “metadatos” o datos sobre los datos.

En el proceso de digitalización, es fundamental que se recopilen metadatos pertinentes y se adjunten a los sustitutos digitales que creamos. Esto se debe a que un sustituto digital, sin sus metadatos adjuntos, se vuelve insignificante e inutilizable, ya que es posible que no podamos encontrarlo o identificarlo, entender qué es, su contexto, historia, creador o a dónde pertenece en el archivo.

La mayoría de los metadatos que necesitamos conservar se vinculan a los archivos digitales que describen y se crean y capturan mediante herramientas informáticas que utilizamos para digitalizar, gestionar y archivar los datos. Esto incluye metadatos básicos (por ejemplo, fecha de creación/digitalización), así como tipos de metadatos muy técnicos, como los relativos a la validez o integridad de los archivos digitales. Por lo tanto, las herramientas informáticas pueden permitirnos capturar los metadatos. Las soluciones técnicas concretas en relación con los distintos tipos de metadatos que se capturan y conservan se tratan más adelante en el manual. Nuestra principal preocupación aquí es seleccionar qué tipos de metadatos queremos y necesitamos registrar y conservar en nuestros archivos digitales.

En comparación con los originales físicos, los sustitutos digitales requieren y permiten recopilar una amplia gama de metadatos adicionales. Esto incluye metadatos como las especificaciones técnicas de un archivo, así como información sobre su creación y cualquier otra acción digital realizada sobre él. Para las OSC que trabajan con material de derechos humanos, estos metadatos técnicos son importantes para la preservación, pero también para mantener la credibilidad de un sustituto digital y establecer la cadena de custodia.

Existe una amplia variedad de tipos de metadatos que se pueden recopilar sobre sustitutos digitales tanto durante como después del proceso de digitalización. Los tipos más comunes, en función de su propósito y función, se resumen en la Figura 13.

Figura 13. Tipos de metadatos
Descriptive & Structural Admin & Preservation Technical
Metadatos descriptivos: resumen o brinda detalles sobre un registro digital y su contenido para que sea más fácil encontrarlo en una búsqueda.

Metadatos estructurales: proporcionan información sobre la estructura interna de un archivo digital, incluyen información como página, sección o índice para ayudar a los dispositivos con la navegación y la visualización

Metadatos administrativos: se refieren a la información sobre la gestión de un registro digital, como quién lo creó, a quién se le permite acceder o qué problemas de derechos están asociados con él.

Metadatos de preservación: ayudan a los archivistas y otros especialistas en preservación digital a abrir y utilizar registros digitales en el futuro que sea necesario. Pueden incluir información sobre qué software o hardware se necesita para abrir y usar un archivo digital.

Metadatos técnicos: en lugar de crearse con fines de archivo, los metadatos técnicos a menudo se capturan automáticamente a través del software o hardware utilizado para crear un registro digital. Por ejemplo, las fotos tomadas con una cámara digital capturan automáticamente información sobre la imagen e incrustan esta información en el propio archivo.

La selección de los metadatos para cualquier proyecto de digitalización dependerá de su contexto y circunstancias: los recursos y capacidades de la organización, el tipo de material, las aplicaciones previstas, los tipos de acceso y las necesidades de los usuarios, entre otros.

Los estándares de metadatos existentes y los perfiles y conjuntos de metadatos específicos, probados y ampliamente utilizados, brindan orientación a través del laberinto de numerosos tipos y formatos de metadatos. Sin embargo, ahora hay tantos estándares y conjuntos de metadatos diferentes desarrollados y propuestos por diferentes organizaciones, que su número en sí mismo crea un obstáculo para identificar aquellos que queremos y necesitamos usar.

Un buen punto de partida es el llamado “Conjunto de elementos de metadatos de Dublin Core”. Dublin Core es un conjunto de 15 propiedades o elementos muy utilizado para describir archivos digitales. Estos elementos a menudo se consideran un conjunto estándar de metadatos que se aplican casi independientemente del tipo de material de archivo, el tema del archivo o el tipo de software utilizado en el sistema de archivo digital. Además, con fines de conservación, el llamado estándar de metadatos PREMIS proporciona una referencia y una guía útiles (PREMIS: Actividad de mantenimiento de metadatos de preservación (Biblioteca del Congreso)).

Cualquiera que sea el conjunto de metadatos que seleccionemos para nuestra colección, hay otro conjunto de decisiones que debemos tomar sobre ellos para completar 7sus especificaciones de digitalización. Estos incluyen preguntas como: ¿dónde se almacenarán los metadatos? ¿Cómo se obtendrán y cuándo?

Tomar decisiones consideradas relacionadas con estas preguntas antes del procesamiento de digitalización nos proporcionará un plan para la recopilación y estructuración estandarizada y consistente de metadatos a lo largo del proceso de digitalización. Esto es importante para que los metadatos sean “interoperables”, es decir, que estén estructurados y formateados de manera que permitan su lectura y uso en diferentes sistemas informáticos.

Hacer que los metadatos sean interoperables nos ahorrará mucho tiempo y recursos (así como dolores de cabeza) más adelante en el proceso, sobre todo en el siguiente paso, cuando necesitemos insertarlos y hacerlos operables junto con los archivos sustitutos digitales a los que estén vinculados en nuestro sistema de archivo digital. Estos problemas relacionados con el procesamiento de archivos digitales y sus metadatos se analizarán con más detalle en la siguiente sección, cuando veamos cómo nuestro material completo, tanto digitalizado como creado de manera digital, debe prepararse para incorporarlo a nuestro sistema de archivo digital.

Selección, configuración y prueba de equipos: software, hardware y medios de almacenamiento

Este manual no puede proporcionar recomendaciones sobre equipos de digitalización, software y medios de almacenamiento específicos, o cómo se deben configurar y optimizar. Dicho asesoramiento sería necesariamente demasiado genérico para los requisitos de cualquier proyecto concreto, y probablemente también se volvería obsoleto pronto.

Imagen compartida por CONAVIGUA, organización socia de GIJTR en Guatemala.

Sin embargo, debemos mencionar tres elementos que deben guiar nuestras decisiones en la selección de la tecnología que utilizamos para la digitalización: características del material, capacidades y recursos de la organización, y necesidades y requisitos del archivo.

En primer lugar, el equipo que seleccionemos, y cómo se configurará y ajustará, dependerá del material que estemos digitalizando: tipo, formato, estado de conservación, tamaño o longitud de los originales y cantidad. El material frágil, por ejemplo, requerirá un equipo y una configuración más refinados y sensibles, mientras que una gran cantidad de material requerirá una solución que permita su procesamiento rápido.

Además, nuestras decisiones serán condicionadas por los recursos que tenemos en términos de tiempo, experiencia, personal, espacio y finanzas. Cada uno de estos aspectos marcará los límites de lo que puede ser una solución factible para nuestro proyecto.

Noticias de última hora: Los equipos más caros pueden reducir los costos generales de digitalización
Debemos tener en cuenta que, aunque la digitalización se puede realizar con una gama diferente de presupuestos, es importante considerar los costos totales del proyecto, en lugar de los costos únicos por separado, como el costo de un equipo. Los costos totales del proyecto deben incluir los salarios del personal, el equipo, el tiempo, etc. Un equipo más costoso que procese los artículos más rápidamente, por ejemplo, podría ahorrarnos mucho más de lo que cuesta si también calculamos el tiempo y los salarios del personal.

Finalmente, y lo más importante, las necesidades de nuestro archivo y sus futuros usuarios, así como los modos de uso planificado de los materiales que estamos digitalizando deberían definir los requisitos mínimos y óptimos del equipo.

Para hardware y software, independientemente del tipo de material (documentos, fotografías, video u otros), los requisitos serán proporcionar sustitutos digitales de la calidad deseada en formatos adecuados y capturar los metadatos seleccionados. En términos de medios de almacenamiento, los aspectos más importantes a considerar son su confiabilidad (su resistencia a la pérdida de datos), durabilidad (su usabilidad durante un período de tiempo más largo) y escalabilidad (potencial para expandir el espacio de almacenamiento de datos según sea necesario).

Una vez que hayamos seleccionado y obtenido nuestro equipo, debemos instalarlo y configurarlo correctamente de acuerdo con nuestros requisitos de digitalización. Este proceso es importante y debe realizarse correctamente, de lo contrario, incluso el equipo adecuado no producirá los resultados requeridos. Por lo tanto, si una organización no tiene experiencia interna, sería aconsejable la asistencia externa.

Esto resulta especialmente cierto porque la instalación y la puesta a punto no son actividades que se hagan una vez. Más bien, es un proceso que requiere pruebas repetidas y cambios iterativos antes de lograr el resultado requerido. El proceso de prueba debe incluir una muestra de diferentes grupos de materiales y debe involucrar todo el proceso de digitalización de un elemento, es decir, el flujo de trabajo de digitalización.

Imagen compartida por CONAVIGUA, organización socia de GIJTR en Guatemala.


Implementación: flujo de trabajo de digitalización

La etapa final de la digitalización es la implementación de todos los diferentes elementos que hemos ido planificando, decidiendo e ideando en las etapas anteriores. La digitalización es un proceso complejo, pero si todas sus partes y funciones se planifican y diseñan bien y con antelación, su implementación será más ágil y fructífera.

Es por eso que, al juntar todos los elementos, debemos desarrollar un flujo de trabajo detallado, que incluya todas sus acciones y operaciones, desde la revisión y preparación de los elementos físicos y el espacio de trabajo, hasta la finalización mediante el almacenamiento de los sustitutos digitales creados y la creación de copias de seguridad.

Cada proyecto de digitalización tendrá su flujo de trabajo único y su secuencia específica de acciones y operaciones de digitalización. Además, algunas actividades como, por ejemplo, el control de calidad, se repetirán en distintas etapas del proceso, mientras que otras se ejecutarán de forma simultánea o en paralelo. Aunque las acciones específicas y su secuencia se adaptan a cada proyecto concreto, podemos identificar los elementos clave necesarios en cualquier flujo de trabajo de digitalización: preparativos, programación de procesos, digitalización, control de calidad, postprocesamiento, almacenamiento y copia de seguridad.

Preparación de material, protocolos y espacio de trabajo

El proceso de digitalización realmente comienza al garantizar un espacio de trabajo limpio y apropiado, que permita suficiente espacio para trabajar con materiales físicos, así como con el equipo de digitalización y una computadora. Suponiendo que cualquier material frágil o comprometido se descartó en forma previa, podemos proceder a limpiar nuestro material físico y eliminar cualquier elemento agregado, como sujetapapeles o grapas en los documentos.

La información y las especificaciones de digitalización pertinentes sobre el nombre del archivo, la resolución del archivo, el formato y cualquier metadato que se registre deben estar disponibles y bien organizadas.

Programación de procesos

Como parte del flujo de trabajo, es esencial programar claramente todo el proceso, es decir, determinar, documentar y luego aplicar estrictamente una secuencia exacta de operaciones durante el proceso de digitalización. La programación debe incluir un margen de tiempo para imprevistos.

¡ALERTA DE RECURSOS!
Se proporcionan excelentes ejemplos de flujos de trabajo de digitalización y programación para organizaciones que se ocupan de la preservación del material de patrimonio cultural en las “Directrices técnicas para la digitalización de materiales de patrimonio cultural” emitidas por la Iniciativa de Directrices Digitales de las Agencias Federales de EE. UU.

Proceso de digitalización

El proceso de digitalización en sí será claramente muy diferente dependiendo del tipo, volumen, contenido y otras características del material. Los documentos en papel y las fotografías se pueden escanear razonablemente rápido, mientras que el audio y el video analógicos deberán digitalizarse en tiempo real. Las obras de arte y los documentos históricos requerirán una configuración de especificaciones de escaneo diferente a un documento administrativo.

Independientemente de las diferencias, una buena práctica al comienzo de cada sesión de digitalización es digitalizar un elemento de referencia (documento, fotografía, muestra breve de audio o video) y comparar el resultado con respecto a las especificaciones, como una forma de control de calidad ad-hoc. En caso de discrepancia con las especificaciones de digitalización, se puede verificar el equipo y ajustar su configuración. Esto ayudará a evitar el desperdicio de sesiones enteras de trabajo debido a problemas con el equipo o la configuración.

Posprocesamiento

El procesamiento posterior a la digitalización de sustitutos digitales incluye implementar ligeras correcciones a un archivo para ajustarlo a un determinado estándar o a una especificación de proyecto particular. Esto podría incluir acciones como aumentar la nitidez del sonido en un archivo de video o el brillo de una imagen en un documento.

El procesamiento posterior a veces también puede incluir la creación de copias secundarias, derivadas del archivo. Estos se crean para fines específicos, como proporcionar acceso o producir reproducciones de alta calidad, así como para crear documentos que permitan búsquedas completas a partir de archivos de imágenes originalmente no aptos para búsquedas mediante la aplicación de software de reconocimiento óptico de texto OCR (por su sigla en inglés). En esencia, al ejecutar un software de OCR en nuestra imagen escaneada de un documento, agregamos una capa de texto a ese archivo de imagen para que otro software pueda leerlo, lo cual permite que el documento sea apto para búsquedas. Esto es esencial para lograr que los archivos de derechos humanos sean más accesibles y visibles, lo cual suele ser un objetivo clave de su digitalización. Dada la importancia de la aplicación de la tecnología de OCR para la creación de archivos de texto con capacidad de búsqueda completa a partir de nuestros archivos de imagen sustitutos digitales, en el Anexo IV proporcionamos un conjunto de recomendaciones para su uso.

Revisión de calidad

dos elementos para el control de calidad de la digitalización y ambos pueden y deben implementarse en múltiples puntos de la programación del proceso, es decir, tanto durante como después de la digitalización, así como a intervalos regulares durante el transcurso del proyecto. El primer elemento se relaciona con garantizar que todos los elementos físicos destinados a la digitalización hayan sido digitalizados. Esto se puede hacer automáticamente, comparando los dos conjuntos de datos de elementos físicos y sus sustitutos. Sin embargo, también debe realizarse una verificación manual de muestra para garantizar que los sustitutos digitales se correspondan correctamente con sus originales físicos.

El segundo elemento de la revisión de calidad es garantizar que se hayan cumplido todas las especificaciones de digitalización: que los sustitutos digitales se creen en el formato y la calidad correctos, con los nombres de archivo correctos y que se hayan capturado los metadatos seleccionados. Aquí, nuevamente, necesitaremos emplear una combinación de revisión de calidad manual y automatizada, la cual se encuentra en herramientas y aplicaciones de software como “JHOVE».

Almacenamiento de productos digitalizados

Imagen compartida por ASOMOVIDINQ, organización socia de GIJTR en Guatemala.

Al final del proceso, necesitamos almacenar temporalmente los productos de la digitalización en uno o más medios de almacenamiento hasta que se preparen y se incorporen a un sistema de archivo digital. El resultado final del proceso debe ser uno o más sustitutos digitales del original, que a menudo se denominan “archivos maestros”. Estos se almacenan en una estructura de directorio de archivos creada para este propósito.

Los archivos maestros son los archivos de mejor calidad que producimos a través de la digitalización. Están destinados a conservarse a largo plazo sin pérdida de ninguna característica esencial. La cantidad de archivos maestros que crearemos dependerá del contenido de los originales y los usos previstos del sustituto digital.

Además de los archivos maestros, podemos producir una serie de archivos secundarios, a menudo llamados “archivos de acceso” o “de servicio”. Estos archivos se crean a partir del archivo maestro y se optimizan para el uso previsto (por ejemplo, para la web o investigación).

Para aquellas organizaciones que trabajan con documentación sobre abusos de los derechos humanos, resulta especialmente importante tener en cuenta que estos archivos derivados se utilizan para la creación de otros con contenido textual totalmente apto para búsquedas a través de OCR. La práctica habitual es que solo los archivos maestros se almacenen con fines de conservación. Sin embargo, dada la importancia del OCR (y, por lo tanto, de las versiones de los documentos con capacidad de búsqueda completa) para los archivos de derechos humanos, también se recomienda crear y almacenar dos archivos legibles, uno como copia de acceso y otro con fines de conservación. Lo mismo se aplica a los archivos maestros, ya que debemos crear al menos dos copias de seguridad y almacenarlas en dos medios de almacenamiento separados, cuando sea posible.

Conservación y preparación para el ingreso


Ahora estamos completamente en el mundo del archivo digital.

Todo nuestro material se encuentra en formato digital.

También contamos con un depósito de archivo digital, en forma de un sistema de archivo digital.

Para completar el proceso de creación de un archivo digital, ahora necesitamos emplear un conjunto de técnicas de archivo digital basadas en software tanto a nuestro material digitalizado como creado de manera digital. Esto es necesario para prepararlo para el ingreso y la conservación a largo plazo en el sistema de archivo digital. Asimismo, necesitamos configurar y preparar nuestro propio sistema de archivo digital (sus bases de datos, herramientas y aplicaciones de software) para recibir, almacenar y preservar adecuadamente nuestro material de archivo digital.

Para lograrlo, primero debemos revisar nuestras herramientas básicas de archivo: la tabla de estructura de archivo y las descripciones del material, que en este mundo de archivo digital tomarán la forma de bases de datos y archivos de texto que contienen directorios de archivos, metadatos y documentación de datos. Por lo tanto, es necesario aclarar estos dos conceptos clave que resultan especialmente importantes para el archivo digital: metadatos y documentación de datos. Estos son necesarios para comprender cómo se organiza, describe, relaciona, gestiona y utiliza nuestro contenido de archivo digital dentro de un sistema de archivo digital.

¿Qué son los metadatos y la documentación de datos?

Los metadatos son datos, información sobre datos, sobre nuestro contenido de archivo digital. Se almacena en una forma estructurada adecuada para el procesamiento de software. Los metadatos son esencialmente iguales a las descripciones de archivo del contenido digital De hecho, las descripciones de nuestro contenido que hicimos en la etapa anterior, ahora en el sistema de archivo digital se convertirán en metadatos, sumándose a otros tipos de metadatos, como metadatos técnicos generados por el sistema o en el historial de acceso de un elemento. Por lo tanto, los metadatos son necesarios para los objetivos de conservación y acceso a largo plazo, ya que nos permiten mantener la integridad, calidad y facilidad de uso del contenido.

La documentación de datos proporciona información sobre el contexto de nuestros datos, nuestro contenido de archivo digital, y a menudo se proporciona en forma de texto u otra forma legible. De hecho, la documentación de datos complementa los metadatos y proporciona información que permite a otros utilizar el contenido del archivo. Por ejemplo, si llevamos a cabo una encuesta de víctimas y conservamos sus cuestionarios completados como nuestros datos de archivo digital, también debemos conservar la documentación de datos relacionada como, por ejemplo, un documento que detalle el diseño y la metodología de la encuesta. Dado que la documentación de datos también es “datos sobre datos”, podría verse como un tipo específico de metadatos, que proporciona contexto y se registra en un formato de fácil comprensión para los humanos.

Preparación de metadatos y documentación de datos

Imagen compartida por CCJ, organización socia de GIJTR en Colombia.

Si bien nuestros archivos digitales se almacenan de forma segura y se respaldan en medios de almacenamiento, esperando a el ingreso y el archivo en el sistema de información digital, debemos centrar nuestra atención en algunas tareas de limpieza. Dichas tareas implican preparar nuestra documentación de metadatos y datos para el próximo proceso, para garantizar un ingreso sin problemas y un archivado adecuado.

Esto implica garantizar que tengamos un registro claro y bien organizado de la documentación de datos y metadatos que se crearon hasta el momento en el proceso: qué contienen y cómo se relacionan entre sí. Esto incluye tablas/bases de datos con listas (o directorios) de nombres de archivos, metadatos de archivos y documentación de datos. En los capítulos anteriores, describimos cómo se desarrollan o generan estos documentos mediante la planificación, la creación de inventarios, la revisión, la selección, la organización, la descripción y la digitalización del material. Como resultado, en este punto del proceso deberíamos contar con los siguientes metadatos y documentación de datos creados:

A. Este documento inició su vida como inventario de identificación y luego, mediante procesos de organización y descripción, creció hasta convertirse en la tabla de estructura del archivo. Contiene metadatos sobre la estructura del archivo, agrupación de archivos en series, subseries y carpetas, así como metadatos descriptivos y técnicos adicionales que seleccionamos para su inclusión.

B. Como resultado del proceso de digitalización, hemos producido bases de datos donde registramos cada sustituto digital que producimos y sus metadatos seleccionados.

Además, el equipo y el software de digitalización generaron bases de datos adicionales con metadatos que seleccionamos sobre los atributos técnicos de los sustitutos digitales y/o el historial de acciones en ellos a lo largo del proceso de digitalización.

Finalmente, también podríamos haber producido documentos de texto que contienen documentación de datos, información sobre el contexto de los sustitutos digitales que creamos, o sobre el proceso de digitalización en sí. Esto permitirá que otros comprendan cómo se pueden interpretar o utilizar nuestros datos.

C. Ya existirá una base de datos de archivos creados digitalmente para la preservación con sus metadatos básicos, o se puede crear fácilmente mediante herramientas de software simples, como “DROID” o “IngestList”.

D. Puede haber tablas/bases de datos o archivos de texto preexistentes adicionales que contengan metadatos y/o documentación de datos sobre ciertos grupos de elementos o la colección completa.

Para que nuestro contenido digital, metadatos y documentación de datos se ingresen correctamente en el sistema de archivo digital, debemos proporcionar al software del sistema instrucciones sobre qué son estos documentos y cómo se relacionan entre sí. De este modo, el sistema puede, por ejemplo, adjuntar correctamente metadatos en una base de datos a los elementos que describen los metadatos que se enumeran en una base de datos diferente, y luego a la documentación de datos que proporciona información sobre el contexto de los elementos dados.

Como parte de los preparativos, es posible que también necesitemos dividir, fusionar o combinar manualmente algunas de nuestras tablas/bases de datos para transformarlas a un formato más apropiado.

Los pasos exactos que deberemos seguir en este proceso en el que necesitaremos preparar nuestra documentación de metadatos y datos, o cómo ingresaremos la información sobre sus interrelaciones en el sistema de archivo digital, dependerá de las características del archivo y el sistema mismo.

Sin embargo, independientemente de estos detalles, siempre necesitaremos tener una visión general clara, un mapa o un esquema de nuestros metadatos y documentación de datos y cómo se relacionan, antes de que podamos comenzar con el ingreso.

Conservación y preparación de datos para el archivo

Ahora podemos avanzar en las acciones de preservación y preparación de nuestros datos digitales para el ingreso y el archivo.

Limpieza

Lo primero que debemos hacer siempre antes de trabajar con datos digitales destinados a la conservación es realizar un análisis antivirus. El escaneo debe realizarse conectando el medio de almacenamiento a una computadora previamente escaneada que no esté conectada a ninguna red local o internet.

Respaldo

Luego, la copia de seguridad. Al final del proceso de digitalización, ya creamos copias de seguridad de los archivos maestros de los sustitutos digitales. Si aún no hemos hecho lo mismo con los datos creados en formato digital, deberíamos crear sus copias de seguridad ahora, produciendo dos copias y almacenándolas en medios de almacenamiento separados, si es posible en dos ubicaciones diferentes.

Nomenclatura de archivos

Si bien los archivos de nuestros sustitutos digitales ya han sido nombrados de acuerdo a la convención de nomenclatura que desarrollamos y adoptamos, es posible que nuestros archivos creados digitalmente aún tengan sus nombres originales. Por lo tanto, debemos aplicar nuestra convención de nomenclatura a los archivos creados en formato digital y nombrarlos en consecuencia. Sus nombres contendrán entonces los mismos componentes (identificación, descripción, técnica u otros) que los que seleccionamos y usamos para los sustitutos digitales, tal como se describió en el capítulo de digitalización. Existen herramientas de software razonablemente simples y fáciles de usar que pueden realizar esta tarea de renombrar nuestros archivos digitales automáticamente, dentro de los parámetros que establezcamos para ello, como “Rename Master” o “File Renamer Basic”.

Metadatos

En la sección anterior hicimos un balance de los metadatos y la documentación de datos que recopilamos hasta el momento en el proceso. Como se explicó allí, necesitaremos incorporar nuestros metadatos en un formato fijo específico que sea reconocible por nuestro sistema de archivo digital. Este formato específico de metadatos se basará en el estándar de metadatos que seleccionamos para implementar anteriormente en el proceso y que ahora debemos aplicar también para el ingreso de datos en nuestro sistema de archivo digital.

Si, como se recomienda en este manual, ya en la fase de planificación tomamos una decisión sobre el estándar que aplicaremos para la recopilación de metadatos y lo implementamos a través de las fases de descripción y digitalización, entonces nuestros metadatos ya se habrán recopilado de acuerdo con ese estándar. De este modo, deberíamos poder organizarlo y prepararlo para la incorporación de acuerdo con el formato reconocible por el sistema, haciendo solo arreglos técnicos básicos o asignando nuestros metadatos al estándar. Por ejemplo, en la sección de digitalización mencionamos que el estándar de metadatos básicos llamado “Dublin Core” es compatible con la mayoría de opciones de software de archivo digital. Por lo tanto, si aplicamos este estándar para la recopilación de metadatos desde el principio y seleccionamos el software que lo admite, ahora podremos traducir los metadatos recopilados al formato que nuestro sistema de archivo digital puede reconocer e incorporar correctamente.

Preservación de metadatos

En la discusión anterior sobre los metadatos y la importancia de su adecuada recopilación y gestión, mencionamos el papel clave que tiene para la preservación a largo plazo de los datos de archivo digital.

Esto se destaca y vuelve más pertinente en este punto del proceso, con la preparación para el ingreso y la conservación a largo plazo de nuestro material. Causa de lo anterior es que, antes de ingresar y archivar nuestros datos, debemos asegurarnos de capturar los metadatos necesarios, lo que permitirá que nuestro material digital se conserve adecuadamente, mantenga su autenticidad y siga siendo utilizable en el futuro. Para comprender qué conjunto esencial de metadatos necesitamos para preservar nuestros datos invaluables, necesitaremos conocer un poco mejor nuestros archivos digitales y sus formatos, incluyendo aspectos como la validez, la calidad y la fijeza de nuestros archivos.

Identificación y conversión de formatos de archivo

En el proceso de digitalización, establecimos la necesidad de almacenar nuestro material digital en formatos de archivo que sean apropiados para la conservación a largo plazo. Principalmente, estos son formatos que tienen una amplia comunidad de usuarios o soporte y que han demostrado ser resistentes al cambio con el tiempo. Esta es también la razón por la que a menudo se les llama “sin pérdida”, en oposición a los formatos “con pérdida” que tienden a perder calidad y/o cambiar y degradarse con el tiempo.

El material digitalizado ya se ha almacenado en formatos de preservación apropiados a través de la digitalización, y ahora debemos asegurarnos de que suceda lo mismo con el material creado de manera digital.

Primero debemos identificar el formato de nuestros archivos creados en forma digital. Esto se puede lograr con la ayuda de un software especializado, como “DROID” o “Siegfried”, que nos permita identificar automáticamente el formato de los lotes de nuestros archivos digitales. Luego procederemos a cambiar los formatos de los archivos para los que determinamos que se pondrán en un formato diferente y apropiado para la conservación. El software especializado para la conversión de archivos a diferentes formatos puede ser muy útil en este proceso. Dicho software es específico del formato como, por ejemplo, “Audio/Video to WAV Converter”, que convierte archivos de audio y video a formato WAV, o “CDS Convert”, que permite convertir documentos, presentaciones e imágenes entre diferentes formatos de software.

’’’La importancia de emplear formatos de conservación apropiados’’’
Los formatos sin pérdida, por regla general, también producen archivos más grandes. Por lo tanto, para colecciones grandes y organizaciones pequeñas, como las OSC, esto puede representar un desafío en términos de capacidades de almacenamiento adicionales. Sin embargo, este manual desaconseja la realización de concesiones con la selección de formatos de archivo, ya que el uso de formatos de preservación adecuados es esencial para todas las acciones de preservación posteriores y el éxito del proceso en su conjunto.

Validación de archivos

El siguiente paso en la preparación de nuestro contenido digital para su correcta conservación en el sistema de archivo digital es la validación de nuestros archivos, o sea, establecer que realmente son lo que creemos que son.

En esencia, a través de la validación de archivos verificamos si el formato de un archivo es adecuado y correcto, es decir, si es válido. Por lo tanto, a través de la validación del formato de archivo podemos verificar si cumple con la especificación de formato de archivo específico: estándares que debe seguir un formato específico como .jpg, .doc. o TIFF. A modo de ilustración, la validación del formato de archivo podría compararse a la inspección de cajas o carpetas en un archivo físico para garantizar que no estén dañados; de lo contrario, los elementos podrían caerse o dañarse.

En el archivo digital, la validación del formato de archivo es particularmente importante para la preservación y el acceso a largo plazo por varias razones. Los archivos con formatos que no son válidos son difíciles de administrar con el tiempo, especialmente cuando es necesario convertir o migrar un archivo. Además, el acceso puede volverse difícil o imposible, ya que los archivos con formatos que no se ajustan a las especificaciones se vuelven más difíciles de abrir y emplear con el tiempo. Por último, los archivos que no sean válidos serán más difíciles – si no imposibles – de procesar correctamente por futuros programas informáticos.

Por supuesto, no inspeccionamos manualmente la conformidad de un formato de archivo con sus especificaciones; hay software disponible que realiza esa función e identifica y crea informes sobre los archivos que no son válidos. Ya mencionamos una de estas herramientas, “JHOVE”, en el capítulo sobre control de calidad al final del proceso de digitalización, pero también existen otras, en su mayoría especializadas para un determinado grupo de formatos.

’’’Las medidas de conservación deben seguir inmediatamente a la digitalización’’’
Cabe mencionar que la validación del formato de archivo y otras acciones de preservación

Junto con los procedimientos de control de calidad, deberían realizarse inmediatamente al final del proceso de digitalización, ya sea como alternativa o además de realizarlos como parte de la preparación para la incorporación. Esto dependerá de las necesidades específicas y el flujo de trabajo de un proyecto.


Fijeza

La fijeza, un elemento crucial en la preservación a largo plazo de los archivos, así como en el mantenimiento de su integridad, autenticidad y facilidad de uso, indica un estado de invariabilidad o permanencia. En esencia, la fijeza nos permite determinar si un archivo ha cambiado con el tiempo, si se ha alterado o corrompido, así como rastrear y registrar dichos cambios.

Para poder hacer esto, usamos la fijeza para registrar el estado inicial de un archivo antes de insertarlo, tomando su “huella digital”, como suele llamarse. De hecho, el software de fijeza registrará un número de características técnicas específicas y creará un código alfanumérico: una “suma de verificación”. Esta suma de verificación, al igual que las huellas dactilares en el caso de los humanos, será única para ese archivo y no debería cambiar con el tiempo. La suma de verificación de un archivo se registrará como parte de sus metadatos, de modo que siempre podamos realizar la misma verificación de fijeza y establecer si la suma de verificación del archivo ha cambiado, es decir, si el archivo ha cambiado. El registro de este tipo de metadatos de conservación es fundamental para confirmar y establecer la “cadena de custodia” de un elemento digital.

Además de permitirnos establecer cualquier cambio en un archivo que haya ocurrido con el tiempo, la fijeza también es útil cuando estamos migrando archivos entre diferentes medios o unidades de almacenamiento o depósitos digitales. Es muy recomendable aplicar una verificación de fijeza después de cada transferencia de archivos a fin de establecer cualquier cambio que pueda haber ocurrido en el curso de la migración.

Además, la fijeza nos permitirá verificar que las copias de un archivo que creamos para la copia de seguridad estén completas y sean correctas. La suma de verificación de fijeza también se puede dar a otros usuarios potenciales de los archivos, para que puedan verificar que han recibido el archivo correcto. Existe una amplia gama de software que puede realizar la fijeza, como “Checksum”, “Exact.File”, entre otros.

Control de calidad

Muchas cosas pueden salir mal con los archivos digitales a medida que se crean, administran y almacenan, antes de que lleguen al punto del ingreso. Durante la digitalización, debido a un error o un virus, los archivos pueden dañarse, quedar incompletos o reducir su calidad. Por lo tanto, es una buena práctica realizar un control de calidad lo más completo posible de todos nuestros archivos digitales, antes de su ingreso y archivo. Existe un conjunto completo de herramientas que realizan acciones específicas o un grupo de acciones de control de calidad. Algunos ejemplos incluyen “File Analyzer and Metadata Harvester” de NARA, que tiene una variedad de funciones; o en el otro lado del espectro, “Fingerdet”, que ayuda a detectar huellas dactilares en elementos digitalizados.

Eliminación de duplicados y eliminación de archivos

Mientras estamos en eso, deberíamos aprovechar esta oportunidad para limpiar un poco nuestros archivos. En el transcurso de la recopilación, organización, copia y almacenamiento temporal de los archivos digitales, es probable que creemos duplicados o que las carpetas contengan archivos ocultos o que no pertenecen a ellas. Tener duplicados y otros archivos no deseados en la colección puede generar confusión, además de ocupar espacio innecesariamente en el almacenamiento. Es por ello que es una buena práctica eliminarlos antes de incorporarlos. Dependiendo del tamaño de la colección, esta podría ser una tarea que consuma mucho tiempo y sea propensa a errores si se realiza manualmente. Afortunadamente, existen herramientas de software que pueden hacer esto por nosotros de manera eficiente y confiable. Algunos ejemplos de herramientas dedicadas a este propósito incluyen “FolderMatch” y “CloneSpy”.

Metadatos sobre datos privados, sensibles, confidenciales o protegidos por derechos de autor

Teniendo en cuenta la importancia de la protección y seguridad de los datos al archivar material relacionado con violaciones de los derechos humanos, es muy recomendable que, en este punto, antes de incorporar el contenido, realicemos una revisión adicional del material con respecto a la privacidad, sensibilidad, confidencialidad y derechos de autor.

Durante los procesos de descripción, ya deberíamos haber identificado grupos de materiales o incluso elementos individuales que contienen información personal o confidencial. En este punto, debemos asegurarnos de que todos los metadatos pertinentes sobre dicho material se recopilen y vinculen adecuadamente a los elementos. Dependiendo de la política de acceso al material y al archivo, puede ser útil, o incluso necesario, añadir más metadatos, específicamente aquellos que brinden instrucciones para su manejo futuro en cuanto a derechos de autor, protección o acceso restringido al material.

Afortunadamente, existen estándares y software que se han desarrollado para brindar asistencia en ese proceso.

Estándares

Los estándares para la selección, recopilación y uso de metadatos a menudo incluyen una gama completa de metadatos de preservación. La aplicación de dichos estándares de metadatos respalda la conservación de elementos digitales y garantiza su usabilidad a largo plazo. Se ha desarrollado una variedad de estándares para gestionar la preservación y los metadatos en general. Dado que una amplia variedad de opciones puede limitar una visión clara, recomendamos que una organización utilice como punto de partida el estándar “Estrategias de implementación de metadatos de preservación” (PREMIS).

¡RECURSO!
PREMIS ha alcanzado el estatus de estándar aceptado a nivel internacional para metadatos de preservación. Una ventaja, pero también una limitación del estándar PREMIS, es que debe adaptarse para cumplir con los requisitos del contexto específico. No es una solución lista para usar en el sentido

de que pueda implementarse directamente en los datos de un archivo. Algunos de los elementos de PREMIS pueden no ser pertinentes y una organización puede encontrar que se necesita información adicional, más allá de lo definido por PREMIS, para respaldar sus requisitos.

Cabe señalar que a menudo se integrarán diferentes estándares de metadatos, o al menos serán compatibles, con el software que utilizamos para las funciones de recopilación y gestión de metadatos.

Herramientas de software

asta ahora, en este capítulo hemos mencionado ejemplos de diferentes soluciones de software que pueden realizar funciones específicas de recopilación y gestión de metadatos de preservación, como la identificación de archivos, la conversión, la validez o las verificaciones de fijeza. Estas herramientas a veces se diseñan para realizar solo una función específica o un grupo de funciones similares. Sin embargo, estas herramientas individuales a menudo se combinan para proporcionar una solución de mayor alcance, que puede proporcionar una cobertura completa de funciones relacionadas con la preservación y los metadatos. Además, estas herramientas multifuncionales para metadatos se incorporan luego a soluciones de software integrales que pueden gestionar todo el proceso de archivo digital dentro de un sistema de archivo digital determinado.

En la sección de planificación de este manual, cuando analizábamos la selección de una solución de software para nuestro sistema de archivo digital, consideramos si la opción que elegimos tiene soporte integrado para el estándar de metadatos seleccionado, así como todas las herramientas necesarias para recopilar y gestionar los metadatos de conservación según los requisitos de nuestro archivo. En ese momento, podíamos elegir una solución empresarial que proporciona una opción todo en uno, con todos los estándares y herramientas necesarios integrados. No obstante, una alternativa es crear una solución que satisfaga nuestras necesidades mediante el uso de diferentes programas interoperables, cada uno de los cuales realice una de las funciones de conservación.

Esta etapa de preparación de datos para el ingreso y captura de metadatos de preservación destaca la importancia de nuestra decisión sobre la selección del software de archivo digital y el efecto que tiene sobre las tecnologías y herramientas que podemos y necesitamos usar. Por lo tanto, las herramientas específicas que aplicaremos en esta fase, así como más adelante, dependerán completamente del tipo de solución que seleccionemos para nuestro software de archivo digital.

Análisis forense digital
Si se trabaja con formatos de almacenamiento de datos más antiguos o con material digital de origen y

características poco claras, especialmente cuando es necesario establecer un historial del material y una "cadena de custodia", un área de desarrollo prometedora es el “análisis forense digital”, la cual ofrece beneficios al abordar la autenticidad digital, la responsabilidad y la accesibilidad. Esta tecnología forense puede hacer posible: la identificación de problemas de privacidad, la determinación de una cadena de custodia por procedencia, el uso de protección contra escritura para captura y transferencia, así como la detección de falsificaciones o manipulaciones. Puede extraer y sacar metadatos y contenido relevantes; permitir una indexación y búsqueda eficientes por parte de los curadores, y facilitar el control de auditoría y los privilegios de acceso granular. Las tecnologías forenses digitales varían mucho en cuanto a su capacidad, costo y complejidad; algunos equipos son caros, pero otros son gratuitos. Algunas técnicas son muy sencillas de usar, otras deben aplicarse con gran cuidado y sofisticación. Hay un conjunto cada vez más rico de herramientas forenses de código abierto, gratuitas para obtener y usar, como “BitCurator.

Preparación del sistema de archivo digital

La configuración y preparación de nuestro sistema de archivo digital para su primer ingreso de archivos es un proceso complejo que requiere tiempo, esfuerzo, paciencia y conocimientos y habilidades de TI razonablemente avanzadas.

Los sistemas de archivo digital no pueden simplemente instalarse y usarse de inmediato, como hacemos con el software comercial que usamos a diario. Esto se debe a que cualquier sistema de archivo digital necesita ser “instruido” en todos y cada uno de los aspectos de sus operaciones. Según nuestros requisitos, debemos establecer los parámetros en el sistema, crear o diseñar bases de datos en él, establecer enlaces entre los datos y sus metadatos, etc. Para proporcionar estas “instrucciones” a nuestro software puede ser necesario cualquier cosa, desde simplemente rellenar un formulario electrónico o elegir una opción de un menú desplegable hasta tener que utilizar codificación informática y otros conocimientos avanzados de TI.

Imagen compartida por AVIPA, organización socia de GIJTR en Guinea

La experiencia y el tiempo necesarios dependen del tipo de solución de software seleccionada para el sistema de archivo digital. La regla general que aplicamos a la selección de software también se aplica aquí. Las soluciones comerciales serán más sencillas tanto para la configuración como para el uso, pero probablemente ofrecerán menos opciones de adaptación. Las soluciones de código abierto en su mayoría requerirán más tiempo y experiencia en TI, pero pueden ofrecer soluciones más adecuadas y personalizadas.

Ingreso

Este es el momento culminante, donde todo el esfuerzo y el proceso realizados confluyen y dan como resultado la creación de nuestro archivo.

Sin embargo, no debemos imaginar que podemos simplemente hacer clic en un botón, ir a tomar un té y regresar para ver todos nuestros datos, metadatos y documentación de datos ingresados y bien vinculados entre sí. Más bien, el proceso de ingreso deberá realizarse en partes, mediante la transferencia de material por grupos durante un período de tiempo. En el proceso, es probable que encontremos errores, descubramos especificaciones incorrectas en un sistema u otros problemas similares que deberán ser abordados para luego ajustar el sistema y repetir el ingreso.

Después de ingresar cada grupo de material, debemos producir al menos una copia maestra de archivo de cada elemento, al menos dos copias de respaldo y toda copia de trabajo derivada que podamos necesitar.

Las copias de respaldo deben crearse y almacenarse de acuerdo con las reglas de mejores prácticas descritas anteriormente, es decir, se deben crear múltiples copias, en dos tecnologías de medios de almacenamiento diferentes y almacenarse en diferentes ubicaciones.

Como paso final, debemos realizar el mismo conjunto de acciones de conservación que aplicamos a nuestro contenido en preparación para el ingreso. Esto incluye escanear el material, así como todas las copias de respaldo con software antivirus y verificar la fijeza, validez y garantía de calidad de cada archivo.

Si hemos cubierto los aspectos básicos hasta ahora y nos hemos asegurado de que todos los elementos están preparados, el proceso debería ser exitoso y ahora deberíamos poder disfrutar de los frutos de nuestro trabajo: nuestro valioso material, antes disperso por la oficina y en unidades de almacenamiento y sótanos, convertido en un archivo digital.

En el próximo paso, tomaremos medidas para asegurarnos de que también se logren los objetivos de nuestro archivo: que conserve nuestro material durante mucho tiempo y de manera segura y que brinde el mayor acceso posible a su contenido.

06:00