Términos y conceptos clave
El esquema de niveles de acceso
El esquema de niveles de acceso forma parte del plan de acceso a los archivos y ofrece una visión general de “quién tiene acceso a qué y cómo” en forma de tabla. Teniendo en cuenta que puede ser necesario proporcionar distintos modos de acceso a distintos grupos de usuarios, a material con distintos niveles de acceso permitidos, un esquema de niveles de acceso ayuda a evitar confusiones y errores.
Método activo y pasivo
Un enfoque de acceso pasivo sería un archivo creado con el objetivo principal de preservar a largo plazo el material por razones históricas, legales o de otro tipo. Sin embargo, la mayoría de las OSC que trabajan con archivos de violaciones de los derechos humanos adoptarán probablemente la otra vía de un enfoque activo para proporcionar acceso, que se centra en facilitar y proporcionar un acceso lo más amplio posible a sus usuarios.
El mantenimiento activo
El mantenimiento activo de un archivo digital es necesario tanto para mantenerlo operativo como para garantizar la conservación a largo plazo, la autenticidad y el acceso a su contenido digital. Si el formato de los archivos digitales se vuelve obsoleto, o si los medios de almacenamiento fallan o el software de copia de seguridad es obsoleto y defectuoso, el contenido digital de archivo puede verse comprometido, dañado o perderse por completo, junto con todo el trabajo invertido en la construcción y desarrollo del archivo digital. El mantenimiento activo de un archivo digital requiere un enfoque sistemático y la realización periódica de un conjunto de acciones que incluyen la supervisión y la migración.
Documento analógico
...
Antivirus
...
Fondos de archivo
...
Normas de archivo
...
Tabla de estructura de archivos
...
Técnicas de archivo
...
Archivo
...
Un plan de acceso a los archivos
Un plan de acceso a los archivos orienta tanto la toma de decisiones como su aplicación en relación con el acceso al material de archivo. Proporciona un equilibrio entre el objetivo de garantizar un acceso lo más amplio posible a un archivo y la responsabilidad de salvaguardar los datos y cumplir las normas legales y éticas vinculadas a la privacidad, sensibilidad, confidencialidad y derechos de autor de los datos. Un plan de acceso a los archivos bien meditado y claro ayudará a lograr ese equilibrio.
Nacido-digital
...
Cadena de custodia
...
Colección
Los grupos más genéricos de material suelen denominarse "colecciones" o, en términos estrictamente archivísticos, "fondos". Cada colección se divide en "series", que pueden contener elementos individuales, así como en "subseries" y "carpetas" (a veces también denominadas "expedientes"), que son unidades de estructura más pequeñas y subordinadas que también contienen elementos individuales.
La documentación de datos
La documentación de datos proporciona información sobre el contexto de nuestros datos, nuestro contenido archivístico digital, a menudo en forma textual u otra forma legible por el ser humano. La documentación de datos complementa los metadatos y brinda información que permite a otros utilizar el contenido de archivo. Dado que la documentación de datos es también “datos sobre datos”, podría considerarse un tipo específico de metadatos, que proporciona contexto y se registra en un formato de fácil lectura.
La protección de datos
Ya sean datos privados, sensibles, confidenciales o protegidos por derechos de autor, la protección de datos es la esencia de la planificación de la seguridad de nuestro archivo. Existen tres instrumentos o acciones principales que un archivo puede adoptar para proteger sus datos: control y gestión del acceso, redacción y cifrado.
Seguridad de los datos
...
La descripción del material de archivo
La descripción del material de archivo permite la conservación adecuada del archivo y orienta a los futuros usuarios proporcionándoles información contextual importante. El contenido de un archivo debe describirse de forma que permita a cualquier persona buscar, localizar y acceder a los elementos de la colección, posibilitando así la creación de conexiones entre elementos, incluso de grupos diferentes. En pocas palabras, sin descripción, un archivo sería más bien un simple almacén en el cual con el tiempo resultaría imposible encontrar o gestionar contenidos.
Un plan de seguridad para archivos digitales
Un plan de seguridad para archivos digitales orienta la elaboración de procedimientos de seguridad y su aplicación. Dicho plan debería enumerar y describir las obligaciones del archivo en materia de seguridad basándose en el material que contiene, las funciones de seguridad que el archivo debe realizar, las medidas de seguridad que se tomarán para garantizar que las funciones se realizan correctamente y las herramientas y tecnologías necesarias para su aplicación.
Los archivos digitales
Los archivos digitales son archivos que contienen material en formato digital, incluyendo tanto elementos creados digitalmente como versiones digitalizadas de material originalmente físico, almacenado en soportes digitales y gestionado mediante herramientas digitales. Al igual que en los archivos físicos, el material de los archivos digitales se organiza, describe, ordena, almacena, conserva, salvaguarda y pone a disposición de los usuarios.
Archivo digital
El archivado digital es el proceso de creación, gestión y desarrollo de archivos digitales.
Un modelo de ciclo de vida de los archivos digitales
Un modelo de ciclo de vida de los archivos digitales refleja la característica clave de los archivos digitales, su carácter circular y continuo, un proceso cíclico en el cual las etapas se suceden continuamente, sin un punto final. A su vez, el modelo de ciclo de vida destaca la necesidad de tomar medidas y gestionar activamente un archivo digital a lo largo de su ciclo de vida. Al mismo tiempo, el modelo presenta claramente el amplio abanico de responsabilidades que implica el proceso de archivo digital. Por último, el modelo de ciclo de vida deja claro que las decisiones y acciones de cada fase afectan qué se puede hacer y cómo se puede lograr en cada fase posterior y en cualquier nueva iteración del proceso. El modelo de ciclo de vida de archivo digital aplicado en este manual se ha desarrollado para adaptarse a las necesidades y retos específicos de las OSC. Refleja algunos de los elementos del modelo de referencia OAIS y, en parte, la estructura del modelo de ciclo de vida de conservación DCC. El modelo OAIS es el modelo más utilizado para el archivo digital, mientras que el modelo de ciclo de vida DCC incluye muchas de las consideraciones que también afectan a las OSC que se dedican al archivo digital.
Un sistema de archivo digital
Un sistema de archivo digital es un sistema de componentes de software y hardware que consta de bases de datos, herramientas de software que gestionan las bases de datos y medios de almacenamiento; es la infraestructura tecnológica de un archivo digital. Define el alcance y el límite de las funciones del archivo y es fundamental para lograr su finalidad y sus objetivos. El objetivo principal del archivo digital es garantizar que el contenido de valor incalculable que estamos preservando permanezca inalterado y accesible durante mucho tiempo en el futuro mediante un marco tecnológico adecuado y sostenible para el archivo digital.
Técnicas de archivo digital
...
Copia Digital
...
El nombre de archivo digital
El nombre de archivo digital de un elemento de archivo digital desempeña la importantísima función de descriptor de ese elemento concreto. Debe contener información que nos permita identificar qué es el elemento y qué contiene para poder localizarlo en el archivo y gestionarlo y conservarlo adecuadamente.
La ciencia forense digital
La ciencia forense digital, en el ámbito de los archivos digitales, hace referencia a un conjunto de técnicas basadas en software y aplicaciones que nos permiten acceder a material de archivo digital e investigarlo en relación con su autenticidad, responsabilidad y accesibilidad. Esto resulta especialmente pertinente en el caso de formatos de almacenamiento de datos antiguos o cuando se trabaja con material digital de origen y características poco claros, sobre todo cuando no se ha establecido un historial del material ni una “cadena de custodia”. La investigación forense digital nos permite, por ejemplo, extraer metadatos pertinentes, acceder a contenidos archivados en formatos digitales obsoletos, establecer una cadena de custodia, detectar la manipulación y falsificación de datos e identificar problemas con la privacidad de los datos.
Los sustitutos digitales
Los sustitutos digitales son copias digitales de objetos de archivo físicos que se procesan, conservan y hacen accesibles como objetos de archivo digitales. Los sustitutos digitales pueden proceder de distintos tipos de objetos físicos (documentos, mapas, vídeos, artefactos, etc.) y pueden almacenarse en distintos formatos digitales.
La digitalización
La digitalización es un proceso de creación de copias digitales o “sustitutos” de los elementos físicos originales. Estas copias digitales se procesan como objetos de archivo digitales. Se pueden digitalizar diferentes tipos de objetos físicos y almacenarlos en distintos soportes. Pueden incluir, por ejemplo, texto, fotografías, dibujos, mapas, vídeo, audio y otros tipos de contenido, almacenados en papel, casetes de audio, cintas VHS o cualquier otro medio de almacenamiento físico o analógico. Las copias digitales también pueden incluir objetos como prendas de vestir, pancartas, objetos personales, etc. El tipo de material que deba digitalizarse determinará los procedimientos, tecnologías, formatos digitales y otros elementos de cualquier proceso concreto de digitalización.
El flujo de trabajo de digitalización
El flujo de trabajo de digitalización es un plan o esquema que debe incluir todas las acciones y operaciones de digitalización, desde la revisión y preparación de los objetos físicos y el espacio de trabajo hasta la finalización del flujo de trabajo, pasando por el almacenamiento de los sustitutos digitales creados y la realización de copias de seguridad. Cada proyecto de digitalización tendrá su propio flujo de trabajo, su secuencia específica de acciones y operaciones. Aunque las acciones específicas y sus secuencias se adaptan a cada proyecto concreto, podemos identificar los elementos clave necesarios en cualquier flujo de trabajo de digitalización: preparación, programación del proceso, digitalización, control de calidad, posprocesamiento y almacenamiento y copias de seguridad.
Un plan de recuperación en caso de catástrofe
Un plan de recuperación en caso de catástrofe detalla cómo se recuperarán o sustituirán nuestros datos en caso de que se produzca algún fallo importante de origen natural o humano, daño, robo o ataque malintencionado a nuestro contenido o sistema de archivo digital. Se basa en los dispositivos de copia de seguridad existentes que definen el número de copias de seguridad, su ubicación geográfica y el tipo de soporte de almacenamiento utilizado. El plan de recuperación en caso de catástrofe debe proporcionar instrucciones sobre cuál de nuestras copias de seguridad debe utilizarse en qué circunstancias de tipo catastrófico y con qué medios tecnológicos para sustituir y recuperar los datos.
Eventos
...
Acceso externo
...
La fijeza
La fijeza, un elemento crucial en la conservación a largo plazo de los archivos, así como en el mantenimiento de su integridad, autenticidad y usabilidad, se refiere a un estado inalterado o permanente. En esencia, la fijeza nos permite determinar si un archivo ha cambiado con el tiempo o ha sido alterado o corrompido, así como rastrear y registrar dichos cambios.
Formatos
...
El plan general
El plan general de un archivo digital es el primer paso, y uno crucial, en el proceso de su desarrollo. Establece la razón y el método para el desarrollo del archivo dotándolo de principios rectores, así como de decisiones clave vinculadas al contenido, el acceso y las principales cuestiones organizativas, tecnológicas y relacionadas con los recursos. La planificación detallada, avanzada y de amplio alcance que contiene el plan general ayudará a la organización a superar una amplia gama de retos que deberán afrontarse en las fases posteriores del proceso de creación de un archivo digital.
Guiding Principles
Guiding Principles of a digital archive summarize the reasoning behind its development. They state why an archive is needed, who will be using it and how, and what the expected benefits of its creation and development are. The Guiding Principles also address the required resources and technologies, legal and security-related responsibilities, and organizational matters.
Human rights organizations
...
Human rights violations
...
Identification Inventory
Identification Inventory is the initial list of item groups we can identify in the material we wish to digitally archive. It is a table that lists the identified item groups and includes information about their type, format, size, amount, condition, location, and storage space or storage media. The Identification Inventory provides us with a clear overview of what source material we have, in what quantity, and in which shapes and forms.
Indexing
...
Ingest
Ingest is the process of transferring digital items into the digital archive, during which the data, its metadata, and data documentation are stored and mutually linked within the Digital Archiving System. A set of preservation actions needs to be applied to the digital content in preparation for ingest, as well as after it has been finished. This includes scanning the digital files and backup copies with antivirus software and checking each file’s fixity, validity, and quality.
Institutional knowledge
...
Integrity
...
Internet Infrastructure
...
Inventory
...
Item
...
Levels of protection
...
Life cycle
...
Long-term preservation
...
Maintenance Plan
Maintenance Plan is centered around the two main sets of maintenance actions. It lists, describes, and schedules the execution of maintenance monitoring and migration activities. The specific elements of the Maintenance Plan, such as time periods for regular checkups or concrete procedures, are defined in line with the needs of a given archive.
Master Files
Master Files are the best-quality files we produce through digitization and are intended to be preserved long term without loss of any essential features. The number of master files we will create will depend on the content of the originals and the planned uses of the digital surrogate. In addition to master files, we can also produce a number of secondary files, often called “access” or “service” files. These files are created from the master file and optimized for the intended use (e.g., for web or for research).
Medium Storage
...
Metadata
...
Metadata refers to the descriptions of archival items. It is essential that relevant metadata is collected and attached to the digital archival items and stored in a structured form suitable for software processing. Without its attached metadata, digital archival material becomes meaningless and unusable, as we might be unable to find or identify it, understand what it is, its context, history, creator, or where it belongs in the archive. Digital archival items allow for a range of metadata to be collected, such as technical specifications of an archival digital file or information about its creation or any further digital action taken on it.
Migration of Data, Software, and Storage Media
Migration of Data, Software, and Storage Media is an essential component of active maintenance of a digital archive, as it allows us to preserve our archival data by migrating it to new formats, software, or storage media. Migration needs to be performed timely, in a systematic and carefully planned way, following clear rules and including the set of preservation actions—checkups of fixity, validity, and quality assurance—as a mandatory step both before and after the actual transfer of files.
Monitoring
Monitoring the digital archive software and improving it when needed ensures that it continues to meet our requirements and avoids it becoming obsolete. However, if the monitoring shows that a software can no longer be adapted or that it is losing its support community, we will need to find a new appropriate software solution and migrate to it. Monitoring and Preservation of archival data are actions that need to be performed on the digital archival data in the maintenance phase. This is in essence a continuation of the work done as part of the preparation of the digital material for ingest, including the backup of data, checkups of file formats, validity, fixity, and quality assurance. Monitoring and preservation actions must be planned and performed regularly to check and amend any irregularities or errors. Monitoring Storage Media is necessary to timely detect any errors or damage and prevent it from becoming obsolete or outdated. Over time, storage media can become unstable and unreliable and cause data corruption or loss. A rule of thumb for a safe preservation practice is for storage media to have a short life cycle, sometimes estimated at only three to five years. This means that after this period, we will need to find and obtain a new storage media and migrate our data to it.
Non-structured material
...
Open-source
...
Optical Character Recognition (OCR) Software
Optical Character Recognition (OCR) software allows for the creation of fully searchable documents from originally non-searchable image files. In essence, by running an OCR software on our scanned image of a document, we add a layer of text onto that image file so other software can read it, which makes the document fully searchable. This is essential for making human rights archives more accessible and visible, which is often a key purpose of their digitization.
Organization
Organization of material for archiving involves introducing a certain logical and hierarchical order into it and thereby devising its structure. This is done on the level of item groups identified through the Inventory, using the organization’s knowledge and understanding of the material.
Outreach Strategy
Outreach Strategy of a digital archive describes its outreach goals and beneficiaries and a plan of activities. It can help achieve the activism goals of the archive—be it to inform, educate, raise awareness, or to seek truth, accountability or reparations—and also to make them more feasible and attainable. An archive with a bigger presence and impact in the community, with wider visibility and credibility, will be more likely to engage a range of actors necessary for its long-term sustainability. This includes expert staff, users, CSOs, and other partners, donors, teachers, students, universities, supporters, mentors, journalists, and others who can and need to contribute to a digital archive’s successful creation, maintenance, and development.
Outsourcing
...
Physical archive
...
Planning
...
Privacy Regulations
...
Public Access
...
Quality standards
...
Records
...
Resourcing and Fundraising Plan
Resourcing and Fundraising Plan should contain a thorough assessment of the overall resource needs related to the development of the digital archive, broken down by phases and activities. This should include an analysis of the more immediate short- and medium-term needs in developing the digital archive (i.e., which resources need to be obtained and within which time frame). Additional assessment should then be made of the resources the organization already has or can reasonably easily acquire. Based on these assessments, a realistic (time- and resources-wise) feasible plan should be made for securing the necessary resources and funds for developing a digital archive, both in terms of immediate steps and in the long term.
Searchable, Search Engine
...
Secondary files
...
Security and safety
...
Selection and Prioritization
Selection and Prioritization are archival procedures in which we make decisions on which groups of source materials should be preserved and for how long, and what the order of their preservation should be.
Selection process
...
Selection Report
...
Server-based storage
...
Size
...
Software
...
Storage
...
Storage media
...
Subgroup
...
System Protection
System Protection is the first function of data security for a digital archive, because in order to protect the content—the data—we must first safeguard its repository. System protection includes safeguarding against system failures as well as protecting the Digital Archiving System from malicious acts of corruption or deletion.
Table of the Archive's Structure
Table of the Archive's Structure is an advanced version of the identification Inventory, which reflects a hierarchical arrangement of series and collections of item groups. In the table of the archive's structure, the main units of analysis—described in terms of their size, format, amount, etc.—are not only individual item groups but also series and collections of these item groups, arranged in a hierarchical way. The table of the archive's structure hence contains information about our material, metadata (on the archive’s structure, grouping of files in collections, series, subseries, and folders), and additional descriptive and technical metadata that we selected to add into it. It is a necessary tool that allows proper archival processing of the source material and the archive’s organization and management.
Technological development
...
Type of material
...
Unique identification number
...
Users
...
Validation
Validation of digital archival files is the process of establishing whether they are what we think they are. Through file validation, we check whether the format of a file is proper and correct—whether it is valid. In this way, we determine whether a file conforms to the specific file format specification or standards a specific file format such as .jpg, .doc., or TIFF must follow.