Termes et concepts clés
Un schéma de niveaux d’accès
Un schéma de niveaux d’accès fait partie du Plan d’accès aux archives et fournit une vue d’ensemble de « qui a accès à quoi, et comment » sous forme de tableau. Car différents modes d’accès peuvent être nécessaires pour différents groupes d’utilisateurs, en fonction du niveau d’accès autorisé à chaque matériel, un schéma de niveaux d’accès permet d’éviter toute confusion et erreur.
Approche active et passive
A passive access approach would be an archive created with the main goal of long-term preservation of the material for historical, legal, or other reasons. However, most CSOs working with human rights violations archives will likely be taking the other route of an active approach to providing access, which is focused on facilitating and providing as wide access as possible to its users.
Maintenance active
La maintenance active d’une archive numérique est nécessaire à la fois pour assurer son fonctionnement et pour garantir la préservation à long terme, l’authenticité et l’accès à son contenu numérique. Si le format des fichiers numériques devient obsolète, si le support de stockage tombe en panne ou si le logiciel de sauvegarde est dépassé et défectueux, le contenu numérique d’archives peut être compromis, endommagé ou perdu complètement, entraînant ainsi la perte de tout le travail investi dans la construction et le développement de l’archive numérique. La maintenance active d’une archive numérique nécessite une approche systématique ainsi que l’exécution régulière d’un ensemble d’actions, incluant la surveillance et la migration.
Document analogique
Antivirus
Fonds d'archives
Règles d'archivage
Tableau de structure des archives
Techniques d'archivage
Archive
Plan d'accès aux archives
Un Plan d’accès aux archives guide à la fois la prise de décision et la mise en œuvre liées à l’accès au matériel d’archives. Il s’agit de trouver un équilibre entre l’objectif d’assurer un accès aussi large que possible à une archive et la responsabilité de protéger les données et de respecter les normes légales et éthiques en matière de confidentialité, de sensibilité, de confidentialité et de droits d’auteur. Un plan d’accès aux archives bien réfléchi et clair aidera à atteindre cet équilibre.
Numérique de naissance
Chaîne de contrôle
Collection
Les groupes de documents les plus génériques sont souvent appelés "collections" ou, en termes strictement archivistiques, "fonds". Chaque collection est divisée en "séries", qui peuvent contenir des pièces individuelles, ainsi qu'en "sous-séries" et en "dossiers" (parfois également appelés "fichiers"), qui sont des unités de structure plus petites et subordonnées, contenant elles aussi des pièces.
Documentation des données
La documentation des données fournit des informations sur le contexte de nos données ainsi que sur notre contenu d’archives numériques, souvent présenté sous forme textuelle ou autrement compréhensible par l’humain. La documentation des données complète les métadonnées et fournit des informations permettant à d’autres personnes d’utiliser le contenu archivé. Comme la documentation des données est également « des données sur les données », elle peut être considérée comme un type spécifique de métadonnées, fournissant un contexte et enregistrée dans un format convivial.
Protection des données
Qu'il s'agisse de données privées, sensibles, confidentielles ou protégées par des droits d'auteur, la protection des données est l'essence même de la planification de la sécurité de nos archives. Il existe trois instruments principaux, ou actions, qu'un service d'archives peut mettre en œuvre pour protéger ses données : le contrôle et la gestion de l'accès, le caviardage et le cryptage.
Sécurité des données
Description des matériels d’archives
La description des matériels d’archives permet une conservation adéquate des archives et guide les futurs utilisateurs en fournissant des informations contextuelles importantes. Le contenu d’une archive doit être décrit de manière à permettre à quiconque de rechercher, localiser et accéder aux éléments de la collection, ce qui permettra d’établir des liens entre les éléments, même s’ils proviennent de différents groupes. En termes simples, sans description, une archive ressemblerait davantage à un simple espace de stockage dans lequel il deviendrait éventuellement impossible de trouver ou de gérer le contenu.
Plan de sécurité des archives numériques
Un plan de sécurité d’archive numérique guide l’élaboration des procédures de sécurité et leur mise en œuvre. Pour assurer la sécurité de l’archive au regard de son contenu, un plan détaillé doit énumérer et décrire les obligations de sécurité, les fonctions de sécurité à effectuer, les actions de sécurité à mettre en place pour garantir une exécution adéquate des fonctions, ainsi que les outils et technologies nécessaires à sa mise en œuvre.
Archives numériques
Les Archives numériques sont des archives qui renferment des matériels sous forme numérique, incluant à la fois des éléments nativement numériques et des versions numérisées de matériels physiques d’origine. Ces archives sont stockées sur des supports numériques et gérées à l’aide d’outils informatiques.
Archivage numérique
L’archivage numérique est le processus de création, de gestion et de développement d’archives numériques.
Modèle de cycle de vie de l'archivage numérique
Un modèle de cycle de vie pour l’archivage numérique reflète la caractéristique clé de cette pratique, à savoir son caractère circulaire et continu. Il s’agit d’un processus cyclique dans lequel les étapes se succèdent continuellement, sans point final. Le modèle du cycle de vie souligne également l’importance de prendre des mesures et de gérer activement une archive numérique tout au long de son existence. En même temps, le modèle présente clairement le large éventail de responsabilités impliquées dans le processus d’archivage numérique. En somme, le Modèle de Cycle de Vie souligne que les décisions et les actions prises à chaque phase ont des conséquences sur ce qui peut être fait à chaque étape suivante et dans chaque nouvelle itération du processus.
Le modèle de cycle de vie d’archivage numérique appliqué dans ce manuel a été développé pour répondre aux besoins et défis spécifiques des OSC. Il reflète certains des éléments du modèle de référence OAIS et en partie la structure du modèle de cycle de vie du DCC. Le modèle OAIS est le modèle le plus largement utilisé pour l’archivage numérique, tandis que le modèle de cycle de vie du DCC comprend de nombreuses considérations qui affectent également les OSC engagées dans l’archivage numérique.
Système d'archivage numérique
Un Système d’Archivage Numérique est un ensemble de composants logiciels et matériels qui comprend des bases de données, des outils logiciels pour gérer ces bases de données et des supports de stockage ; il s’agit de l’infrastructure technologique d’une archive numérique. Il définit la portée et les limites des fonctions de l’archive et est essentiel pour atteindre son objectif et ses objectifs. Le principal objectif de l’archivage numérique est de garantir que le contenu de grande valeur que nous préservons reste inchangé et accessible longtemps grâce à un cadre technologique adéquat et pérenne pour l’archivage numérique.
Techniques d'archivage numérique
Copie numérique
Nom du fichier numérique
Le nom de fichier numérique d’un élément d’archive numérique joue un rôle très important comme descripteur de cet élément particulier. Il doit contenir des informations nous permettant d’identifier ce qu’est l’élément et ce qu’il contient, afin que nous puissions le localiser dans l’archive, le gérer et le préserver correctement.
Domaine de l’archivage numérique
Dans le domaine de l’archivage numérique, l’investigation numérique désigne l’ensemble des techniques logicielles et des applications qui permettent d’accéder et d’analyser les matériels d’archives numériques en relation avec leur authenticité, leur responsabilité et leur accessibilité. Cette question est particulièrement pertinente pour les formats de stockage de données plus anciens ou lorsqu’on travaille avec du matériel numérique d’origine incertaine et de caractéristiques floues, surtout lorsque l’historique du matériel et la « chaîne de surveillance » n’ont pas été établis. L’investigation numérique nous permet, par exemple, d’extraire les métadonnées pertinentes, d’accéder au contenu archivé dans des formats numériques obsolètes, d’établir une chaîne de surveillance, de détecter la manipulation et la falsification de données, ainsi que d’identifier les problèmes de confidentialité des données.
Substituts numériques
Les substituts numériques sont des copies numériques d’éléments d’archives physiques traités, préservés et rendus accessibles en tant qu’objets d’archives numériques. Les substituts numériques peuvent provenir de différents types d’objets physiques tels que des documents, des cartes, des vidéos, des artefacts, etc. Ils peuvent aussi être stockés dans différents formats numériques.
Numérisation
La numérisation est un processus de création de copies numériques, ou « substituts », d’éléments physiques originaux. Ces copies numériques sont ensuite traitées en tant qu’objets d’archivage numériques. Différents types d’objets physiques peuvent être numérisés puis stockés sur une variété de supports. Ils peuvent inclure, par exemple, du texte, des photographies, des dessins, des cartes, des vidéos, de l’audio et d’autres types de contenu, stockés sur papier, des cassettes audio, des bandes VHS ou tout autre support de stockage physique ou analogique. Les copies numériques pourraient également inclure des objets tels que des vêtements, des bannières, des effets personnels, etc. Le type de matériel à numériser déterminera les procédures, les technologies, les formats numériques et autres éléments de tout processus de numérisation concret.
Flux de travail de la numérisation
Le flux de travail de la numérisation est un plan ou un schéma qui devrait inclure toutes les actions et opérations de numérisation, en commençant par l’examen et la préparation des éléments physiques et de l’espace de travail, jusqu’à l’achèvement du flux de travail en stockant les substituts numériques créés et en faisant des copies de sauvegarde. Chaque projet de numérisation aura son propre flux de travail, sa séquence spécifique d’actions et d’opérations. Bien que les actions spécifiques et leurs séquences soient adaptées à chaque projet concret, nous pouvons identifier les éléments clés requis dans n’importe quel flux de travail de numérisation : la préparation, la planification du processus, la numérisation, le contrôle qualité, le post-traitement, ainsi que le stockage et la sauvegarde.
Plan de Reprise d’Activité
Un Plan de Reprise d’Activité détaille comment nos données seront récupérées ou remplacées en cas de catastrophe naturelle ou causée par l’homme, de dommages, de vol ou d’attaque malveillante sur notre contenu d’archives numériques ou notre système. Cette solution repose sur les arrangements de sauvegarde existants, lesquels définissent le nombre de copies de sauvegarde, leur emplacement géographique ainsi que le type de support de stockage utilisé. Le plan de Reprise d’Activité après sinistre doit inclure des instructions sur l’utilisation de nos copies de sauvegarde dans différentes situations de catastrophe, comme sur les moyens technologiques à utiliser pour remplacer et récupérer les données en cas de sinistre.
Événements
Accès externe
L’intégrité
L’intégrité, un élément crucial pour la préservation à long terme des fichiers ainsi que pour maintenir leur authenticité et leur utilisabilité, se définit comme un état d’immuabilité ou de permanence. En substance, la vérification de l’intégrité nous permet de déterminer si un fichier a été modifié ou corrompu au fil du temps, et de suivre et d’enregistrer ces changements.
Formats
Plan Général
Le Plan Général d’une archive numérique est la première étape cruciale dans le processus de son développement. Il définit la raison et la méthode du développement des archives en leur fournissant des Principes Directeurs, ainsi que des décisions clés concernant le contenu, l’accès, l’organisation, la technologie et les ressources principales. Le Plan Général, grâce à sa planification détaillée, avancée et à grande échelle, aidera l’organisation à naviguer avec succès à travers les divers défis qui surgiront lors des étapes ultérieures du processus de création d’archives numériques.
Principes Directeurs
Les Principes Directeurs d’une archive numérique résument la logique derrière son développement. Ils expliquent pourquoi une archive est nécessaire, qui l’utilisera, comment elle sera utilisée, ainsi que les avantages attendus de sa création et de son développement. Les Principes Directeurs abordent également les ressources et technologies requises, les responsabilités légales et liées à la sécurité, comme les questions organisationnelles.
Organisations de défense des droits de l'homme
Violations des droits de l'homme
L’Inventaire d’Identification
L’Inventaire d’Identification est la liste initiale des groupes d’éléments que nous pouvons identifier dans le matériel que nous souhaitons archiver numériquement. Il s’agit d’un tableau qui répertorie les groupes d’éléments identifiés et qui inclut des informations sur leur type, leur format, leur taille, leur quantité, leur état, leur emplacement et leur espace de stockage ou leur support de stockage. L’inventaire d’identification nous fournit une vue d’ensemble claire de notre matériel source, en quantité, sous quelles formes et formats.
Indexation
L’intégration
L’intégration est le processus de transfert d’éléments numériques dans l’archive numérique. Durant ce processus, les données, leurs métadonnées et la documentation des données sont stockées et liées mutuellement au sein du Système d’Archivage Numérique. Avant l’intégration et après sa finalisation, il est nécessaire d’appliquer un ensemble d’actions de préservation au contenu numérique. Cela comprend la numérisation des fichiers numériques et des copies de sauvegarde avec un logiciel antivirus, ainsi que la vérification de l’intégrité, de la validité et de la qualité de chaque fichier.
Connaissances institutionnelles
Intégrité
Infrastructure Internet
Inventaire
Item
Niveaux de protection
Cycle de vie
Préservation à long terme
Plan de Maintenance
Le Plan de Maintenance est axé sur les deux principales séries d’actions de maintenance. Il répertorie, décrit et planifie l’exécution des activités de surveillance, de maintenance et de migration. Les éléments spécifiques du Plan de Maintenance, tels que les périodes régulières de vérification ou les procédures concrètes, sont définis en fonction des besoins particuliers de chaque archive.
Les fichiers maîtres
Les fichiers maîtres sont les fichiers de la meilleure qualité possible produits par numérisation. Ils sont destinés à être préservés à long terme sans perte de caractéristiques essentielles. Le nombre de fichiers maîtres que nous créerons dépendra du contenu des originaux et des utilisations prévues du substitut numérique. En plus des fichiers maîtres, nous pouvons également produire un certain nombre de fichiers secondaires, appelés fichiers d’« accès » ou de « service ». Ces fichiers sont créés à partir du fichier maître et optimisés pour l’utilisation prévue, par exemple, pour le web ou pour la recherche.
Stockage des médias
Métadonnées
Les métadonnées font référence aux descriptions des éléments d’archives. Il est essentiel de collecter les métadonnées pertinentes, de les attacher aux éléments d’archives numériques, puis de les stocker sous une forme structurée adaptée au traitement logiciel. Sans ses métadonnées rattachées, le matériel d’archivage numérique devient dénué de sens et inutilisable. Nous pourrions être incapables de le trouver ou de l’identifier, de comprendre son contexte, son histoire, son créateur ou encore où il se situe dans les archives. Les éléments d’archives numériques permettent de collecter une gamme de métadonnées, telles que les spécifications techniques d’un fichier numérique d’archives, des informations sur sa création ou toute autre action numérique ultérieure effectuée sur celui-ci.
Migration des données, des logiciels et des supports de stockage
La migration de données, de logiciels et de supports de stockage est un élément essentiel de la maintenance active d’une archive numérique. Elle nous permet de préserver nos données d’archives en les migrant vers de nouveaux formats, logiciels ou supports de stockage. La migration doit être effectuée de manière opportune, systématique et soigneusement planifiée, en suivant des règles claires et en incluant un ensemble d’actions de préservation. Ces actions doivent inclure la verification de l’intégrité, de la validité et de l’assurance qualité, qui doivent être effectuées obligatoirement avant et après le transfert réel des fichiers.
Surveillance
La surveillance du logiciel d’archivage numérique et son amélioration, en cas de besoin, garantissent qu’il continue à répondre à nos exigences et évitent qu’il ne devienne obsolète. Cependant, si la surveillance révèle qu’un logiciel ne peut plus être adapté ou qu’il perd son soutien communautaire, nous devrons trouver une nouvelle solution logicielle appropriée et migrer vers celle-ci.
La surveillance et la préservation des données d’archives sont des actions qui doivent être effectuées sur les données d’archives numériques lors de la phase de maintenance. En somme, il s’agit de poursuivre le travail entamé pour préparer le matériel numérique à l’intégration, en incluant la sauvegarde des données, les vérifications de formats de fichier, de validité, d’intégrité et de qualité. Les actions de surveillance et de préservation doivent être planifiées et effectuées régulièrement afin de vérifier et de corriger toute irrégularité ou erreur.
La surveillance des supports de stockage est nécessaire afin de détecter rapidement toute erreur ou dommage, ainsi que pour éviter qu’ils ne deviennent obsolètes ou dépassés. Avec le temps, les supports de stockage peuvent devenir instables et peu fiables, ce qui peut entraîner la corruption ou la perte de données. Pour une pratique de préservation sûre, il est recommandé que les supports de stockage aient une durée de vie courte, souvent estimée à seulement trois à cinq ans. Cela signifie qu’après cette période, nous devrions trouver et obtenir un nouveau support de stockage et y migrer nos données.
== Matériau non structuré
Open-source
Logiciel de reconnaissance optique de caractères (OCR)
Le logiciel de reconnaissance optique de caractères (OCR) permet de créer des documents entièrement consultables à partir de fichiers d’images qui étaient initialement non consultables. En substance, en exécutant un logiciel OCR sur notre image numérisée d’un document, nous ajoutons une couche de texte à ce fichier image, permettant ainsi à d’autres logiciels de le lire et rendant le document complètement consultable. Ceci est essentiel pour rendre les archives des droits de l’homme plus accessibles et plus visibles, ce qui est souvent un objectif clé de leur numérisation.
Organisation
L’organisation du matériel pour l’archivage implique d’introduire un certain ordre logique et hiérarchique, ce qui nécessite de concevoir sa structure. Cela se fait au niveau des groupes d’éléments identifiés par l’Inventaire, en utilisant la connaissance et la compréhension du matériel par l’organisation.
Outreach Strategy
La stratégie de sensibilisation d’une archive numérique décrit ses objectifs de sensibilisation, ses bénéficiaires ainsi qu’un plan d’activités. Il peut aider à atteindre les objectifs d’activisme de l’archive – qu’il s’agisse d’informer, d’éduquer, de sensibiliser ou de chercher la vérité, la responsabilité ou les réparations – tout en les rendant plus réalisables et accessibles. Une archive ayant une présence plus importante et un impact plus large dans la communauté, ainsi qu’une visibilité et une crédibilité accrues, sera plus à même d’impliquer une gamme d’acteurs nécessaires à sa pérennité. Cela inclut le personnel expert, les utilisateurs, les OSC, comme d’autres partenaires tels que les donateurs, les enseignants, les étudiants, les universités, les soutiens, les mentors, les journalistes et toutes les personnes qui peuvent et doivent contribuer à la création, à la maintenance et au développement réussis d’une archive numérique.
Externalisation
Archives physiques
Planification
Règlement sur la protection de la vie privée
Accès public
Normes de qualité
Records
Plan de ressources et de collecte de fonds
Un Plan de ressources et de collecte de fonds doit contenir une évaluation approfondie des besoins en ressources globales liées au développement de l’archive numérique, décomposée par phases et activités. Pour développer l’archive numérique, il est essentiel d’analyser les besoins immédiats à court et moyen terme, c’est-à-dire les ressources à obtenir et le délai imparti pour les obtenir. Il convient ensuite de procéder à une évaluation supplémentaire des ressources dont dispose déjà l’organisation ou qu’elle peut facilement acquérir. À partir de ces évaluations, il convient d’élaborer un plan réalisable (en termes de temps et de ressources) pour sécuriser les ressources et les fonds nécessaires au développement d’une archive numérique, tant pour les étapes immédiates que pour le long terme.
Recherche et moteur de recherche
Fichiers secondaires
Sécurité et sûreté
Sélection et priorisation
La sélection et la priorisation sont des procédures d’archivage au cours desquelles nous prenons des décisions sur les groupes de matériels sources qui doivent être préservés, pendant combien de temps, ainsi que sur l’ordre de leur conservation.
Processus de sélection
Rapport de sélection
Stockage sur serveur
Taille
Logiciel
Stockage
Supports de stockage
Sous-groupe
Protection du système
La protection du système est la première fonction de la sécurité des données pour une archive numérique. En effet, pour protéger le contenu (les données), il est essentiel de protéger en premier lieu l’emplacement dans lequel elles sont stockées. La protection du système consiste à se prémunir contre les défaillances du système, ainsi qu’à protéger le Système d’Archivage Numérique contre les actes malveillants tels que la corruption ou la suppression.
Tableau de la structure de l'archive
Un Tableau de la Structure des Archives est une version avancée de l’Inventaire d’Identification, qui reflète l’organisation hiérarchique des séries et des collections de groupes d’éléments. Dans le tableau de la structure d’archives, les principales unités d’analyse – décrites en termes de leur taille, format, quantité, etc – ne se limitent pas aux groupes d’éléments individuels. Cependant, ils incluent également des séries et des collections de ces groupes d’articles, organisées de manière hiérarchique. Le tableau de la structure de l’archive contient donc des informations sur notre matériel, ainsi que des métadonnées sur la structure de l’archive, le regroupement des fichiers en collections, séries, sous-séries et dossiers. Nous avons aussi ajouté des métadonnées descriptives et techniques supplémentaires pour enrichir ces informations. Il s’agit d’un outil indispensable qui permet un traitement d’archivage adéquat du matériel source, comme l’organisation et la gestion de l’archive.
Développement technologique
Type de matériau
Numéro d'identification unique
Utilisateurs
Validation
La validation des fichiers d’archives numériques consiste à déterminer s’ils sont réellement ce que nous pensons qu’ils sont. Grâce à la validation de fichiers, nous vérifions si le format d’un fichier est adéquat et correct, c’est-à-dire s’il est valide. Ainsi, nous pouvons déterminer si un fichier est conforme aux spécifications ou aux normes d’un format de fichier spécifique, tel que .jpg, .doc ou TIFF.