Curation numérique - Digital curation

La curation numérique est la sélection, la préservation , la maintenance, la collecte et l' archivage des actifs numériques . La curation numérique établit, maintient et ajoute de la valeur aux référentiels de données numériques pour une utilisation présente et future. Ceci est souvent accompli par des archivistes , des bibliothécaires, des scientifiques, des historiens et des universitaires. Les entreprises commencent à utiliser la curation numérique pour améliorer la qualité des informations et des données dans leurs processus opérationnels et stratégiques. Une curation numérique réussie atténuera l'obsolescence numérique, gardant les informations accessibles aux utilisateurs indéfiniment. La curation numérique comprend la gestion des actifs numériques, la conservation des données, la préservation numérique et la gestion des enregistrements électroniques.

Histoire des mots

Tout comme le mot archive a des significations et des utilisations en couches, le mot curation est à la fois un nom et un verbe utilisés à l'origine dans le domaine de la muséologie pour représenter un large éventail d'activités, le plus souvent associées au soin des collections, à la préservation à long terme et à l'exposition. conception.  La conservation peut être une référence à des dépôts physiques qui stockent le patrimoine culturel ou des collections de ressources naturelles (par exemple, un dépôt de conservation) ou une représentation de diverses politiques et processus impliqués dans le soin et la gestion à long terme des collections patrimoniales, des archives numériques et des données de recherche. (p. ex., plans de gestion des conservateurs / collections, cycle de vie de la conservation et conservation des données). Pourtant, la conservation est également associée à des objectifs à court terme et à des processus de sélection et d'interprétation à des fins de présentation, comme pour les expositions de galeries et les sites Web, qui contribuent à la création de connaissances. Il a également été appliqué à l'interaction avec les médias sociaux, y compris la compilation d'images numériques, de liens Web et de fichiers vidéo.

Le terme curation est entré dans le cadre juridique par le biais des lois fédérales sur la préservation historique, à commencer par la National Historic Preservation Act de 1966, et a été davantage défini et codé dans les règlements fédéraux par le biais du 36 CFR Part 79:  Curation of Federally appartenant et administré des collections archéologiques. La conservation a depuis imprégné un éventail de disciplines, mais reste étroitement liée à la gestion du patrimoine et de l'information.

Principes et activités de base

Le terme «curation numérique» a été utilisé pour la première fois dans les domaines de la science électronique et des sciences biologiques pour différencier la suite d’activités supplémentaires habituellement employées par les conservateurs de bibliothèques et de musées pour ajouter de la valeur à leurs collections et permettre sa réutilisation de la sous-tâche plus petite de simplement préserver les données, une tâche d’archivage nettement plus concise. De plus, la compréhension historique du terme « conservateur » exige plus qu'un simple soin de la collection. On s'attend à ce qu'un conservateur maîtrise la maîtrise académique du sujet en tant qu'élément requis de l'évaluation et de la sélection des actifs et de toute valeur ajoutée ultérieure à la collection par l'application de métadonnées.

Des principes

Il existe cinq principes communément acceptés qui régissent l'occupation de la conservation numérique:

  • Gérez le cycle de vie complet de la naissance à la retraite de l'actif numérique.
  • Évaluer et éliminer les actifs à inclure dans la collection.
  • Appliquer des méthodes de conservation pour renforcer l'intégrité et la réutilisabilité de l'actif pour les futurs utilisateurs.
  • Agissez de manière proactive tout au long du cycle de vie de l'actif pour ajouter de la valeur à l'actif numérique et à la collection.
  • Faciliter le degré approprié d'accès aux utilisateurs.

Méthodologie

Le Digital Curation Center propose les procédures de cycle de vie étape par étape suivantes pour mettre en pratique les principes ci-dessus:

Actions séquentielles:

  • Conceptualisez: considérez le matériel numérique que vous allez créer et développez des options de stockage. Tenez compte des sites Web, des publications, du courrier électronique, entre autres types de sortie numérique.
  • Créer: Produisez du matériel numérique et joignez toutes les métadonnées pertinentes , généralement plus il y a de métadonnées, plus les informations sont accessibles.
  • Évaluer et sélectionner: Consultez l'énoncé de mission de l'institution ou de la collection privée et déterminez quelles données numériques sont pertinentes. Il peut également y avoir des directives juridiques en place qui guideront le processus de décision pour une collection particulière.
  • Ingestion: envoyez du matériel numérique à la solution de stockage prédéterminée. Cela peut être une archive, un référentiel ou une autre installation.
  • Action de préservation: utiliser des mesures pour maintenir l'intégrité du matériel numérique.
  • Stocker: sécuriser les données dans l'installation de stockage prédéterminée.
  • Accès, utilisation et réutilisation: déterminez le niveau d'accessibilité pour la gamme de matériel numérique créé. Certains éléments peuvent être accessibles uniquement par mot de passe et d'autres éléments peuvent être librement accessibles au public. Vérifiez régulièrement que le matériel est toujours accessible pour le public visé et que le matériel n'a pas été compromis par de multiples utilisations.
  • Transformer: si cela est souhaitable ou nécessaire, le matériel peut être transféré dans un format numérique différent.

Actions occasionnelles:

  • Éliminer: jetez tout matériel numérique qui n'est pas jugé nécessaire pour l'institution.
  • Réévaluer: réévaluer le matériel pour s'assurer qu'il est toujours pertinent et qu'il est fidèle à sa forme originale.
  • Migrer: Migrez les données vers un autre format afin de protéger les données pour une meilleure utilisation à l'avenir.

Termes connexes

Le terme «conservation numérique» est parfois utilisé de manière interchangeable avec des termes tels que « conservation numérique » et « archivage numérique ». Bien que la préservation numérique concentre une part importante d'énergie sur l'optimisation de la réutilisabilité, la préservation reste une sous-tâche du concept d'archivage numérique, qui est à son tour une sous-tâche de la conservation numérique. Par exemple, l'archivage fait partie de la conservation, tout comme les tâches ultérieures telles que la création de collections thématiques, qui n'est pas considérée comme une tâche d'archivage. De même, la préservation fait partie de l'archivage, tout comme les tâches de sélection et d' évaluation qui ne font pas nécessairement partie de la préservation.

La curation de données est un autre terme souvent utilisé de manière interchangeable avec la curation numérique, mais l'utilisation commune des deux termes diffère. Alors que « données » est un terme plus général qui peut être utilisé de manière générale pour indiquer tout ce qui est enregistré sous forme binaire, le terme «conservation des données» est le plus courant dans le jargon scientifique et fait généralement référence à l'accumulation et à la gestion d'informations relatives au processus de recherche. . La recherche axée sur les données de l'éducation demande le rôle de professionnel de l'information de développer progressivement la tradition du service numérique à la curation de données en particulier à la gestion des données de recherche numériques. Ainsi, alors que les documents et autres actifs numériques discrets sont techniquement un sous-ensemble du concept plus large de données, dans le contexte de la curation numérique scientifique vernaculaire représente un champ de responsabilités plus large que la curation des données en raison de son intérêt à préserver et à ajouter de la valeur aux actifs numériques de toute sorte.

Défis

Taux de création de nouvelles données et ensembles de données

Le coût toujours plus bas et la prévalence croissante de catégories entièrement nouvelles de technologies ont conduit à un flux croissant rapidement de nouveaux ensembles de données. Ceux-ci proviennent de sources bien établies telles que les entreprises et le gouvernement, mais la tendance est également motivée par de nouveaux styles de capteurs qui s'intègrent dans davantage de domaines de la vie moderne. Cela est particulièrement vrai des consommateurs, dont la production d'actifs numériques n'est plus reléguée strictement au travail. Les consommateurs créent désormais une gamme plus large d'actifs numériques, y compris des vidéos, des photos, des données de localisation, des achats et des données de suivi de la condition physique, pour n'en nommer que quelques-uns, et les partagent sur une plus large gamme de plateformes sociales.

De plus, les progrès de la technologie ont introduit de nouvelles façons de travailler avec les données. Quelques exemples de cela sont des partenariats internationaux qui exploitent les données astronomiques pour créer des «observatoires virtuels», et des partenariats similaires ont également exploité des données issues de la recherche au Grand collisionneur de hadrons du CERN et de la base de données des structures protéiques de la Protein Data Bank .

Évolution et obsolescence du format de stockage

Par comparaison, l'archivage des actifs analogiques est notamment de nature passive, souvent limité à la simple garantie d'un environnement de stockage adapté. La préservation numérique nécessite une approche plus proactive. Les artefacts d'aujourd'hui d'importance culturelle sont particulièrement transitoires par nature et sujets à l'obsolescence lorsque les tendances sociales ou les technologies dépendantes changent. Cette progression rapide de la technologie rend parfois nécessaire la migration des actifs numériques d'un format de fichier à un autre afin d'atténuer les dangers d'obsolescence matérielle et logicielle qui rendraient l'actif inutilisable.

Sous-estimation des coûts de main-d'œuvre humaine

Les outils modernes de planification de programmes sous-estiment souvent le montant des coûts de main-d'œuvre humaine requis pour une conservation numérique adéquate de grandes collections. En conséquence, les évaluations coûts-avantages brossent souvent un tableau inexact à la fois de la quantité de travail impliquée et du coût réel pour l'institution tant pour les réussites que pour les échecs.

Le concept de coût dans le domaine des affaires serait plus évident. Divers systèmes d'entreprise sont en cours d'exécution pour les opérations quotidiennes. Par exemple, les systèmes de ressources humaines traitent du recrutement et de la paie, les systèmes de communication gèrent le courrier électronique interne et externe, et les systèmes administratifs gèrent les finances, le marketing et d'autres aspects. Cependant, les systèmes commerciaux des institutions ne sont pas initialement conçus pour la préservation à long terme de l'information. Dans certains cas, les systèmes d'entreprise sont révisés pour devenir des systèmes de conservation numérique pour préserver les informations de transaction en raison de la considération des coûts. L'exemple des systèmes d'entreprise sont les applications de gestion de contenu d'entreprise (ECM), qui sont utilisées par des groupes désignés tels que les dirigeants d'entreprise, les clients pour la gestion de l'information qui prennent en charge les processus clés au niveau organisationnel. À long terme, transférer le contenu numérique des applications ECM vers les applications de conservation numérique (DC) serait une tendance dans les grandes organisations au niveau national ou international. L'amélioration des modèles de maturité d'ECM et de DC peut ajouter de la valeur aux informations qui nécessitent une déduction des coûts et une utilisation extensive pour des modifications ultérieures.

Normalisation et coordination entre les institutions

L'absence de coordination entre les différents secteurs de la société et de l'industrie dans des domaines tels que la normalisation des définitions sémantiques et ontologiques , et la formation de partenariats pour une bonne gestion des actifs a entraîné un manque d'interopérabilité entre les institutions et une rupture partielle de la pratique de la curation numérique. du point de vue de l'utilisateur ordinaire. L'exemple de coordination est l'Open Archival Information System (OAIS).

Le modèle de référence OAIS permet aux professionnels et à de nombreuses autres organisations et individus de contribuer aux efforts des forums ouverts de l'OAIS pour développer des normes internationales d'informations archivistiques en accès à long terme.

Numérisation de matériaux analogiques

La conservation des objets numériques ne se limite pas aux actifs strictement numériques. De nombreuses institutions se sont engagées dans des efforts monumentaux pour numériser les fonds analogiques dans le but d'améliorer l'accès à leurs collections. Des exemples de ces matériaux sont des livres, des photographies, des cartes, des enregistrements audio, etc. Le processus de conversion des ressources imprimées en collections numériques a été incarné dans une certaine mesure par les bibliothécaires et les spécialistes apparentés. Par exemple, on prétend que le Digital Curation Center est un "centre d'expertise de premier plan dans le domaine de la conservation de l'information numérique" qui assiste les établissements de recherche de l'enseignement supérieur dans de telles conversions.

Types de matériaux

Manuscrits

Patrimoine culturel bâti

Artefacts
Monuments ou biens architecturaux

De nos jours, avec le développement des TIC et de la visualisation informatisée, les conservateurs bénéficient des méthodes de reconstruction 3D et de Digital Twin pour non seulement représenter leurs ensembles de données actualisés et authentiques sur le patrimoine culturel, mais également aider les architectes de conservation et les autres experts dans d'autres pratiques sur les actifs. .

Patrimoine culturel immatériel

Folklore

Nouveaux formats de représentation

Pour certains sujets, les connaissances sont incarnées sous des formes qui n'ont pas été propices à l'impression, comme la difficulté à coder la chorégraphie de la danse ou du mouvement d'ouvriers ou d'artisans qualifiés. De nouvelles approches numériques telles que les hologrammes 3D et autres expressions programmées par ordinateur se développent.

Pour les mathématiques, il semble possible de développer un nouveau langage commun qui exprimerait des idées mathématiques de manière à pouvoir être stocké numériquement, lié et rendu accessible. La Global Digital Mathematics Library est un projet visant à définir et développer un tel langage.

Accessibilité

La capacité de la communauté d'utilisateurs prévue à accéder aux fonds du référentiel est d'une importance égale à toutes les tâches de conservation précédentes. Cela doit prendre en compte non seulement le format et les préférences de communication de la communauté des utilisateurs, mais également une prise en compte des communautés qui ne devraient pas y avoir accès pour diverses raisons juridiques ou de confidentialité.

L'accès peut être amélioré en fournissant des informations sur le statut de l' accès ouvert avec des données ouvertes et des méthodes open source telles que les points de terminaison OAI-PMH d'une archive ouverte , qui sont ensuite agrégées par des bases de données et des moteurs de recherche tels que BASE , CORE et Unpaywall pour les articles universitaires.

Réponses aux défis

  • Institutions de recherche spécialisées

Il existe trois éléments pour les besoins essentiels des institutions traitant des questions de conservation numérique: le leadership, les ressources et la collaboration. Trois éléments liés au rôle des gardiens d'avance pour les bibliothécaires et les archivistes travaillant avec des approches ouvertes de la technologie, des processus normalisés et des communications savantes. L'archiviste avec leadership, qui doit jouer un rôle dynamique et actif pour adopter la technologie, les processus normalisés et la communication savante. En outre, le chef archiviste peut adopter le concept commercial et les méthodes pour gérer son flux de travail, comme lever des fonds, investir dans le système technologique et se conformer aux normes de l'industrie, afin d'obtenir plus de ressources. La collaboration au sein de la communauté des archives et de la conservation numérique pourrait fournir et partager des formations, des technologies, des normes et des outils pour aider les institutions sur les questions contestables de la conservation numérique. Digital Preservation Coalition (DPC), l'Open Preservation Foundation ou de nouveaux partenariats offrent des opportunités de collaboration aux institutions confrontées à des défis similaires en matière de conservation numérique.

  • Cours académiques

Le domaine de l'information, en particulier dans les bibliothèques, les archives et les musées, doit considérablement apporter la connaissance des nouvelles technologies. L'enseignement traditionnel des études supérieures ne suffit pas à répondre à cette demande; un programme de formation pour le personnel actuel du référentiel culturel serait un complément efficace à cette demande, comme des ateliers professionnels et des MOOC (cours en ligne massivement ouverts) sur la conservation et la gestion des données.

  • Symposiums dédiés

International Digital Curation Conference (IDCC) est un événement annuel établi depuis 2005, visant à collaborer avec des individus, des organisations et des institutions confrontés à des défis, en soutenant le développement et en échangeant des idées sur le terrain.

  • Revues techniques et industrielles à comité de lecture

L'International Journal of Digital Curation (IJDC) est administré par le comité de rédaction de l'IJDC comprenant le rédacteur en chef du Digital Curation Center (DCC) et les membres suivants. IJDC se consacre à fournir une plate-forme scientifique pour le partage, la discussion et l'amélioration des connaissances et des informations sur la conservation numérique au sein de la communauté mondiale. L'IJDC a deux types de soumission en vertu des directives éditoriales, qui sont des articles évalués par des pairs et des articles généraux basés sur des recherches originales, des informations sur le terrain et des événements pertinents dans la curation numérique. IJDC est publié par l'Université d'Edimbourg pour le Digital Curation Centre sous forme électronique sur une base continue deux fois par an. Le libre accès au public soutient les connaissances échangeables dans la conservation numérique dans le monde entier.

Approches

De nombreuses approches de la conservation numérique existent et ont évolué au fil du temps en réponse à l'évolution du paysage technologique. La curation et la canalisation en sont deux exemples.

La curation pure est une approche de la curation numérique où les activités de curation sont discrètement intégrées dans le flux de travail normal de ceux qui créent et gèrent des données et d'autres actifs numériques. Le mot pure est utilisé pour souligner la nature légère et pratiquement transparente de ces activités de curation. Le terme pure curation a été inventé par Alistair Miles dans le projet ImageStore et le projet SCARP du UK Digital Curation Centre. L'approche dépend des conservateurs ayant un contact étroit ou une «immersion» dans les pratiques de travail des créateurs de données. Un exemple est l'étude de cas d'un groupe de recherche en neuroimagerie par Whyte et al., Qui a exploré les moyens de renforcer sa capacité de conservation numérique autour du style d'apprentissage d'apprentissage des chercheurs en neuroimagerie, à travers lequel ils partagent l'accès à des ensembles de données et réutilisent des procédures expérimentales.

La conservation pure dépend de l'hypothèse qu'une bonne gestion des données et des actifs numériques au point de création et d'utilisation principale est également une bonne pratique en vue du partage, de la publication et / ou de la préservation à long terme de ces actifs. Par conséquent, la curation pure tente d'identifier et de promouvoir des outils et des bonnes pratiques en matière de gestion des données locales et des actifs numériques dans des domaines spécifiques, où ces outils et pratiques ajoutent une valeur immédiate aux créateurs et aux principaux utilisateurs de ces actifs. La conservation peut être mieux soutenue en identifiant les pratiques existantes de partage, d'intendance et de réutilisation qui ajoutent de la valeur, et en les augmentant de manière à la fois avoir des avantages à court terme et à plus long terme, réduire les risques pour les actifs numériques ou offrir de nouvelles opportunités de pérennisation. leur accessibilité à long terme et leur valeur de réutilisation.

Le but de la conservation pure et simple est d'établir une base solide pour d'autres activités de conservation qui peuvent ne pas profiter directement aux créateurs et aux principaux utilisateurs des actifs numériques, en particulier ceux qui sont nécessaires pour assurer la préservation à long terme. En fournissant cette base, d'autres activités de conservation peuvent être menées par des spécialistes aux niveaux institutionnels et organisationnels appropriés, tout en causant le minimum d'interférence aux autres.

Une idée similaire est la conservation à la source utilisée dans le contexte des systèmes de gestion de l'information de laboratoire LIMS . Cela se réfère plus spécifiquement à l'enregistrement automatique des métadonnées ou des informations sur les données au point de capture, et a été développé pour appliquer des techniques du Web sémantique afin d'intégrer des systèmes d'instrumentation et de documentation de laboratoire. La conservation pure et simple à la source peut être comparée à la préservation numérique post hoc , où un projet est lancé pour préserver une collection d'actifs numériques qui ont déjà été créés et sont au-delà de la période de leur utilisation principale.

La canalisation est la conservation d'actifs numériques sur le Web, souvent par des marques et des entreprises de médias, en flux continus de contenu, transformant l'expérience utilisateur d'un support interactif lean-forward, en un support passif lean-back. La conservation du contenu peut être effectuée par un tiers indépendant, qui sélectionne les médias à partir de n'importe quel nombre de points de vente à la demande du monde entier et les ajoute à une liste de lecture pour offrir une «chaîne» numérique dédiée à certains sujets, thèmes ou intérêts afin que l'utilisateur final puisse voir et / ou entendre un flux continu de contenu.


Voir également

Références

Liens externes