Chronologie de la préservation numérique - Timeline of digital preservation

Cette page est une chronologie de la préservation numérique et de l' archivage Web . Il couvre divers aspects de la sauvegarde et de la préservation des données numériques , qu'elles soient d' origine numérique ou non.

Les tendances

La préservation numérique englobe une variété d'efforts et de technologies, de sorte que son histoire peut être vue à travers diverses tendances dans ces efforts distincts:

  • Systèmes de fichiers avec tolérance aux pannes intégrée
  • Divers changements dans le stockage physique utilisé
  • Services d'archivage à la demande
  • Services de raccourcissement d'URL
  • Divers épisodes d'importants travaux d'archivage, parfois à la suite de la fermeture des services
  • Efforts de conversion des informations physiques / analogiques en supports numériques, formats de fichiers et stockage plus modernes

Chronologie

An Mois et date Sujet Détails
1972 Gestion des versions Marc Rochkind développe le système de contrôle du code source chez Bell Labs .
1982 octobre Stockage physique Le disque compact (CD) ainsi que le lecteur CD sont d'abord disponibles dans le commerce au Japon.
1987 juin Stockage physique Le terme " RAID " a été inventé par David Patterson , Garth A. Gibson et Randy Katz à l' Université de Californie, Berkeley en 1987. Dans leur article de juin 1988 "A Case for Redundant Arrays of Inexpensive Disks (RAID)", présenté à lors de la conférence SIGMOD , ils soutiendraient que les disques durs mainframe les plus performants de l'époque pouvaient être battus en termes de performances par un ensemble de disques bon marché qui avaient été développés pour le marché croissant des ordinateurs personnels . Bien que les pannes augmentent proportionnellement au nombre de disques, en configurant pour la redondance, la fiabilité d'un module RAID pourrait bien dépasser celle de n'importe quel grand disque unique.
1989 13 novembre Gestion des versions La protection continue des données , la technique de sauvegarde des données informatiques en enregistrant automatiquement une copie de chaque modification apportée à ces données, est brevetée par l' entrepreneur britannique Pete Malcolm .
1990 La référence la plus ancienne au terme «préservation numérique» (pour signifier la conversion de supports analogiques en supports numériques et la conservation sous forme numérique) date peut-être de cette année.
1996 janvier Archivage Web La version initiale du programme de téléchargement en ligne de commande Wget , alors connu sous le nom de Geturl, est publiée.
1996 Archivage Web Les archives Internet sont fondées par Brewster Kahle .
1996 avril Archivage Web Alexa Internet est fondée par Brewster Kahle. Depuis cette année, Alexa Internet a fait don de ses données d'exploration à Internet Archive.
1996 Preserving Digital Information: Report of the Task Force on Archiving of Digital Information (Donald Waters, John Garrett, eds.) Est publié. Il est devenu un document fondamental dans le domaine de la préservation numérique qui a aidé à définir les concepts clés, les exigences et les défis.
1997 8 avril Archivage Web cURL , un projet de logiciel informatique fournissant une bibliothèque et un outil de ligne de commande pour le transfert de données à l'aide de divers protocoles , publie sa version initiale de l'outil. Il est connu à ce stade sous le nom de HttpGet, se renommerait brièvement en urlget, et se renommerait finalement en cURL en mars 1998. cURL peut être utilisé pour télécharger des fichiers sur un réseau.
1998 Mai Archivage Web La première version de HTTrack , un crawler Web gratuit et open source et un navigateur hors ligne , est disponible.
2000 L' infrastructure nationale d' information numérique et le Programme de préservation (NDIIPP) lancements.
2001 octobre Archivage Web La Wayback Machine est lancée.
2001 14 octobre La version 1.0 de la spécification Parity Volume Set, utilisée dans Par1 , est publiée.
2002 janvier Archivage Web TinyURL , le premier service de raccourcissement d'URL notable , est lancé.
2003 juillet Le Consortium international de préservation d'Internet est fondé.
2005 Stockage en ligne Box est lancé sous le nom de Box.net.
2005 7 avril Gestion des versions La version initiale de Git , un système de contrôle de version prenant en charge l'intégrité des données, est publiée.
2005 29 avril Archivage Web Safari version 2.0 introduit la possibilité de sauvegarder des sites Web complets en utilisant le format propriétaire WebArchive (détails dans l' historique des versions de Safari ).
2005 1 août Stockage physique L'article « La loi de Kryder » est publié La loi observe que la densité de stockage sur disque magnétique a augmenté très rapidement.
2005 août Gestion des versions Writely , un logiciel de traitement de texte Web créé par la société de logiciels Upstartle, est lancé. D'ici janvier 2006, Writely bénéficierait d'un support pour l'historique des révisions. Upstartle serait plus tard acquis par Google et Writely serait intégré dans Google Docs .
2005 31 octobre Système de fichiers La première implémentation de ZFS , un système de fichiers qui inclut une protection contre la corruption des données , est intégrée à Solaris .
2006 19 mars Stockage en ligne Amazon Web Services se lance en libérant le service de stockage simple (S3), destiné à stocker des fichiers individuels (appelés objets) d'une manière hautement redondante et disponible. S3 est conçu pour une durabilité d'au moins 99,999999999% (c'est-à-dire que le pourcentage d'objets devrait survivre après un an) et une disponibilité de 99,99% (c'est-à-dire que ce pourcentage d'objets est accessible à tout moment). Le coût du stockage S3 a chuté au cours de la prochaine décennie, atteignant 2,3 cents par Go à compter du 1er décembre 2016. S3 a été largement utilisé par les entreprises, les bibliothèques et les gouvernements pour numériser les données pour un stockage à long terme.
2007 30 janvier Gestion des versions Microsoft Office 2007 est publié. Word 2007 introduit la possibilité de suivre les modifications des documents.
2007 juin Stockage en ligne Dropbox est fondée par les étudiants du MIT Drew Houston et Arash Ferdowsi , en tant que start - up de l' accélérateur de semences américain Y Combinator .
2007 21 septembre Stockage physique La version initiale de Paperkey est publiée. Paperkey est une implémentation logicielle gratuite d'une clé papier . Il extrait les octets secrets essentiels d'une clé privée OpenPGP , qui peut ensuite être imprimée sur papier.
2007 26 octobre Gestion des versions Apple publie la version initiale de Time Machine .
2007 Stockage physique Deux logiciels pour stocker de manière dense des informations sur papier sont lancés: PaperBack et Optar de Twibright Labs .
2008 Archivage Web Le service de raccourcissement d'URL Bitly est lancé.
2008 10 avril Gestion des versions GitHub , un service d'hébergement de référentiels Git basé sur le Web , est lancé. GitHub vulgariserait le contrôle de version et Git. GitHub jouerait également un rôle important en encourageant les gens à rendre leur code source disponible gratuitement pour la postérité, permettant à d'autres de fourrer le code et agissant comme une archive de facto . En plus des projets logiciels, GitHub serait également utilisé pour héberger des référentiels de code pour la recherche scientifique ainsi que pour l'hébergement et la sauvegarde de sites Web et de contenu.
2008 20 novembre Numérisation Le prototype d' Europeana est lancé.
2009 6 janvier Archivage Web L' équipe des archives commence à fonctionner. Son premier gros effort, pour lequel il bénéficie d'une couverture médiatique, consiste à télécharger les données de Geocities avant la fermeture du service.
2009 Archivage Web Création de SocialSafe Ltd , la société chargée de développer SocialSafe.
2009 23 mars Système de fichiers La version initiale de Btrfs , un système de fichiers qui prend en charge les sommes de contrôle , les sauvegardes incrémentielles et la capacité de réparer les erreurs, est publiée dans le cadre de la version 2.6.29 du noyau Linux .
2009 15 mai Archivage Web Le format de fichier WARC est publié en tant que norme ISO 28500: 2009 1ère édition.
2009 26 octobre Archivage Web Yahoo! GeoCities , un service d'hébergement Web fondé en 1994, ferme sa succursale aux États-Unis. Diverses tentatives d' archivage des GeoCities sont faites. Le site continuerait d'être disponible uniquement au Japon.
2010 14 avril Archivage Web Twitter annonce qu'il fera don de ses archives de Tweets publics à la Bibliothèque du Congrès .
2011 28 juin Archivage Web Google Takeout est lancé par le Front de libération des données de Google .
2012 1 août Système de fichiers Microsoft présente ReFS . ReFS possède un certain nombre de fonctionnalités liées à la préservation numérique, notamment la vérification de l'intégrité et le nettoyage des données , la protection contre la dégradation des données , la gestion intégrée des pannes et de la redondance des disques durs et l'intégration de la fonctionnalité RAID .
2012 21 août Stockage en ligne Amazon Web Services lance Amazon Glacier , un ajout à ses offres S3 avec des coûts de stockage inférieurs à ceux de S3 (initialement 1 cent par Go). Glacier est destiné à l'archivage à long terme dans les cas où la récupération est rare; par conséquent, la récupération est coûteuse et lente. Glacier offre la même durabilité que l'offre S3 standard. En décembre 2016, le prix de Glacier est réduit à 0,4 centimes par Go. Glacier a été utilisé par les gouvernements, les entreprises et les bibliothèques pour l'archivage à long terme à faible coût. Il a également été recommandé pour une utilisation pour les sauvegardes personnelles lorsqu'un accès fréquent n'est pas nécessaire.
2013 6 avril Archivage Web Au Royaume-Uni , le règlement sur les bibliothèques de dépôt légal (œuvres non imprimées) entre en vigueur, plaçant le matériel numérique et en ligne dans le cadre du dépôt légal du Royaume-Uni . Auparavant, la loi de 2003 sur les bibliothèques de dépôt légal avait donné au Secrétaire d’État le pouvoir de réglementer le dépôt des publications non imprimées, mais de telles réglementations n’ont jamais été adoptées à l’époque.
2013 18 avril Numérisation La Bibliothèque publique numérique de l' Amérique lance.
2013 1er juillet Archivage Web Google Reader , un flux RSS / Atom agrégateur de flux exploité par Google , se ferme vers le bas après avoir lancé en 2005. L'arrêt invites un effort pour archiver les données d'alimentation du service.
2017 août Archivage Web Le format de fichier WARC est publié en tant que norme ISO 28500: 2017 2e édition.

Voir également

Références