Chronologie de la préservation numérique - Timeline of digital preservation
Cette page est une chronologie de la préservation numérique et de l' archivage Web . Il couvre divers aspects de la sauvegarde et de la préservation des données numériques , qu'elles soient d' origine numérique ou non.
Les tendances
La préservation numérique englobe une variété d'efforts et de technologies, de sorte que son histoire peut être vue à travers diverses tendances dans ces efforts distincts:
- Systèmes de fichiers avec tolérance aux pannes intégrée
- Divers changements dans le stockage physique utilisé
- Services d'archivage à la demande
- Services de raccourcissement d'URL
- Divers épisodes d'importants travaux d'archivage, parfois à la suite de la fermeture des services
- Efforts de conversion des informations physiques / analogiques en supports numériques, formats de fichiers et stockage plus modernes
Chronologie
An | Mois et date | Sujet | Détails |
---|---|---|---|
1972 | Gestion des versions | Marc Rochkind développe le système de contrôle du code source chez Bell Labs . | |
1982 | octobre | Stockage physique | Le disque compact (CD) ainsi que le lecteur CD sont d'abord disponibles dans le commerce au Japon. |
1987 | juin | Stockage physique | Le terme " RAID " a été inventé par David Patterson , Garth A. Gibson et Randy Katz à l' Université de Californie, Berkeley en 1987. Dans leur article de juin 1988 "A Case for Redundant Arrays of Inexpensive Disks (RAID)", présenté à lors de la conférence SIGMOD , ils soutiendraient que les disques durs mainframe les plus performants de l'époque pouvaient être battus en termes de performances par un ensemble de disques bon marché qui avaient été développés pour le marché croissant des ordinateurs personnels . Bien que les pannes augmentent proportionnellement au nombre de disques, en configurant pour la redondance, la fiabilité d'un module RAID pourrait bien dépasser celle de n'importe quel grand disque unique. |
1989 | 13 novembre | Gestion des versions | La protection continue des données , la technique de sauvegarde des données informatiques en enregistrant automatiquement une copie de chaque modification apportée à ces données, est brevetée par l' entrepreneur britannique Pete Malcolm . |
1990 | La référence la plus ancienne au terme «préservation numérique» (pour signifier la conversion de supports analogiques en supports numériques et la conservation sous forme numérique) date peut-être de cette année. | ||
1996 | janvier | Archivage Web | La version initiale du programme de téléchargement en ligne de commande Wget , alors connu sous le nom de Geturl, est publiée. |
1996 | Archivage Web | Les archives Internet sont fondées par Brewster Kahle . | |
1996 | avril | Archivage Web | Alexa Internet est fondée par Brewster Kahle. Depuis cette année, Alexa Internet a fait don de ses données d'exploration à Internet Archive. |
1996 | Preserving Digital Information: Report of the Task Force on Archiving of Digital Information (Donald Waters, John Garrett, eds.) Est publié. Il est devenu un document fondamental dans le domaine de la préservation numérique qui a aidé à définir les concepts clés, les exigences et les défis. | ||
1997 | 8 avril | Archivage Web | cURL , un projet de logiciel informatique fournissant une bibliothèque et un outil de ligne de commande pour le transfert de données à l'aide de divers protocoles , publie sa version initiale de l'outil. Il est connu à ce stade sous le nom de HttpGet, se renommerait brièvement en urlget, et se renommerait finalement en cURL en mars 1998. cURL peut être utilisé pour télécharger des fichiers sur un réseau. |
1998 | Mai | Archivage Web | La première version de HTTrack , un crawler Web gratuit et open source et un navigateur hors ligne , est disponible. |
2000 | L' infrastructure nationale d' information numérique et le Programme de préservation (NDIIPP) lancements. | ||
2001 | octobre | Archivage Web | La Wayback Machine est lancée. |
2001 | 14 octobre | La version 1.0 de la spécification Parity Volume Set, utilisée dans Par1 , est publiée. | |
2002 | janvier | Archivage Web | TinyURL , le premier service de raccourcissement d'URL notable , est lancé. |
2003 | juillet | Le Consortium international de préservation d'Internet est fondé. | |
2005 | Stockage en ligne | Box est lancé sous le nom de Box.net. | |
2005 | 7 avril | Gestion des versions | La version initiale de Git , un système de contrôle de version prenant en charge l'intégrité des données, est publiée. |
2005 | 29 avril | Archivage Web | Safari version 2.0 introduit la possibilité de sauvegarder des sites Web complets en utilisant le format propriétaire WebArchive (détails dans l' historique des versions de Safari ). |
2005 | 1 août | Stockage physique | L'article « La loi de Kryder » est publié La loi observe que la densité de stockage sur disque magnétique a augmenté très rapidement. |
2005 | août | Gestion des versions | Writely , un logiciel de traitement de texte Web créé par la société de logiciels Upstartle, est lancé. D'ici janvier 2006, Writely bénéficierait d'un support pour l'historique des révisions. Upstartle serait plus tard acquis par Google et Writely serait intégré dans Google Docs . |
2005 | 31 octobre | Système de fichiers | La première implémentation de ZFS , un système de fichiers qui inclut une protection contre la corruption des données , est intégrée à Solaris . |
2006 | 19 mars | Stockage en ligne | Amazon Web Services se lance en libérant le service de stockage simple (S3), destiné à stocker des fichiers individuels (appelés objets) d'une manière hautement redondante et disponible. S3 est conçu pour une durabilité d'au moins 99,999999999% (c'est-à-dire que le pourcentage d'objets devrait survivre après un an) et une disponibilité de 99,99% (c'est-à-dire que ce pourcentage d'objets est accessible à tout moment). Le coût du stockage S3 a chuté au cours de la prochaine décennie, atteignant 2,3 cents par Go à compter du 1er décembre 2016. S3 a été largement utilisé par les entreprises, les bibliothèques et les gouvernements pour numériser les données pour un stockage à long terme. |
2007 | 30 janvier | Gestion des versions | Microsoft Office 2007 est publié. Word 2007 introduit la possibilité de suivre les modifications des documents. |
2007 | juin | Stockage en ligne | Dropbox est fondée par les étudiants du MIT Drew Houston et Arash Ferdowsi , en tant que start - up de l' accélérateur de semences américain Y Combinator . |
2007 | 21 septembre | Stockage physique | La version initiale de Paperkey est publiée. Paperkey est une implémentation logicielle gratuite d'une clé papier . Il extrait les octets secrets essentiels d'une clé privée OpenPGP , qui peut ensuite être imprimée sur papier. |
2007 | 26 octobre | Gestion des versions | Apple publie la version initiale de Time Machine . |
2007 | Stockage physique | Deux logiciels pour stocker de manière dense des informations sur papier sont lancés: PaperBack et Optar de Twibright Labs . | |
2008 | Archivage Web | Le service de raccourcissement d'URL Bitly est lancé. | |
2008 | 10 avril | Gestion des versions | GitHub , un service d'hébergement de référentiels Git basé sur le Web , est lancé. GitHub vulgariserait le contrôle de version et Git. GitHub jouerait également un rôle important en encourageant les gens à rendre leur code source disponible gratuitement pour la postérité, permettant à d'autres de fourrer le code et agissant comme une archive de facto . En plus des projets logiciels, GitHub serait également utilisé pour héberger des référentiels de code pour la recherche scientifique ainsi que pour l'hébergement et la sauvegarde de sites Web et de contenu. |
2008 | 20 novembre | Numérisation | Le prototype d' Europeana est lancé. |
2009 | 6 janvier | Archivage Web | L' équipe des archives commence à fonctionner. Son premier gros effort, pour lequel il bénéficie d'une couverture médiatique, consiste à télécharger les données de Geocities avant la fermeture du service. |
2009 | Archivage Web | Création de SocialSafe Ltd , la société chargée de développer SocialSafe. | |
2009 | 23 mars | Système de fichiers | La version initiale de Btrfs , un système de fichiers qui prend en charge les sommes de contrôle , les sauvegardes incrémentielles et la capacité de réparer les erreurs, est publiée dans le cadre de la version 2.6.29 du noyau Linux . |
2009 | 15 mai | Archivage Web | Le format de fichier WARC est publié en tant que norme ISO 28500: 2009 1ère édition. |
2009 | 26 octobre | Archivage Web | Yahoo! GeoCities , un service d'hébergement Web fondé en 1994, ferme sa succursale aux États-Unis. Diverses tentatives d' archivage des GeoCities sont faites. Le site continuerait d'être disponible uniquement au Japon. |
2010 | 14 avril | Archivage Web | Twitter annonce qu'il fera don de ses archives de Tweets publics à la Bibliothèque du Congrès . |
2011 | 28 juin | Archivage Web | Google Takeout est lancé par le Front de libération des données de Google . |
2012 | 1 août | Système de fichiers | Microsoft présente ReFS . ReFS possède un certain nombre de fonctionnalités liées à la préservation numérique, notamment la vérification de l'intégrité et le nettoyage des données , la protection contre la dégradation des données , la gestion intégrée des pannes et de la redondance des disques durs et l'intégration de la fonctionnalité RAID . |
2012 | 21 août | Stockage en ligne | Amazon Web Services lance Amazon Glacier , un ajout à ses offres S3 avec des coûts de stockage inférieurs à ceux de S3 (initialement 1 cent par Go). Glacier est destiné à l'archivage à long terme dans les cas où la récupération est rare; par conséquent, la récupération est coûteuse et lente. Glacier offre la même durabilité que l'offre S3 standard. En décembre 2016, le prix de Glacier est réduit à 0,4 centimes par Go. Glacier a été utilisé par les gouvernements, les entreprises et les bibliothèques pour l'archivage à long terme à faible coût. Il a également été recommandé pour une utilisation pour les sauvegardes personnelles lorsqu'un accès fréquent n'est pas nécessaire. |
2013 | 6 avril | Archivage Web | Au Royaume-Uni , le règlement sur les bibliothèques de dépôt légal (œuvres non imprimées) entre en vigueur, plaçant le matériel numérique et en ligne dans le cadre du dépôt légal du Royaume-Uni . Auparavant, la loi de 2003 sur les bibliothèques de dépôt légal avait donné au Secrétaire d’État le pouvoir de réglementer le dépôt des publications non imprimées, mais de telles réglementations n’ont jamais été adoptées à l’époque. |
2013 | 18 avril | Numérisation | La Bibliothèque publique numérique de l' Amérique lance. |
2013 | 1er juillet | Archivage Web | Google Reader , un flux RSS / Atom agrégateur de flux exploité par Google , se ferme vers le bas après avoir lancé en 2005. L'arrêt invites un effort pour archiver les données d'alimentation du service. |
2017 | août | Archivage Web | Le format de fichier WARC est publié en tant que norme ISO 28500: 2017 2e édition. |