Les Archives Web du gouvernement du Canada lancent la collection sur les Jeux olympiques et paralympiques de 2010 à Vancouver

English version

Doigts sur un clavier d'ordinateur.

Par Tom J. Smyth

À l’occasion du 15e anniversaire des Jeux olympiques et paralympiques de 2010 à Vancouver, Bibliothèque et Archives Canada (BAC) est fier de lancer une collection d’archives en ligne qui documente ce grand événement de l’histoire du Canada.

Affiche pour les Jeux olympiques de Vancouver intitulée « Des plus brillants exploits ».

Image tirée de la page d’accueil du site des Jeux olympiques de Vancouver dans les archives Web.

L’archivage Web : qu’est-ce que c’est, et pourquoi c’est important?

L’archivage Web est une discipline spécialisée de la conservation numérique, axée sur la préservation. Il garantit l’accès futur à des ressources uniques publiées sur Internet. Il utilise du matériel informatique et des logiciels spécialisés pour cibler, télécharger, organiser, décrire, préserver et reconstituer le contexte original publié et interactif des ressources Web. Pour ce faire, il a recours à l’émulation dans un portail de découverte et d’accès public spécialisé.

Des bibliothèques et des archives nationales du monde entier utilisent l’archivage Web pour capturer et préserver des ressources généralement uniques, qui ne se trouvent sur aucun autre support. Préserver le patrimoine documentaire numérique provenant de notre domaine Internet national est donc capital pour l’histoire de notre pays.

L’acquisition de ressources Web fait officiellement partie du mandat de BAC depuis 2004, en vertu du paragraphe 8(2) de la Loi sur la Bibliothèque et les Archives du Canada. C’est le Programme de préservation du Web et des médias sociaux, au sein du Secteur des services numériques, qui s’en acquitte de façon quotidienne depuis le milieu de l’année 2005.

Le Programme conserve des données et des collections de recherche tirées de ressources Web uniques, qui documentent des thèmes et des événements historiques et culturels canadiens. La conservation se fait dans le respect des priorités et des cadres stratégiques de BAC; des exigences de l’utilisation informatique (p. ex., extraction de textes et de données, intelligence artificielle, apprentissage machine et grands modèles de langue); et des programmes d’étude modernes dans le domaine des sciences humaines numériques. Nous mettons ensuite ces ressources à la disposition du public pour les générations à venir, afin de soutenir la recherche internationale future sur le Canada par l’entremise des Archives Web du gouvernement du Canada.

L’archivage Web est appuyé par le Consortium international pour la préservation d’Internet, qui compte plus de 50 membres, dont BAC (membre fondateur et actuel président du Comité directeur).

Conserver des collections d’archives Web sur les Jeux olympiques

Depuis la création du Programme de préservation du Web et des médias sociaux, BAC rassemble des ressources sur les Jeux olympiques au fur et à mesure de leur déroulement, à commencer par les Jeux d’hiver de 2006 tenus à Turin, en Italie.

Au début, nos efforts étaient modestes : nous recueillions l’information publiée sur les sites officiels des Jeux olympiques et du Comité olympique canadien. Puis nous avons commencé à recueillir des renseignements sur les programmes de soutien fédéraux (« À nous le podium ») et sur les organismes sportifs olympiques, sans oublier les blogues d’athlètes.

À l’heure actuelle, les collections d’archives Web sur les Jeux olympiques et paralympiques de BAC comprennent ce qui suit :

  • Hiver 2006 : Turin, du 10 au 26 février 2006
  • Été 2008 : Beijing, du 8 au 24 août 2008
  • Hiver 2010 : Vancouver, du 12 au 28 février 2010
  • Été 2012 : Londres, du 27 juillet au 12 août 2012
  • Hiver 2014 : Sotchi, du 7 au 23 février 2014
  • Été 2016 : Rio de Janeiro, du 5 au 21 août 2016
  • Hiver 2018 : Pyeongchang, 9 au 25 février 2018
  • Été 2020 : Tokyo, du 23 juillet au 8 août 2020
  • Hiver 2022 : Beijing, du 4 au 20 février 2022
  • Été 2024 : Paris, du 26 juillet au 11 août 2024

Rappelons-nous que le Canada a accueilli trois Jeux olympiques : les Jeux d’été de 1976 à Montréal, les Jeux d’hiver de 1988 à Calgary et les Jeux d’hiver de 2010 à Vancouver.

Les Jeux olympiques et paralympiques d’hiver de 2010 à Vancouver se sont déroulés du 12 au 28 février 2010 (1). Au total, 209 athlètes canadiens y ont participé : c’est le quatrième contingent canadien en importance de l’histoire. Le Canada s’est classé troisième au classement général des médailles, et premier pour le nombre total de médailles d’or, avec 14 médailles d’or, 7 médailles d’argent et 5 médailles de bronze (2).

Équipe de hockey féminin célébrant sa victoire sur la patinoire. Le filet de la gardienne est déplacé; autour des joueuses qui se font l’accolade, la glace est jonchée de casques, de gants et de bâtons de hockey.

Équipe Canada célèbre sa victoire à la finale de hockey féminin aux Jeux olympiques de Vancouver, en février 2010. Crédit : Jason Ransom. (MIKAN 5570828)

Les Jeux de 2010 ont été spéciaux pour le Canada; ils ont vu l’établissement de partenariats sans précédent avec certaines communautés autochtones. (Ces dernières ne parlent pas au nom de tous les groupes autochtones, et ne prétendent pas refléter leur opinion.) Ce sont aussi les plus récents Jeux olympiques organisés au Canada, et ceux ayant demandé le plus d’efforts. Pour le Programme de préservation du Web et des médias sociaux, ce fut un important jalon, tant sur le plan de l’élaboration du programme que sur celui des méthodes de collecte et de conservation thématiques.

Développement des collections et conservation numérique : l’évolution

Depuis Vancouver 2010, nous n’avons cessé de peaufiner nos méthodes et de constituer de vastes collections d’archives Web pour documenter les performances et les perspectives du Canada ainsi que les expériences des athlètes canadiens aux Jeux d’hiver et d’été et aux Jeux paralympiques.

Tout a commencé en juin 2009, quand un chercheur universitaire nous a contactés. Il s’intéressait à l’archivage Web, et en particulier à la promotion du tourisme et des activités sportives. Il nous a demandé ce qui était fait pour promouvoir le tourisme en Colombie-Britannique en vue des Jeux olympiques.

Nous avons dû nous rendre à l’évidence : nous n’en avions aucune idée! Mais cela nous a permis de lancer notre processus de conservation sans tarder, et ainsi, d’avoir amplement le temps de recueillir les ressources Web et celles des médias d’information documentant les préparatifs avant l’ouverture officielle des Jeux. Nous avons aussi pu prendre en compte des perspectives nouvelles et typiquement canadiennes, comme les points de vue autochtones.

Nous n’avions jamais délibérément ciblé et recueilli les données et les ressources Web sur le tourisme en tant que thème parallèle aux Jeux, d’autant plus que nous n’avions pas accueilli de Jeux olympiques depuis Calgary, en 1988. Nous nous sommes donc posé la question : quelles ressources et quels thèmes auxquels nous n’avions pas encore pensé pourraient intéresser les chercheurs dans nos archives Web?

Cette question a lancé une sorte de remise en question sur la façon de penser la conservation et de respecter les principes généraux du dépôt légal national. Puisqu’on ne peut pas prévoir tous les besoins des clients en matière de recherche, il faut recueillir les ressources de la façon la plus inclusive possible. Nous nous sommes aussi demandé comment conserver et organiser nos données pour aider les chercheurs de demain, tant en informatique qu’en sciences humaines numériques, à utiliser nos collections d’archives Web en tant que « mégadonnées ».

Nous avons commencé à envisager de nouveaux thèmes et sous-thèmes pour la conservation (comme l’aménagement des infrastructures et des installations, l’incidence environnementale, écologique et économique des Jeux, et même le sentiment anti-olympique). Élargir ainsi notre champ d’action a exigé davantage de recherches, mais le résultat en valait la peine : nous avons pu constituer des archives Web beaucoup plus riches et complètes pour les générations futures.

Tout cela a porté ses fruits : avant la fin de l’année 2009, le Secrétariat fédéral pour les Jeux olympiques et paralympiques à Patrimoine canadien (l’organisation d’accueil) a pris connaissance de notre projet et a voulu le promouvoir. C’est ainsi que le projet a été présenté dans un rapport de 2009-2019 intitulé Le rendement du Canada : La contribution du gouvernement du Canada (3), en tant que réalisation conjointe de BAC et du Secrétariat en vue des Jeux de Vancouver.

Notre méthode de collecte a beaucoup évolué depuis : aujourd’hui, nous disposons d’une « liste de base » raffinée pour de nombreux sujets (comme les Jeux olympiques, mais aussi la présence Web du gouvernement fédéral, les changements au sein du gouvernement ou du cabinet, les élections fédérales, etc.). Cette liste est composée d’URL considérés comme des ressources clés, qui ne sont pas susceptibles de changer et dont le contenu peut être recueilli rapidement, efficacement et fréquemment. Les spécialistes de l’archivage Web peuvent ainsi se concentrer sur la conservation et l’inclusion de ressources supplémentaires, générées en conséquence directe d’événements uniques et adaptées à ces derniers. Ce fut le cas, par exemple, des Jeux de 2024 à Paris.

Paris 2024 et accès à la collection sur Vancouver 2010

Pour les Jeux de 2024 à Paris, nous savions que de nouveaux sujets seraient abordés; des sujets qui n’étaient pas aussi pertinents ou qui n’existaient tout simplement pas en 2010. Par exemple, on a sérieusement envisagé d’inclure les sports électroniques dans les disciplines olympiques officielles, et le breakdance s’y est taillé une place. La sécurité fut aussi une préoccupation majeure; pour la première fois, elle a été classée parmi les thèmes principaux.

Au départ, nous comptions faire connaître nos travaux de conservation liés aux Jeux olympiques en lançant la collection sur les Jeux de 2024 à Paris. Mais nous nous sommes rendu compte que la majeure partie du travail connexe avait été effectué pour la collection d’archives Web de Vancouver 2010, lors de la préparation des métadonnées et des vocabulaires contrôlés. C’était donc la collection toute désignée pour donner le coup d’envoi de nos publications sur les Jeux olympiques; en effet, le modèle, plus complexe, peut mieux servir de « gabarit » pour organiser nos collections historiques sur les Jeux olympiques par l’entremise des Archives Web du gouvernement du Canada.

Nous avons aussi pensé que ce serait encore plus passionnant si nous lancions nos collections olympiques en en choisissant une qui est si chère à notre cœur, et qui a joué un rôle essentiel dans l’élaboration du programme!

Alors voilà : nous avons donc le plaisir de lancer notre collection sur les Jeux olympiques et paralympiques de 2010 à Vancouver, à quelques jours du 15e anniversaire de l’événement!

Pour faciliter la navigation et la découverte, la collection a été classée en sous-thèmes :

  • Blogues
  • À nous le podium
  • Commanditaires
  • Tourisme
  • Gouvernement – municipal
  • Gouvernement – provincial
  • Gouvernement – fédéral
  • Environnement
  • Points de vue autochtones
  • Organismes de sport
  • Organismes à but non lucratif
  • Éducation
  • Postes Canada
  • Sites officiels des Jeux olympiques
  • Communauté
  • Médias d’information
  • Autres perspectives et protestations
  • Sites olympiques
  • Athlètes
  • Jeux paralympiques
  • Entreprises
  • Commémoration
  • Rétrospective

En établissant ces sujets, ainsi que les vocabulaires contrôlés et l’architecture des métadonnées nécessaires pour soutenir, organiser et publier la collection, nous avons établi des bases qui nous permettront de bâtir, d’élargir, de compléter et de publier toutes nos autres collections historiques sur les Jeux olympiques, qui suivront en temps voulu.

Nous espérons que vous aimerez la collection sur Vancouver 2010!

Références

  1. Vancouver 2010 – Équipe Canada – Site officiel de l’équipe olympique
  2. Taille d’Équipe Canada par Jeux olympiques d’hiver – Équipe Canada – Site officiel de l’équipe olympique
  3. Rapport du président du Conseil du Trésor du Canada. Le rendement du Canada: La contribution du gouvernement du Canada – Rapport annuel au Parlement de 2009-2010, p. 79.

Tom J. Smyth est gestionnaire du Programme de préservation du Web et des médias sociaux et des Archives Web du gouvernement du Canada à Bibliothèque et Archives Canada. L’équipe du Programme comprend Elizabeth Doyle, Jason Meng, Kevin Palendat et Russell White.

Amélioration de votre expérience en ligne : lancement des nouvelles Archives Web du gouvernement du Canada

Par Tom J. Smyth

Introduction et historique du programme

Bibliothèque et Archives Canada (BAC) est l’institution de mémoire nationale désignée du pays. Son mandat législatif consiste à acquérir, décrire et préserver le patrimoine documentaire du Canada, ainsi qu’à le rendre accessible à long terme. Le Web canadien compris!

Les ressources Web sont en effet reconnues internationalement comme un élément important du patrimoine numérique moderne d’une nation. Elles sont irremplaçables, car elles constituent des témoignages importants de l’histoire et de la culture canadiennes au 21e siècle. Cependant, elles sont volatiles et susceptibles de disparaître sans avertissement.

Que peut-on y faire? Comment sauver des ressources générées en temps réel, qui existent en dehors des flux de production habituels des documents d’archives ou des publications traditionnelles? Comment protéger les ressources Web, qui contiennent parfois des renseignements qu’on ne trouve nulle part ailleurs, et qui peuvent documenter des événements historiques nationaux ou des aspects importants de la culture, au fur et à mesure qu’ils se déroulent?

Les ressources Web qui constituent le patrimoine documentaire numérique canadien sont de nature précaire. Il faut donc prendre sans délai les mesures appropriées pour les sélectionner, les organiser, les rendre accessibles et les préserver, tout en assurant la pérennité de leurs données. Cette mesure s’appelle « archivage Web » à l’échelle internationale. C’est une discipline fondée sur la curation et la préservation numériques. Elle est pratiquée et perfectionnée, par exemple, par la cinquantaine de membres du Consortium international pour la préservation de l’Internet (dont BAC est un membre fondateur).

L’acquisition de ressources Web fait officiellement partie du mandat de BAC depuis l’adoption, en 2004, de la Loi sur la Bibliothèque et les Archives du Canada (paragraphe 8[2]). Le Programme de préservation du Web et des médias sociaux, qui est géré par le Secteur des services numériques, permet à BAC de réaliser cette partie de son mandat. Il consiste à conserver des données et à rechercher des collections de ressources Web uniques documentant des thèmes et des événements historiques et culturels canadiens, afin de répondre aux besoins des chercheurs modernes. Ces ressources sont mises à la disposition du public pour la postérité, afin de soutenir les futures recherches sur le Canada réalisées partout dans le monde.

Les ressources Web acquises dans le cadre du Programme sont rendues accessibles dans les Archives Web du gouvernement du Canada. Celles-ci et le Programme de préservation du Web et des médias sociaux sont bien connus au Canada, mais leur ampleur ne l’est peut-être pas.

Quelle est la taille des Archives Web du gouvernement du Canada? Quelle quantité de données peut-on y trouver?

En 2022-2023, le Programme de préservation du Web et des médias sociaux de BAC a franchi une étape importante.

Nous sommes fiers de vous informer qu’en février 2023, les Archives du Web ont dépassé les 120 téraoctets de données. Elles contiennent plus de 3,1 milliards de documents!

C’est à peu près l’équivalent de 4 600 disques Blu-ray (1 150 en 4K, ou 384 copies de vos trilogies préférées). Si les Archives Web étaient imprimées, il y aurait quelque 57,5 milliards de feuilles. Empilées, celles-ci équivaudraient à 12 263 tours du CN!

Certains clients seront peut-être surpris de l’apprendre, car depuis 2005, BAC n’a fourni un accès public qu’à certaines parties de ses collections d’archives Web fédérales. La moitié des collections n’ont jamais été accessibles au public jusqu’à présent.

Capture d’écran d’une page des Archives Web du gouvernement du Canada

Nouvelles fonctionnalités et caractéristiques des Archives Web du gouvernement du Canada depuis le nouveau lancement

Nouvelles collections

Nous avons le plaisir d’annoncer qu’avec la relance des Archives Web en 2023, BAC ouvrira l’accès à toutes les collections non fédérales conservées depuis 2005. Au moment du lancement, les collections suivantes seront disponibles :

  • La collection de la Commission de vérité et réconciliation (conservée en partenariat avec le Centre national pour la vérité et la réconciliation, l’Université du Manitoba et l’Université de Winnipeg)
  • La collection de BAC sur la COVID-19 et ses répercussions sur le Canada (plus de 20 téraoctets de données)
  • Toutes les données du gouvernement fédéral recueillies depuis 2005 (plus de 55 téraoctets de données)
  • D’autres collections conservées (qui seront organisées et publiées au cours du prochain exercice)

Les Archives Web du gouvernement du Canada comptent parmi les sources d’information les plus complètes sur les éléments suivants :

  • Événements culturels et historiques canadiens documentés sur le Web (2005-)
  • Publications officielles du gouvernement du Canada (2005-)
  • La présence fédérale et historique du gouvernement du Canada sur le Web (domaine gc.ca, 2005-)
    • Historique des plans financiers, plans ministériels et rapports sur le rendement du gouvernement du Canada (2005-)
    • Historique des cadres stratégiques du gouvernement du Canada (2005-)
    • Historique de la divulgation proactive du gouvernement du Canada (2005-)
    • Données et statistiques du site Web fédéral (2005-)
    • Matériel supprimé du site Web fédéral dans le cadre de la normalisation des sites Internet 2.0 (2005-2008)
    • Matériel supprimé du site Web fédéral dans le cadre de la normalisation des sites Internet 3.0 (2008-2013)
    • Matériel supprimé du site Web fédéral dans le cadre de l’Initiative de renouvellement du Web (2013-)

Dans l’ensemble, les Archives Web du gouvernement du Canada sont la source par excellence pour toute étude historique sur le domaine Web du gouvernement fédéral au fil du temps.

Refonte du portail

De 2005 à 2019, les Archives Web ont organisé les données en fonction du droit d’auteur de la Couronne. De plus, l’accès aux ressources Web du gouvernement fédéral était limité par ce droit d’auteur (environ 15 téraoctets de données maximum étaient accessibles). Avec le lancement des nouvelles Archives Web, en 2023, nous avons élargi nos outils et nos filtres de recherche pour aider les utilisateurs à explorer les données non fédérales et les collections Web thématiques.

Les clients pourront désormais accéder aux collections non fédérales au moyen d’un portail et d’une interface spécialisés. L’interface pertinente (collections gouvernementales ou non fédérales) sera présentée automatiquement en fonction de la collection consultée.

Recherche en texte intégral dans les Archives Web, dans les collections individuelles ou par thèmes

Depuis 2011, BAC n’offre aucun service de recherche en texte intégral pour que le public puisse naviguer dans les Archives Web. Cette situation très problématique limitait l’accès à la découverte et la navigation. À partir du lancement en 2023, une fonctionnalité de recherche en texte intégral aussi puissante que sophistiquée sera offerte.

  • Les clients pourront effectuer des recherches à plusieurs niveaux hiérarchiques, depuis l’ensemble des archives jusqu’aux fichiers individuels.
  • Une recherche avancée donnera la possibilité de chercher par collection, mot-clé, exclusion, phrase exacte, URL ou domaine, type de ressource Web et plage de dates.
  • Il sera également possible d’effectuer une recherche rapide par URL exacte.
  • De plus, les clients pourront découvrir le contenu des collections non fédérales par sous-thème et y accéder (par exemple : afficher toutes les ressources ayant trait aux « répercussions économiques de la COVID-19 sur le Canada »).

Services de référence spécialisés

BAC fournit des services de référence et de soutien pour les Archives Web du gouvernement du Canada. Si vous avez de la difficulté à localiser une ressource connue dans les Archives Web du gouvernement du Canada, nous nous ferons un plaisir de vous aider avec les éléments suivants :

  • Localisation de publications officielles obscures du gouvernement du Canada ou de sites Web hors service
  • Localisation de rapports historiques, de politiques, de données financières ou de divulgation proactive obscurs
  • Localisation des genres de contenu du gouvernement du Canada lorsque les titres ou les dates exacts ne sont pas connus
  • Histoire et évolution du domaine du gouvernement du Canada (gc.ca)
  • Utilisation des archives Web comme source historique ou comme données informatiques
  • Droits d’auteur ou protection de la vie privée
  • Questions sur la façon de préserver numériquement votre ressource Web à BAC

Si vous avez des idées sur ce qui devrait être recueilli, n’hésitez pas à nous le faire savoir!

Posez-nous une question. Nous pouvons répondre à vos questions de référence concernant les archives Web, les propositions d’acquisition de ressources Web canadiennes ou les demandes d’accès informatique à nos données sur les collections d’archives Web.


Tom J. Smyth est le gestionnaire du Programme de préservation du Web et des médias sociaux à Bibliothèque et Archives Canada.