Données bilingues des recensements : une meilleure expérience de recherche pour la population canadienne

Bannière pour la série "Le recensement de 1931". À gauche, le texte "Le recensement de 1931". À droite, un train en marche qui passe à côté d'une gare.Par Julia Barkhouse

Cet article renferme de la terminologie et des contenus à caractère historique que certaines personnes pourraient considérer comme offensants, notamment au chapitre du langage utilisé pour désigner l’identité de genre ou des groupes raciaux, ethniques et culturels. Pour en savoir plus, consultez notre Mise en garde – terminologie historique.

Bibliothèque et Archives Canada (BAC) est le gardien du passé lointain et de l’histoire récente du Canada. L’institution conserve les résultats des anciens recensements du Canada, dont certains de Terre-Neuve et d’autres remontant à la Nouvelle-France. Nous avons indexé certains recensements datant de 1825 à 1926, qui peuvent être consultés en ligne via l’outil Recherche dans les recensements.

Avant la Confédération, les recensements étaient généralement effectués en anglais ou en français, selon le lieu. Le Bureau fédéral de la statistique (aujourd’hui Statistique Canada) a introduit progressivement des formulaires bilingues après la Confédération en 1867.

Exemple d’un formulaire bilingue du recensement de 1921, rempli en anglais et en français :

Feuille de recensement du recensement de 1921. Cette image particulière figure à la page 6 pour le sous-district de Scots Bay dans le district de Kings, en Nouvelle-Écosse.

Recensement de 1921 rempli en anglais (e002910991).

Feuille de recensement du recensement de 1921. Cette image particulière figure à la page 19 pour le sous-district de Wolfestown (canton) dans le district de Richmond-Wolfe, au Québec.

Recensement de 1921 rempli en français (e003096782).

La langue dans laquelle sont consignées les réponses aux questions du recensement peut refléter la préférence linguistique du recenseur ou la langue dans laquelle les réponses ont été fournies. Les données historiques des recensements dont nous disposons reflètent la dualité linguistique de notre pays. Les recensements du Québec et de certaines parties du Nouveau-Brunswick et du Manitoba sont remplis en français, alors que dans le reste du Canada, ils sont remplis en anglais.

Lorsque nos partenaires, notamment Ancestry et FamilySearch, ont indexé les recensements de 1825 à 1926, nous avons produit une mine de données comportant des noms de personnes, leur sexe, leur état civil, etc. Nous étions cependant aux prises avec un défi de taille : les données des recensements pouvaient avoir été recueillies en anglais ou en français, selon les préférences personnelles du recenseur. Comment avons-nous géré cette situation?

La vie d’un recenseur

Retournons en arrière un instant pour examiner le parcours du recenseur. Les recenseurs étaient des Canadiens embauchés par le Bureau fédéral de la statistique pour recueillir des données de recensement dans un ou plusieurs sous-districts. Ils recevaient un manuel d’instructions (comme celui-ci pour le recensement de 1921) qui décrivait les renseignements à inscrire sur le formulaire selon les réponses fournies. On leur remettait un cahier de formulaires de recensement et des instructions sur les sous-districts à recenser. Cette personne disposait ensuite d’un nombre de jours donné pour recenser la population d’un certain nombre de sous-districts et renvoyer les formulaires au ministère concerné. Imaginez-vous cette personne faire du porte-à-porte dans une calèche ou, en 1921, à bord d’une des premières automobiles (peut-être une Ford modèle T)!

Le recenseur frappait à la porte et demandait à parler au chef de ménage (généralement le père ou le mari). Il était parfois invité à prendre place à la table de la cuisine pour poser ses questions. Si la famille était absente, le recenseur pouvait laisser à la porte une carte de visite précisant ses coordonnées et demandant aux résidents de faire un suivi avant une certaine date afin d’être pris en compte dans le recensement.

Selon la province au pays, le recenseur consignait les renseignements dans la langue de la personne à laquelle il s’adressait ou dans sa langue de préférence. Il est donc possible que des régions francophones du Canada au Québec, au Nouveau-Brunswick et au Manitoba aient été recensées en anglais, en français ou dans les deux langues, selon la préférence personnelle du recenseur.

Revenons à nos moutons! Les données saisies sur ces formulaires ont été transcrites par nos partenaires environ 92 ans après le recensement, et publiées en ligne.

Barrières linguistiques

Lorsque BAC a publié ces bases de données en ligne, nous avons constaté que nous disposions de données dans les deux langues. Si vous souhaitez trouver votre ancêtre, vous devez faire vos recherches dans la langue du recenseur. Ce dernier a-t-il consigné les renseignements concernant votre grand-mère en anglais ou en français? Votre nom comporte-t-il un accent (é, è…) qui aurait pu être mal entendu (ou omis) par le recenseur? Le nom de votre oncle comporte-t-il un « h » muet qui aurait pu être omis? Cette barrière linguistique nuit aux chercheurs qui souhaitent retrouver certaines personnes, mais ne parlent pas la langue utilisée à l’époque. Certains chercheurs francophones doivent effectuer des recherches en anglais pour retrouver leurs ancêtres francophones. L’expérience de recherche n’est donc pas la même pour les Canadiens qui accèdent à notre interface Recherche dans les recensements en français.

Création de l’outil Recherche dans les recensements

En novembre dernier, l’équipe Agile des Services numériques a réorganisé les 17 bases de données du recensement pour les regrouper dans l’outil Recherche dans les recensements, afin d’offrir une meilleure expérience de recherche à l’ensemble de la population canadienne. Notre objectif était de fournir la même expérience de recherche aux francophones qu’aux anglophones, de sorte que nos usagers utilisant l’interface en français puissent effectuer une recherche et obtenir les mêmes résultats que s’ils effectuaient une recherche en anglais.

Comment y parvenir? Comment traduire des renseignements comme le sexe, l’état civil, l’origine ethnique et la profession pour plus de 44 millions de personnes afin d’offrir une expérience identique à tout le monde? C’était en fait très simple. La solution? Un nettoyage des données.

Coup d’œil sous le capot

Jetons un coup d’œil en coulisses pour comprendre comment les données de recensement sont sauvegardées. L’outil Recherche dans les recensements est l’interface publique que les usagers de BAC peuvent utiliser pour effectuer des recherches. Les données de recensement pour chaque personne enregistrée sont sauvegardées dans un tableau principal appelé EnumAll.

Les données de recensement sont sauvegardées dans un tableau dans SQL Management Server.

Capture d’écran du tableau principal (Census.EnumAll ) produit à l’aide du logiciel SQL Management Server (Bibliothèque et Archives Canada).

Dans ce tableau, chaque rangée représente une personne. Les données saisies concernant cette personne sont séparées en colonnes. Lorsque nous ne disposons pas de données pour une colonne, il est indiqué NULL.

Création de bassins de données communes

Census.EnumAll sert de tableau principal. À partir de ce tableau, nous avons créé des ensembles de données communes. Autrement dit, nous avons copié une des colonnes (sexe, état civil, origine ethnique, religion, etc.) dans un tableau distinct. Un tel tableau comprend uniquement une liste de sexes ou d’options d’état civil, par exemple. C’est ce que nous appelons un bassin de données communes : un tableau qui ne contient qu’un seul type de données.

Le tableau de données communes sépare les données (p. ex., « Homme » ou « Femme ») de la personne. Si vous examinez 44 millions de personnes, vous constaterez que les mêmes données se répètent, par exemple chaque fois que le recenseur a indiqué « Homme » ou « Marié ». Dans un tableau commun, vous ne verrez « Homme » qu’une seule fois, avec une valeur indiquant le nombre de personnes correspondant à ce renseignement (ce que nous appelons un attribut).

C’est là que la magie opère.

Tableau des sexes du côté serveur de l’outil Recherche dans les recensements. Il convient de noter qu’il existe des variations (Homme et H, Femme et F) de même que deux colonnes intitulées TextLongEn (affichage en anglais) et TextLongFr (affichage en français).

Capture d’écran du tableau des sexes (T_Gender) produit à l’aide du logiciel SQL Management Server (Bibliothèque et Archives Canada).

Comme vous pouvez le constater dans ce tableau distinct de données communes, nous pouvons effectuer d’autres opérations. Dans le présent exemple, les codes permettent d’établir une façon uniforme de désigner chaque sexe. C’est ce qu’on appelle une autorité. Nous procédons ensuite à un nettoyage afin que toutes les variations (par exemple « Homme » et « H ») renvoient à cette autorité unique.

Une fois cette autorité établie, nous créons des colonnes selon la façon dont nous voulons afficher les renseignements dans l’outil Recherche dans les recensements. Nous créons un affichage en anglais (TextLongEn) et un affichage en français (TextLongFr). Nous ajoutons ensuite la traduction bilingue une seule fois, et elle s’applique à tout. Dans ce cas, nous avons traduit « Male » par « Homme », et cette traduction s’applique à l’ensemble des 20 163 488 personnes qui se sont identifiées comme « Homme » dans les 17 recensements.

Nous avons ensuite regroupé tous les tableaux et indexé les données pour les afficher dans l’outil Recherche dans les recensements. Ainsi, l’interface et les données elles-mêmes seront traduites dans la langue de votre choix.

Interface de Recherche dans les recensements en anglais affichant le menu déroulant des sexes avec les valeurs « Female », « Male » et « Unknown », à côté de l’interface de Recherche dans les recensements en français affichant le même menu déroulant des sexes avec les valeurs « Femme », « Homme » et « Inconnu ».

Captures d’écran de l’interface de Recherche dans les recensements en anglais et en français (Bibliothèque et Archives Canada).

Maintenant, lorsque je cherche mon arrière-grand-père Henry D. Barkhouse dans les recensements, les données générées sont traduites.

Deux captures d’écran, l’une en anglais et l’autre en français, d’un recensement de 1911 pour Henry D. Barkhouse, avec des flèches indiquant où les données sont traduites.

Affichage en français et en anglais du recensement de 1911 pour Henry D. Barkhouse (e001973146).

Évaluation de l’état d’avancement

Comme vous pouvez l’imaginer, le nettoyage et la traduction de nos données sont des opérations qui prennent du temps. Notre priorité a été de créer des menus déroulants pour le sexe et l’état civil dans l’outil Recherche dans les recensements. Désormais, si vous effectuez une recherche dans l’un de ces champs, une courte liste de termes traduits, dans les deux langues officielles, s’affiche à l’écran. Dans le cadre de la poursuite de ce travail, nous nous penchons actuellement sur les champs origine ethnique et lieu de naissance et avons effectué de 60 à 70 % de ce travail. Nos usagers pourront donc découvrir de nouvelles options dans l’outil Recherche dans les recensements en 2024. Nous poursuivrons ensuite l’exercice avec les autres champs comme la religion, le lien avec le chef du ménage, la profession, etc.

Conclusion

Le regroupement des 17 recensements en une seule et même plateforme, Recherche dans les recensements, nous a permis de créer un affichage bilingue pour nos données de recensement en nettoyant les données. Depuis son lancement, notre plateforme offre une expérience de recherche plus uniforme dans la langue de votre choix. Je vous encourage à l’essayer et à nous dire si votre expérience de recherche s’est améliorée.

Comme toujours, nous sommes ravis de recevoir vos commentaires et vos idées par courriel. Vous pouvez également vous inscrire à une séance de rétroaction de 10 minutes.


Julia Barkhouse travaille à Bibliothèque et Archives Canada dans le domaine de la qualité des données, de la gestion des bases de données et de l’administration depuis 14 ans. Elle occupe actuellement le poste d’analyste de données pour les collections au sein de l’équipe Agile des Services numériques.

Création de l’outil Recherche dans les recensements

Par Julia Barkhouse

Tout le monde aime les recensements. Les données des recensements sont notre principale ressource généalogique pour retrouver des ancêtres, parce qu’elles contiennent des informations fiables sur tous les Canadiens, comme leur lieu de résidence, leur âge, leur profession et d’autres renseignements utiles. Un recensement nous donne un instantané de la population à un moment et à un endroit donnés.

J’adore les recensements, parce qu’ils m’ont permis de suivre le parcours de mon arrière-grand-père, Henry D. Barkhouse. Ce dernier a inspiré le travail récent de mon équipe, l’équipe Agile des services numériques, pour créer et lancer notre outil Recherche dans les recensements (bêta) en novembre 2022.

Permettez-moi de vous décrire tout le processus de la recherche que j’ai menée sur la vie de mon ancêtre dans les données des recensements. Henry D. est né en 1864 et est mort en 1947 en Nouvelle-Écosse. Mon père ne l’a pas connu, parce qu’il est décédé avant sa naissance. Henry D. était un homme très grand. Il a épousé mon arrière-grand-mère, Samantha Udora (Dora) Butler, en 1899, à Scots Bay, en Nouvelle-Écosse, avec qui il a eu huit enfants. Henry D. était fermier, et sa ferme a été transmise de génération en génération jusqu’à aujourd’hui. À part ces informations de base, je savais très peu de choses sur lui.

Photo de Henry D. Barkhouse et Samantha Udora (Dora) Butler à leur ferme.

Henry D. Barkhouse (1864-1947) et Samantha Udora (Dora) Butler à la ferme des Barkhouse à Scots Bay, en Nouvelle-Écosse (vers 1930-1947). Image courtoisie de l’auteure, Julia Barkhouse.

Avant de commencer ma recherche, j’ai noté toutes les informations que je possédais sur Henry D. :

  • Nom de famille : Barkhouse
  • Prénom : Henry D.
  • Genre : Homme
  • Dates : 1864-1947
  • Occupation : Fermier
  • Province : Nouvelle-Écosse (je ne savais pas dans quel district ou sous-district)

Avec ces informations, je m’attendais à trouver Henry D. dans les recensements de 1871 à 1921. Les données des recensements de 1931 et de 1941 ne sont pas encore accessibles.

J’ai donc entrepris ma recherche, et j’ai trouvé Henry D. dans le recensement de 1871.

Une page du recensement du Canada de 1871 présentant des informations sur Henry Barkhouse.

Page du recensement du Canada, 1871 (Numéro d’item : 3150873)

J’ai appris de nouvelles choses sur lui dès les premiers résultats. Les dossiers du recensement ont confirmé qu’il était né en 1864 et qu’il avait sept ans au moment du recensement de 1871. Je sais maintenant dans quels district et sous-district de Scots Bay il vivait. Je sais aussi quelle était sa religion. En regardant l’image, je peux obtenir plus d’informations sur son éducation et savoir s’il avait une infirmité. Je peux aussi consulter les informations sur ses parents (James et Rebecca) et ses frères et sœurs. J’ai maintenant plus d’informations pour trouver mon ancêtre dans d’autres recensements, et je peux mettre à jour mon arbre généalogique.

J’ai réalisé à cette étape-ci que j’allais devoir refaire la même recherche dans d’autres bases de données sur les recensements du Canada. J’ai décidé de répéter ma recherche dans les recensements de 1881, 1891, 1901, 1911 et 1921. Je savais que refaire ma recherche encore cinq fois allait me prendre beaucoup de temps, et que tout cela allait être (oserais-je dire) assez frustrant.

Il m’est donc venu une idée : Et si je regroupais tous les recensements dans une seule base de données principale? De cette façon, je pourrais effectuer une seule recherche sur mon ancêtre avec les mêmes paramètres et obtenir tous les résultats de toutes les bases de données sur les recensements d’un seul coup. Je pourrais afficher les résultats de 1871 à 1921 sur un seul écran, et utiliser nos outils intégrés pour enregistrer ces résultats dans Ma recherche afin de pouvoir y revenir plus tard. En procédant de cette manière, le temps nécessaire pour effectuer des recherches sur chaque ancêtre serait grandement réduit.

J’ai dû penser fort à mon approche, parce que chaque recensement présente de légères différences. On pourrait penser que tous les recensements fournissent des informations similaires, mais en fait, les premiers recensements (avant la Confédération) sont très différents de ceux réalisés après 1867. De plus, des recensements portaient seulement sur certaines provinces (Ontario et Manitoba) et sur les Prairies (anciennement appelées « les territoires »). J’ai dû me poser un certain nombre de questions, surtout : Qu’est-ce qui se passe quand on place une telle quantité de données dans une même base de données?

Cette recherche représentait un défi de taille. Bibliothèque et Archives Canada compte 17 recensements canadiens qui contiennent près de 44 millions de noms. Chaque nom correspond à un dossier dans nos bases de données. Le travail a commencé par une analyse détaillée de chaque recensement afin de comparer le contenu des bases de données. Dans le cadre de cette analyse, mon équipe a établi un plan de travail et cerné plusieurs améliorations à apporter ou questions à régler après le lancement. Notre première version, Recherche dans les recensements (bêta), combine les bases de données de 17 recensements en une seule interface. Nous avons qualifié cette version de « bêta » pour indiquer que le produit est presque final et que des améliorations y sont encore apportées aux deux semaines. Nos critères d’approbation pour le lancement de la version bêta étaient les suivants :

  • une interface de recherche avec tous les champs actuellement disponibles dans nos bases de données individuelles, plus quelques champs additionnels en fonction des commentaires de nos clients (genre, origine ethnique, lieu de naissance, religion, occupation, etc.);
  • la possibilité de filtrer les résultats de recherche par province, année de recensement, district et sous-district;
  • un affichage montrant les objets numériques dans notre afficheur harmonisé ainsi que la liste complète des champs disponibles (nom, genre, âge, etc.).

Une fois les résultats des recensements migrés et disponibles dans Recherche dans les recensements, nous avons pu améliorer l’expérience de recherche globale de nos clients. On peut maintenant agrandir les images avec l’afficheur harmonisé ou les afficher en plein écran. On peut aussi télécharger et exporter ses résultats de recherche dans divers formats (HTML, XML, CSV et JSON). On peut sauvegarder des dossiers dans Ma recherche et y revenir plus tard. On peut ajouter des transcriptions ou des commentaires dans Co-Lab pour étiqueter ou traduire les images. Enfin, on peut suggérer des corrections à apporter à un dossier et contribuer à améliorer les données des recensements.

Capture d’écran de Recherche dans les recensements montrant les paramètres prénom, nom de famille et province (Nouvelle-Écosse) pour obtenir des informations sur l’arrière-grand-père de Julia Barkhouse.

Capture d’écran de Recherche dans les recensements (Site web de Bibliothèque et Archives Canada)

La première version de Recherche dans les recensements a demandé beaucoup de travail, et nous sommes très heureux de ce que nous avons accompli. Nous avons aussi un plan pour les améliorations que nous voulons y apporter au fil du temps. Maintenant que le lancement initial a eu lieu, nous avons un certain nombre de questions et de problèmes que nous souhaitons étudier et pour lesquels nous voulons trouver des solutions viables. Ces améliorations seront déployées dans Recherche dans les recensements à mesure que nous sortirons de la phase bêta. Nos objectifs sont les suivants :

  • regrouper les images pour que les utilisateurs puissent passer à la page suivante et voir les personnes ou familles qui sont mentionnées au bas d’une page et dont les informations se poursuivent sur la page suivante;
  • programmer l’interface de recherche pour qu’elle s’ajuste avec du texte grisé ou des messages dans des fenêtres contextuelles dans les cas où tous les recensements ne fournissent pas des données pour tous les champs (origine ethnique, lieu de naissance, religion, etc.);
  • assurer un suivi des changements géographiques dans le pays avec le temps – une fois les données regroupées, nous voulons permettre le suivi des changements dans les provinces, les territoires, les districts et les sous-districts;
  • trouver un moyen d’isoler une personne et de la trouver dans chaque recensement, ou d’établir les relations d’une personne avec d’autres;
  • ajouter toutes les annexes supplémentaires (par exemple, les annexes agricoles) dans Recherche dans les recensements, et indiquer si ces annexes contiennent des informations additionnelles sur une personne;
  • nettoyer les données et créer des dictionnaires de données historiques qui permettent de mettre en contexte les termes employés à une autre époque (par exemple, « ethnicité »);
  • trier les résultats de recherche afin de regrouper les personnes par année de recensement ou par ordre alphabétique (croissant ou décroissant).

Alors, quels sont les résultats, maintenant, pour mon arrière-grand-père? Eh bien, quand je cherche Henry D. dans Recherche dans les recensements, j’obtiens les informations qui le concernent de 1871 à 1921. Je peux enregistrer ces informations sous forme de liste dans Ma recherche pour y revenir plus tard, et effectuer des recherches sur d’autres membres de la famille. Avec les améliorations que nous comptons apporter à notre outil, je serai en mesure de parcourir les recensements et de voir les informations sur les membres de la famille de mon ancêtre sur deux pages, si ces personnes sont mentionnées. Je pourrai voir si on parle de Henry D. dans les annexes agricoles, puisqu’il était fermier. Peut-être que j’apprendrai quelle était la taille de sa ferme et s’il élevait des poulets, des porcs ou des vaches.

Capture d’écran des résultats de Recherche dans les recensements enregistrés dans Ma recherche.

Capture d’écran des résultats de Recherche dans les recensements enregistrés dans Ma recherche (Site web de Bibliothèque et Archives Canada)

La création de Recherche dans les recensements a été toute une aventure, et le projet ne fait que commencer. Comme vous pouvez le constater, nous avons de nombreuses améliorations et fonctionnalités à mettre en œuvre pour rendre l’expérience des utilisateurs plus agréable. Regrouper les 17 bases de données en une seule n’était que la première étape. Nous espérons que vous nous aiderez à améliorer cette ressource gratuite pour vous. Vous pouvez nous envoyer vos commentaires par courriel. Vous pouvez aussi vous inscrire à une séance de rétroaction de 10 minutes avec nous.


Julia Barkhouse travaille à Bibliothèque et Archives Canada depuis 14 ans dans les domaines de la qualité des données et de la gestion et de l’administration de bases de données. Elle est actuellement analyste des données pour les collections au sein de l’équipe Agile des services numériques.