Cet article renferme de la terminologie et des contenus à caractère historique que certaines personnes pourraient considérer comme offensants, notamment au chapitre du langage utilisé pour désigner l’identité de genre ou des groupes raciaux, ethniques et culturels. Pour en savoir plus, consultez notre Mise en garde – terminologie historique.
Bibliothèque et Archives Canada (BAC) est le gardien du passé lointain et de l’histoire récente du Canada. L’institution conserve les résultats des anciens recensements du Canada, dont certains de Terre-Neuve et d’autres remontant à la Nouvelle-France. Nous avons indexé certains recensements datant de 1825 à 1926, qui peuvent être consultés en ligne via l’outil Recherche dans les recensements.
Avant la Confédération, les recensements étaient généralement effectués en anglais ou en français, selon le lieu. Le Bureau fédéral de la statistique (aujourd’hui Statistique Canada) a introduit progressivement des formulaires bilingues après la Confédération en 1867.
Exemple d’un formulaire bilingue du recensement de 1921, rempli en anglais et en français :

Recensement de 1921 rempli en anglais (e002910991).

Recensement de 1921 rempli en français (e003096782).
La langue dans laquelle sont consignées les réponses aux questions du recensement peut refléter la préférence linguistique du recenseur ou la langue dans laquelle les réponses ont été fournies. Les données historiques des recensements dont nous disposons reflètent la dualité linguistique de notre pays. Les recensements du Québec et de certaines parties du Nouveau-Brunswick et du Manitoba sont remplis en français, alors que dans le reste du Canada, ils sont remplis en anglais.
Lorsque nos partenaires, notamment Ancestry et FamilySearch, ont indexé les recensements de 1825 à 1926, nous avons produit une mine de données comportant des noms de personnes, leur sexe, leur état civil, etc. Nous étions cependant aux prises avec un défi de taille : les données des recensements pouvaient avoir été recueillies en anglais ou en français, selon les préférences personnelles du recenseur. Comment avons-nous géré cette situation?
La vie d’un recenseur
Retournons en arrière un instant pour examiner le parcours du recenseur. Les recenseurs étaient des Canadiens embauchés par le Bureau fédéral de la statistique pour recueillir des données de recensement dans un ou plusieurs sous-districts. Ils recevaient un manuel d’instructions (comme celui-ci pour le recensement de 1921) qui décrivait les renseignements à inscrire sur le formulaire selon les réponses fournies. On leur remettait un cahier de formulaires de recensement et des instructions sur les sous-districts à recenser. Cette personne disposait ensuite d’un nombre de jours donné pour recenser la population d’un certain nombre de sous-districts et renvoyer les formulaires au ministère concerné. Imaginez-vous cette personne faire du porte-à-porte dans une calèche ou, en 1921, à bord d’une des premières automobiles (peut-être une Ford modèle T)!
Le recenseur frappait à la porte et demandait à parler au chef de ménage (généralement le père ou le mari). Il était parfois invité à prendre place à la table de la cuisine pour poser ses questions. Si la famille était absente, le recenseur pouvait laisser à la porte une carte de visite précisant ses coordonnées et demandant aux résidents de faire un suivi avant une certaine date afin d’être pris en compte dans le recensement.
Selon la province au pays, le recenseur consignait les renseignements dans la langue de la personne à laquelle il s’adressait ou dans sa langue de préférence. Il est donc possible que des régions francophones du Canada au Québec, au Nouveau-Brunswick et au Manitoba aient été recensées en anglais, en français ou dans les deux langues, selon la préférence personnelle du recenseur.
Revenons à nos moutons! Les données saisies sur ces formulaires ont été transcrites par nos partenaires environ 92 ans après le recensement, et publiées en ligne.
Barrières linguistiques
Lorsque BAC a publié ces bases de données en ligne, nous avons constaté que nous disposions de données dans les deux langues. Si vous souhaitez trouver votre ancêtre, vous devez faire vos recherches dans la langue du recenseur. Ce dernier a-t-il consigné les renseignements concernant votre grand-mère en anglais ou en français? Votre nom comporte-t-il un accent (é, è…) qui aurait pu être mal entendu (ou omis) par le recenseur? Le nom de votre oncle comporte-t-il un « h » muet qui aurait pu être omis? Cette barrière linguistique nuit aux chercheurs qui souhaitent retrouver certaines personnes, mais ne parlent pas la langue utilisée à l’époque. Certains chercheurs francophones doivent effectuer des recherches en anglais pour retrouver leurs ancêtres francophones. L’expérience de recherche n’est donc pas la même pour les Canadiens qui accèdent à notre interface Recherche dans les recensements en français.
Création de l’outil Recherche dans les recensements
En novembre dernier, l’équipe Agile des Services numériques a réorganisé les 17 bases de données du recensement pour les regrouper dans l’outil Recherche dans les recensements, afin d’offrir une meilleure expérience de recherche à l’ensemble de la population canadienne. Notre objectif était de fournir la même expérience de recherche aux francophones qu’aux anglophones, de sorte que nos usagers utilisant l’interface en français puissent effectuer une recherche et obtenir les mêmes résultats que s’ils effectuaient une recherche en anglais.
Comment y parvenir? Comment traduire des renseignements comme le sexe, l’état civil, l’origine ethnique et la profession pour plus de 44 millions de personnes afin d’offrir une expérience identique à tout le monde? C’était en fait très simple. La solution? Un nettoyage des données.
Coup d’œil sous le capot
Jetons un coup d’œil en coulisses pour comprendre comment les données de recensement sont sauvegardées. L’outil Recherche dans les recensements est l’interface publique que les usagers de BAC peuvent utiliser pour effectuer des recherches. Les données de recensement pour chaque personne enregistrée sont sauvegardées dans un tableau principal appelé EnumAll.

Capture d’écran du tableau principal (Census.EnumAll ) produit à l’aide du logiciel SQL Management Server (Bibliothèque et Archives Canada).
Dans ce tableau, chaque rangée représente une personne. Les données saisies concernant cette personne sont séparées en colonnes. Lorsque nous ne disposons pas de données pour une colonne, il est indiqué NULL.
Création de bassins de données communes
Census.EnumAll sert de tableau principal. À partir de ce tableau, nous avons créé des ensembles de données communes. Autrement dit, nous avons copié une des colonnes (sexe, état civil, origine ethnique, religion, etc.) dans un tableau distinct. Un tel tableau comprend uniquement une liste de sexes ou d’options d’état civil, par exemple. C’est ce que nous appelons un bassin de données communes : un tableau qui ne contient qu’un seul type de données.
Le tableau de données communes sépare les données (p. ex., « Homme » ou « Femme ») de la personne. Si vous examinez 44 millions de personnes, vous constaterez que les mêmes données se répètent, par exemple chaque fois que le recenseur a indiqué « Homme » ou « Marié ». Dans un tableau commun, vous ne verrez « Homme » qu’une seule fois, avec une valeur indiquant le nombre de personnes correspondant à ce renseignement (ce que nous appelons un attribut).
C’est là que la magie opère.

Capture d’écran du tableau des sexes (T_Gender) produit à l’aide du logiciel SQL Management Server (Bibliothèque et Archives Canada).
Comme vous pouvez le constater dans ce tableau distinct de données communes, nous pouvons effectuer d’autres opérations. Dans le présent exemple, les codes permettent d’établir une façon uniforme de désigner chaque sexe. C’est ce qu’on appelle une autorité. Nous procédons ensuite à un nettoyage afin que toutes les variations (par exemple « Homme » et « H ») renvoient à cette autorité unique.
Une fois cette autorité établie, nous créons des colonnes selon la façon dont nous voulons afficher les renseignements dans l’outil Recherche dans les recensements. Nous créons un affichage en anglais (TextLongEn) et un affichage en français (TextLongFr). Nous ajoutons ensuite la traduction bilingue une seule fois, et elle s’applique à tout. Dans ce cas, nous avons traduit « Male » par « Homme », et cette traduction s’applique à l’ensemble des 20 163 488 personnes qui se sont identifiées comme « Homme » dans les 17 recensements.
Nous avons ensuite regroupé tous les tableaux et indexé les données pour les afficher dans l’outil Recherche dans les recensements. Ainsi, l’interface et les données elles-mêmes seront traduites dans la langue de votre choix.

Captures d’écran de l’interface de Recherche dans les recensements en anglais et en français (Bibliothèque et Archives Canada).
Maintenant, lorsque je cherche mon arrière-grand-père Henry D. Barkhouse dans les recensements, les données générées sont traduites.

Affichage en français et en anglais du recensement de 1911 pour Henry D. Barkhouse (e001973146).
Évaluation de l’état d’avancement
Comme vous pouvez l’imaginer, le nettoyage et la traduction de nos données sont des opérations qui prennent du temps. Notre priorité a été de créer des menus déroulants pour le sexe et l’état civil dans l’outil Recherche dans les recensements. Désormais, si vous effectuez une recherche dans l’un de ces champs, une courte liste de termes traduits, dans les deux langues officielles, s’affiche à l’écran. Dans le cadre de la poursuite de ce travail, nous nous penchons actuellement sur les champs origine ethnique et lieu de naissance et avons effectué de 60 à 70 % de ce travail. Nos usagers pourront donc découvrir de nouvelles options dans l’outil Recherche dans les recensements en 2024. Nous poursuivrons ensuite l’exercice avec les autres champs comme la religion, le lien avec le chef du ménage, la profession, etc.
Conclusion
Le regroupement des 17 recensements en une seule et même plateforme, Recherche dans les recensements, nous a permis de créer un affichage bilingue pour nos données de recensement en nettoyant les données. Depuis son lancement, notre plateforme offre une expérience de recherche plus uniforme dans la langue de votre choix. Je vous encourage à l’essayer et à nous dire si votre expérience de recherche s’est améliorée.
Comme toujours, nous sommes ravis de recevoir vos commentaires et vos idées par courriel. Vous pouvez également vous inscrire à une séance de rétroaction de 10 minutes.
Julia Barkhouse travaille à Bibliothèque et Archives Canada dans le domaine de la qualité des données, de la gestion des bases de données et de l’administration depuis 14 ans. Elle occupe actuellement le poste d’analyste de données pour les collections au sein de l’équipe Agile des Services numériques.




