Données bilingues des recensements : une meilleure expérience de recherche pour la population canadienne

Bannière pour la série "Le recensement de 1931". À gauche, le texte "Le recensement de 1931". À droite, un train en marche qui passe à côté d'une gare.Par Julia Barkhouse

Cet article renferme de la terminologie et des contenus à caractère historique que certaines personnes pourraient considérer comme offensants, notamment au chapitre du langage utilisé pour désigner l’identité de genre ou des groupes raciaux, ethniques et culturels. Pour en savoir plus, consultez notre Mise en garde – terminologie historique.

Bibliothèque et Archives Canada (BAC) est le gardien du passé lointain et de l’histoire récente du Canada. L’institution conserve les résultats des anciens recensements du Canada, dont certains de Terre-Neuve et d’autres remontant à la Nouvelle-France. Nous avons indexé certains recensements datant de 1825 à 1926, qui peuvent être consultés en ligne via l’outil Recherche dans les recensements.

Avant la Confédération, les recensements étaient généralement effectués en anglais ou en français, selon le lieu. Le Bureau fédéral de la statistique (aujourd’hui Statistique Canada) a introduit progressivement des formulaires bilingues après la Confédération en 1867.

Exemple d’un formulaire bilingue du recensement de 1921, rempli en anglais et en français :

Feuille de recensement du recensement de 1921. Cette image particulière figure à la page 6 pour le sous-district de Scots Bay dans le district de Kings, en Nouvelle-Écosse.

Recensement de 1921 rempli en anglais (e002910991).

Feuille de recensement du recensement de 1921. Cette image particulière figure à la page 19 pour le sous-district de Wolfestown (canton) dans le district de Richmond-Wolfe, au Québec.

Recensement de 1921 rempli en français (e003096782).

La langue dans laquelle sont consignées les réponses aux questions du recensement peut refléter la préférence linguistique du recenseur ou la langue dans laquelle les réponses ont été fournies. Les données historiques des recensements dont nous disposons reflètent la dualité linguistique de notre pays. Les recensements du Québec et de certaines parties du Nouveau-Brunswick et du Manitoba sont remplis en français, alors que dans le reste du Canada, ils sont remplis en anglais.

Lorsque nos partenaires, notamment Ancestry et FamilySearch, ont indexé les recensements de 1825 à 1926, nous avons produit une mine de données comportant des noms de personnes, leur sexe, leur état civil, etc. Nous étions cependant aux prises avec un défi de taille : les données des recensements pouvaient avoir été recueillies en anglais ou en français, selon les préférences personnelles du recenseur. Comment avons-nous géré cette situation?

La vie d’un recenseur

Retournons en arrière un instant pour examiner le parcours du recenseur. Les recenseurs étaient des Canadiens embauchés par le Bureau fédéral de la statistique pour recueillir des données de recensement dans un ou plusieurs sous-districts. Ils recevaient un manuel d’instructions (comme celui-ci pour le recensement de 1921) qui décrivait les renseignements à inscrire sur le formulaire selon les réponses fournies. On leur remettait un cahier de formulaires de recensement et des instructions sur les sous-districts à recenser. Cette personne disposait ensuite d’un nombre de jours donné pour recenser la population d’un certain nombre de sous-districts et renvoyer les formulaires au ministère concerné. Imaginez-vous cette personne faire du porte-à-porte dans une calèche ou, en 1921, à bord d’une des premières automobiles (peut-être une Ford modèle T)!

Le recenseur frappait à la porte et demandait à parler au chef de ménage (généralement le père ou le mari). Il était parfois invité à prendre place à la table de la cuisine pour poser ses questions. Si la famille était absente, le recenseur pouvait laisser à la porte une carte de visite précisant ses coordonnées et demandant aux résidents de faire un suivi avant une certaine date afin d’être pris en compte dans le recensement.

Selon la province au pays, le recenseur consignait les renseignements dans la langue de la personne à laquelle il s’adressait ou dans sa langue de préférence. Il est donc possible que des régions francophones du Canada au Québec, au Nouveau-Brunswick et au Manitoba aient été recensées en anglais, en français ou dans les deux langues, selon la préférence personnelle du recenseur.

Revenons à nos moutons! Les données saisies sur ces formulaires ont été transcrites par nos partenaires environ 92 ans après le recensement, et publiées en ligne.

Barrières linguistiques

Lorsque BAC a publié ces bases de données en ligne, nous avons constaté que nous disposions de données dans les deux langues. Si vous souhaitez trouver votre ancêtre, vous devez faire vos recherches dans la langue du recenseur. Ce dernier a-t-il consigné les renseignements concernant votre grand-mère en anglais ou en français? Votre nom comporte-t-il un accent (é, è…) qui aurait pu être mal entendu (ou omis) par le recenseur? Le nom de votre oncle comporte-t-il un « h » muet qui aurait pu être omis? Cette barrière linguistique nuit aux chercheurs qui souhaitent retrouver certaines personnes, mais ne parlent pas la langue utilisée à l’époque. Certains chercheurs francophones doivent effectuer des recherches en anglais pour retrouver leurs ancêtres francophones. L’expérience de recherche n’est donc pas la même pour les Canadiens qui accèdent à notre interface Recherche dans les recensements en français.

Création de l’outil Recherche dans les recensements

En novembre dernier, l’équipe Agile des Services numériques a réorganisé les 17 bases de données du recensement pour les regrouper dans l’outil Recherche dans les recensements, afin d’offrir une meilleure expérience de recherche à l’ensemble de la population canadienne. Notre objectif était de fournir la même expérience de recherche aux francophones qu’aux anglophones, de sorte que nos usagers utilisant l’interface en français puissent effectuer une recherche et obtenir les mêmes résultats que s’ils effectuaient une recherche en anglais.

Comment y parvenir? Comment traduire des renseignements comme le sexe, l’état civil, l’origine ethnique et la profession pour plus de 44 millions de personnes afin d’offrir une expérience identique à tout le monde? C’était en fait très simple. La solution? Un nettoyage des données.

Coup d’œil sous le capot

Jetons un coup d’œil en coulisses pour comprendre comment les données de recensement sont sauvegardées. L’outil Recherche dans les recensements est l’interface publique que les usagers de BAC peuvent utiliser pour effectuer des recherches. Les données de recensement pour chaque personne enregistrée sont sauvegardées dans un tableau principal appelé EnumAll.

Les données de recensement sont sauvegardées dans un tableau dans SQL Management Server.

Capture d’écran du tableau principal (Census.EnumAll ) produit à l’aide du logiciel SQL Management Server (Bibliothèque et Archives Canada).

Dans ce tableau, chaque rangée représente une personne. Les données saisies concernant cette personne sont séparées en colonnes. Lorsque nous ne disposons pas de données pour une colonne, il est indiqué NULL.

Création de bassins de données communes

Census.EnumAll sert de tableau principal. À partir de ce tableau, nous avons créé des ensembles de données communes. Autrement dit, nous avons copié une des colonnes (sexe, état civil, origine ethnique, religion, etc.) dans un tableau distinct. Un tel tableau comprend uniquement une liste de sexes ou d’options d’état civil, par exemple. C’est ce que nous appelons un bassin de données communes : un tableau qui ne contient qu’un seul type de données.

Le tableau de données communes sépare les données (p. ex., « Homme » ou « Femme ») de la personne. Si vous examinez 44 millions de personnes, vous constaterez que les mêmes données se répètent, par exemple chaque fois que le recenseur a indiqué « Homme » ou « Marié ». Dans un tableau commun, vous ne verrez « Homme » qu’une seule fois, avec une valeur indiquant le nombre de personnes correspondant à ce renseignement (ce que nous appelons un attribut).

C’est là que la magie opère.

Tableau des sexes du côté serveur de l’outil Recherche dans les recensements. Il convient de noter qu’il existe des variations (Homme et H, Femme et F) de même que deux colonnes intitulées TextLongEn (affichage en anglais) et TextLongFr (affichage en français).

Capture d’écran du tableau des sexes (T_Gender) produit à l’aide du logiciel SQL Management Server (Bibliothèque et Archives Canada).

Comme vous pouvez le constater dans ce tableau distinct de données communes, nous pouvons effectuer d’autres opérations. Dans le présent exemple, les codes permettent d’établir une façon uniforme de désigner chaque sexe. C’est ce qu’on appelle une autorité. Nous procédons ensuite à un nettoyage afin que toutes les variations (par exemple « Homme » et « H ») renvoient à cette autorité unique.

Une fois cette autorité établie, nous créons des colonnes selon la façon dont nous voulons afficher les renseignements dans l’outil Recherche dans les recensements. Nous créons un affichage en anglais (TextLongEn) et un affichage en français (TextLongFr). Nous ajoutons ensuite la traduction bilingue une seule fois, et elle s’applique à tout. Dans ce cas, nous avons traduit « Male » par « Homme », et cette traduction s’applique à l’ensemble des 20 163 488 personnes qui se sont identifiées comme « Homme » dans les 17 recensements.

Nous avons ensuite regroupé tous les tableaux et indexé les données pour les afficher dans l’outil Recherche dans les recensements. Ainsi, l’interface et les données elles-mêmes seront traduites dans la langue de votre choix.

Interface de Recherche dans les recensements en anglais affichant le menu déroulant des sexes avec les valeurs « Female », « Male » et « Unknown », à côté de l’interface de Recherche dans les recensements en français affichant le même menu déroulant des sexes avec les valeurs « Femme », « Homme » et « Inconnu ».

Captures d’écran de l’interface de Recherche dans les recensements en anglais et en français (Bibliothèque et Archives Canada).

Maintenant, lorsque je cherche mon arrière-grand-père Henry D. Barkhouse dans les recensements, les données générées sont traduites.

Deux captures d’écran, l’une en anglais et l’autre en français, d’un recensement de 1911 pour Henry D. Barkhouse, avec des flèches indiquant où les données sont traduites.

Affichage en français et en anglais du recensement de 1911 pour Henry D. Barkhouse (e001973146).

Évaluation de l’état d’avancement

Comme vous pouvez l’imaginer, le nettoyage et la traduction de nos données sont des opérations qui prennent du temps. Notre priorité a été de créer des menus déroulants pour le sexe et l’état civil dans l’outil Recherche dans les recensements. Désormais, si vous effectuez une recherche dans l’un de ces champs, une courte liste de termes traduits, dans les deux langues officielles, s’affiche à l’écran. Dans le cadre de la poursuite de ce travail, nous nous penchons actuellement sur les champs origine ethnique et lieu de naissance et avons effectué de 60 à 70 % de ce travail. Nos usagers pourront donc découvrir de nouvelles options dans l’outil Recherche dans les recensements en 2024. Nous poursuivrons ensuite l’exercice avec les autres champs comme la religion, le lien avec le chef du ménage, la profession, etc.

Conclusion

Le regroupement des 17 recensements en une seule et même plateforme, Recherche dans les recensements, nous a permis de créer un affichage bilingue pour nos données de recensement en nettoyant les données. Depuis son lancement, notre plateforme offre une expérience de recherche plus uniforme dans la langue de votre choix. Je vous encourage à l’essayer et à nous dire si votre expérience de recherche s’est améliorée.

Comme toujours, nous sommes ravis de recevoir vos commentaires et vos idées par courriel. Vous pouvez également vous inscrire à une séance de rétroaction de 10 minutes.


Julia Barkhouse travaille à Bibliothèque et Archives Canada dans le domaine de la qualité des données, de la gestion des bases de données et de l’administration depuis 14 ans. Elle occupe actuellement le poste d’analyste de données pour les collections au sein de l’équipe Agile des Services numériques.

Traduction fidèle : à la découverte des traductions littéraires canadiennes

Par Liane Belway

La découverte de nouveaux livres et de nouveaux auteurs excitants s’avère une expérience enrichissante pour la plupart des lecteurs. À Patrimoine publié – le volet bibliothèque de Bibliothèque et Archives Canada (BAC) –, nous communiquons avec les éditeurs qui nous envoient des ouvrages pour permettre à un public élargi de profiter de la diversité du patrimoine publié canadien.

Pour rendre le matériel accessible, les éditeurs canadiens déposent des exemplaires de leurs publications par l’entremise de l’équipe du dépôt légal de BAC. Quel matériel le dépôt légal acquiert-il? Un vaste contenu canadien : livres, musique, enregistrements oraux, magazines et autres séries ainsi que documents numériques. Chaque publication offre un point de vue unique sur la société et la culture canadiennes, reflétant la vision, les intérêts et l’identité de l’éditeur. Une des sources de savoir et de talent du milieu littéraire est la traduction de tels ouvrages, permettant à ces publications d’être lues par un tout nouveau public.

Traductions canadiennes

La traduction littéraire permet de faire connaître de grandes œuvres littéraires à un public élargi. Ce talent, souvent négligé, est néanmoins très précieux dans notre société multiculturelle et multilingue. Les traductions offrent de nouvelles perspectives et des styles uniques, tout en donnant la chance aux gens de découvrir des traditions et des innovations littéraires qui, sans cela, seraient difficiles d’accès. D’ailleurs, les Prix du Gouverneur général comprennent une catégorie destinée à la traduction, reconnaissant ainsi l’importance de faire connaître des œuvres de langue française aux lecteurs anglophones. Chaque année, ce prix reconnaît la traduction d’un livre vers l’anglais pour son excellence littéraire et sa contribution au milieu culturel.

Gagnants

Le Prix littéraire du Gouverneur général pour la traduction (du français vers l’anglais) de 2017 a été remis à Readopolis, traduit en anglais par Oana Avasilichioaei et publié par BookThug, à Toronto. Il s’agit d’une traduction de Lectodôme de Bertrand Laverdure, publié par Le Quartanier, une maison d’édition francophone de Montréal. Le comité d’évaluation par les pairs ne tarissait pas d’éloges pour Avasilichioaei : « Readopolis, d’Oana Avasilichioaei, correspond au style acrobatique dont Lectodôme, de Bertrand Laverdure, est empreint. Les nombreuses voies de l’écriture québécoise se font entendre par cette traduction intelligente, une ode vertigineuse à la quête pure, bien que rarement récompensée, de littérature. »

Le livre Brothers de David Clerson, un autre finaliste louable du même prix en 2017, incarne bien la vision d’un nouvel éditeur. QC Fiction, une collection des Livres Baraka adoptant des perspectives stimulantes, est un éditeur québécois de livres en anglais se trouvant à Montréal. Reconnaissant l’importance de la traduction, QC Fiction a pour objectif de publier des traductions anglaises de romans québécois contemporains, d’abord publiés en français, pour les autres Canadiens et le public à l’étranger. Une autre publication de QC Fiction, I Never Talk About It, comprend 37 nouvelles, chacune traduite par un traducteur différent. Peter McCambridge, éditeur de romans, a affirmé qu’il s’agit de « 37 traducteurs différents ayant traduit chacune des nouvelles publiées dans une collection de Véronique Côté et de Steve Gagnon. Cela nous rappelle qu’il existe au moins 37  façons différentes de traduire la voix d’un auteur. Pensez-y la prochaine fois que vous achetez une traduction! »

Six couvertures de livre colorées à l’apparence semblable, placées côte à côte et montrant tous les titres : Listening for Jupiter, I Never Talk About It, Behind the Eyes We Meet, Brothers, The Unknown Huntsman, Life in the Court of Matane.

Une sélection des publications de QC Fiction, dont Brothers (2016), finaliste du Prix du Gouverneur général pour la traduction. Image utilisée avec la permission de QC Fiction.

L’offre de traductions permet à des publics non canadiens de découvrir notre vaste littérature, laquelle grandit constamment dans notre monde de plus en plus connecté. Les auteurs canadiens apprécient d’ailleurs l’élargissement de leur public international. QC Fiction illustre bien l’attrait général des romans canadiens. M. McCambridge a ajouté ce qui suit : « Pour l’instant, notre formule semble bien fonctionner : trois de nos cinq premiers livres ont été mentionnés dans le journal The Guardian, en Angleterre. Des blogueurs de l’Écosse jusqu’en Australie ont découvert notre entreprise et encensent nos “lectures légères et intrigantes” ».

Grâce à ces éditeurs primés – seulement deux exemples du travail novateur effectué dans le monde de la traduction littéraire au Canada –, la publication canadienne demeure un milieu créatif, varié et florissant que BAC s’efforce de conserver et de préserver pour les lecteurs d’aujourd’hui et de demain. Pour voir les autres articles de la collection de BAC, utilisez notre nouvel outil de recherche : http://www.collectionscanada.gc.ca/lac-bac/recherche/tout.

Liane Belway est bibliothécaire aux acquisitions, monographies anglaises, pour la Direction générale du patrimoine publié de Bibliothèque et Archives Canada.

Voici Co-Lab : l’outil qui vous permettra de donner un coup de pouce à l’histoire!

Une bannière turquoise avec les mots: Co-Lab - votre outil de collaborationLa production participative est arrivée à Bibliothèque et Archives Canada! Grâce à Co-Lab et à notre nouvel outil Recherche dans la collection(bêta), vous pouvez maintenant transcrire des documents d’archives, y ajouter des mots-clés et des étiquettes, traduire des textes et des descriptions de photos ou d’images, ou encore créer des descriptions pour des images déjà numérisées.

Relevez le défi!

Pour rendre le tout encore plus intéressant, nous vous lançons des « défis » en vous invitant à travailler sur de petites collections : par exemple, les archives de Rosemary Gilliat (Eaton). Venez transcrire son journal et décrire les photos de ses voyages dans l’Arctique! À moins que vous ne préfériez recopier les lettres d’amour de sir Wilfrid Laurier à Zoé, sa bien-aimée et sa future épouse? Ces défis n’attendent que vous : relevez-les dès maintenant!

Une capture d’écran du Co-Lab montrant les différents défis de disponible.Pour participer : utilisez l’outil Recherche dans la collection(bêta)

Lorsque vous trouverez des images dans notre nouvel outil de recherche, vous aurez ce choix : « activer cette image aux fins de production participative à l’aide de Co-Lab ». Vous répondrez alors à de brèves questions, et vous pourrez ensuite commencer à utiliser Co-Lab pour transcrire, traduire ou décrire les documents voulus.

Si une image est déjà choisie, vous pourrez ajouter vos propres contributions ou modifier celles d’autres personnes. De plus, en vous créant un compte d’utilisateur, vous pourrez consulter l’historique de votre participation et vous serez informé des nouveaux défis et des mises à jour de Co-Lab.

Une nouvelle façon d’afficher les images

Une capture d’écran montrant une lettre écrite à la plume dans une fenêtre et dans l’espace de droite on voit un espace dédié à la transcription et sous cet espace une petite boîte indique le statut de la transcription.

Co-Lab s’accompagne d’un nouvel afficheur qui vous permet de zoomer sur des images ou de les glisser-déplacer. Ces fonctions sont très utiles lorsque vous voulez voir un détail afin de le transcrire ou d’ajouter des mots-clés ou des étiquettes.

Et s’il y a des erreurs?

C’est inévitable : il y aura des erreurs, surtout dans les transcriptions des documents manuscrits. Cela dit, le contenu dans Co-Lab peut être révisé par d’autres contributeurs. Si vous voyez une erreur, corrigez-la ou ajoutez la mention « Révision nécessaire » pour que d’autres puissent y jeter un coup d’œil.

Le plus grand avantage de Co-Lab? Chaque contribution individuelle profite aux autres chercheurs et améliore l’accès aux archives. Et chaque ajout à un document se traduit par une nouvelle métadonnée qui devient interrogeable dans un délai de 24 heures. Résultat : de jour en jour, les documents de Bibliothèque et Archives Canada deviennent plus facilement repérables.

De plus, en transcrivant sous forme de texte des documents qui n’étaient auparavant que des images numérisées, nous les rendons accessibles aux personnes utilisant un appareil de synthèse vocale ou un lecteur sonore d’écran. Enfin, en traduisant certains documents, nous permettons aux Canadiens unilingues d’en comprendre le contenu.

Pour plus d’informations et pour obtenir des réponses aux questions fréquemment posées, consultez la page À propos de Co-Lab. Déjà prêt à commencer? Donnez un coup de pouce à l’histoire et essayez Co-Lab dès maintenant!

Les Prix littéraires du Gouverneur général pour 2013

Les Prix littéraires du Gouverneur général sont décernés chaque année aux meilleurs ouvrages de langue française et de langue anglaise dans chacune des sept catégories suivantes : romans et nouvelles, essais littéraires, poésie, théâtre, littérature jeunesse (texte), littérature jeunesse (illustrations) et traduction.

Chaque année, Bibliothèque et Archives Canada acquiert, catalogue et rend accessibles tous les livres canadiens qui sont mis en nomination avant que les lauréats soient connus. Le dépôt légal est utilisé dans la plupart des cas, mais certains ouvrages ne sont pas publiés au Canada et doivent être acquis par d’autres moyens pour que les générations futures aient accès aux œuvres de tous les candidats aux prix du Gouverneur général.

Félicitations à tous!

Roman
Français
Quand les guêpes se taisent, par Stéphanie Pelletier (AMICUS 40915742)
Anglais
The Luminaries, par Eleanor Catton (AMICUS 41787649)

Poésie
Français
Pour les désespérés seulement, par René Lapierre (AMICUS 40824154)
Anglais
North End Love Songs, par Katherena Vermette (AMICUS 40823688)

Théâtre
Français
Bienveillance, par Fanny Britt (AMICUS 41316358)
Anglais
Fault Lines, par Nicolas Billon (AMICUS 41530643)

Essais
Français
Aimer, enseigner, par Yvon Rivard (AMICUS 40909709)
Anglais
Journey with No Maps: A Life of P.K. Page, par Sandra Djwa (AMICUS 40812690)

Jeunesse – Texte
Français
À l’ombre de la grande maison, par Geneviève Mativat (AMICUS 40696767)
Anglais
The Unlikely Hero of Room 13B, par Teresa Toten (AMICUS 41749214)

Jeunesse – Illustrations
Français
Jane, le renard et moi, par Isabelle Arsenault (AMICUS 41921688)
Anglais
Northwest Passage, par Matt James (AMICUS 40320781)

Traduction
Français
L’enfant du jeudi, par Sophie Voillot (AMICUS 40772400)
Anglais
The Major Verbs, par Donald Winkler (AMICUS 40717619)