Transcription
Transcription : Série Café virtuel de l'EFPC : Approches novatrices pour la collecte en temps réel de données fondées sur l'analyse de sentiments
[Le logo de l'EFPC s'affiche à l'écran, accompagné du texte "CSPS Virtual Café Series" / « Série Café virtuel de l'EFPC ».]
[L'écran s'estompe et Kyle Burns apparaît dans un panneau de clavardage vidéo.]
Kyle Burns : Bonjour et bienvenue à la Série Café virtuel de l'École de la fonction publique du Canada. Il s'agit d'une série qui met en vedette des experts universitaires de premier plan, des dirigeants œuvrant dans le secteur non gouvernemental, des experts des médias et des fonctionnaires qui font part et débattent de leurs idées et de leurs points de vue sur toute une gamme de sujets économiques, sociaux et technologiques. Dans le cadre de cette séance, nous aborderons les approches novatrices pour la collecte en temps réel de données fondées sur l'analyse des sentiments. Je m'appelle Kyle Burns et je suis le directeur général de l'Innovation dans le secteur public à l'École de la fonction publique du Canada. Je suis heureux d'être ici aujourd'hui pour animer cet événement. Veuillez noter que la séance d'aujourd'hui se déroulera en anglais; un service d'interprétation simultanée est toutefois offert.
Avant de commencer, j'aimerais souligner que je me trouve aujourd'hui dans la ville d'Ottawa, qui est située sur le territoire traditionnel non cédé du peuple anichinabé. Dans le contexte de la participation à cet événement virtuel, je vous demande de reconnaître que nous travaillons tous dans des endroits différents et que nous œuvrons donc dans différents territoires autochtones traditionnels. De plus, avant de poursuivre, je vais mentionner quelques éléments d'ordre administratif. Premièrement, afin d'améliorer votre expérience visuelle, nous vous encourageons à vous déconnecter du RPV, si possible, et à vous reconnecter à l'événement. Veuillez noter que des services d'interprétation simultanée et de traduction en temps réel des communications (TTRC) vous sont offerts pour cet événement. Vous n'avez qu'à consulter le courriel de rappel que vous avez reçu de l'École ou à visiter notre plateforme vExpo pour obtenir des renseignements sur l'accès à ces fonctionnalités. Je précise également que nous recevrons des questions tout au long de l'événement par l'entremise de la plateforme de clavardage Collaborate. Et c'est vraiment simple de poser des questions. Il vous suffit de cliquer sur l'icône de bulle dans le coin supérieur droit de votre écran. Vous ne verrez pas vos questions apparaître dans la zone de clavardage, mais nous les recevrons et nous essaierons de répondre au plus grand nombre de questions possible aujourd'hui. Nous vous encourageons à participer dans la langue de votre choix.
J'ai donc maintenant le plaisir de vous présenter notre invitée, Danielle Goldfarb. Au baseball, Danielle serait décrite comme une joueuse qui dispose des cinq outils. Elle est extraordinaire. Elle est une conseillère exécutive, une analyste, une économiste et une professeure accomplie et novatrice. Elle est reconnue pour sa capacité à diriger et à mettre au point des recherches et des analyses novatrices sur des sujets liés aux politiques publiques, à la technologie, aux données de rechange, au commerce mondial et à l'économie mondiale. Danielle est chercheuse en politiques publiques depuis plus de deux décennies, et elle est actuellement vice-présidente des politiques publiques, des affaires mondiales et de l'économie chez RIWI, qui signifie Real-Time Interactive Worldwide Intelligence.
[Danielle Goldfarb apparaît dans un autre panneau de clavardage vidéo.]
Danielle, j'aimerais vous souhaiter chaleureusement la bienvenue. Merci de vous joindre à nous aujourd'hui.
Danielle Goldfarb : Merci beaucoup, Kyle. C'est un plaisir d'être ici et de m'adresser à tous les participants. Je suis vraiment excitée de vous parler aujourd'hui un peu du fait que nous nous sommes tous tournés vers le virtuel et notre société est devenue numérique, tout comme nos économies. Par conséquent, nous avons assisté à cette explosion de données mondiales, qu'il s'agisse de données textuelles, de données satellitaires ou de données mobiles. Les décideurs disposent ainsi d'énormes possibilités pour saisir ces données, mais il y a en même temps des défis importants. Je suis donc vraiment excitée de vous parler de l'un des outils et technologies qui existent et avec lequel j'ai eu le privilège de travailler au cours des cinq dernières années. Il tire parti du fait que les gens sont en ligne. Il sert à développer et à créer des ensembles de données en temps réel et plus inclusifs. Ainsi, pendant la pandémie, nous avons vraiment pu voir le développement plus rapide de certains nouveaux ensembles de données et outils.
Donc, sans plus attendre, je vais vous faire part un peu plus de la vue d'ensemble et du contexte dans lequel nous nous trouvons. Je vous parlerai un peu de la perspective de RIWI alors que nous explorons les utilisations de cette technologie. Je mentionnerai peut-être simplement que RIWI est une technologie canadienne mise au point à l'Université de Toronto et qui est dorénavant utilisée dans tous les pays du monde, à l'exception de la Corée du Nord. Nous ne sommes pas en mesure de l'utiliser en Corée du Nord, il n'y a pas d'Internet. Mais nous l'utilisons partout dans le monde, y compris au Canada, et je vous ferai part de quelques exemples tout au long de ma présentation. Alors, passons maintenant à la diapositive suivante.
[Une diapositive est présentée à l'écran et porte le titre suivant : « Harnessing the Digital Data Revolution for Real-time and More Inclusive Data / Exploiter la révolution des données numériques pour des données en temps réel et plus inclusives ».]
Je voulais commencer en disant – si nous pouvions simplement passer à la diapositive suivante – je voulais vous parler en quelque sorte de ce que nous utilisons en matière de données traditionnelles, les données que nous utilisons à titre de fondement à l'information. Si nous pouvons passer à la diapositive suivante, je vais juste... vous le verrez. Bon, je vais en parler jusqu'à ce que nous y arrivions. Essentiellement, pour ce qui est des données dont nous disposons en ce moment, nous sommes très chanceux au Canada. Nous avons un excellent organisme de statistique. Il fournit notre fondement à l'information.
[Une diapositive est présentée et montre une liste d'annonces de politiques depuis mai 2023, en ordre chronologique. Les dates de publication et les périodes de référence sont indiquées à côté de chacune d'elles.]
Donc, comme vous le verrez dans cette diapositive, nos données sont publiées.
[Du texte apparaît au-dessus du graphique et on peut lire : « Data lags reality, challenging ability to make timely interventions / Les données sont en décalage avec la réalité, ce qui remet en cause la capacité d'intervenir en temps opportun ».]
Nous sommes en mai 2023, on voit les jours où des données ont été publiées en mai 2023. Par contre, si vous jetez un coup d'œil aux périodes de référence, elles remontent toutes à plusieurs semaines ou mois. Nous avons constaté, pendant la pandémie, la nécessité d'avoir en temps opportun [...] Lorsque des changements de politique se produisent très rapidement, vous avez vraiment besoin de mesures plus opportunes pour être en mesure de faire des interventions politiques en temps utile. C'est donc l'un des défis associés à nos données existantes.
Maintenant, si nous passons à la diapositive suivante, nous devons commencer à demander, au fur et à mesure que nos économies deviennent numériques et ainsi de suite... continuez à avancer avec les puces. Oui, à mesure que notre économie devient plus numérisée, plus complexe, les sources de données actuelles sont-elles aussi fiables et aussi pertinentes qu'elles l'ont été dans le passé? Sont-elles aussi granulaires qu'elles doivent l'être? Ainsi, ce sont des données, cela fait référence à la situation aux États-Unis, c'est une citation du National Bureau of Economic Research. Ce que le Bureau a constaté, et ce qui a également été constaté au Canada et à peu près partout dans le monde, c'est qu'il a été très, très difficile d'utiliser des méthodes traditionnelles pour recueillir des données d'enquête auprès des gens. Les taux de réponse ont considérablement diminué, ce qui soulève des questions quant à savoir si nous obtenons vraiment un portrait complet de ce qui se passe. Aussi, plus l'économie ou la société se complexifie et que les problèmes auxquels nous faisons face deviennent complexes, plus les gens exigent des données en temps plus utile, des données plus granulaires. La diapositive suivante, s'il vous plaît.
[Une diapositive apparaît avec le texte suivant : « As society has digitized, an explosion of new data is now available / Alors que la société s'est numérisée, une myriade de nouvelles données sont maintenant disponibles ». Un graphique apparaît en dessous et montre le nombre de recherches « Non Sento Odori » (« Je ne sens rien ») dans Google effectuées en Italie en mars 2020.]
Donc, en ce moment où nous sommes vraiment [...] comme nous l'avons vu pendant la pandémie, c'était très difficile pour nous de compter sur certaines sources de données traditionnelles et d'être en mesure de vraiment comprendre ce qui se passait en temps opportun. Nous avons été exposés à une énorme explosion de données, que ce soit... voici un exemple que j'ai toujours trouvé assez intéressant. Il a été publié dans le New York Times et utilise essentiellement des données de recherche en ligne pour identifier un nouveau symptôme de la COVID avant qu'il ne soit signalé et validé comme un vrai symptôme de la COVID. Nous savons maintenant que nous pouvons faire fausse route avec les données de recherche en ligne; il y avait ce cas tristement célèbre de tendances concernant la grippe Google et ainsi de suite. Néanmoins, nous avons ces nouvelles sources de données, et la question est de savoir comment nous pouvons les exploiter pour améliorer notre capacité à mesurer et à comprendre ce qui se passe. La diapositive suivante, s'il vous plaît.
[Un graphique montre le nombre d'emplois vacants à Statistique Canada et le nombre de postes affichés sur le site Indeed entre le 18 et le 23 janvier 2022 et le 18 et le 23 juillet 2022.]
Donc, nous pouvons maintenant voir certaines tendances en temps réel, que nous ne pouvions pas voir auparavant parce que certains de nos ensembles de données traditionnels ne nous permettaient pas de le faire. C'est un travail effectué par Brendan Bernard qui se sert du site Indeed.com, un site Web d'affichage d'offres d'emploi. La plupart d'entre vous le connaissent probablement. Essentiellement, ce qui est incroyable à propos de l'ensemble de données qu'il a utilisé, c'est qu'il suit en fait les données officielles de très près, mais ces données sont disponibles avant les données officielles. En fait, il y a eu une période pendant la COVID où les données n'ont pas été recueillies. Vous pouvez voir le genre de ligne rose qui est continue parce qu'il a pu rassembler cet ensemble de données tout au long de cette période. Maintenant, il y a, encore une fois, des défis, des biais dans cet ensemble de données. Néanmoins, ces nouveaux ensembles de données sont disponibles. La diapositive suivante, s'il vous plaît.
[Un graphique montre l'indice de valeur domiciliaire de Zillow dans 22 États américains distincts en septembre 2022.]
Donc, nous avons la capacité ici de faire de meilleures prédictions et interventions en théorie, si nous tirons bien parti de ces outils et si nous comprenons ce qu'ils peuvent faire et ce qu'ils ne peuvent pas faire. Ce sont des données de Zillow. Zillow est une plateforme de logement, qui est maintenant utilisée pour faire des prédictions au sujet de l'inflation. Elle a été très utile pour ce qui est de prédire bien à l'avance, soit bien avant les données officielles, à quoi l'inflation va réellement ressembler, en se fondant sur des données officielles. Encore une fois, nous devons simplement être conscients de ces ensembles de données. La diapositive suivante, s'il vous plaît.
[Un graphique montre le nombre de recherches en Chine, à l'aide du moteur de recherche Baidu, à propos des termes « Antigen » (antigène), « Lianhua qingwen », « Covid », « Antipyretics » (antipyrétiques), « Fever » (fièvre) et « Funeral services » (services funéraires) entre les mois d'octobre et de décembre 2022.]
Ils peuvent nous permettre aussi... ces nouveaux ensembles de données peuvent nous permettre de valider ou d'invalider d'autres sources. C'est l'exemple juste après que la Chine a fait volte-face par rapport à sa politique de tolérance zéro à l'égard de la COVID et a dit qu'elle allait ouvrir l'économie, qu'elle allait rouvrir la société. Et puis la Chine a signalé qu'il n'y avait pas eu de décès attribuables à la COVID. Bien sûr, personne ne la croyait. Mais vous pourriez en fait valider ce que [...] au lieu de simplement attendre les données officielles, une révision ou quelque chose comme ça, nous pourrions regarder dans Baidu les données relatives aux recherches en ligne, et nous pourrions aussi examiner les données satellitaires des morgues. Nous pourrions regarder, vraiment... Nous avons des données autodéclarées qui nous ont en fait montré un portrait beaucoup plus précis de la situation telle qu'elle se passait en temps réel. Donc, c'est vraiment important et cela peut être utilisé à toutes sortes de fins pour comprendre ce qui se passe dans le monde. La diapositive suivante, s'il vous plaît. Et... revenez en arrière, s'il vous plaît.
[Un graphique montre les réponses à la question « Prior to this survey, when was the last time you answered survey questions? / Avant cette enquête, quand avez-vous répondu aux questions de l'enquête pour la dernière fois? ».]
Par ailleurs, l'avantage de ces nouvelles données numériques, de cette révolution et de cette capacité de numériser, d'aller en ligne et d'accéder aux gens en ligne, c'est que nous avons maintenant de nouvelles façons d'accéder à des populations qui n'étaient généralement pas incluses ou qui étaient sous-représentées dans certaines de nos collectes de données traditionnelles. Et c'est l'une des choses importantes que nous faisons à RIWI, nous essayons vraiment de joindre les gens. Nous voulons avoir accès à la population engagée, mais nous voulons aussi nous assurer de recueillir l'ensemble de données le plus large possible afin de pouvoir vraiment mobiliser des gens qui n'ont peut-être pas été invités à donner leur avis dans le passé. Donc, quand nous allons de l'avant... Et je vais vous en dire un peu plus sur la façon dont nous le faisons, mais nous sommes en mesure d'obtenir l'avis d'une part importante de nos répondants qui nous disent qu'ils n'ont jamais répondu à un sondage, ou qui, du moins, ne le font pas de manière régulière chaque semaine... ou qu'ils ne font pas partie d'un groupe de personnes interrogées, par exemple, qui répondent à de nombreux sondages. Donc, c'est notre capacité de joindre des populations qui peuvent être plus méfiantes envers le gouvernement, qui n'ont peut-être pas de compte bancaire, ou qui ne veulent peut-être pas faire confiance aux directives de la santé publique en matière de vaccination. Nous voulons vraiment avoir accès à ces groupes démographiques parce que nous devons comprendre, en tant que décideurs, les personnes d'entre vous dans l'auditoire qui réfléchissent à ces questions. Nous devons vraiment... nous pouvons faire fausse route si nous n'entendons pas tout ce spectre d'opinions. La diapositive suivante, s'il vous plaît.
Bon, alors voici comment nous le faisons. Il y a beaucoup d'autres approches différentes. C'est l'une des différentes façons dont nous nous y prenons. Nous sommes en mesure de... attendez, et je vais vous dire quand présenter les points. Essentiellement, nous avons une approche vraiment inclusive. Nous voulons en fait réellement augmenter la couverture et réduire au minimum le biais associé à notre ensemble de données. Donc, nous essayons de [...] la population en ligne nous offre la possibilité de joindre n'importe qui en ligne. Le fondateur de RIWI a inventé le concept d'interception Web. En gros, il s'agit de cette idée selon laquelle les gens sont en ligne, vaquent à leurs activités courantes, comme nous le sommes tous, que ce soit sur leur téléphone ou à leur ordinateur. En théorie, nous voulons pouvoir joindre n'importe qui en ligne de manière aléatoire. C'est donc notre objectif. Notre objectif consiste essentiellement à élargir le bassin de répondants potentiels et à les intercepter de tant de façons différentes que nous réduisons au minimum les biais associés aux méthodes conventionnelles. Donc, si vous passez au point suivant, nous ne sommes pas... Nous n'allons pas en ligne pour recruter tout le monde sur Facebook. Non, nous avons des centaines et des milliers de façons différentes d'intercepter les gens en ligne, et Facebook.com ne serait pas l'un de ces moyens. Nous le faisons grâce à toutes les différentes façons qu'ont les gens d'utiliser Internet. Et si vous passez au point suivant, nous essayons également de le faire de manière à réduire dans la mesure du possible les biais. Maintenant, je devrais dire tout de suite qu'une technologie sans biais n'existe pas. Cette technologie comporte aussi des biais. Mais nous faisons de notre mieux pour éliminer tout biais. Ainsi, l'un des biais associés à certaines approches conventionnelles, la collecte de données, consiste à limiter ou à restreindre la collecte de données à, disons, une semaine, une période de référence ou une période de temps, et de ne joindre que les personnes entre 9 heures et 17 heures, potentiellement par l'entremise d'un sondage téléphonique. Nous voulons éliminer tout biais relatif à l'heure de la journée. Donc, nous réalisons le sondage de manière continue. L'autre chose que nous faisons, c'est de mener les sondages sur une base continue de sorte que s'il y a un événement, disons une pandémie, un choc bancaire, un facteur persistant, nous voulons comprendre... un certain nombre d'événements auxquels nous avons été confrontés au cours des dernières années. Nous voulons pouvoir faire une étude d'événement et nous voulons être en mesure de savoir si cet événement a eu un impact sur les sentiments et le comportement des gens. Nous le faisons donc sur une base continue. Le point suivant, s'il vous plaît.
Le point suivant... nous réfléchissons aussi avec beaucoup de soin. Parce que nous interceptons des gens en ligne et que nous n'avons pas [...] ils n'ont pas besoin de le faire, nous voulons le faire comme [...] et notre objectif est de les garder et de garder cet ensemble de données aussi large et aussi inclusif que possible. Nous voulons qu'il soit très facile de répondre. Nous avons fait très attention à la façon dont nous avons conçu les questions, à l'apparence de l'interface, afin qu'il soit très facile et simple d'y répondre. Nous voulons nous assurer que, si vous êtes dans une région à faible bande passante, nous serons en mesure de [...] que cela fonctionnera sans problème quoi qu'il arrive et que ce sera très, très facile à utiliser. C'est, encore une fois, toujours dans le but d'essayer vraiment de réduire au minimum le biais de couverture, c'est-à-dire essayer de mobiliser le plus grand nombre possible de personnes. Puis-je, s'il vous plaît, continuer? La diapositive suivante, le point suivant. Et, oui, nous l'optimisons pour les environnements à faible niveau d'alphabétisation en plus d'optimiser la conception des questions pour les personnes ayant un faible niveau d'alphabétisation. Nous usons aussi de beaucoup de sensibilité pour la conception de questions parce que nous posons des questions sur tout, de la santé mentale à des questions très, très délicates sur le plan politique. Par exemple, on peut demander aux gens, en Iran, de nous faire part de leur soutien aux manifestations, ou, en Russie, de nous indiquer s'ils soutiennent l'approche de Vladimir Poutine par rapport à la guerre. Nous posons donc des questions très, très délicates et nous réfléchissons très attentivement à la façon dont nous concevons ces questions. Je peux en parler davantage si les gens sont intéressés. Le prochain point, s'il vous plaît.
Il s'agit ici d'un point très important. J'aurais probablement utilisé une plus grande police pour indiquer que nous voulons vraiment nous assurer... il y a beaucoup de problèmes avec la confidentialité des données et ainsi de suite. La décision de ne pas saisir le numéro d'assurance sociale, l'adresse courriel ou tout autre type d'identificateur personnel est au cœur de la conception de cette technologie particulière. La raison pour laquelle nous voulons le faire, c'est parce que nous voulons nous assurer que... ce n'est pas comme si nous saisissions ces données et les rendions anonymes. Nous ne saisissons jamais ces renseignements en premier lieu. C'est parce que nous voulons vraiment nous assurer que les gens auront confiance et se sentiront aussi à l'aise que possible. Nous ne pouvons pas éliminer le fait qu'ils pourraient ne pas se sentir en confiance, mais nous essayons de réduire au minimum les biais de désirabilité sociale. Nous essayons de réduire au minimum les chances que [...] de maximiser les chances qu'ils nous disent la vérité et qu'ils se sentiront à l'aise de rester et de répondre aux questions. La diapositive suivante, s'il vous plaît... Et nous le faisons partout.
Alors comment le faisons-nous? Nous interceptons les gens. Il n'y a pas de lien avec l'appareil qu'ils utilisent. Vous pouvez vous servir d'une tablette, d'un ordinateur ou d'un téléphone intelligent. Vous pouvez être en Ukraine, quitter votre maison parce que la guerre a commencé ou est en cours et vous pourriez être intercepté sur votre téléphone intelligent, par exemple. Par conséquent, si vous passez à la prochaine diapositive, je vais vous montrer à la fois l'anglais et le français. Il s'agit d'une étude que nous avons menée récemment dans les pays du G7 sur la polarisation politique. En fait, nous la réalisons de façon continue et nous cherchons à déterminer si la polarisation s'accentue. Bref, le Canada est le pays le moins polarisé de tous les pays qui... eh bien, l'un des [...] Le Canada et le Japon sont les moins polarisés, mais nous allons faire le suivi au fil du temps pour voir si cela change, si cela s'aggrave. Et vous pouvez voir que c'est un très [...] voici à quoi cela ressemble sur un téléphone intelligent. Je viens de prendre une photo de mon propre téléphone intelligent, et c'est très simple. Nous interceptons les gens, nous leur posons des questions très fondamentales concernant leur âge et leur genre comme première question. Et dès qu'ils répondent à cette question, eh bien, ils passent à la prochaine série de questions. Nous saisissons également leurs coordonnées de latitude et de longitude par leur fournisseur IP; ce n'est pas leur emplacement physique réel, par exemple s'ils sont dans ce café à cet endroit, mais en quelque sorte leur position générale... leur ville, par exemple. Nous saurions donc s'ils se trouvaient à Québec ou quelque chose du genre. Nous leur poserions ensuite, sans avoir d'identificateurs personnels, une série de questions très, très simples, nous essaierions de les rendre très simples et faciles à comprendre. La diapositive suivante, s'il vous plaît.
Ce qui est incroyable, c'est qu'au fur et à mesure que nous avons continué à l'utiliser, cela nous a continuellement surpris en prédisant divers événements géopolitiques ou autres qui ont surpris d'autres sondages, ceux qui ont utilisé des approches de sondage plus conventionnelles. Ainsi, le premier a été la chute de Moubarak en 2011, ensuite, le Brexit en 2016, où les sondages ont mobilisé beaucoup [...] les sondages ont approché beaucoup de jeunes très engagés, mais n'ont pas parlé à des jeunes désengagés. Par conséquent, lorsque nous avons utilisé cette approche, nous avons pu entrer en contact avec les populations plus naturellement désengagées et prédire que le Brexit était susceptible de se produire. Même chose, une chose légèrement différente, en 2016, lorsque de nombreuses personnes dans le monde ont été surprises par la victoire électorale du président Trump. Le PDG de RIWI avait joint toutes les personnes associées à l'entreprise le matin de l'élection et avait dit que nos répondants nous disaient que Trump allait gagner. C'est parce que cette technologie a pu avoir accès aux populations désengagées qui n'étaient pas incluses dans les modèles des sondeurs les années précédentes parce qu'elles n'avaient pas voté lors des élections précédentes. Donc, passez aux autres points. Voici d'autres exemples récents. L'exemple le plus récent s'est produit en fait au cours des deux dernières semaines. Tout le monde pensait qu'Erdogan ne serait pas réélu en Turquie et qu'il allait y avoir un changement majeur concernant l'orientation de ce pays et de ce que nous allions voir. La technologie RIWI, les répondants RIWI, nous disaient que non, qu'Erdogan jouissait d'un énorme soutien et que nous allions assister à sa victoire. Nous le constations plusieurs semaines auparavant dans l'ensemble de données. Et puis, bien sûr, il y a aussi... nous verrons également les données que nous obtiendrons lors des élections américaines de 2024. Donc, c'est en fait assez incroyable, selon moi, que chaque fois que l'on pense se tromper sur l'un d'entre eux, on a toujours accès à cette population désengagée et nous sommes donc vraiment en mesure de voir plus précisément ce qui va se passer à l'avenir. La diapositive suivante, s'il vous plaît. Ce n'est qu'une citation tirée de l'étude sur le Brexit que nous avons réalisée, qui dit que cette méthode, la méthode RIWI, approche naturellement davantage les jeunes désengagés sur le plan politique comparativement aux méthodologies habituelles. Ce sont des chercheurs qui ont comparé, en fait, les profils démographiques des répondants du sondage sur le Brexit au genre d'enquête de référence sur les élections britanniques en présentiel. Ils ont conclu que c'est en fait une technologie qui capte quelque chose de différent et elle est capable d'approcher naturellement ces populations désengagées. La diapositive suivante, s'il vous plaît.
Voilà quelque chose que j'ai trouvé intéressant. Il s'agit d'une étude du Forum des politiques publiques. Ce que nous avons fait, c'est que nous avons montré aux répondants une image du convoi de la liberté et nous leur avons demandé ce que faisaient ces personnes. Ainsi, les répondants étaient prévisibles. Des personnes disaient « oui, ils défendent la liberté, c'est tout à propos de la liberté ». D'un autre côté, des personnes disaient que ces gens provoquaient le chaos et des perturbations à Ottawa et ruinaient nos vies. Nous avions aussi ce groupe important de personnes, et cela a été fait pour les mineurs, qu'ils ont définis comme étant âgés de moins de 35 ans. Un nombre important de personnes nous ont donné les types de réponses suivantes, qui sont – et vous pouvez montrer toutes les réponses – « je ne sais pas, désolé je ne sais pas, peut-être qu'ils célèbrent la fête du Canada, peut-être qu'ils protestent contre le gouvernement, je ne suis pas certain, cela ressemble à une manifestation pacifique ». Nous avions beaucoup de gens qui, en quelque sorte, ne savaient clairement pas ce que c'était. Donc, il pourrait être choquant de... c'est choquant pour moi, comme je suis une personne qui, chaque matin au réveil, lit religieusement le journal, même en format papier. Mais beaucoup de gens exercent leurs activités dans des environnements d'information différents, vivent possiblement dans ces vases clos et peuvent ne pas avoir été exposés à cela. Donc, je pense que c'est vraiment... c'est l'une des choses dont les gens sont les plus surpris lorsque vous utilisez une technologie comme celle-ci. Ils voient combien de personnes ne sont pas bien informées sur une chose en particulier, et que nous devons vraiment nous ouvrir les yeux sur le vrai sentiment au sein de la population. Parfois, il faut faire attention à ce que l'on demande pour le type de réponses qui seront fournies. La diapositive suivante, s'il vous plaît.
[Un graphique montre le pourcentage de participants qui ont évité les rassemblements sociaux comparativement au nombre de cas de COVID-19 entre le 22 décembre 2020 et le 14 juin 2021.]
C'est une étude que nous avons réalisée avec le Fields Institute of Mathematics de l'Université de Toronto pendant la pandémie. Et vous pouvez montrer... Ouais, super. Vous pouvez montrer le tout. Essentiellement, nous demandions, nous utilisions cela pour recueillir des données en temps réel. Cette diapositive est un peu chargée, mais elle montre essentiellement ce que le Fields Institute faisait, c'est-à-dire de modéliser en quelque sorte, pour la Table de consultation scientifique, le gouvernement de l'Ontario, la trajectoire de la pandémie. L'institut utilisait toutes sortes de données, un ensemble de projets vraiment intéressants. Mais les données d'essai, comme nous le savons tous, étaient à la fois décalées et n'avaient pas une couverture complète. Puis nous avons arrêté de tester à un moment donné. Donc, le groupe de modélisation voulait vraiment utiliser... ils ont utilisé les données de mobilité de Google pour savoir où les gens allaient, mais ils devaient ensuite comprendre comment les gens se comportaient réellement une fois qu'ils étaient rendus à leur destination, quel que soit l'endroit où ils se trouvaient. Peut-être qu'ils sortaient davantage, mais peut-être qu'ils évitaient encore les rassemblements ou qu'ils portaient le masque, n'est-ce pas? L'institut ne connaissait pas cette composante comportementale. Nous avons donc travaillé avec l'institut pour demander, sur une base quotidienne, si les gens respectaient les directives de la santé publique, s'ils portaient le masque, s'ils évitaient les rassemblements sociaux, etc. Donc, ce qui est intéressant à ce sujet, c'est que vous pouvez voir en temps réel... et les modélisateurs nous ont dit, à différents stades de la pandémie, qu'ils pensaient savoir ce qui allait se passer ensuite, mais que cela leur a en quelque sorte ouvert les yeux sur le fait que les gens ont cessé de se conformer à divers moments malgré les orientations politiques et le fait qu'on allait avoir des éclosions. Ce sont en fait des données qui ont été recueillies au niveau du code postal. Les modélisateurs ont donc été en mesure d'obtenir des informations très granulaires concernant les lieux susceptibles d'être touchés par des éclosions, y compris au sein des populations désengagées qui étaient potentiellement non vaccinées ou exposées à la mésinformation liée à la vaccination. Je pense que c'est un exemple vraiment, aussi, intéressant. Vous pouvez voir qu'une partie de la population n'a jamais respecté les directives, qu'une partie s'est toujours conformée aux directives, mais que cette partie au milieu a cessé de se conformer à diverses étapes et que cela ne correspondait pas nécessairement aux directives de santé publique. Je pense qu'il est vraiment important de comprendre que ces décideurs ont trouvé très important de pouvoir avoir accès à ce type d'information et d'être en mesure de prendre des décisions en temps opportun. Nous allons passer à la diapositive suivante.
[Un graphique montre dans quelle mesure les participants s'attendaient à ce que le pourcentage d'emploi à l'échelle locale augmente, diminue ou demeure le même sur une période de six mois.]
Il s'agit de travaux avec la Banque du Canada, en fait, sur les conditions du marché du travail au Canada. Traditionnellement, ce que les banques centrales faisaient, c'est qu'elles menaient une enquête, annuelle ou trimestrielle. Mais il arrive des choses que vous ne pouvez pas [...] comme nous le savons, pendant la pandémie, le choc bancaire qui s'est produit en mars. Traditionnellement, nous ne faisions qu'un sondage en février, puis un autre en mai, mais vous ne saviez alors pas ce qui se passait en mars. Donc, ce n'est qu'un exemple de la façon dont la Banque du Canada... et cela est paru dans une publication récente de la Banque du Canada, sur les points de vue des Canadiens sur le marché du travail en temps réel. Nous l'utilisons pour d'autres exemples concernant la demande des consommateurs, les attentes relatives à l'inflation et d'autres choses qui intéressent beaucoup les banques centrales. Mais alors ils peuvent... parce que cela se fait quotidiennement et parce que cela leur donne une autre perspective pour déterminer si leurs données d'enquête conventionnelles ne saisissent pas réellement quelque chose, parce qu'il s'agit d'un groupe alternatif de répondants qui peuvent ne pas être représentés dans les ensembles de données conventionnels. Alors la diapositive suivante, s'il vous plaît.
[Un graphique montre le nombre de participants ayant perdu leur emploi ou dont un proche a perdu son emploi entre novembre 2022 et mai 2023.]
C'est quelque chose que nous suivons ici. Donc, nous demandons, ce sont des données du Canada, elles datent de quelques semaines, mais elles ne semblent pas très différentes maintenant. Si vous voulez, je peux extraire les données les plus récentes. Si vous m'appelez, je vais les extraire pour vous. Avez-vous perdu votre emploi au cours des deux dernières semaines ou est-ce le cas d'un ami proche ou d'un membre de votre famille? Nous demandons donc aux gens [...] notre hypothèse tout au long du processus, c'est qu'en recevant l'information des gens les plus proches du terrain concernant ce qui se passe autour d'eux, nous obtiendrons des renseignements beaucoup plus précis. Et nous sommes vraiment à la recherche de changement, n'est-ce pas? Alors, est-ce que vous avez perdu votre emploi au cours des deux dernières semaines ou est-ce le cas d'un ami proche ou d'un membre de la famille? Et au cours des dernières, je ne sais pas, trois ou quatre semaines, nous voyons qu'il y a un peu de changement, pas autant que probablement... nous nous posons en quelque sorte des questions, sommes-nous en train de nous diriger vers une récession? Donc, ce que nous faisons, c'est de regarder ici. Pouvons-nous voir des preuves de cela? L'époque où il fallait attendre est donc révolue. En fait, je ne dirais pas que l'époque est révolue. Nous devons encore examiner les données et voir s'il y a eu deux trimestres consécutifs de croissance négative du PIB pour conclure qu'il y a eu officiellement une récession. Mais si vous prenez des décisions aujourd'hui, vous ne pouvez pas attendre d'obtenir ce genre d'information. Eh bien, vous pouvez le faire, mais il y a un coût à attendre, pour ce qui est des vies et des moyens de subsistance des gens qui sont touchés. Donc, c'est pourquoi je pense que ce genre d'information est si utile. La diapositive suivante, s'il vous plaît.
[Un graphique montre la cote de tension militaire pour l'Ukraine et la Russie entre les mois de mai 2022 et mai 2023.]
J'ai pensé qu'il serait intéressant pour vous de voir quelques exemples de ce que nous faisons dans le monde entier. C'est ce que nous faisons en Ukraine, en Russie, en Chine, à Taïwan, en Israël, en Iran et dans les principales zones de conflit géopolitique du monde entier. Nous leur demandons depuis le premier [...] dix jours avant l'invasion de l'Ukraine par la Russie, nous avons demandé aux gens s'ils pensaient que les tensions militaires entre l'Ukraine et la Russie allaient s'intensifier ou devenir moins intenses. Donc, tout ce qui est au-dessus de zéro, nous faisons la moyenne et nous prenons une moyenne mobile de sept jours. Tout ce qui est au-dessus de zéro désigne les impressions selon lesquelles les gens pensent que les choses vont s'intensifier. Ainsi, vous pouvez voir de gros pics à divers moments pendant la guerre. Et vous pouvez voir que les Ukrainiens, bien sûr, contrairement aux Russes qui ont... il y a des discours très différents, bien sûr, qui sont racontés dans les deux pays, mais les Ukrainiens, bien sûr, voient beaucoup plus de combats autour d'eux et ont essentiellement prédit toutes sortes de tournants ou de points d'inflexion dans le conflit. Il y a un pic il y a quelques semaines, il est en fait descendu depuis... jetez un coup d'œil. Je viens de vérifier les données ce matin et c'est descendu un peu. Mais il ne fait aucun doute que c'est [...] Les Ukrainiens le voient en quelque sorte sur le terrain. C'est une autre chose que nous sommes capables de faire, c'est-à-dire de vraiment de voir ce qui se passe en temps réel. Parce que les Ukrainiens sont en fait parmi les plus groupes les plus connectés sur le plan numérique. Tout le monde a un téléphone intelligent en Ukraine, donc ils sont vraiment en mesure de répondre. Et nous l'utilisons également à des fins humanitaires pour comprendre quelles personnes quittent leurs maisons, où elles vont, quels sont leurs besoins. Ce sont des informations qui seront très utiles, car l'Ukraine devra être reconstruite, on l'espère, après la fin de la guerre. La diapositive suivante, s'il vous plaît.
En conclusion, le contexte des données a vraiment changé. Nous avons vu cela se produire avant la pandémie, mais il y a eu une réelle accélération pendant la pandémie. Nous avons un nouvel ensemble d'outils ici. Beaucoup de ces outils résident dans des entreprises technologiques, ou ce sont des outils de source libre. Ils n'appartiennent pas nécessairement au gouvernement. Mais ils permettent... ils mettent en lumière des possibilités et ils mettent en lumière des défis. Et nous pouvons utiliser ces outils, comme nous le faisons, vraiment, pour joindre des populations auparavant sous-représentées. Le prochain point, s'il vous plaît. Nous pouvons également mesurer ce qui se passe en temps réel, nous pouvons mesurer à l'avance ce qui se passe, dans certains cas, et nous pouvons, en théorie, tirer parti de ces outils pour des interventions politiques meilleures et plus opportunes. Dans mon travail, je parle à beaucoup de gens dans le secteur privé qui utilisent ces outils, chaque élément de données de capteur ou de données satellitaires, de données textuelles de rechange. Et nous voulons voir que le secteur public [...] Il y a aussi des exemples dans le secteur public, d'excellents exemples de ce qui se passe, mais on peut faire beaucoup plus pour utiliser ces outils. Et oui, nous devons aussi [...] nous faisons de notre mieux à RIWI pour réellement remédier à certains biais créés par ces nouveaux outils, mais on doit faire beaucoup plus pour comprendre, vraiment, quels sont les biais et défis et les possibilités, et comment nous pourrions atténuer certains d'entre eux pendant que nous allons de l'avant dans ce nouveau contexte. Donc, c'est tout. J'aimerais entendre vos questions.
Kyle Burns : Eh bien, vous pourrez entendre leurs questions – ils en ont envoyé quelques-unes – mais pas avant que je ne pose quelques questions supplémentaires. Je dirai, Danielle, que c'était incroyable. Je vais vous donner l'occasion de boire rapidement une gorgée d'eau, si vous en avez besoin. J'ajouterai aussi que vous et moi avons eu des conversations vraiment fascinantes récemment. Je pense que vous êtes probablement contente de ne pas être assise à côté de moi pendant un long vol d'avion, parce que je n'arrêterais pas de poser des questions. Je vais encourager les participants en ligne à utiliser la bulle en haut. Nous recevons déjà des questions, ce qui n'est pas étonnant. Ce sont vraiment de bonnes questions. Je vais toutefois formuler quelques réflexions avant de passer à certaines de ces questions. Depuis mes débuts il y a 20 ans dans la fonction publique fédérale, on nous a toujours demandé, en tant que fonctionnaires, des conseils. De plus en plus, on nous demande des conseils en temps opportun. Les conseils doivent être fournis rapidement, ils doivent être précis, ils doivent être dignes de confiance, inclusifs, incroyables. Je ne fais que nommer quelques éléments. Nous avons des participants à la conversation, j'en suis certain, qui mènent des enquêtes législatives et d'autres types d'enquêtes et qui collaborent au recensement. Ces choses prennent du temps. Notre sous-ministre nous a fait part de son point de vue, à savoir qu'une décision retardée est une décision prise.
Donc, avoir le type d'informations que RIWI est capable de fournir est exceptionnellement puissant. Nous allons nous attarder à quelques questions sur les biais et ainsi de suite, mais je me demande si nous pourrions commencer en parlant un peu de votre méthodologie et de la façon dont vous transformez en quelque sorte les données que vous recueillez en conseils que vous êtes en mesure de produire. C'est fascinant que vous ayez pu prédire autant d'élections différentes et que vous soyez en mesure de recueillir des informations auprès de certaines des personnes les plus vulnérables au monde. Je repense à une conversation que nous avons eue plus tôt au cours de laquelle vous avez dit qu'il est en fait tout à fait possible de recueillir des données auprès des réfugiés. Mais vous avez pu recueillir des données auprès des réfugiés en transit. J'ai eu l'occasion de mettre à l'essai vos méthodes d'enquête, et la question de la conception est une question qui va certainement être soulevée. Bref, comme nous ne sommes pas sur un long vol, je vais faire une pause et vous donner l'occasion de parler un peu de la méthodologie. Je poserai peut-être quelques autres questions avant d'inviter d'autres personnes à poser des questions également.
Danielle Goldfarb : D'accord, très bien. Oui, je pense que la méthodologie, la base de l'idée, c'est qu'à chaque étape du processus de collecte de données, nous pouvons introduire des biais ou nous pouvons réduire au minimum certains de ces biais et ensuite les corriger. Avant d'œuvrer dans le secteur des données, je ne comprenais pas vraiment tous les différents endroits où l'on pouvait introduire un biais. Donc, la première chose que nous faisons dans notre approche et notre méthode, c'est d'essayer d'élargir l'univers potentiel des personnes qui sont interceptées en ligne. Donc, nous les interceptons. Alors, disons que vous êtes... Nous pourrions entre autres le faire lorsque vous naviguez en ligne et que vous tombez sur un message d'erreur. Donc, vous naviguez en ligne, un site Web n'existe pas. Nous pourrions vous montrer un sondage à ce moment-là et vous pourriez choisir d'y répondre ou non. Donc, vous faites autre chose, on vous intercepte. Nous le faisons sur des centaines et des milliers de domaines Web, différents domaines Web. Il y a tous ces domaines Web qui sont des domaines en attente et inactifs. Vous pourriez aussi voir une publicité ou quelque chose comme ça, mais nous vous montrerions plutôt un sondage, ou vous pourriez voir un message d'erreur. Nous occupons ces espaces pendant des périodes fractionnées et nous le faisons constamment en alternance. Il y a des algorithmes d'apprentissage automatique dans les coulisses qui font ce genre de travail et qui s'assurent que nous avons accès à ce large éventail de domaines Web. Nous le faisons aussi en [...] vous pourriez possiblement être en train de jouer à un jeu sur votre téléphone sur une application. Nous pourrions vous intercepter pendant ce temps. Il y a tellement de façons différentes dont nous interceptons les gens pendant qu'ils sont en ligne. Notre objectif est de maximiser le nombre de façons dont nous le faisons afin de réduire au minimum le biais d'une source particulière. C'est l'une des choses que nous faisons, et c'est notre méthode. Et puis, comme je l'ai mentionné, nous faisons aussi ces [...] Nous le rendons anonyme, facile à répondre et nous utilisons certaines de ces autres caractéristiques de conception que, je pense, tout le monde peut utiliser. Nous sommes donc en mesure de vraiment nous assurer que les gens trouvent l'expérience facile. Nous sommes obligés en quelque sorte... parce que les gens ne s'attendent pas à être interceptés, nous sommes obligés de leur faciliter la tâche, alors que... donc, je pense que c'est une autre chose lorsque vous rejoignez particulièrement des populations qui pourraient être plus méfiantes, et ainsi de suite. Vous devez faire en sorte qu'il soit très facile de répondre à ces choses. Nous le faisons même comme s'il y avait une image ou une vidéo. Il y a différentes choses que nous montrons aux gens. Vous devez rendre cela attrayant, sinon les gens ne répondront pas.
Kyle Burns : Eh bien, je vais en témoigner. J'ai réservé plusieurs minutes pour l'essai de la démonstration, en pensant que je devais m'assurer d'avoir assez de temps pour la terminer, mais c'était fini avant même de m'en rendre compte. C'est donc assez facile. Je vais arrêter d'être égoïste.
Je vais passer à certaines questions que nous avons reçues de nos participants, des questions qui sont vraiment réfléchies. Je vais lire la première. Elle se lit comme suit : « Je suis curieux de connaître les conversations que vous avez eues sur la protection des renseignements personnels. Je ne cesse de penser au moment où l'album de U2 venait d'apparaître dans iTunes sans invitation, et au contrecoup qui a suivi. Ces interceptions seraient-elles qualifiées d'intrusives? Et quelle a été la conversation autour de cela? »
Danielle Goldfarb : C'est une question très intéressante. Ouais, nous avons toujours ces questions. Absolument. Je pense à deux ou trois choses. Tout d'abord, une chose qui est très importante dans ces discussions est le consentement, c'est-à-dire si les gens ont le droit. Donc, nous sommes toujours, parce que [...] Et une chose que je n'ai pas mentionnée, c'est que la personne qui a créé cette technologie provient du milieu de la santé publique. Le consentement et la protection des renseignements personnels étaient donc en quelque sorte une priorité au moment de mettre au point la technologie. Cette personne s'appelle Neil Seeman. C'est un chercheur en santé publique à l'Université de Toronto. Et il tenait à ce que nous nous assurions de recevoir le consentement à chaque étape, d'offrir aux gens la possibilité de mettre fin à leur participation à n'importe quelle étape. Donc, vous pouvez mettre fin à votre participation... vous devez choisir de répondre au sondage. Sinon, il n'y a que [...] vous n'avez qu'à cliquer sur le « X » dans le coin et vous avez terminé, vous n'avez pas à répondre au sondage. Je ne sais pas si vous avez essayé cela, Kyle, mais vous pouvez... si vous ne voulez pas répondre, vous pouvez simplement sortir et vous aurez terminé. C'est tout. En fait, vous pouvez le faire à n'importe quelle étape du processus. Disons que vous avez répondu à la première question et que vous ne voulez pas répondre à la deuxième parce qu'elle porte sur quelque chose que vous trouvez trop délicat, vous n'avez qu'à cliquer sur le « X » et vous quittez le sondage. Donc, c'est quelque chose sur lequel nous nous concentrons vraiment. Nous nous assurons qu'il n'y a pas de [...] que les gens ne se sentent pas obligés de rester s'ils ne pensent pas que c'est un emploi judicieux de leur temps. Je ne sais pas si cela répond pleinement à la question, mais ce sont, je pense, des conversations en cours, et nous devons toujours penser à la façon dont nous interpellons les gens. Est-ce respectueux? Avons-nous le consentement? S'agit-il d'un ensemble approprié de questions que nous posons au public? Par exemple, mettons-nous les gens en danger en posant certaines de ces questions? Et nous sommes dans certains des [...] lorsque vous demandez aux gens en Iran de dire s'ils soutiennent les manifestations ou s'ils [...] toutes sortes de questions comme celle-ci, nous devons faire très attention à la façon dont nous les posons.
Kyle Burns : Eh bien, cela témoigne vraiment de la façon dont vous êtes en mesure d'établir la confiance parce que même l'expression « interception Web »... disons que j'essaie de ne pas être intercepté dans la mesure du possible. Mais vous avez pu joindre certaines des communautés les plus vulnérables. Je pense que cela témoigne de la conception.
Je vais peut-être passer à la question suivante parce que c'est un point de vue légèrement différent de celui sur la question traitant de U2. La question se lit comme suit : « Dans quelle mesure considérez-vous que les forums en ligne ou d'autres sources ont des règles explicites et que leurs données sont exploitées à des fins autres que l'objectif prévu? S'agit-il d'une atteinte à la vie privée? »
Danielle Goldfarb : Ouais, ce sont toutes de bonnes questions.
Kyle Burns : Fascinantes.
Danielle Goldfarb : Je n'ai pas de réponses faciles.
Kyle Burns : Ouais.
Danielle Goldfarb : Oui, vous soulevez un point très important. Il y a une énorme quantité de travail qui est fait, que je vois dans mon domaine professionnel en ce qui concerne l'analyse des médias sociaux et l'analyse de texte. Toutes sortes de chercheurs extraient toutes ces données et les étudient, et je n'ai pas une bonne réponse, s'il s'agit d'une atteinte à la vie privée ou non. Je pense que c'est une conversation en cours que nous devons tous [...] certaines personnes pourraient considérer qu'il s'agit d'une atteinte à la vie privée et d'autres personnes pourraient estimer que leurs affaires en ligne peuvent être utilisées à d'autres fins. Je pense que vous trouveriez probablement des différences par rapport à l'impact générationnel, des points de vue générationnels à ce sujet, par exemple. Mes enfants pensent que s'ils mettent quelque chose en ligne, les gens peuvent l'utiliser, c'est équitable. Mais les gens ne sont pas tous d'accord avec cela. Je pense que c'est une question très importante parce qu'on effectue tellement de travail, en particulier dans le secteur privé, pour explorer toutes sortes de forums en ligne pour toute une gamme de questions. Et puis même quand vous pensez au gouvernement, en essayant de comprendre, par exemple... il y a du travail qui se fait aux États-Unis, par exemple, la surveillance des forums en ligne pour essayer de prédire les fusillades de masse, par exemple. Donc, dans quelle mesure avons-nous, les forces de l'ordre ont-elles, les enquêteurs ont-ils le droit d'utiliser ce genre de données pour empêcher qu'un incident terrible ne se produise, d'appliquer des outils d'apprentissage automatique à cela, et ainsi de suite? Je pense que ce sont en quelque sorte les questions centrales de notre époque en fait, sur la façon dont nous... quel genre de droits à la vie privée avons-nous en ligne, et ainsi de suite?
Kyle Burns : Oui, je suis en fait très heureux que nos participants posent ces questions vraiment difficiles parce que je pense que cela témoigne de leur engagement à l'égard de ces questions et du soin et de la réflexion avec lesquels ils les abordent. En revanche, un participant nous a demandé comment tenir compte des segments de la population qui ne sont pas en ligne.
Danielle Goldfarb : Oui.
Kyle Burns : Peut-être l'accessibilité ou les obstacles, et ils veulent s'assurer que les données ne mènent pas à une insuffisance perpétuelle de services.
Danielle Goldfarb : Oui, 100 %. C'est un énorme enjeu. Donc, si vous avez une question de politique particulière qui nécessite... pour laquelle vous devez joindre des parties de la population qui n'ont pas d'appareil, qui ne sont pas en ligne, vous auriez absolument besoin de recourir à une approche combinant plus d'une méthode pour vous permettre d'accéder à ces personnes par une autre méthode. Ce que nous faisons avec cette approche, c'est que nous essayons d'accéder... Nous voulons tirer parti du fait que les gens sont en ligne pour essayer de joindre un plus large éventail de personnes comparativement aux méthodes conventionnelles. Par exemple, même lorsque vous travaillez avec des réfugiés, la plupart d'entre eux, la plupart des Ukrainiens, ont des téléphones intelligents et peuvent nous dire où ils vont. Il est possible qu'un moins grand nombre de Syriens aient des téléphones intelligents, mais beaucoup en ont un. Mais rejoignez-vous chaque personne? Non, pas du tout. Et il y a aussi d'autres biais qui vous toucheront, parce que c'est la population en ligne et en raison de l'utilisation d'Internet. Vous allez avoir un biais favorisant les jeunes, les populations masculines. Différentes parties du monde ont des biais différents pour ce qui est de la façon dont ils utilisent Internet. Donc, cette méthode, vous devrez utiliser... si vous voulez un portrait complet, vous devrez utiliser diverses méthodes. En fait, l'une des choses sur lesquelles je n'ai pas assez insisté, je pense, c'est que, ce qui est le plus important à mon avis, ou ce que j'apprends, de toutes mes recherches et de mon travail, et c'est probablement, j'imagine, à travers le travail de beaucoup de personnes du public aussi, c'est que vous devez vraiment vous fier à plusieurs ensembles de données et sources de données pour obtenir un portrait complet de ce qui se passe. Ce que j'essaie de souligner, c'est qu'il y a de nouvelles façons d'avoir accès à de nouveaux types d'ensembles de données qui peuvent nous aider à compléter le tableau de ce que nous voyons. Vous ne devez pas vous fier à un seul ensemble de données pour tirer des conclusions. Vous devez être en mesure de réunir toutes les sources de renseignements disponibles qui existent actuellement pour pouvoir prendre des décisions stratégiques.
Kyle Burns : Oui, c'est tellement vrai. Je pense que c'est un point important à retenir. Vous ne dites pas que vous avez accaparé le marché de l'analyse prédictive, mais en fait que vous faites un très bon travail et qu'il pourrait être complété par d'autres qui sont dans ce monde.
Je pense que la prochaine question que je vais poser peut sembler simple, mais je me demande si elle a une réponse à plusieurs niveaux. Et c'est la suivante : « Combien de temps à l'avance pouvez-vous prédire? » Je n'ai pas terminé avec « prédire une élection », « prédire une pandémie » ou « prédire un événement économique ». Donc, je vais vous laisser, avec toute votre expérience, le soin d'interpréter en quelque sorte cette question.
Danielle Goldfarb : Combien de temps à l'avance peut-on prédire? C'est une bonne question. Je ne suis pas certaine que cette technologie particulière sera en mesure de nous dire, par exemple, quelque chose qui va se produire dans quelques années ou quelque chose comme ça. Peut-elle prédire aujourd'hui l'issue des élections américaines de 2024? Probablement pas. Parce que... mais pourrait-elle nous donner des indications de la position des gens aujourd'hui, de leurs intentions, pour ce qui est de l'avenir? Je pense que cela dépend vraiment de la question. Prenons une question sur l'inflation, les attentes concernant l'inflation. Si vous demandez aux gens : « Pensez-vous que les prix vont baisser ou augmenter, quelle sera l'évolution des prix, disons, au cours des 12 prochains mois? » Si les gens s'attendent constamment à une inflation, cela pourrait en fait vous dire quelque chose sur ce qui va arriver en matière d'inflation dans quelques mois, n'est-ce pas? Cela dépend vraiment de la [...] alors que si vous leur demandez combien ils ont dépensé aujourd'hui pour ce qui est du divertissement et de choses comme ça comparativement au mois dernier, vous aurez en quelque sorte une idée de ce qui se passe maintenant, de ce qu'ils pensent en ce moment. Cela dépend vraiment de la façon dont vous posez les questions, et aussi de comment vous posez la question. Une autre chose intéressante quand je me suis jointe à l'entreprise, c'est qu'on n'a pas demandé aux entreprises, mais plutôt aux répondants ce qui se passera lors de l'élection américaine. En fait, nous ne demandons pas aux gens pour qui ils vont voter. Nous demandons aux gens pour qui ils vont voter, mais nous demandons aussi aux gens qui remportera l'élection, selon eux. « Qui remportera l'élection, à votre avis? » est une question plus prédictive. Dans presque toutes les élections que nous avons examinées dans le monde entier, c'est une question plus prédictive. Donc, combien de temps à l'avance? Dans cette situation, nous savions vraiment des semaines à l'avance ce qui était susceptible de se passer. Mais il y a aussi toujours des événements qui viennent perturber vos attentes par rapport à ce qui va se passer. Donc, ça dépend vraiment. J'espère que c'est une réponse plutôt satisfaisante à la question. Cela dépend des circonstances.
Kyle Burns : Ouais.
Danielle Goldfarb : Ce que vous pouvez prédire et quand vous pouvez le prédire, et je ne pense qu'à, ouais, toutes sortes d'impacts de choses différentes. Cela dépend juste de la façon dont vous... Je veux dire, un autre exemple que je peux vous donner est le suivant : lorsque l'économie chinoise a rouvert après la période de tolérance zéro à la COVID, tout le monde pensait qu'il y aurait un énorme élan dans [...] que l'économie subirait une croissance très rapide. Il y avait toute cette demande accumulée et on pensait qu'il y aurait cette énorme reprise. Tout de suite, nous avons vu des premiers signes indiquant que ce ne serait pas le cas. Bien sûr, les chiffres du PIB ne sortent que des mois et des mois plus tard. La Chine, quelque peu opaque, a cessé de publier certaines de ses données économiques. Il est difficile d'obtenir un portrait exact de ce qui se passe. Donc, avons-nous prédit cela des mois à l'avance? Eh bien, nous avions des indications des mois à l'avance que les choses n'allaient pas être aussi solides que certaines personnes le pensaient. Donc, c'est toujours plus nuancé.
Kyle Burns : Absolument, et je pense que lorsque vous avez des rapports d'étape, comme celui que vous venez de décrire, l'analyse des tendances qui fournit en quelque sorte un présage pour ces rapports pourrait être très précieuse et vous donner une idée de l'orientation des choses, d'autant plus que les pays du monde entier accordent beaucoup d'attention aux chaînes d'approvisionnement.
On n'arrête pas de recevoir des questions et elles sont tout aussi fascinantes les unes que les autres. Je vais donc passer à une question liée à la sécurité : « Qui se charge de la sécurité de l'application pour le système? Dans certains contextes, le modèle de menace comprendrait un acteur de l'État-nation voulant en abuser. » Est-ce que cela vous interpelle, et avez-vous été confrontée à ce genre de questions dans le passé ou pendant la conception? Je vais arrêter de parler et vous laisser le soin de répondre.
Danielle Goldfarb : Attendez, est-ce que la question est... ah d'accord, qui se charge de la sécurité de l'application? Eh bien, cela inclurait... la question est-elle en réalité : « cela pourrait-il être utilisé notamment par des régimes autoritaires pour faire des choses abominables? »
Kyle Burns : Oui, la façon dont je l'interprétais, c'est que vous avez dit que vous faisiez des sondages dans tous les pays, je pense, à l'exception de la Corée du Nord. Vous avez mentionné l'Iran et la Syrie, et d'autres endroits où les gens ont des restrictions ou des libertés limitées. Donc, oui, c'est comme ça que je l'interprétais. Y a-t-il des mesures de sécurité qui empêcheront les États-nations d'en abuser?
Danielle Goldfarb : Nous n'effectuons pas de travail pour le compte de ces acteurs, et nous prenons des précautions. Ainsi, par exemple, toutes les données que nous recueillons en Chine, par exemple, ne sont en fait pas stockées en Chine. Elles sont stockées à l'extérieur de la Chine dans des systèmes en dehors du pays. Ce n'est qu'un exemple de l'un des types de précautions en matière de sécurité que nous prenons pour nous assurer, tout d'abord, que les données ne sont pas soumises à la censure de l'État, que nous sommes en mesure de mener ce genre de recherche. C'est une chose. Mais en théorie, oui, je veux dire, beaucoup de... je ne parle pas de cette technologie particulière, mais beaucoup de technologies différentes peuvent être utilisées à mauvais escient par des agents qui ne devraient pas agir de la sorte. Je pense que l'un des grands défis, c'est de s'assurer que nous utilisons ces outils au mieux de leurs capacités pour neutraliser ces informations. Donc, une partie du travail que nous faisons réellement est liée aux questions de droits de la personne et à la compréhension de ce qui se passe dans les régions où nous savons qu'il y a des violations des droits de la personne, et à la collecte de données et à la tentative de comprendre. Une partie du travail que nous faisons en quelque sorte dans les coulisses porte sur certaines de ces questions. Nous faisons également beaucoup de travail sur la mésinformation et la désinformation, en comprenant dans quelle mesure les gens croient aux théories du complot, par exemple, et comment nous pouvons combattre et résoudre certains de ces problèmes. Nous venons de réaliser une étude sur la croyance envers les théories du complot en Chine autour des laboratoires américains d'armes biologiques en Ukraine – il y a un nombre étonnant de personnes qui croient que cela se produit réellement – puis les messages que vous pouvez utiliser pour lutter contre cela et les messages les plus efficaces. Donc, nous essayons de travailler pour résoudre ce problème, ces défis. Mais absolument, il y aura un nombre croissant d'approches et de technologies semblables qui pourraient être utilisées à des fins non désirables.
Kyle Burns : Ouais, bien sûr. Nous sommes très près de la fin, mais je vais poser une question qui ne nécessitera peut-être pas une longue réponse afin que nous puissions poser une dernière question. Elle concerne la fréquence des interceptions pour chaque question répondue, et il y aura une question de suivi. Je soupçonne que cette personne participe possiblement à la conception d'enquêtes. « Y a-t-il un certain pourcentage de questions qui sont généralement complétées? »
Danielle Goldfarb : Alors, à quelle fréquence les interceptions sont-elles envoyées? Cela dépend vraiment de l'objectif de recherche, n'est-ce pas? Si votre objectif est de [...] encore une fois, certaines questions pour effectuer un suivi économique en temps réel, n'est-ce pas? Si vous voulez comprendre le marché du travail, par exemple, en temps réel, nous demandons... nous savons que nous voulons avoir, disons, 75 ou 100 répondants chaque jour au Canada. Nous savons seulement combien de personnes nous devons intercepter pour que 100 personnes répondent au sondage. Nous saurions en quelque sorte généralement combien de gens ne finissent pas de répondre au sondage. Pour répondre à la question concernant le pourcentage de questions qui sont généralement complétées, je dirais que nous interceptons les gens jusqu'à ce que nous obtenions toutes les réponses. La durée optimale du sondage est, disons, dix questions, mais nous faisons des enquêtes plus longues et nous faisons des enquêtes plus courtes, et ainsi de suite. Mais c'est un peu comme ça que ça fonctionne. Désolé si ce n'était pas... ce n'est peut-être pas une réponse courte, mais c'est très flexible.
Kyle Burns : Non, c'est parfait.
Danielle Goldfarb : Si votre objectif est comme... par exemple, pendant la pandémie, notre objectif était d'inciter le plus grand nombre d'Ontariennes et d'Ontariens possible à répondre en très peu de temps pour comprendre ce qui se passait en temps réel. Ensuite, nous allons de l'avant et obtenons... nous ne faisons qu'intercepter les gens jusqu'à ce que nous obtenions ce nombre. Mais comme c'est différent d'un suivi quotidien pour vous permettre d'avoir des informations en temps réel, vous le faites simplement à un rythme différent. Cela dépend vraiment de votre objectif de recherche.
Kyle Burns : C'est tout à fait logique. Danielle, vous avez été si généreuse de votre temps, à la fois avec moi alors que nous préparions cet événement et avec nos participants qui posent vraiment des questions judicieuses. Et vous savez quoi? Avant de conclure, je vais faire un message de promotion très égoïste. En fait, il s'adresse aux participants qui pourraient vouloir en savoir plus sur les données. Je suis certain qu'ils voudront approfondir la matière que vous avez abordée et en savoir davantage au sujet de ce que fait RIWI. Je vais aussi simplement souligner que nous avons une incroyable Communauté des données du gouvernement du Canada, qui est l'une de mes équipes au sein de l'Innovation dans le secteur public. C'est une communauté vraiment dynamique qui se penche sur l'application des données, tout comme vous. Bon, je vais arrêter de faire ma propre promotion égoïste et je vais vous remercier pour votre altruisme. Danielle, vous avez été tellement réfléchie et disposée à participer et à nous faire part de vos connaissances et de vos idées. Dans le contexte de l'ère numérique actuelle, c'est un réel cadeau pour nous. J'aimerais également remercier nos participants. Ces événements sont plus efficaces lorsque les participants sont engagés, alors merci d'avoir été des nôtres aujourd'hui et d'avoir posé d'excellentes questions. Avant de vous laisser partir, je vous encourage tous à nous faire part de vos commentaires. Nous aimons adapter nos événements pour répondre à vos besoins, et vos commentaires sont vraiment importants pour nous. Je vais aussi simplement faire remarquer que nous avons des événements incroyables qui auront lieu au mois de juin et plus tard cette année, alors jetez-y un coup d'œil. Nous essayons de les adapter à vos besoins. Sur ce, je vais remercier encore une fois Danielle, notre équipe technique et nos participants, et je souhaite à tous une journée formidable.
[Le logo de l'EFPC s'affiche à l'écran, accompagné du texte "CSPS Virtual Café Series" / « Série Café virtuel de l'EFPC ».]
[Le logo du gouvernement du Canada s'affiche à l'écran.]