Chercheur : 
Bang Liu

Établissement : 
Université de Montréal

Année de concours : 
2022-2023

Quelles sont les relations entre les fréquents incidents de discrimination raciale cette année et la propagation de l’épidémie mondiale. La chute du cours des actions d’une certaine entreprise est-elle due ou non à l’impact d’une certaine politique émise par le gouvernement local. Lorsqu’on veut savoir «ce qui se passe» à partir des articles de presse ou d’autres sources d’information, il est également crucial de comprendre «pourquoi c’est arrivé». Cela nous oblige à comprendre la causalité ou les chaînes de causalité entre les événements. Une telle structure causale nous aide à répondre aux questions liées à la causalité mentionnées précédemment et à prendre de meilleures décisions et actions dans différents domaines, notamment la santé, l’environnement, la finance, la politique, l’éducation, etc.

Les travaux de recherche existants cherchent à prédire la relation causale entre une paire d’événements mentionnés dans le texte. Cependant, ils présentent plusieurs inconvénients majeurs :
i) Ils se concentrent principalement sur l’identification des relations causales explicitement mentionnées dans le texte. Cependant, la plupart des relations causales entre les événements du monde réel ne sont pas explicitement décrites dans le texte et sont difficiles à saisir.
ii) La majorité des recherches existantes se concentrent sur la détection de causalité inter-phrase de fine grainularité, en accordant une attention limitée à la détection de causalité de plus grosse grainularité au niveau du document ou au niveau du corpus.
iii) Deux événements apparemment non corrélés peuvent être liés par une chaîne causale implicite, tout comme l’effet papillon. Cependant, les approches existantes pour la recherche d’informations causales résolvent la causalité en tant qu’association et construisent le modèle de manière heuristique sans vraiment comprendre la structure causale complexe à travers les événements.
iv) Les données de référence et de test disponibles pour les tâches d’identification et de recherche de la causalité des événements sont très limités.

La recherche proposée vise à développer de nouvelles techniques, systèmes et références pour : i) identifier la relation causale entre deux événements ; et ii) retrouver des documents qui fournissent des informations sur les causes probables conduisant à un événement de requête.
Nos recherches antérieures ont développé des algorithmes et des systèmes pour l’organisation d’événements chauds et la classification des relations entre paires de documents. Nous étendrons nos recherches précédentes et explorerons plus l’apprentissage automatique des graphes et l’inférence causale pour retrouver et identifier les causalités d’événements, améliorant ainsi la recherche d’informations ad hoc axée sur la causalité. Les techniques qui seront développées dans ce programme de recherche permettront également d’améliorer la robustesse, la généralisation et l’explicabilité des modèles de traitement du langage naturel. De plus, nous créerons de nouveaux ensembles de données de référence avec un mécanisme d’étiquetage de données avec « humain dans la boucle ».

Ce programme contribuera à maintenir le rôle de chef de file du Québec en intelligence artificielle. Il améliorera la compréhension de la causalité dans le traitement du langage naturel et aura un impact significatif sur les applications du monde réel telles que les systèmes d’information et les moteurs de recherche.