Maxime Turgeon (University of Manitoba)
Title:ÌýAnalyser les tweets de chefs politiques canadiens grâce à l'Analyse Topologique de Données.
Abstract:Le texte est une source de données de plus en plus fréquente en statistique et en apprentissage machine. La récupération d'information est un exemple bien connu, mais les données textuelles peuvent aussi aider à mesurer le pouls des utilisateurs sur les médias sociaux, prédire les mouvements des marchés boursiers, découvrir des menaces pour la sécurité, ou extraire l'information des dossiers médicaux. Or, les données textuelles sont difficiles à analyser avec des outils traditionnels. D'une part, il y a plusieurs façons non-équivalentes de transformer les données de textuelles à numériques, et ces approches produisent des données éparses de haute dimension. D'autre part, il est clair que les données textuelles sont fortement structurées: un texte n'est pas qu'une combinaison aléatoire de lettres et de mots. Cette structure complexe peut être utilisée à notre avantage pour mitiger la malédiction de la dimensionnalité. Je discuterai d'outils d'Analyse Topologique de Données (TDA) qui peuvent nous aider à comprendre et analyser cette structure. Pour illustrer cette approche, j'utiliserai les tweets publiés par les chefs des principaux partis politiques canadiens durant la dernière élection générale fédérale d'octobre 2019.
Ìý
Seminar Statistique