Mur Mitoyen devient Caligram!
Une nouvelle plateforme moderne et agréable, actuellement en version bêta.

Débute à 

PK-2265
201, avenue du Président-Kennedy
Montréal (QC) Canada  H2X 2J6

Vous êtes tous cordialement invités à assister à la soutenance!

TITRE : Chaînes de traitement pour la détection des concepts dans le contexte de l’analyse conceptuelle philosophique basée sur des données textuelles

Présenté par : Louis CHARTRAND, étudiant au doctorat en informatique cognitive

Résumé
L’analyse conceptuelle en philosophie a pris un tournant empirique dans les dernières années, notamment avec l’essor de la philosophie expérimentale et, plus localement, de la LACTAO (Lecture et analyse conceptuelle de texte assistée par ordinateur), ce qui ouvre la porte au développement d’un type d’analyse conceptuelle basée sur l’étude des corpus de données textuelles. Cependant, certains défi techniques freinent encore l’essor de ce type de méthode. En particulier, l’heuristique couramment employée pour détecter la présence d’un concept dans le texte, l’heuristique du mot-clé, tend à systématiquement exclure certains contextes où le concept est employé implicitement, et à inclure des contextes où le ou les mots que l’on associe habituellement à un concept sont employés dans un sens très différent. La présente thèse attaque ce problème en deux étapes, qui sont présentés dans trois articles. Dans une première étape, on discute les notions principales de cette question – ANALYSE CONCEPTUELLE et CONCEPT – afin d’interpréter le problème de la détection de la présence du concept dans le texte. Un portrait du type d’analyse conceptuelle philosophique susceptible de prendre en compte des données empiriques est avancé, et sur la base de celui-ci, on énonce un problème pour le concept de CONCEPT. Une solution est alors proposée en puisant dans la téléosémantique de Millikan (1984), et on montre comment son application permet à la fois de faire un protocole d’annotation pour la détection de la présence du concept dans le texte, et de proposer des avenues d’automatisation pour la même tâche. Dans une deuxième étape, des chaînes de traitement exploitant des modèles topiques sont conçues et son évaluées. Pour l’évaluation de celles-ci, un protocole d’annotation est conçu et soumis à des participants.es. Ceux ensembles de chaînes de traitement sont ensuite testées, l’un reposant sur l’allocation Dirichlet latente (LDA) de Blei et al. (2003) et l’autre reposant sur le Latent Concept Topic Model de Hu et Tsujii (2016). Des chaînes de traitement des deux ensembles s’avèrent mieux corrélées avec les jugements humains que l’heuristique du mot-clé, mais les meilleurs résultats viennent de chaînes construites à partir de la LCTM, dont certaines sont également plus flexibles dans la formulation du concept ciblé qu’elles permettent.

Jury d’évaluation :
François Claveau, Université de Sherbrooke (membre externe)
Roger Villemaire, UQAM, département d’informatique (membre interne)
Serge Robert, UQAM, département de philosophie (membre interne)
Mohamed Bouguessa, UQAM, département d’informatique (codirecteur de recherche)
Jean-Guy Meunier, UQAM, département de philosophie (directeur de recherche)

Consulté 1004 fois   ·   Modifier