Prix de thèse ATALA décerné à Thimothée Mickus
Le prix de la thèse 2023 de l’ATALA a été décerné conjointement Tobias Mayer (I3S, Université Côte d’Azur, Sophia Antipolis) et Thimothée Mickus (ATILF, Université de Lorraine/CNRS, Nancy).
La thèse de Timothée Mickus porte sur les l’exploration des relations pouvant a priori exister entre les plongements lexicaux, les approches de sémantique distributionnelle, et les approches par dictionnaire. Le jury a considéré ambitieux et important l’objectif de mieux interpréter ce qui est capturé par les plongements lexicaux. C’est un travail très riche, qui s’appuie sur une large palette d’approches et un nombre conséquent d’expériences bien conçues ; une vraie réflexion sur le travail effectué amène à se poser des questions sur la nature du sens des mots et des plongements lexicaux qui pourront être le point de départ à de beaux projets de recherche. Le travail de thèse a donné lieu à un nombre conséquent de publications de qualité couvrant l’ensemble des contributions.
Tobias Mayer a effectué sa thèse sur la fouille d’arguments à partir des essais cliniques. Le jury a salué la grande maturité de l’auteur de cette thèse qui constitue pourtant l’un des premiers travaux visant à explorer l’analyse d’essais cliniques sous l’angle de l’argumentation. En particulier, le jury pointe la création d’un nouveau jeu de données, contribution majeure au domaine et déjà réutilisée par d’autres auteurs. Ce corpus constituera une ressource précieuse pour la poursuite des recherches dans ce domaine. De plus la conception expérimentale est riche, discutée en profondeur et les résultats démontrables ; c’est une contribution d’autant plus significative que le système global développé (ACTA) a été réutilisé dans un projet sur la Covid-19. Le jury souligne que Tobias est auteur d’une impressionnante série de publications de premier rang pendant sa thèse et juste après.
A l’unanimité, et afin de valoriser deux types de recherche différentes, comparables uniquement par la grande qualité du travail proposé et publié, le jury a décidé de décerner le prix de thèse 2023 de l’ATALA en le partageant entre les deux auteurs, Timothée Mickus et Tobias Mayer.
Le jury du prix de thèse ATALA 2023
Benoît Crabbé (Président, Rapporteur, Université Paris Cité, Paris), Nabil Hathout (Rapporteur, Université Toulouse – Jean Jaurès, Toulouse), Gemma Boleda (Examinatrice, Universitat Pompeu Fabra, Barcelone, Espagne), Claire Gardent (Examinatrice, CNRS, Nancy), Vera Demberg (Examinatrice, Universität des Saarlandes, Saarbrücken, Allemagne), Alessandro Lenci (Examinateur, Università di Pisa, Pise, Italie), Kees Van Deemter (Membre invité, Université d’Aberdeen, Écosse, Royaume-Uni).
La thèse de Thimothée Mickus (ATILF / Université de Lorraine – CNRS)
« On the Status of Word Embeddings as Implementations of the Distributional Hypothesis / Du Statut des Plongements Lexicaux en tant qu’Implémentations de l’Hypothèse Distributionnelle) »
Sous la direction de Mathieu Constant (ATILF | Université de Lorraine – CNRS) et Denis Paperno (Université d’Utrecht, Pays Bas)
Thèse soutenue le 31 mars 2022
Cependant, les ressources lexicales qui sont développées par des experts peuvent elles-même être difficiles à comprendre pour un public large. Par exemple, les citoyens peuvent être confrontés aux scénarios suivants : (i) la définition du mot ou du concept dans la ressource est trop difficile (technicité) ; (ii) le sens du mot ou du concept dans le contexte de lecture recouvre plusieurs sens définis dans la resource (ambiguïté) ; (iii) le mot ou son sens peut ne pas être couvert par la ressource (couverture).
Afin de lutter contre ces problèmes, le projet de thèse consiste à concevoir et développer de nouvelles méthodes pour extraire les connaissances sémantiques appropriées pour un mot dans un contexte donné. Plus particulièrement, étant donné un mot et un contexte, les méthodes proposées chercheront à automatiquement générer sa définition et ses propriétés sémantiques, adaptées non seulement au contexte, mais aussi à l’utilisateur.
Avec la révolution de l’apprentissage profond, l’hypothèse principale de ce projet de thèse est qu’il est désormais possible de modéliser entièrement cette tâche au moyen de réseaux de neurones en incluant à la fois une phase d’analyse du mot et son contexte et d’une phase de génération d’une phrase de définition en langage naturel. Ces modèles pourront être entrainés à partir du contenu des ressources lexicales, et enrichis de modèles de langage et de plongements de mots appris sur de grand volumes de textes, dans le but de capter la diversité lexicale et le style d’expression d’un public large. Cette approche se rapproche des approches neurones récentes utilisées pour la traduction automatique et le résumé automatique.
Bien que le sujet de thèse proposé soit lié aux tâches traditionnelles de la levée d’ambiguïté sémantique et l’induction de sens des mots, le problème propose un défi plus important car il va plus loin : le système attendu devra générer des définitions, même pour les mots ou sens non converts par les ressources lexicales existantes, en généralisant à partir de bases lexicales existantes.
Qu’est-ce que le prix de thèse ATALA ?
Depuis 2011, l’ATALA, Association pour le Traitement Automatique des Langues (TAL), décerne un prix de thèse pour récompenser des travaux francophones d’excellence dans le domaine du TAL.
Ce prix honorifique illustre la volonté de l’ATALA de soutenir les jeunes chercheurs francophones et de contribuer à la diffusion de leur travaux à l’ensemble de la communauté du TAL.