Thèses soutenues
Clotilde George
« Analyse de l’interaction en situation professionnelle exolingue dans le cadre de la formation au métier de cuisinier d’apprentis allophones en France. »
Sous la direction de Sophie Bailly (ATILF | Université de Lorraine – CNRS) et Maud Ciekanski (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 2 décembre 2024
Pauline Gillet
« Description syntaxique des interrogatives partielles chez les enfants francophones : situation de diglossie ou exploitations différenciées d’une unique grammaire ? »
Sous la direction de Marie-Laurence Knittel (ATILF | Université de Lorraine – CNRS) et Christophe Benzitoun (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 8 novembre 2024
Ces tournures, selon qu’elles conservent ou non l’ordre sujet-verbe, ont un statut différent en français ce qui nous amène à nous questionner, dans un second temps, sur la manière de rendre compte de leur mode d’appropriation en tenant compte de l’input et de l’enseignement scolaire. Effectivement, nous défendons l’idée que les interrogatives avec inversion du sujet clitique (comment s’appelle-t-il ?) possèdent un statut grammatical spécifique différent de celles qui conservent l’ordre sujet-verbe comme comment il s’appelle ? et il s’appelle comment ? Et nous formulons également l’hypothèse que les mots interrogatifs ne fonctionnent pas de manière homogène. À cet égard, deux approches théoriques différentes peuvent être mises à l’épreuve des données et ainsi rendre compte de la variation : la théorie des savoirs grammaticaux de Blanche-Benveniste (1990) et l’approche diglossique de Ferguson (1959). À partir de ces deux modèles, nous proposons de réfléchir à l’articulation entre grammaire première/variété basse et grammaire seconde/variété haute en français.
Afin de répondre à ces deux questions de recherche, nous avons mené deux études sur corpus, la première à l’oral auprès d’enfants de 2-5 ans, la seconde à l’écrit chez des élèves de CE1-CM2. Nous avons aussi élaboré un test expérimental de productions orales que nous avons soumis à des élèves de moyenne section de maternelle et de CE1 dont nous avons également testé la compréhension de la tournure avec inversion du sujet clitique. Pour finir, nous avons soumis un questionnaire à des élèves de CM1-CM2 visant à évaluer leur représentation de la norme grammaticale de l’écrit. L’ensemble de ces sources de données nous permet d’étudier la distribution de diverses tournures dans des productions plus ou moins spontanées et en tenant compte du medium (oral/écrit) ainsi que du contexte (familial et/ou scolaire).
Teng Guo
« Le Rôle des Instructions sur les Apprentissages Associatif et Statistique aux Tout-débuts de l’Apprentissage de la Lecture en France et en Chine »
Sous la direction de Daniel Zagar (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 18 décembre 2023
Idéalement, l’enseignement de la lecture doit accompagner ces deux mécanismes d’apprentissage en donnant des instructions qui correspondent d’une part aux capacités cognitives de l’apprenti lecteur et d’autre part au niveau d’élaboration des représentations mentales des unités linguistiques que celui-ci élabore progressivement. Par exemple on sait que le pré-lecteur, s’il parvient à associer des lettres à des sons, éprouve en revanche de grandes difficultés à fusionner ces sons en syllabes.
L’objectif de la thèse est double. D’un point de vue théorique il s’agit de mieux comprendre les relations entre apprentissage associatif et apprentissage statistique, relations qui à l’heure actuelle sont très mal connues (et très peu étudiées). Ce projet a également une portée pédagogique. Il consiste à comparer la bénéfice respectif des instructions explicites sur les performances des deux types d’apprentissage (associatif et statistique) en fonction de leur contenu (par exemple des instructions qui concernent les correspondances entre lettres et syllabes et/ou entre lettres phonèmes) et de l’ordre temporel dans lequel on les donne à l’enfant (par exemple en donnant à apprendre d’abord des instructions sur les correspondances lettre/phonème ou sur les correspondances lettres/syllabe).
Chloé Provot
« Un accompagnement de l’échange franco-allemand des enseignants du premier degré. »
Sous la direction de Dominique Macaire (ATILF | Université de Lorraine – CNRS) et Julia Putsche-Fisher (Université de Strasbourg)
Thèse soutenue le 30 novembre 2023
Cette recherche vise à enrichir les travaux déjà menés sur ce dispositif d’échange (Dupas, 1998 et Perrefort, 2013). La méthodologie de recherche utilisée est qualitative et comporte plusieurs types de recueil de données : un questionnaire envoyé à l’ensemble des participants en amont et en aval, des entretiens menés avec une dizaine d’enseignants (répartis des côtés français et allemand), des interviews avec des représentants de l’OFAJ et de l’institution scolaire des deux pays, des observations de classes in situ et de stages organisés par l’OFAJ. Les données seront collectées pendant l’année universitaire 2020-2021 et complétées par des rapports d’enseignants ayant participé à l’échange depuis de nombreuses années.
Marine Noël
« ‘Poétiques du récit de retour aux origines: du documentaire au roman’ suivi de ‘Je t’envoie des photos des primevères dans le sable’. »
Sous la direction de Véronique Montémont (ATILF | Université de Lorraine – CNRS) et Claire Legendre (Université de Montréal)
Thèse soutenue le 17 novembre 2023
Toma Gotkova
« Le lexique de l’environnement et ses termes liés à la chimie dans le discours ordinaire. Utilisation des réseaux sociaux comme corpus. »
Sous la direction d’Alain Polguère (ATILF | Université de Lorraine – CNRS) et Francesca Ingrosso (LPCT | Université de Lorraine – CNRS)
Thèse soutenue le 14 novembre 2023
Mots-clés : vocabulaire spécialisé, réseaux sociaux comme corpus, lexicographie informatisée, réseau lexical, environnement, chimie
Barbara Francioni
« Systèmes linguistiques en contact dans le chansonnier estense. Étude stratigraphique et philologique des éléments en langue d’oc et en langue d’oïl. »
Sous la direction de Yann Greub (ATILF | CNRS – Université de Lorraine) et Fabrizio Cigni (Université de Sienne)
Thèse soutenue le 30 mai 2023
Arthur Trognon
« Diagnostic du Syndrome de Shwachman-Diamond par des investigations cognitives et dialogiques. »
Sous la direction de Michel Musiol (ATILF | Université de Lorraine – CNRS) et Jean Donadieu (Hopital Trousseau Paris)
Thèse soutenue le 20 décembre 2022
Une étude récente a décrit l’impact des mutations SBDS sur le développement du système nerveux. Ces données ont suggéré que les patients SDS présentent un rétrécissement global des volumes corticaux dans les deux hémisphères, en particulier dans le cortex cingulaire antérieur et les régions hippocampique. Ils ont également observé des anomalies cérébrales diffuses dans la matière grise ainsi que des disruptions de la connectivité myélinique (Perobelli et al., 2015).
Bien que ces données cérébrales pourraient permettre d’expliquer en partie la symptomatologie clinique observée chez les patients SDS, les données de la littérature disponibles concernant le retentissement linguistique, psychologique et psycholinguistique de ces altérations sont rares. Actuellement, il a été démontré que les sujets porteurs du SDS présentent des altérations cognitives diffuses, avec notamment un affaiblissement de l’efficience intellectuelle et un syndrome dysexécutif (Aggett, Harries, Harvey, & Soothill, 1979; Cipolli et al., 1999; Kent, Murphy, & Milla, 1990; Kerr, Ellis, Dupuis, Rommens, & Durie, 2010; Perobelli et al., 2015), en dépit d’une importante variabilité intragroupe (Perobelli, Nicolis, Assael, & Cipolli, 2012).
Cependant, aucune donnée n’existe concernant la retentissement de ces anomalies cognitives sur les interactions sociales et en particulier dans le cas de l’interaction sociale humaine la plus naturelle : l’interaction dialogique.
Certains travaux ont déjà examiné les conduites conversationnelles associées à certaines pathologies mentales comme la schizophrénie (Musiol & Rebuschi, 2007; Trognon, 1992), ou l’autisme (Gerardin-Collet, 1999) ; ainsi qu’à certaines pathologies dégénératives ou neurologiques comme la maladie d’Alzheimer (Jacob, 2017) ou le polyhandicap (Bocéréan & Musiol, 2017), et les traumatismes crâniens (Dardier, Delaye, & Laurent-Vannier, 2003; Peter-Favre, 1999). Le Syndrome de Shwachman-Diamond, appartenant à la seconde catégorie citée ci-dessus, n’a lui, donné lieu à aucune étude systématique, bien qu’une étude exploratoire ait été réalisée (Batt et al., 2017; Canton et al., 2016).
Alors que dans cette étude exploratoire, la partie dialogique et l’évaluation neuropsychologique sont conçus séparément, ils seront dans la présente étude intégrés de façon à ce que l’évaluation des conduites dialogiques ne soit pas une tâche parmi d’autres, se positionnant comme une tâche super-ordonnée garantissant l’aspect écologique de celle-ci. Nous utiliserons à cet effet un dispositif original créé pour l’expérience, le Trognon Ecological Side Task for the Assessment of Speech-Act Processing (TEST-ASAP ; publication en cours de préparation). Cette tâche est subdivisée en trois sous tâches afin de mesurer les aspects inférentiels d’une part ; l’induction comportementale sous instruction et l’induction comportementale nécessitant une inférence préalable, permettant ainsi de mettre en évidence des dissociations, cette tâche étant intégrée dans le processus même d’évaluation neuropsychologique.
Ces données dialogiques seront enregistrées, transcrites verbatim, puis analysées à l’aide d’une méthode dérivée des travaux de (Caelen, 2003 ; Caelen, 2007 ; Caelen & Xuereb, 2019). Cette approche, initialement conçue pour étudier les interactions homme-machine en 2003, a été généralisée en 2019 à l’analyse de tout dialogue naturel. L’intérêt de cette approche est qu’elle permet d’intégrer à la fois la théorie des actes de langage dans une version dialogique, et la SDRT (Segmented Discourse Representation Theory – Asher & Lascarides, 2003).
L’utilisation de techniques d’analyse d’interaction homme-machine pour étudier le dialogue naturel se justifie ici par la construction de la tâche, dont l’issue et son déroulement sont prédictibles chez le sujet neurotypique (dialogue idéal ayant les caractéristiques d’un dialogue coopératif où les interactants s’entraident vers un but commun), et dont toutes les autres configurations seraient considérées comme incidentielles (non optimales et détectées par ces méthodes).
Une fois ces interactions catégorisées chez les patients SDS et les sujets contrôles, elles seront encodées informatiquement à l’aide d’une procédure décrite par (Cooper, 2019), et permettront d’être utilisées comme données d’un algorithme de machine-learning permettant de distinguer les deux populations si elles présentent des différences objectivables sur le plan dialogique pouvant servir de base pour réaliser un algorithme de diagnostic.
Polina Mikhel
« Étude multilingue du lexique de la chimie à l’interface entre terminologie et langue générale
(Multilingual study of the lexicon of chemistry at the interface of terminology and general language). »
Sous la direction d’Alain Polguère (ATILF | Université de Lorraine – CNRS) et Francesca Ingrosso (LPCT | Université de Lorraine – CNRS)
Thèse soutenue le 16 décembre 2022
Sur le plan théorique, la recherche vise, d’une part, à apporter une solution au problème de la modélisation formelle et rigoureuse de la multidimensionnalité inhérente à l’organisation des terminologies, c’est-à-dire le fait que les termes peuvent être appréhendés et les terminologies parcourues selon de multiples axes. D’autre part, et de façon liée, la recherche vise à rendre compte de l’interdépendance entre lexique de langue générale et lexique terminologique.
Sur le plan pratique, la thèse débouchera sur des modèles terminologiques multilingues de la chimie, en français, en anglais et en russe. Ces modèles, conçus pour évoluer et être enrichis sur le long terme, seront des outils exploitables par les scientifiques aussi bien que par les enseignants en chimie. La recherche est de ce fait destinée à avoir une résonance non seulement dans le domaine de la recherche en lexicologie et terminologie, mais aussi auprès de la communauté des chimistes.
Le projet se situe dans la thématique des études lexicales, qui sont au cœur du projet scientifique du laboratoire ATILF. Il présente l’originalité d’aborder le sujet du rapport entre terme et non-terme dans le cadre des travaux menés à l’ATILF sur les grands réseaux lexicaux. Une exploitation intensive sera faite des modèles lexicaux développés depuis plusieurs années au laboratoire. En retour, la recherche doctorale alimentera ces ressources en données sur les terminologies anglaises et françaises de la chimie.
Claire Schlienger
« Les prépositions d’inclusion en ancien et moyen français : analyse diachronique de EN, ENZ, DEDANS et DANS »
Sous la direction de Sylvie Bazin (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 27 juin 2022
Dans l’intention de répondre à ces questions et d’enrichir la diachronie des prépositions, nous réalisons une analyse diachronique des prépositions EN, ENZ, DEDANS et DANS exprimant l’inclusion. La notion d’inclusion est à prendre au sens large, regroupant les approches structuralistes et cognitivistes, soit au sens de « X se situe / est inclus dans Y ».
Afin de définir les emplois des prépositions d’inclusion dans l’ancienne langue, nous orientons notre travail sur trois axes de recherches : caractériser les préférences syntaxiques et sémantiques de EN, ENZ, DEDANS et DANS en ancien et moyen français, identifier les phénomènes majeurs dans la diachronie des prépositions tels que l’origine de DEDANS et DANS et les changements linguistiques qui ont conduit aux emplois modernes de EN et DANS, et enfin établir la chronologie des prépositions, avec une datation des évolutions, du latin au 16e siècle.
Grâce aux bases textuelles BFM de Lyon (2016 et 2019) et Frantext, riches en ouvrages médiévaux, nous disposons de matériaux suffisants pour une analyse diachronique représentative de la langue. Afin d’y parvenir, nous réalisons dans un premier temps une analyse synchronique selon deux découpages temporels : un par période (AF et MF) et un par siècle (du 12e au 16e siècle). Avec l’analyse distributionnelle et l’observation des concurrences, nous déterminons les emplois de chaque préposition, y compris les formes contractées de EN (el, es, ou). À partir de ces résultats synchroniques, nous pouvons relever les changements linguistiques à travers une approche diachronique. Les analyses contrastives mettront au jour les spécialisations d’emplois et les remplacements.
Cette étude permettra de découvrir que DEDANS est le pivot dans la transition de EN vers DANS, que la spécialisation de EN avec des compléments abstraits a lieu dès le moyen français et que DANS vient remplacer DEDANS dès son apparition.
Cette thèse est une contribution aux recherches diachroniques déjà réalisées. Les périodes d’ancien et moyen français, moins observées pour ces prépositions, sont enrichies par ce travail à travers l’apport de précisions sur les comportements et changements linguistiques opérant du 12e au 16e siècle, en particulier avec ENZ et DEDANS qui sont peu étudiés.
Timothée Mickus
« Génération automatique de définitions et de propriétés sémantiques de mots. »
Sous la direction de Mathieu Constant (ATILF | Université de Lorraine – CNRS) et Denis Paperno (Université d’Utrecht, Pays Bas)
Thèse soutenue le 31 mars 2022
Cependant, les ressources lexicales qui sont développées par des experts peuvent elles-même être difficiles à comprendre pour un public large. Par exemple, les citoyens peuvent être confrontés aux scénarios suivants : (i) la définition du mot ou du concept dans la ressource est trop difficile (technicité) ; (ii) le sens du mot ou du concept dans le contexte de lecture recouvre plusieurs sens définis dans la resource (ambiguïté) ; (iii) le mot ou son sens peut ne pas être couvert par la ressource (couverture).
Afin de lutter contre ces problèmes, le projet de thèse consiste à concevoir et développer de nouvelles méthodes pour extraire les connaissances sémantiques appropriées pour un mot dans un contexte donné. Plus particulièrement, étant donné un mot et un contexte, les méthodes proposées chercheront à automatiquement générer sa définition et ses propriétés sémantiques, adaptées non seulement au contexte, mais aussi à l’utilisateur.
Avec la révolution de l’apprentissage profond, l’hypothèse principale de ce projet de thèse est qu’il est désormais possible de modéliser entièrement cette tâche au moyen de réseaux de neurones en incluant à la fois une phase d’analyse du mot et son contexte et d’une phase de génération d’une phrase de définition en langage naturel. Ces modèles pourront être entrainés à partir du contenu des ressources lexicales, et enrichis de modèles de langage et de plongements de mots appris sur de grand volumes de textes, dans le but de capter la diversité lexicale et le style d’expression d’un public large. Cette approche se rapproche des approches neurones récentes utilisées pour la traduction automatique et le résumé automatique.
Bien que le sujet de thèse proposé soit lié aux tâches traditionnelles de la levée d’ambiguïté sémantique et l’induction de sens des mots, le problème propose un défi plus important car il va plus loin : le système attendu devra générer des définitions, même pour les mots ou sens non converts par les ressources lexicales existantes, en généralisant à partir de bases lexicales existantes.
Mathilde Huguin
« Analyse morphologique des mots construits sur base de noms de personnalités politiques. »
Sous la direction de Fiammetta Namer (ATILF | Université de Lorraine – CNRS) et Stéphanie Lignon (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 3 décembre 2021
Cette thèse est menée dans le cadre théorique de la morphologie lexématique (cf. Fradin, 2003). Ainsi, nous considérons qu’une construction morphologique est un patron appliqué à (au moins) un lexème base pour former un nouveau lexème, plus complexe. Le lexème est une unité abstraite caractérisée par une forme, une catégorie syntaxique et un sens. Prototypiquement, le lexème construit est une élaboration formelle et sémantique du lexème base.
D’un point de vue morphologique, le NPr a très peu été étudié. Les quelques études consacrées à la construction de mots français à partir de bases NPr et plus particulièrement anthroponymiques (e.g. Dal, 1997 ; Leroy 2005, 2008 ; Leroy & Roger, 2014 ; Lignon & Plénat, 2009 ; Lasserre, 2016) se cantonnent à la description de cas particuliers, c’est à dire l’étude de quelques mots construits, dans une monographie sur un suffixe, par exemple (e.g. Lignon, 2000, sur l’étude du suffixe ien). Cette absence d’étude spécifique est naturelle si on analyse le NPr comme une entité vide de sens, référant directement à un individu unique (Mill, 1843 ; Kripke, 1972). Or, si un mot nouveau est construit à partir d’une base NPr, cela suppose que sa construction est sémantiquement motivée par le locuteur qui l’a forgé. Ce sens est élaboré à partir du sens de la base. Donc, la base, i.e. le NPP, doit d’une manière ou d’une autre, posséder un contenu sémantique qui contient une interprétation partagée par une communauté linguistique.
Nous travaillons sur des formes attestées et contextualisées. Les mots construits sur NPP se rencontrent souvent dans des écrits spontanés : sur des forums, blogs ou réseaux sociaux (Huguin, 2015). En d’autres termes, nous devons constituer notre propre corpus puisqu’aujourd’hui aucun corpus existant ne nous permet d’accéder à une quantité de données suffisante pour réaliser notre objectif. Notre démarche de constitution de corpus peut se résumer en deux temps : (1) nous avons tout d’abord généré des formes candidates, c’est-à-dire des mots construits sur NPP dont l’existence est hypothétique (Christiane Taubira > taubiraiser, taubiratiser, taubiriser…), (2) pour ensuite vérifier leur existence sur la Toile. 128 808 formes candidates ont été générées automatiquement à partir d’une liste de 90 NPP dont les référents sont des femmes ou hommes ayant exercé une fonction politique de premier plan depuis 1981 en France. Nous construisons notre corpus à partir du contenu de la Toile, en exploitant les outils et méthodologies élaborés dans le passé et présentés dans des travaux antérieurs (e.g. Dal & Namer, 2012, 2015 ; Hathout & alii, 2009). La collecte et le post traitement des sources composant le corpus sont effectués en collaboration avec le service R&D de Data Observer1. Ainsi récoltés, ces données et leurs contextes d’emplois, sont triés et annotés dans une base de données lexicales dans laquelle sont organisés les résultats de notre analyse. Chaque entrée de la base comprend les informations formelles, catégorielles et sémantiques sur la relation morphologique unissant un mot construit et le NPP qui en est la base morphologique.
À travers cette thèse, nous cherchons à montrer que la morphologie apporte un éclairage nouveau à la définition linguistique du NPr, notamment au regard de la notion de lexème, unité de base de la morphologie lexématique. Ce travail va apporter des réponses sur le comportement morphologique du NPr, mais également sur le NPr en général (son sens, sa forme), et fournira une grammaire de l’anthroponyme ainsi qu’un large corpus de construits sur base anthroponymique.
1 Data Observer (www.data-observer.com) est une startup spécialisée dans la collecte, le traitement et l’analyse des données textuelles issues du Web.
► Page perso : https://apps.atilf.fr/homepages/mhuguin/
► Télécharger la bibliographie
Julie Prévost
« Obstacles et facilitateurs pour l’inclusion scolaire des élèves allophones nouvellement arrivés (EANA) dans l’enseignement secondaire public en France et leurs incidences didactiques notamment en cours ordinaire de français. »
Sous la direction de Dominique Macaire (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 26 novembre 2021
Nous analysons les pratiques de l’écrit des apprenants allophones au collège (en UPE2A et en cours-disciplinaire de français). Nous analysons les répercussions sociolinguistiques sur le niveau de littératie et l’impact de l’environnement scolaire sur l’apprentissage de la langue.
Notre recherche sur les pratiques de l’écrit a pour objectif de situer les activités d’écriture dans un contexte plus large que celui de la simple scolarisation, en tenant compte des objectifs sociaux et culturels imposés aux apprenants allophones. Nous envisageons un élargissement du champ de réflexion sur les pratiques sociales de l’écrit en sollicitant des dimensions linguistique, sociale, sociolinguistique, anthropologique et économique.
► Page perso : http://julie.prevostzuddas.free.fr/
Elise Gandon
« La place des objets et faits culturels au sein des formations linguistiques et professionnelles pour adultes migrants : dimensions linguistiques et sociolinguisitiques de l’apprentissage de la langue. »
Sous la direction d’Hervé Adami (ATILF | Université de Lorraine – CNRS), Claudie Péret (Université de Cergy Pontoise)
Thèse soutenue le 22 octobre 2021
Nous étudierons la place des objets et faits culturels comme supports d’apprentissage et comme déclencheurs d’interactions verbales permettant l’acquisition de compétences linguistiques et sociolinguistiques et notamment l’acquisition de lexique en production et interaction orales. Nous voulons démontrer que les objets et faits culturels peuvent favoriser l’acquisition d’outils linguistiques et communicationnels transposables dans la vie quotidienne et professionnelle.
Notre recherche s’appuie sur plusieurs hypothèses. Selon notre première hypothèse, le contact prolongé, verbalisé avec des objets et faits culturels aurait une incidence sur l’acquisition des compétences langagières car il permettrait d’éveiller la curiosité et donc d’amorcer l’envie d’interagir. Nous réfèrerons à la théorie socioconstructiviste (Vygotski, 1934) ainsi qu’à l’idée selon laquelle l’interaction avec l’autre est déterminante dans l’apprentissage du langage. (Bruner, 1956, 1996). Par ailleurs, une seconde hypothèse serait que ces contextes particuliers d’apprentissage favoriseraient conjointement l’acquisition de compétences linguistiques et sociolinguistiques. Notre travail d’analyse prendra appui sur les travaux d’analyse conversationnelle et d’analyse du discours (Kerbrat Orecchioni, 1990, 1992, 1994). Nous formulons une troisième hypothèse selon laquelle ces outils linguistiques et sociolinguistiques seraient transférables à d’autres situations de communication (Meirieu, 1996 ; Minder, 1999).
Nous analyserons les interactions verbales déclenchées par le contact d’objets et faits culturels. Par « objets et faits culturels » nous entendons ici peintures, sculptures, et parce que cette recherche se fera à Lyon, vestiges du patrimoine architectural gallo-romain : amphithéâtres, remparts, traboules…
Le corpus sera recueilli auprès d’adultes migrants en formation. Au contact des objets et faits culturels présentés, les apprenants seront invités à s’exprimer individuellement et collectivement. Il leur sera demandé de décrire et d’exprimer une opinion sur l’œuvre présentée. Chaque apprenant sera enregistré. Les transcriptions des enregistrements permettront une analyse linguistique précise grâce à un outil et des critères d’évaluation définis en amont portant principalement sur le lexique… L’expérience sera menée trois fois au cours de la formation permettant de voir la progression de chaque apprenant. A l’issue des enregistrements, pour répondre aux besoins linguistiques des apprenants, nous leur proposerons de partager leurs connaissances en les invitant à produire collectivement une « banque » de lexique spécifique (sous la forme d’une « boîte à outils », d’une carte heuristique…) enrichi par le formateur. En fin de formation, les compétences orales seront mesurées et les productions orales seront analysées selon les mêmes critères, avec le même outil. Nous verrons si les apprenants sont en mesure de réinvestir le lexique à bon escient dans des situations de communication de la vie quotidienne (sujets d’examen proposés) et donc de voir si les acquis sont transférables.
Jorge Valdenebro Sánchez
« De la prise en compte des réalités culturelles dans la traduction juridique. Élaboration d’un dictionnaire analytique des concepts en Droit pénal français à l’usage des hispanophones péninsulaires. »
Sous la direction d’Anne-Marie Chabrolle-Cerretini (ATILF | Université de Lorraine – CNRS) et Tanagua Barceló (Université de Malaga)
Thèse soutenue le 29 juin 2021
Lou Lee
« Fonctions pragmatiques et prosodie de marqueurs discursifs en français et en anglais. »
Sous la direction d’Yvon Keromnes (ATILF | Université de Lorraine – CNRS) et de Denis Jouvet (LORIA)
Thèse soutenue le 7 avril 2021 | Visioconférence
Shuaa Alamri
« L’utilisation des TIC dans le développement de l’aptitude de compréhension orale de futures interprètes arabe-français à l’université du Roi Saoud. »
Sous la direction de Sophie Bailly (ATILF | Université de Lorraine – CNRS) et Maud Ciekanski (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 21 février 2021 | Visioconférence
Selon notre expérience personnelle en tant qu’enseignante à l’Université du Roi Saoud, deux constats peuvent être établis : les étudiantes ont des difficultés à comprendre le sens du message oral et leurs capacités se limitent à une traduction littérale des mots, détachée de la réalité culturelle et contextuelle. L’observation de nombreux malentendus et de quiproquos lors d’échanges avec les étudiantes nous ont ainsi amenée à penser que la formation d’interprétariat dispensée à l’Université du Roi Saoud, pour ce qui est du FLE, ne permettait pas de doter les apprenantes des compétences linguistiques, communicationnelles et contextuelles nécessaires pour être en en mesure de communiquer en situation professionnelle authentique. Ainsi durant notre observation de la réalité sur le terrain d’enseignement au département de français, nous avons constaté que la majorité des étudiantes saoudiennes rencontrent des difficultés en ce qui concerne la compréhension orale. L’objectif de notre recherche de doctorat est de proposer un dispositif TIC adapté à la réalité du métier d’interprétariat car l’analyse des scores obtenus au pré-test et au post-test par les étudiantes en compréhension orale durant notre expérimentation en M2, a permis d’établir l’apport positif de l’utilisation des TIC dans le développement de la compréhension orale en termes d’efficacité (on comprend plus ou mieux) et de rapidité (les progrès sont plus rapides).
La recherche actuelle en didactique des langues a montré l’importance de prendre en compte les contextes sociaux, culturels et éducatifs (CASTELLOTTI et CHALABI 2006). En ce qui concerne l’Arabie Saoudite, il existe dans ce pays de fortes différenciations dans les rôles féminins et masculins. Les sujets et les bénéficiaires de notre étude sont exclusivement des femmes, et nous pensons que ce trait doit être souligné et pris en compte du point de vue théorique. Notamment, en ce qui concerne le rapport aux technologies, plusieurs études ont montré que les femmes en faisaient un usage particulier dans les pays arabes (ALSHAMMRI 2007). De plus, les femmes sont de plus en plus nombreuses à choisir le parcours professionnel de l’interprétariat, qui est actuellement plutôt un métier d’homme en Arabie Saoudite ; ceci a peut-être des répercussions sur le métier d’interprète, dont il faudra tenir compte dans le cadre de la formation.
Marie Flesch
« Langue d’internet et genre : étude du corpus du site web communautaire Reddit. »
Sous la direction de Sophie Bailly (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 16 décembre 2020 | Visioconférence
Si le site internet Reddit a été choisi pour cette thèse, c’est parce qu’il s’impose comme un des espaces d’expression privilégiés de la langue d’internet, de par, tout d’abord, la liberté dont jouissent ses utilisateurs. Les « Redditeurs » s’expriment ainsi bien souvent dans une langue informelle, et généralement dans l’anonymat total, sur des dizaines de milliers de forums auto-modérés. Reddit est également un objet d’étude intéressant parce que la plateforme a connu une croissance fulgurante depuis sa création en 2005, pour devenir, en novembre 2016, le septième site le plus visité aux Etats-Unis.
Autoproclamé « première page d’internet », Reddit est aujourd’hui un véritable phénomène de société, à la fois théâtre d’échanges passionnés, terreau fertile à l’explosion de scandales, espace d’accueil des contenus les plus provocateurs du web, et outil de communication utilisé par les personnalités politiques. La plateforme, dominée par les hommes depuis sa création, est par ailleurs en pleine mutation : le profond fossé entre les sexes, caractéristique des forums de discussion en ligne, est en train de se combler, les femmes investissant de plus en plus le site.
Pour étudier la relation entre langue et genre sur Reddit, un corpus de plus de 10 millions de mots sera construit, qui rassemblera les contributions de plusieurs centaines d’utilisateurs ayant indiqué le genre auquel ils s’identifient. Une approche « corpus-driven » sera adoptée. Au travers d’analyses quantitatives et qualitatives, la thèse explorera les différences d’utilisations entre les genres et les variations à l’intérieur de chaque groupe. Elle se penchera également sur la façon dont d’autres facteurs démographiques et contextuels interagissent avec l’identité sexuée des Redditeurs dans la production d’éléments typiques du « Netspeak ». Elle tentera enfin d’esquisser les éventuelles évolutions de la langue d’internet, et de dégager les implications sociales qui se dessinent dans les résultats de l’analyse du corpus, à l’échelle de Reddit, d’internet, et de la société.
► Page perso : http://mflesch.weebly.com/
Anouchka Divoux
« Analyse linguistique, praxéologique et socio-interactionnelle de la question en réunion de travail. »
Sous la direction de Virginie André (ATILF | Université de Lorraine – CNRS) et Hervé Adami (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 7 décembre 2020 | Visioconférence
Les recherches de Kerbrat-Orecchioni (1991, 2008) ont permis de montrer la variabilité illocutoire de la question : les questions peuvent ainsi revêtir une autre valeur que la demande d’information. Cette variabilité illocutoire des questions est intrinsèquement liée à la situation de communication. En effet, les pratiques langagières sont engagées dans un système d’inter-influences (André, 2006) mettant en jeu l’activité langagière, la situation de communication mais aussi le genre de discours. Il est donc nécessaire de s’interroger sur la place du langage au travail pour comprendre le rôle des questions en réunion.
Le langage au travail revêt deux valeurs principales : une valeur praxéologique (Zarifian, 1999 ; Filliettaz et de Saint Georges, 2009 ; Borzeix, 2015) permettant la réalisation de l’activité, mais aussi une valeur relationnelle permettant le marquage des relations (Girin, 1990 ; Filliettaz et de Saint Georges, 2009) que celles-ci soient horizontales ou verticales (Kerbrat-Orecchioni, 2004). Ainsi, les deux valeurs du langage au travail se retrouvent dans l’usage de la question. L’acte de questionnement peut par exemple servir à faciliter l’intercompréhension, répartir les tâches mais aussi à mettre en difficulté un interlocuteur ou exposer son expertise de manière détournée.
Avec cette thèse, nous chercherons à découvrir quels éléments extralinguistiques influencent la production de questions en réunion de travail en nous intéressant plus particulièrement au statut, au rôle interactionnel mais aussi au genre des locuteurs. Par ailleurs, à partir d’un corpus de réunions de travail, nous tenterons de décrire finement ce qui constitue une question à l’oral.
Anaïs Carnet
« L’utilisation des séries télévisées dans l’apprentissage de la consultation pour les étudiants de médecine français. »
Sous la direction d’Alex Boulton (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 30 novembre 2020 | Visioconférence
Les futurs professionnels de santé seront confrontés tôt ou tard à des patients ne parlant pas français – pendant leurs stages pratiques à l’hôpital durant leurs études, pendant un stage qu’ils effectueront à l’étranger, ou lorsqu’ils seront en poste en tant que professionnels de santé. Il est donc nécessaire de préparer ces étudiants en leur donnant des clefs stratégiques communicatives qui leur permettront de mener à bien une consultation en anglais. Ainsi, il semble primordial de réfléchir à la langue en tant qu’objet d’enseignement dans les facultés de médecine, afin de permettre aux étudiants d’acquérir les outils linguistiques dont ils auront besoin dans leur future carrière professionnelle.
La mise en place de la recherche-action consiste en la comparaison de deux dispositifs d’enseignement différents afin d’évaluer lequel semble le plus à même d’amener les étudiants vers l’autonomie communicationnelle visée. Ces programmes seront essentiellement suivis par des étudiants souhaitant partir étudier un an à la faculté de médecine de Leeds, Angleterre. Il conviendra donc d’analyser lequel de ces programmes est le plus pertinent pour répondre à leur projet, en s’interrogeant sur la validité de chacun des deux programmes.
Trois groupes d’une quinzaine d’étudiants volontaires (2° & 3° années) seront créés, au sein desquels les étudiants seront répartis de manière aléatoire. Le premier groupe suivra un enseignement composé de documents traditionnels (vidéos et documents audio didactisés) et servira de groupe de contrôle. Les deux autres groupes suivront le même programme, mais les documents traditionnels seront remplacés par des extraits de séries télévisées ; le premier groupe bénéficiera d’un enseignement utilisant uniquement la série House, M.D., tandis que l’autre groupe travaillera sur des extraits de séries généralistes (The Walking Dead, Friends, The Big Bang Theory…). L’intégralité des documents et extraits sélectionnés seront soumis à un panel de professionnels de santé afin d’en vérifier les faits médicaux. Trois corpus distincts seront créés. Tout d’abord, en étudiant les documents du premier groupe, nous pourrons créer une banque de données qui viendra révéler les besoins langagiers des étudiants dans le domaine de la consultation. En parallèle, la transcription des extraits de séries permettra de créer deux autres corpus : le premier correspondant à de l’anglais médical et le deuxième à de l’anglais plus informel.
Les données de l’étude seront collectées et analysées grâce à différents outils. Pour les mesures qualitatives, les questionnaires ainsi que les entretiens seront utilisés. L’observation directe sera également employée dans le but de ne pas impacter le déroulement de l’étude. Il est également prévu d’évaluer les étudiants en situation. Grâce à la participation d’étudiants étrangers présents sur le campus, nous pourrons envisager d’organiser des mises en situation, en face à face, lors desquelles les étudiants de médecine devront utiliser toutes les connaissances acquises lors des cours d’anglais pour mener à bien une consultation face à un patient qu’ils ne connaissent pas et dans une situation non préparée à l’avance. Il est envisagé de filmer puis transcrire le dialogue afin de mesurer l’authenticité de cet échange, et de le comparer aux corpus précédemment créés.
Hazem Al Saied
« Analyse automatique par transitions pour l’identification des expressions polylexicales. »
Sous la direction de Mathieu Constant (ATILF | Université de Lorraine – CNRS) et Marie Candito (Université Paris-Diderot)
Thèse soutenue le 20 décembre 2019 à Nancy (Campus Lettres et Sciences Humaines | Bâtiment A | Salle A104)
La tâche d’identification d’EPs consiste à annoter en contexte les occurrences d’EPs dans des textes, i.e à détecter les ensembles de tokens formant de telles occurrences. Par exemple, dans la phrase « Cette série ne vit finalement jamais le jour. », les tokens « vit », « le » et « jour » seraient marqués comme formant une occurrence de l’EP « voir le jour ». La tâche est formellement complexe, dans la mesure où une EP peut être discontinue et un token peut appartenir à plusieurs EPs.
L’analyse par transitions est une approche célèbre qui construit une sortie structurée à partir d’une séquence d’éléments, en appliquant une séquence d’actions (appelées « transitions ») choisies parmi un ensemble prédéfini, pour construire incrémentalement la structure de sortie. L’utilisation de l’apprentissage automatique permet d’optimiser un classifieur pour réaliser le choix de la transition à opérer à chaque étape, et ainsi choisir au final une structure de sortie parmi un ensemble en général très grand de structures possibles.
Dans cette thèse, nous proposons un système par transitions dédié à l’identification des EPs au sein de phrases représentées comme des séquences de tokens, et étudions diverses architectures pour le classifieur qui sélectionne les transitions à appliquer, permettant de construire l’analyse de la phrase. La première variante de notre système utilise un classifieur linéaire de type machine à vecteur support (SVM). Les variantes suivantes utilisent des modèles neuronaux : un simple perceptron multicouche (MLP), puis des variantes intégrant une ou plusieurs couches récurrentes.
Le scénario privilégié est une identification d’EPs n’utilisant pas d’informations syntaxiques, alors même que l’on sait les deux tâches liées. Nous étudions ensuite une approche par apprentissage multitâche, réalisant et mettant à profit conjointement l’étiquetage morphosyntaxique, l’identification des EPs par transitions et l’analyse syntaxique en dépendances par transitions.
La thèse comporte une partie expérimentale importante. Nous avons d’une part étudié quelles techniques de ré-échantillonnage des données permettent une bonne stabilité de l’apprentissage malgré des initialisations aléatoires. D’autre part nous avons proposé une méthode de réglage des hyperparamètres de nos modèles par analyse de tendances au sein d’une recherche aléatoire de combinaison d’hyperparamètres. Nous produisons des systèmes avec la contrainte d’utiliser le même hyperparamétrage pour différentes langues. Nous utilisons en effet de manière privilégiée les données des deux compétitions internationales PARSEME (1.0 et 1.1), contenant des annotations d’EPs verbales pour 18 et 20 langues.
Nos variantes produisent de très bons résultats, et notamment les scores d’état de l’art pour de nombreuses langues des jeux de données PARSEME 1.0 et 1.1. L’une des variantes s’est classée première pour la plupart des langues lors de la campagne PARSEME 1.0. Comparées aux autres méthodes de la littérature, nos variantes MLP et SVM montrent une bonne performance en particulier pour les EPs discontinues ou les EPs correspondant à des variantes d’occurrences vues à l’apprentissage. Mais comme les autres systèmes, nos modèles ont des performances faibles sur les EPs non vues à l’apprentissage. Nous constatons cela dit que les variantes récurrentes et notre approche multitâche ont des performances globales peu compétitives, mais prometteuses pour ce qui est des EPs inconnues. Ceci suggère que l’accent doit être mis sur la découverte d’EPs utilisant des données non annotées en grosse quantité.
Mots clés :
Expressions polylexicales, Identification des expressions polylexicales, Analyse par transitions, Modèles linéaires, Modèles neuronaux, Réglage d’hyperparamètres de tendances, Classification avec données déséquilibrées
Marine Borel
« Les formes verbales surcomposées en français. »
Sous la direction de Denis Apothéloz (ATILF | Université de Lorraine – CNRS) et Françoise Revaz (Université de Fribourg)
Thèse soutenue le 7 juin 2019 à Fribourg (Université de Fribourg | Faculté des Lettres | Salle du Sénat)
Il existe, en français, neuf formes surcomposées, qui sont toutes attestées dans la littérature francophone : un infinitif (avoir eu chanté), un participe (ayant eu chanté), deux formes au subjonctif (que j’aie eu chanté, que j’eusse eu chanté) et cinq formes à l’indicatif (j’ai eu chanté, j’avais eu chanté, j’eus eu chanté, j’aurai eu chanté et j’aurais eu chanté). Seul l’impératif surcomposé (*Aie eu chanté !) n’est pas attesté.
Les premières formes surcomposées semblent être apparues dans la langue française à la fin du XIIe siècle. Depuis cette époque, elles sont attestées sans discontinuer jusqu’à l’époque moderne, et l’on trouve des attestations de ces formes dans tous les types de textes, aussi bien littéraires ou épistolaires que juridiques ou journalistiques.
C’est à l’analyse, notamment morphologique et sémantique, de ces formes surcomposées que je consacre mon projet de thèse. Mon but est de parvenir à comprendre et à décrire très précisément le sens de chacune de ces neuf formes surcomposées ainsi que les fonctions qu’elles remplissent dans la langue française. Pour mener à bien cette recherche, d’ordre qualitatif, je travaille sur des données réelles, que j’ai recueillies et référencées. Le corpus sur lequel se base ma recherche est actuellement composé de plus de 4000 occurrences authentiques, datant de toutes les époques et provenant de tous les types de textes.
Lorraine Vézy De Beaufort
« Learning French in Hong Kong : A sociocultural and narrative perspective on language learner identity in the context of globalization. »
Sous la direction de Dominique Macaire (ATILF | Université de Lorraine – CNRS) et John Trent (EdUHK)
Thèse soutenue le 10 mai 2019
À la différence de l’anglais qui est une langue obligatoire à Hong Kong dès le plus jeune âge, le français ne l’est pas. S’il existe un grand nombre d’études à Hong Kong liées à l’apprentissage de l’anglais et du mandarin, il en existe peu sur des langues que je qualifierai de ‘langues additionelles’ (voir pour commentaire Hammarberg 2011; Jessner 2008) pour ce contexte.
L’étude s’attache à commenter la construction de l’identité liée à l’aprentissage du français à travers ce que Lemke (2000) appelle le multi-timescale dynamical system qui consiste à appréhender la construction de l’identité en tant qu’ensemble de procédés complexes, simultanés et complémentaires à différentes échelles de temps et d’espace (Blommaert 2007, 2010 ; Wortham, 2005) en relation avec l’environnement socioculturel immédiat et avec l’imaginaire (voir Kanno & Norton 2003 ; Ryan & Irie 2014) ainsi qu’avec les idéologies sociales (Heller 2007 ; Blommaert and Rampton 2011) et les pratiques de la langue (Pennycook 2010).
La thèse s’adosse à une étude qui consiste à « penser par cas» (Passeron et Revel, 2005) soit, à la compréhension de vrais individus dans leur milieu social et non pas d’individus conceptualisés (Ushioda 2012; Block, 2003; Lantolf & Thorne, 2006). Pour se faire, elle engage une approche méthodologique connue sous le nom de narrative inquiry (voir Barkhuizen et al. 2014 ; Clandinin, 2013), de type ‘études de récits’.
L’étude apporte des éléments sur la compréhension de la fluidité (Plivart, 2010 ; Dervin, 2011) en contexte de superdiversity (voir Blommaert 2010 ; Pennycook, 2010 ; Macaire, 2015) et propose une réflexion sur la ‘multidimentionalité’ sociale (Clark 2010) de l’apprenant. A travers l’éclairage qu’elle apporte, elle convoque également une réflexion sur l’éducation interculturelle en situation multilingue.
Sarah Kremer
« La réalisation matérielle du Französisches Etymologisches Wörterbuch. Impact de la mise en forme typographique sur le développement d’un projet lexicographique. »
Sous la direction de Yan Greub (ATILF | CNRS – Université de Lorraine) et Alice Savoie (ANRT | ENSAD Nancy)
Thèse soutenue le 20 décembre 2018 à Nancy (ATILF | Salle Imbs)
L’objet de cette thèse consiste dans l’étude de la réalisation matérielle du FEW, en particulier sa typographie, des premières publications d’articles en 1922 jusqu’à leur diffusion actuelle sous une forme uniquement numérique. L’étude s’appuie pour cela sur une analyse des évolutions de la présentation du dictionnaire en abordant ses changements, d’ordre lexicographique mais aussi technique. Cette analyse est complétée par l’observation d’une série d’autres dictionnaires dont la mise en forme typographique est remarquable. La thèse participe ainsi à mettre en évidence la manière dont le FEW est un objet lexicographique unique.
Le résultat concret de la thèse correspond à la création d’une famille de caractères adaptée aux usages du FEW. Ces polices sont exploitées au sein de deux interfaces : la première accompagne les rédacteurs du FEW lors de l’élaboration de nouveaux articles, la seconde permet aux utilisateurs de consulter et d’interagir avec la base de données du FEW informatisé. Issue d’une collaboration entre linguistes, informaticiens et designers, cette thèse propose un modèle d’intégration du design typographique au sein des humanités numériques.
Élisabeth Berchtold
« Dictionnaire de l’ancien francoprovençal : conception d’un projet lexicographique et réalisation sectorielle. »
Sous la direction de Yan Greub (ATILF | CNRS – Université de Lorraine) et Andres Kristol (Université de Neuchâtel)
Thèse soutenue le 19 décembre 2018 à l’Université de Neuchâtel
Les sources en francoprovençal sont relativement peu nombreuses parce que cette langue a été de tout temps confiné à un usage essentiellement oral. La littérature ancienne se borne à quelques textes d’édification et un traité juridique, surtout des traductions. À partir du XVIe siècle se développe une littérature en patois le plus souvent fortement ancrée localement. Les auteurs qui voulaient toucher un publique plus large ont très tôt opté pour le français. Les sources documentaires sont plus nombreuses, mais très inégalement réparties dans l’espace. Les sources issues de la partie française du domaine ont pour la plupart été éditées, mais beaucoup d’entre elles sont difficilement exploitables en l’absence de glossaires. La situation est plus favorable en Suisse romande où le Glossaire des patois de la Suisse romande (Gl.) documente non seulement les dialectes modernes, mais aussi leurs états anciens. Pour cette raison nous nous sommes concentrée sur la partie française du domaine et nous nous sommes basée sur le Gl. pour la partie suisse. En collaboration avec une autre doctorante, Laure Grüner, nous avons rassemblé les sources intéressantes pour l’étude de l’ancien francoprovençal de France et nous avons procédé à des dépouillements étendus.
Sur cette base, nous avons élaboré un modèle de description lexicographique adapté à l’ancien francoprovençal et nous avons rédigé la tranche f de ce Dictionnaire de l’ancien francoprovençal, qui représente environ un vingtième du dictionnaire complet, afin de prouver la faisabilité du projet et d’évaluer son apport à la connaissance de l’ancien francoprovençal. Plus de la moitié de nos articles documentent des unités lexicales qui n’étaient pas encore attestées en ancien francoprovençal de France dans le FEW et dans une bonne partie des autres cas nous pouvons compléter les matériaux. Sur la base des 386 articles rédigés, nous évaluons la nomenclature complète du dictionnaire à 7’500 articles et le temps de rédaction à une bonne douzaine d’années de travail d’une personne à temps plein. Nous avons aussi envisagé plusieurs possibilités pour obtenir des résultats tangibles dans des délais plus courts.
Bianca Mertens
« Figement et renouvellement du lexique protoroman : recherches sur la création lexicale. »
Sous la direction d’Eva Buchi (ATILF | CNRS – Université de Lorraine) et Marie-Guy Boutier (Université de Liège)
Thèse soutenue le 20 janvier 2018
Marie-Sophie Pausé
« Structure lexico-syntaxique des locutions du français et incidence sur leur combinatoire. »
Sous la direction d’Alain Polguère (ATILF | Université de Lorraine – CNRS) et Sylvain Kahane (Université Paris Nanterre)
Thèse soutenue le 3 novembre 2017
Notre hypothèse est qu’une description des locutions combinant à la fois l’identification des unités lexicales qui les composent, et à la fois les relations de dépendance syntaxique qui unissent les unités constituantes, permettra de prédire leurs différents emplois possibles en discours. Une telle description n’est possible que dans un modèle du lexique décrivant précisément la combinatoire des lexèmes.
L’objectif de notre thèse est de développer un modèle de description lexicographique des locutions vérifiant cette hypothèse et applicable au TAL et à la didactique. Notre recherche, basée sur les principes de la Lexicologie Explicative et Combinatoire (Clas et coll. 1995), exploitera et enrichira les données du Réseau Lexical du Français (RL-fr) (Lux-Pogodalla et Polguère 2011), ressource en cours de développement à l’ATILF. Notre travail visera dans un premier temps à affiner la classification des locutions selon les variations qu’elles admettent ou non dans les corpus. Dans un second temps, il s’agira de coupler les structures lexico-syntaxiques (association d’un patron syntaxique à des unités lexicales) des locutions à des arbres de dépendance, nous permettant de rentre compte de la structure syntaxique des locutions non linéarisée, et ainsi d’ouvrir aux différents agencements possibles des unités constituantes.
Kim Mi Hyun
« Étude contrastive de la phraséologie des noms d’éléments du corps en français et coréen. »
Sous la direction d’Alain Polguère (ATILF | Université de Lorraine – CNRS) et Seong Heon Lee (Université Nationale de Séoul)
Thèse soutenue le 17 février 2017
L’hypothèse de notre travail est que la comparaison de la lexicalisation des NÉC dans les deux langues – le français et le coréen – va montrer, bien évidemment, de nettes différences de conceptualisation du corps dans les deux cultures correspondantes, mais que la comparaison des collocations contrôlées par les NÉC va mettre en lumière des écarts beaucoup plus variés, liés à la conceptualisation des fonctions pratiques et sociales des entités physiques que les NÉC dénotent. Ce travail approfondira un phénomène de la collocation à la fois générique et spécifique.
À partir de nos hypothèses de départ, notre thèse se divisera en deux grandes parties. Dans la première partie, nous allons comparer la structuration des lexiques français et coréen des NÉC. Nous supposerons plusieurs cas logiques de (non-)correspondances entre les deux langues. Nous utiliserons le Natural Semantic Metalanguage ou NSM (Wierzbicka 1996) pour la comparaison sémantique des lexiques des NÉC en français et coréen. Dans la seconde partie, nous allons tout d’abord établir la liste des collocations dont la base est un NÉC. Nous définissons la collocation comme un phrasème particulier, fondé sur une relation de combinatoire restreinte entre deux unités lexicales. Nous allons ensuite comparer les collocations du français et coréen, pour chaque NÉC. La correspondance de la collocation entre deux langues est variée. À cette étape de la comparaison, nous allons utiliser un encodage des collocations fondé sur le système formel des Fonctions Lexicales de la théorie Sens-Texte (Mel’čuk 2001), en nous appuyant sur la base Réseau Lexical Français ou RLF(Lux-Pogodalla et Polguère 2011) et sur un échantillon de base du coréen, Réseau Lexical Coréen ou RLC, que nous développerons. Nous allons utiliser non seulement les fonctions lexicale dites standards, mais aussi les fonctions lexicale non standards.
Guillaume Nassau
« Les émotions en entretien de conseil dans un dispositif d’apprentissage de langue auto-dirigé : une analyse des interactions entre apprenant et conseillère. »
Sous la direction de Sophie Bailly (ATILF | Université de Lorraine – CNRS) et Virginie André (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 8 novembre 2016
Capucine Herbert
« Les récits de voyages du XIVe et du XVe siècles lemmatisés : apports lexicographiques au Dictionnaire du moyen français. »
Sous la direction de Sylvie Bazin (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 26 février 2016
L’étude des récits de voyages des XIVe et XVe siècles permet donc à travers l’étude de la langue, le moyen français, d’accéder à la perception qu’avaient du monde ces voyageurs.
Notre travail consistera tout d’abord en l’élaboration d’un lexique de ces récits, qui viendra compléter le Dictionnaire du moyen français, puis en l’étude lexicale et sémantique des vocables français liés à la topographie, ce qui devrait permettre de comprendre la perception du relief chez les voyageurs de la fin du Moyen Âge.
Kyuma Bernard Nzuki
« Les causes de l’abandon de l’étude du français au Kenya : étude didactique et sociolinguistique. »
Sous la direction de Sophie Bailly (ATILF | Université de Lorraine – CNRS) et Francis Carton (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 17 décembre 2015
Étant en cotutelle entre la France et le Kenya, ce travail de thèse se réalisera essentiellement grâce à une enquête de terrain au Kenya qui permettra de recueillir des informations auprès des acteurs éducatifs, des apprenants jeunes et adultes, des parents d’élèves et du monde de l’entreprise. Les informations recueillies constitueront ainsi une base de données statistiques et aussi qualitatives. Les grandes lignes de l’enquête se réaliseraient auprès des questionnaires et aussi d’une observation des cours afin d’analyser des méthodes utilisées / ou faire une étude comparative et éventuellement, c’est-à-dire aller en personne dans les salles classe pour confirmer/voir les stratégies que les enseignants utilisent pour que nous puissions accomplir une étude pratique.
A l’issue de cette recherche, nous devrions pouvoir mieux comprendre les interactions entre l’apprenant de langue étrangère et les contextes micro, méso et macro (la classe, l’école, la famille et la société) et leur rôle dans le processus qui mène à l’abandon de l’étude d’une langue étrangère. Concernant l’étude du français, la compréhension de ce processus permettrait de penser des solutions didactiques susceptibles de favoriser sa promotion et sa diffusion.
Laure Budzinski
« Dictionnaire historique et étymologique de la terminologie linguistique française. »
Sous la direction d’Eva Buchi (ATILF | CNRS – Université de Lorraine) et Yan Greub (ATILF | CNRS – Université de Lorraine)
Thèse soutenue le 30 novembre 2015
La thèse pourra contribuer à un progrès méthodologique dans un secteur faible de la science étymologique, progrès d’autant plus significatif que celui-ci est crucial pour notre connaissance du fonctionnement actuel de la création lexicale en français.
Élaborer un dictionnaire historique et étymologique de la terminologie de la linguistique nécessitera d’en reconsidérer l’ensemble des représentations dans les grands monuments étymologiques, afin d’identifier les lacunes à combler. Ainsi, un des premiers aspects de notre travail consistera à représenter le plus largement possible tous les sémantismes n’ayant pas été distinguée par les principaux dictionnaires étymologiques comme le FEW, Dauzat, Bloch & Wartburg ou le TLF. Le deuxième aspect de notre travail consistera en une analyse détaillée de l’origine des lexèmes étudiés, afin de vérifier dans quel cas il y a eu emprunt, calque ou construction française. Le troisième aspect de notre travail sera d’exploiter les données du dictionnaire pour un regard synthétique sur la constitution de la terminologie linguistique française : quel est le pourcentage de créations internes et d’emprunts ? Quels sont les patterns de formation les plus utilisés ? Quelle part de la science considérée comme établie est‐elle vraiment sûre ?
Fabien Python
« La duplicité du vocabulaire français. Étude des doublets étymologiques relevant de la dichotomie populaire/savant. »
Sous la direction d’Eva Buchi (ATILF | CNRS – Université de Lorraine) et Henri Vernay
Thèse soutenue le 26 septembre 2015
Sandrine Ollinger
« Le raisonnement analogique en lexicographie, son informatisation et son application au Réseau Lexical du Français. »
Sous la direction d’Alain Polguère (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 15 décembre 2014
Inga Gheorghita
« Construction automatique de hiérarchies sémantiques à partir du Trésor de la Langue Française informatisé (TLFi) : application à l’indexation et la recherche d’images. »
Sous la direction de Jean-Marie Pierrel (ATILF | CNRS – Université de Lorraine)
Thèse soutenue le 17 février 2014
Émilienne-Nadège Mékina
« Description du fang-nzaman, Langue bantoue du gabon : Phonologie et classes nominales. »
Sous la direction de Bernard Combettes (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 15 décembre 2012
Dans le cadre syntaxique, l’identification de différents énoncés, leurs catégories grammaticales et lexicales a contribué à la détermination des classes. Ceci a introduit l’étude du fonctionnement des accords, la distribution des classes, la valeur sémantique des préfixes, l’appariement des classes en opposition singulier/pluriel. La langue s’organise avec des connexions d’unités qui gravitent au tour du noyau central qui peut être : un verbe, un connecteur, une anaphore…En fin le cadre lexical définit un corpus limité de termes qui permet d’éclairer sur le choix des énoncés représentatifs.
Jinjing Wang
« Causes de l’échec d’apprentissage du français par des étudiants chinois en France. »
Sous la direction de Sophie Bailly (ATILF | Université de Lorraine – CNRS) et Francis Carton (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 30 novembre 2012
Aurore Koehl
« La construction morphologique des noms désadjectivaux suffixés en français. »
Sous la direction de Fiammetta Namer (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 30 novembre 2012
Comment détermine-t-on les RCL ? Une première hypothèse est qu’à un exposant formel identifié correspond une RCL à laquelle s’oppose une seconde hypothèse selon laquelle à une seule RCL correspondent plusieurs exposants. Il s’agit de déterminer quelle est l’influence de la valeur des exposants dans le dénombrement des RCL. Cela implique (i) d’étudier les conditions de sélection des bases et (ii) d’étudier les critères aboutissant aux différentes formes de noms désadjectivaux. La première question relève d’une logique liée aux conditions d’application des règles, la seconde relève des motivations du locuteur/scripteur intervenant dans les conditions de concurrence entre les suffixes. Pour chaque suffixation, nous menons une étude sur la disponibilité de chaque suffixe, en comparant les noms contenus dans le Trésor de la langue française et les créations des locuteurs/scripteurs en recourant au corpus électronique du journal Le Monde et à la Toile. Nous étudions également si les RCL subissent d’autres influences que celles des exposants, en analysant les contextes d’apparition des doublons de noms construits sur une même base adjectivale (e.g. tendresse / tendreté).
Parallèlement à cette étude, nous avons créé une base de données morphologique des dérivations d’adjectif à nom (nommée MORDAN) qui enregistre 3750 couples (adjectif, nom) assortis d’informations formelles, sémantiques, historiques et pragmatiques. Chaque nouvelle forme est accompagnée d’un contexte d’apparition qui permet son interprétation. Cette base de données est une ressource libre qui sera mise en ligne à la date de la soutenance.
Lolita Berard
« Dépendances à distance en français contemporain – Étude sur corpus « c’est ce qu’on pense qui devrait être fait ». »
Sous la direction de Jeanne-Marie Debaisieux (ATILF | Université de Lorraine – CNRS) et Henri-José Deulofeu (Université Aix Marseille)
Thèse soutenue le 26 novembre 2012
Notre objectif est de décrire les propriétés syntaxiques, lexicales et sémantico-pragmatiques des constructions comportant des dépendances à distance en français contemporain puis d’en mesurer la fréquence. Une attention particulière est portée aux unités lexicales impliquées. La méthode utilisée est donc corpus-driven. Nous nous appuyons sur des corpus écrits et oraux variés : presse, littérature, forum internet, annonces, écrits scientifiques, discours politiques, échanges entre un ‘visiteur’ et un administratif, conversations du quotidien, entretiens, émissions de radio et de télévision, conversations téléphoniques, échanges entre adultes et enfants, etc. Après avoir décrit les tendances générales, il s’agit de préciser les différences observées selon les types de constructions (complétives et infinitives), de structures (relatives, interrogatives, clivées) et de situations de communication.
Églantine Guély Costa
« Distance transactionnelle et apprentissage autodirigé de langue étrangère avec soutien : ouverture, dialogue, autonomie et appropriation de dispositif de formation. »
Sous la direction de Sophie Bailly (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 5 juillet 2012
Pour cela, elle tente d’appréhender le processus d’appropriation (Paquelin, 2004, 2009) d’un dispositif de formation auto-dirigée de l’anglais (Holec, 1979, 1981, 1988) en s’appuyant sur la perception de l’ouverture (Jézégou, 2004, 2005, 2007, 2010) des acteurs à un moment T de la conception (dispositif prescrit), un moment T de la formation (dispositif perçu des formateurs et personnels), et un moment T de l’apprentissage (dispositif perçu des apprenants), grâce à des données issues de questionnaires, d’entretiens, et de traces d’apprentissage. Ces données sont comparées afin de montrer des mouvements en cours au sein du processus d’appropriation, puis des freins et des leviers sont analysés dans le double mouvement d’appropriation du dispositif et de développement de l’autonomie de l’apprenant. Les résultats tendent à montrer qu’il existe bien une relation de dépendance entre structure, dialogue et autonomie et à en étayer la hiérarchie au sein de ce dispositif particulier, représensatif d’une forme particulière de dispositif ouvert visant l’apprentissage auto-dirigé.
Note : Pour des raisons de confidentialité, le volume d’annexes n’est pas disponible en ligne.
Coralie Reutenauer
« Vers un traitement automatique de la néosémie : approche textuelle et statistique. »
Sous la direction de Jean-Marie Pierrel (ATILF | CNRS – Université de Lorraine), Evelyne Jacquey (ATILF | CNRS – Université de Lorraine) et Mathieu Valette (ATILF | CNRS – Université de Lorraine)
Thèse soutenue le 20 janvier 2012
Nous définissons un modèle théorique sur l’émergence d’un nouveau sens pour une unité lexicale ayant déjà un sens codé. Le phénomène ciblé est la néologie sémantique, ou néosémie, définie comme une variation sémantique marquée en cours de diffusion. Nous la modélisons à partir d’indices quantitatifs articulés à des principes issus de la sémantique textuelle. Le sens codé est représenté
comme un ensemble structuré de traits sémantiques. Il est modulé en discours sous l’effet de récurrences d’autres traits. La dynamique du sens est représentée à l’aide de descripteurs de granularité sémantique variable.
Ensuite, nous proposons des ressources et outils adaptés, relevant de la linguistique de corpus. Les ressources sont de deux types, lexicographiques pour le sens codé et textuelles pour le sens en
discours. En pratique, le Trésor de la Langue Française informatisé fournit les sens codés. Une plateforme transforme ses définitions en ensembles de traits sémantiques. Trois corpus journalistiques des années 2000 servent de ressources textuelles. Les outils mathématiques, essentiellement statistiques, permettent de jouer sur la structure des ressources, d’extraire des unités saillantes et d’organiser l’information.
Enfin, nous établissons les grandes lignes d’une procédure pour allouer de façon semi-automatique un nouveau sens. Elles sont étayées par des expériences illustratives. Le déroulement de la procédure repose sur des niveaux de description de plus en plus fins (domaines, unités lexicales puis traits sémantiques). Il s’appuie sur des jeux de contrastes multiples, permettant de nuancer l’information
sémantique.
Tiphanie Bertin
« Grammaticalisation du langage de l’enfant : processus interactionnel d’appropriation des articles et des clitiques sujets chez des enfants francophones entre 1 et 3 ans. »
Sous la direction de Denis Apothéloz (ATILF | Université de Lorraine – CNRS), Anne-Salazar-Orvig (Université Sorbonne Nouvelle) et d’Emmanuelle Canut (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 3 décembre 2011
Iveta Chovanová
« Morphologie constructionnelle du slovaque et éléments de comparaison avec le français : les adjectifs dénominaux construits par composition et dérivation. »
Sous la direction de Fiammetta Namer (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 2 décembre 2011
► Télécharger la thèse
► Télécharger les annexes
► Télécharger les données
Magali Husianycia
« Caractérisation de types de discours dans des situations de travail. »
Sous la direction de Richard Duda (ATILF | Université de Lorraine – CNRS) et Emmanuelle Canut (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 2 décembre 2011
► Télécharger la thèse
► Télécharger les annexes
► Télécharger le corpus complet
Delphine Beauseroy
« Syntaxe et sémantique des noms abstraits statifs. Des propriétés verbales et adjectivales aux propriétés nominales. »
Sous la direction de Marie-Laurence Knittel (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 5 décembre 2009
Dorota Sikora
« Les verbes de manière de mouvement en polonais et en français. Eléments pour une étude comparée des propriétés structurelles de prédicats. »
Sous la direction de Denis Apothéloz (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le Thèse soutenue le 5 décembre 2009
Ciulla e Silva Alena
« Os processos de referência e suas funções discursivas – o universo literário dos contos. »
Sous la direction de Mônica Magalhães Cavalcante (Universidade Federal do Ceará, Fortaleza, Brasil) et Denis Apothéloz (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 24 avril 2008
Coralie Reutenauer
« Analyse et modélisation sémantiques à partir de ressources lexico-sémantiques. »
Sous le tutorat d’Evelyne Jacquey (ATILF | CNRS – Université de Lorraine), Mathieu Valette (ATILF | CNRS – Université de Lorraine), Jean-Marie Pierrel (ATILF | CNRS – Université de Lorraine) et Pierre Chauvet
Mémoire de stage réalisé en 2008
Sébastien Haton
« Analyse et modélisation de la polysémie verbale dans une perspective multilingue : le dictionnaire bilingue vu dans un miroir. »
Sous la direction de Jean-Marie Pierrel (ATILF | CNRS – Université de Lorraine) et Bernard Combettes (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 25 novembre 2006
Virginie André
« Construction collaborative du discours au sein de réunions de travail en entreprise : de l’analyse micro-linguistique à l’analyse socio-interactionnelle. »
Sous la direction de Philip Riley (Université de Lorraine)
Thèse soutenue le 2 juin 2006