Thèses soutenues
Shuaa Alamri
« L’utilisation des TIC dans le développement de l’aptitude de compréhension orale de futures interprètes arabe-français à l’université du Roi Saoud. »
Sous la direction de Sophie Bailly (ATILF | Université de Lorraine – CNRS) et Maud Ciekanski (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 21 février 2021 | Visioconférence
Selon notre expérience personnelle en tant qu’enseignante à l’Université du Roi Saoud, deux constats peuvent être établis : les étudiantes ont des difficultés à comprendre le sens du message oral et leurs capacités se limitent à une traduction littérale des mots, détachée de la réalité culturelle et contextuelle. L’observation de nombreux malentendus et de quiproquos lors d’échanges avec les étudiantes nous ont ainsi amenée à penser que la formation d’interprétariat dispensée à l’Université du Roi Saoud, pour ce qui est du FLE, ne permettait pas de doter les apprenantes des compétences linguistiques, communicationnelles et contextuelles nécessaires pour être en en mesure de communiquer en situation professionnelle authentique. Ainsi durant notre observation de la réalité sur le terrain d’enseignement au département de français, nous avons constaté que la majorité des étudiantes saoudiennes rencontrent des difficultés en ce qui concerne la compréhension orale. L’objectif de notre recherche de doctorat est de proposer un dispositif TIC adapté à la réalité du métier d’interprétariat car l’analyse des scores obtenus au pré-test et au post-test par les étudiantes en compréhension orale durant notre expérimentation en M2, a permis d’établir l’apport positif de l’utilisation des TIC dans le développement de la compréhension orale en termes d’efficacité (on comprend plus ou mieux) et de rapidité (les progrès sont plus rapides).
La recherche actuelle en didactique des langues a montré l’importance de prendre en compte les contextes sociaux, culturels et éducatifs (CASTELLOTTI et CHALABI 2006). En ce qui concerne l’Arabie Saoudite, il existe dans ce pays de fortes différenciations dans les rôles féminins et masculins. Les sujets et les bénéficiaires de notre étude sont exclusivement des femmes, et nous pensons que ce trait doit être souligné et pris en compte du point de vue théorique. Notamment, en ce qui concerne le rapport aux technologies, plusieurs études ont montré que les femmes en faisaient un usage particulier dans les pays arabes (ALSHAMMRI 2007). De plus, les femmes sont de plus en plus nombreuses à choisir le parcours professionnel de l’interprétariat, qui est actuellement plutôt un métier d’homme en Arabie Saoudite ; ceci a peut-être des répercussions sur le métier d’interprète, dont il faudra tenir compte dans le cadre de la formation.
Marie Flesch
« Langue d’internet et genre : étude du corpus du site web communautaire Reddit. »
Sous la direction de Sophie Bailly (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 16 décembre 2020 | Visioconférence
Si le site internet Reddit a été choisi pour cette thèse, c’est parce qu’il s’impose comme un des espaces d’expression privilégiés de la langue d’internet, de par, tout d’abord, la liberté dont jouissent ses utilisateurs. Les « Redditeurs » s’expriment ainsi bien souvent dans une langue informelle, et généralement dans l’anonymat total, sur des dizaines de milliers de forums auto-modérés. Reddit est également un objet d’étude intéressant parce que la plateforme a connu une croissance fulgurante depuis sa création en 2005, pour devenir, en novembre 2016, le septième site le plus visité aux Etats-Unis.
Autoproclamé « première page d’internet », Reddit est aujourd’hui un véritable phénomène de société, à la fois théâtre d’échanges passionnés, terreau fertile à l’explosion de scandales, espace d’accueil des contenus les plus provocateurs du web, et outil de communication utilisé par les personnalités politiques. La plateforme, dominée par les hommes depuis sa création, est par ailleurs en pleine mutation : le profond fossé entre les sexes, caractéristique des forums de discussion en ligne, est en train de se combler, les femmes investissant de plus en plus le site.
Pour étudier la relation entre langue et genre sur Reddit, un corpus de plus de 10 millions de mots sera construit, qui rassemblera les contributions de plusieurs centaines d’utilisateurs ayant indiqué le genre auquel ils s’identifient. Une approche « corpus-driven » sera adoptée. Au travers d’analyses quantitatives et qualitatives, la thèse explorera les différences d’utilisations entre les genres et les variations à l’intérieur de chaque groupe. Elle se penchera également sur la façon dont d’autres facteurs démographiques et contextuels interagissent avec l’identité sexuée des Redditeurs dans la production d’éléments typiques du « Netspeak ». Elle tentera enfin d’esquisser les éventuelles évolutions de la langue d’internet, et de dégager les implications sociales qui se dessinent dans les résultats de l’analyse du corpus, à l’échelle de Reddit, d’internet, et de la société.
► Page perso : http://mflesch.weebly.com/
Anouchka Divoux
« Analyse linguistique, praxéologique et socio-interactionnelle de la question en réunion de travail. »
Sous la direction de Virginie André (ATILF | Université de Lorraine – CNRS) et Hervé Adami (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 7 décembre 2020 | Visioconférence
Les recherches de Kerbrat-Orecchioni (1991, 2008) ont permis de montrer la variabilité illocutoire de la question : les questions peuvent ainsi revêtir une autre valeur que la demande d’information. Cette variabilité illocutoire des questions est intrinsèquement liée à la situation de communication. En effet, les pratiques langagières sont engagées dans un système d’inter-influences (André, 2006) mettant en jeu l’activité langagière, la situation de communication mais aussi le genre de discours. Il est donc nécessaire de s’interroger sur la place du langage au travail pour comprendre le rôle des questions en réunion.
Le langage au travail revêt deux valeurs principales : une valeur praxéologique (Zarifian, 1999 ; Filliettaz et de Saint Georges, 2009 ; Borzeix, 2015) permettant la réalisation de l’activité, mais aussi une valeur relationnelle permettant le marquage des relations (Girin, 1990 ; Filliettaz et de Saint Georges, 2009) que celles-ci soient horizontales ou verticales (Kerbrat-Orecchioni, 2004). Ainsi, les deux valeurs du langage au travail se retrouvent dans l’usage de la question. L’acte de questionnement peut par exemple servir à faciliter l’intercompréhension, répartir les tâches mais aussi à mettre en difficulté un interlocuteur ou exposer son expertise de manière détournée.
Avec cette thèse, nous chercherons à découvrir quels éléments extralinguistiques influencent la production de questions en réunion de travail en nous intéressant plus particulièrement au statut, au rôle interactionnel mais aussi au genre des locuteurs. Par ailleurs, à partir d’un corpus de réunions de travail, nous tenterons de décrire finement ce qui constitue une question à l’oral.
Anaïs Carnet
Thèse soutenue le 30 novembre 2020 | Visioconférence
« L’utilisation des séries télévisées dans l’apprentissage de la consultation pour les étudiants de médecine français. »
Sous la direction d’Alex Boulton (ATILF | Université de Lorraine – CNRS)
Les futurs professionnels de santé seront confrontés tôt ou tard à des patients ne parlant pas français – pendant leurs stages pratiques à l’hôpital durant leurs études, pendant un stage qu’ils effectueront à l’étranger, ou lorsqu’ils seront en poste en tant que professionnels de santé. Il est donc nécessaire de préparer ces étudiants en leur donnant des clefs stratégiques communicatives qui leur permettront de mener à bien une consultation en anglais. Ainsi, il semble primordial de réfléchir à la langue en tant qu’objet d’enseignement dans les facultés de médecine, afin de permettre aux étudiants d’acquérir les outils linguistiques dont ils auront besoin dans leur future carrière professionnelle.
La mise en place de la recherche-action consiste en la comparaison de deux dispositifs d’enseignement différents afin d’évaluer lequel semble le plus à même d’amener les étudiants vers l’autonomie communicationnelle visée. Ces programmes seront essentiellement suivis par des étudiants souhaitant partir étudier un an à la faculté de médecine de Leeds, Angleterre. Il conviendra donc d’analyser lequel de ces programmes est le plus pertinent pour répondre à leur projet, en s’interrogeant sur la validité de chacun des deux programmes.
Trois groupes d’une quinzaine d’étudiants volontaires (2° & 3° années) seront créés, au sein desquels les étudiants seront répartis de manière aléatoire. Le premier groupe suivra un enseignement composé de documents traditionnels (vidéos et documents audio didactisés) et servira de groupe de contrôle. Les deux autres groupes suivront le même programme, mais les documents traditionnels seront remplacés par des extraits de séries télévisées ; le premier groupe bénéficiera d’un enseignement utilisant uniquement la série House, M.D., tandis que l’autre groupe travaillera sur des extraits de séries généralistes (The Walking Dead, Friends, The Big Bang Theory…). L’intégralité des documents et extraits sélectionnés seront soumis à un panel de professionnels de santé afin d’en vérifier les faits médicaux. Trois corpus distincts seront créés. Tout d’abord, en étudiant les documents du premier groupe, nous pourrons créer une banque de données qui viendra révéler les besoins langagiers des étudiants dans le domaine de la consultation. En parallèle, la transcription des extraits de séries permettra de créer deux autres corpus : le premier correspondant à de l’anglais médical et le deuxième à de l’anglais plus informel.
Les données de l’étude seront collectées et analysées grâce à différents outils. Pour les mesures qualitatives, les questionnaires ainsi que les entretiens seront utilisés. L’observation directe sera également employée dans le but de ne pas impacter le déroulement de l’étude. Il est également prévu d’évaluer les étudiants en situation. Grâce à la participation d’étudiants étrangers présents sur le campus, nous pourrons envisager d’organiser des mises en situation, en face à face, lors desquelles les étudiants de médecine devront utiliser toutes les connaissances acquises lors des cours d’anglais pour mener à bien une consultation face à un patient qu’ils ne connaissent pas et dans une situation non préparée à l’avance. Il est envisagé de filmer puis transcrire le dialogue afin de mesurer l’authenticité de cet échange, et de le comparer aux corpus précédemment créés.
Hazem Al Saied
« Analyse automatique par transitions pour l’identification des expressions polylexicales. »
Sous la direction de Mathieu Constant (ATILF | Université de Lorraine – CNRS) et Marie Candito (Université Paris-Diderot)
Thèse soutenue le 20 décembre 2019 à Nancy (Campus Lettres et Sciences Humaines | Bâtiment A | Salle A104)
La tâche d’identification d’EPs consiste à annoter en contexte les occurrences d’EPs dans des textes, i.e à détecter les ensembles de tokens formant de telles occurrences. Par exemple, dans la phrase « Cette série ne vit finalement jamais le jour. », les tokens « vit », « le » et « jour » seraient marqués comme formant une occurrence de l’EP « voir le jour ». La tâche est formellement complexe, dans la mesure où une EP peut être discontinue et un token peut appartenir à plusieurs EPs.
L’analyse par transitions est une approche célèbre qui construit une sortie structurée à partir d’une séquence d’éléments, en appliquant une séquence d’actions (appelées « transitions ») choisies parmi un ensemble prédéfini, pour construire incrémentalement la structure de sortie. L’utilisation de l’apprentissage automatique permet d’optimiser un classifieur pour réaliser le choix de la transition à opérer à chaque étape, et ainsi choisir au final une structure de sortie parmi un ensemble en général très grand de structures possibles.
Dans cette thèse, nous proposons un système par transitions dédié à l’identification des EPs au sein de phrases représentées comme des séquences de tokens, et étudions diverses architectures pour le classifieur qui sélectionne les transitions à appliquer, permettant de construire l’analyse de la phrase. La première variante de notre système utilise un classifieur linéaire de type machine à vecteur support (SVM). Les variantes suivantes utilisent des modèles neuronaux : un simple perceptron multicouche (MLP), puis des variantes intégrant une ou plusieurs couches récurrentes.
Le scénario privilégié est une identification d’EPs n’utilisant pas d’informations syntaxiques, alors même que l’on sait les deux tâches liées. Nous étudions ensuite une approche par apprentissage multitâche, réalisant et mettant à profit conjointement l’étiquetage morphosyntaxique, l’identification des EPs par transitions et l’analyse syntaxique en dépendances par transitions.
La thèse comporte une partie expérimentale importante. Nous avons d’une part étudié quelles techniques de ré-échantillonnage des données permettent une bonne stabilité de l’apprentissage malgré des initialisations aléatoires. D’autre part nous avons proposé une méthode de réglage des hyperparamètres de nos modèles par analyse de tendances au sein d’une recherche aléatoire de combinaison d’hyperparamètres. Nous produisons des systèmes avec la contrainte d’utiliser le même hyperparamétrage pour différentes langues. Nous utilisons en effet de manière privilégiée les données des deux compétitions internationales PARSEME (1.0 et 1.1), contenant des annotations d’EPs verbales pour 18 et 20 langues.
Nos variantes produisent de très bons résultats, et notamment les scores d’état de l’art pour de nombreuses langues des jeux de données PARSEME 1.0 et 1.1. L’une des variantes s’est classée première pour la plupart des langues lors de la campagne PARSEME 1.0. Comparées aux autres méthodes de la littérature, nos variantes MLP et SVM montrent une bonne performance en particulier pour les EPs discontinues ou les EPs correspondant à des variantes d’occurrences vues à l’apprentissage. Mais comme les autres systèmes, nos modèles ont des performances faibles sur les EPs non vues à l’apprentissage. Nous constatons cela dit que les variantes récurrentes et notre approche multitâche ont des performances globales peu compétitives, mais prometteuses pour ce qui est des EPs inconnues. Ceci suggère que l’accent doit être mis sur la découverte d’EPs utilisant des données non annotées en grosse quantité.
Mots clés :
Expressions polylexicales, Identification des expressions polylexicales, Analyse par transitions, Modèles linéaires, Modèles neuronaux, Réglage d’hyperparamètres de tendances, Classification avec données déséquilibrées
Marine Borel
« Les formes verbales surcomposées en français. »
Sous la direction de Denis Apothéloz (ATILF | Université de Lorraine – CNRS) et Françoise Revaz (Université de Fribourg)
Thèse soutenue le 7 juin 2019 à Fribourg (Université de Fribourg | Faculté des Lettres | Salle du Sénat)
Il existe, en français, neuf formes surcomposées, qui sont toutes attestées dans la littérature francophone : un infinitif (avoir eu chanté), un participe (ayant eu chanté), deux formes au subjonctif (que j’aie eu chanté, que j’eusse eu chanté) et cinq formes à l’indicatif (j’ai eu chanté, j’avais eu chanté, j’eus eu chanté, j’aurai eu chanté et j’aurais eu chanté). Seul l’impératif surcomposé (*Aie eu chanté !) n’est pas attesté.
Les premières formes surcomposées semblent être apparues dans la langue française à la fin du XIIe siècle. Depuis cette époque, elles sont attestées sans discontinuer jusqu’à l’époque moderne, et l’on trouve des attestations de ces formes dans tous les types de textes, aussi bien littéraires ou épistolaires que juridiques ou journalistiques.
C’est à l’analyse, notamment morphologique et sémantique, de ces formes surcomposées que je consacre mon projet de thèse. Mon but est de parvenir à comprendre et à décrire très précisément le sens de chacune de ces neuf formes surcomposées ainsi que les fonctions qu’elles remplissent dans la langue française. Pour mener à bien cette recherche, d’ordre qualitatif, je travaille sur des données réelles, que j’ai recueillies et référencées. Le corpus sur lequel se base ma recherche est actuellement composé de plus de 4000 occurrences authentiques, datant de toutes les époques et provenant de tous les types de textes.
Lorraine Vézy De Beaufort
« Learning French in Hong Kong : A sociocultural and narrative perspective on language learner identity in the context of globalization. »
Sous la direction de Dominique Macaire (ATILF | Université de Lorraine – CNRS) et John Trent (EdUHK)
Thèse soutenue le 10 mai 2019
À la différence de l’anglais qui est une langue obligatoire à Hong Kong dès le plus jeune âge, le français ne l’est pas. S’il existe un grand nombre d’études à Hong Kong liées à l’apprentissage de l’anglais et du mandarin, il en existe peu sur des langues que je qualifierai de ‘langues additionelles’ (voir pour commentaire Hammarberg 2011; Jessner 2008) pour ce contexte.
L’étude s’attache à commenter la construction de l’identité liée à l’aprentissage du français à travers ce que Lemke (2000) appelle le multi-timescale dynamical system qui consiste à appréhender la construction de l’identité en tant qu’ensemble de procédés complexes, simultanés et complémentaires à différentes échelles de temps et d’espace (Blommaert 2007, 2010 ; Wortham, 2005) en relation avec l’environnement socioculturel immédiat et avec l’imaginaire (voir Kanno & Norton 2003 ; Ryan & Irie 2014) ainsi qu’avec les idéologies sociales (Heller 2007 ; Blommaert and Rampton 2011) et les pratiques de la langue (Pennycook 2010).
La thèse s’adosse à une étude qui consiste à « penser par cas» (Passeron et Revel, 2005) soit, à la compréhension de vrais individus dans leur milieu social et non pas d’individus conceptualisés (Ushioda 2012; Block, 2003; Lantolf & Thorne, 2006). Pour se faire, elle engage une approche méthodologique connue sous le nom de narrative inquiry (voir Barkhuizen et al. 2014 ; Clandinin, 2013), de type ‘études de récits’.
L’étude apporte des éléments sur la compréhension de la fluidité (Plivart, 2010 ; Dervin, 2011) en contexte de superdiversity (voir Blommaert 2010 ; Pennycook, 2010 ; Macaire, 2015) et propose une réflexion sur la ‘multidimentionalité’ sociale (Clark 2010) de l’apprenant. A travers l’éclairage qu’elle apporte, elle convoque également une réflexion sur l’éducation interculturelle en situation multilingue.
Sarah Kremer
« La réalisation matérielle du Französisches Etymologisches Wörterbuch. Impact de la mise en forme typographique sur le développement d’un projet lexicographique. »
Sous la direction de Yan Greub (ATILF | CNRS – Université de Lorraine) et Alice Savoie (ANRT | ENSAD Nancy)
Thèse soutenue le 20 décembre 2018 à Nancy (ATILF | Salle Imbs)
L’objet de cette thèse consiste dans l’étude de la réalisation matérielle du FEW, en particulier sa typographie, des premières publications d’articles en 1922 jusqu’à leur diffusion actuelle sous une forme uniquement numérique. L’étude s’appuie pour cela sur une analyse des évolutions de la présentation du dictionnaire en abordant ses changements, d’ordre lexicographique mais aussi technique. Cette analyse est complétée par l’observation d’une série d’autres dictionnaires dont la mise en forme typographique est remarquable. La thèse participe ainsi à mettre en évidence la manière dont le FEW est un objet lexicographique unique.
Le résultat concret de la thèse correspond à la création d’une famille de caractères adaptée aux usages du FEW. Ces polices sont exploitées au sein de deux interfaces : la première accompagne les rédacteurs du FEW lors de l’élaboration de nouveaux articles, la seconde permet aux utilisateurs de consulter et d’interagir avec la base de données du FEW informatisé. Issue d’une collaboration entre linguistes, informaticiens et designers, cette thèse propose un modèle d’intégration du design typographique au sein des humanités numériques.
Élisabeth Berchtold
« Dictionnaire de l’ancien francoprovençal : conception d’un projet lexicographique et réalisation sectorielle. »
Sous la direction de Yan Greub (ATILF | CNRS – Université de Lorraine) et Andres Kristol (Université de Neuchâtel)
Thèse soutenue le 19 décembre 2018 à l’Université de Neuchâtel
Les sources en francoprovençal sont relativement peu nombreuses parce que cette langue a été de tout temps confiné à un usage essentiellement oral. La littérature ancienne se borne à quelques textes d’édification et un traité juridique, surtout des traductions. À partir du XVIe siècle se développe une littérature en patois le plus souvent fortement ancrée localement. Les auteurs qui voulaient toucher un publique plus large ont très tôt opté pour le français. Les sources documentaires sont plus nombreuses, mais très inégalement réparties dans l’espace. Les sources issues de la partie française du domaine ont pour la plupart été éditées, mais beaucoup d’entre elles sont difficilement exploitables en l’absence de glossaires. La situation est plus favorable en Suisse romande où le Glossaire des patois de la Suisse romande (Gl.) documente non seulement les dialectes modernes, mais aussi leurs états anciens. Pour cette raison nous nous sommes concentrée sur la partie française du domaine et nous nous sommes basée sur le Gl. pour la partie suisse. En collaboration avec une autre doctorante, Laure Grüner, nous avons rassemblé les sources intéressantes pour l’étude de l’ancien francoprovençal de France et nous avons procédé à des dépouillements étendus.
Sur cette base, nous avons élaboré un modèle de description lexicographique adapté à l’ancien francoprovençal et nous avons rédigé la tranche f de ce Dictionnaire de l’ancien francoprovençal, qui représente environ un vingtième du dictionnaire complet, afin de prouver la faisabilité du projet et d’évaluer son apport à la connaissance de l’ancien francoprovençal. Plus de la moitié de nos articles documentent des unités lexicales qui n’étaient pas encore attestées en ancien francoprovençal de France dans le FEW et dans une bonne partie des autres cas nous pouvons compléter les matériaux. Sur la base des 386 articles rédigés, nous évaluons la nomenclature complète du dictionnaire à 7’500 articles et le temps de rédaction à une bonne douzaine d’années de travail d’une personne à temps plein. Nous avons aussi envisagé plusieurs possibilités pour obtenir des résultats tangibles dans des délais plus courts.
Bianca Mertens
« Figement et renouvellement du lexique protoroman : recherches sur la création lexicale. »
Sous la direction d’Eva Buchi (ATILF | CNRS – Université de Lorraine) et Marie-Guy Boutier (Université de Liège)
Thèse soutenue le 20 janvier 2018
Marie-Sophie Pausé
« Structure lexico-syntaxique des locutions du français et incidence sur leur combinatoire. »
Sous la direction d’Alain Polguère (ATILF | Université de Lorraine – CNRS) et Sylvain Kahane (Université Paris Nanterre)
Thèse soutenue le 3 novembre 2017
Notre hypothèse est qu’une description des locutions combinant à la fois l’identification des unités lexicales qui les composent, et à la fois les relations de dépendance syntaxique qui unissent les unités constituantes, permettra de prédire leurs différents emplois possibles en discours. Une telle description n’est possible que dans un modèle du lexique décrivant précisément la combinatoire des lexèmes.
L’objectif de notre thèse est de développer un modèle de description lexicographique des locutions vérifiant cette hypothèse et applicable au TAL et à la didactique. Notre recherche, basée sur les principes de la Lexicologie Explicative et Combinatoire (Clas et coll. 1995), exploitera et enrichira les données du Réseau Lexical du Français (RL-fr) (Lux-Pogodalla et Polguère 2011), ressource en cours de développement à l’ATILF. Notre travail visera dans un premier temps à affiner la classification des locutions selon les variations qu’elles admettent ou non dans les corpus. Dans un second temps, il s’agira de coupler les structures lexico-syntaxiques (association d’un patron syntaxique à des unités lexicales) des locutions à des arbres de dépendance, nous permettant de rentre compte de la structure syntaxique des locutions non linéarisée, et ainsi d’ouvrir aux différents agencements possibles des unités constituantes.
Kim Mi Hyun
« Étude contrastive de la phraséologie des noms d’éléments du corps en français et coréen. »
Sous la direction d’Alain Polguère (ATILF | Université de Lorraine – CNRS) et Seong Heon Lee (Université Nationale de Séoul)
Thèse soutenue le 17 février 2017
L’hypothèse de notre travail est que la comparaison de la lexicalisation des NÉC dans les deux langues – le français et le coréen – va montrer, bien évidemment, de nettes différences de conceptualisation du corps dans les deux cultures correspondantes, mais que la comparaison des collocations contrôlées par les NÉC va mettre en lumière des écarts beaucoup plus variés, liés à la conceptualisation des fonctions pratiques et sociales des entités physiques que les NÉC dénotent. Ce travail approfondira un phénomène de la collocation à la fois générique et spécifique.
À partir de nos hypothèses de départ, notre thèse se divisera en deux grandes parties. Dans la première partie, nous allons comparer la structuration des lexiques français et coréen des NÉC. Nous supposerons plusieurs cas logiques de (non-)correspondances entre les deux langues. Nous utiliserons le Natural Semantic Metalanguage ou NSM (Wierzbicka 1996) pour la comparaison sémantique des lexiques des NÉC en français et coréen. Dans la seconde partie, nous allons tout d’abord établir la liste des collocations dont la base est un NÉC. Nous définissons la collocation comme un phrasème particulier, fondé sur une relation de combinatoire restreinte entre deux unités lexicales. Nous allons ensuite comparer les collocations du français et coréen, pour chaque NÉC. La correspondance de la collocation entre deux langues est variée. À cette étape de la comparaison, nous allons utiliser un encodage des collocations fondé sur le système formel des Fonctions Lexicales de la théorie Sens-Texte (Mel’čuk 2001), en nous appuyant sur la base Réseau Lexical Français ou RLF(Lux-Pogodalla et Polguère 2011) et sur un échantillon de base du coréen, Réseau Lexical Coréen ou RLC, que nous développerons. Nous allons utiliser non seulement les fonctions lexicale dites standards, mais aussi les fonctions lexicale non standards.
Guillaume Nassau
« Les émotions en entretien de conseil dans un dispositif d’apprentissage de langue auto-dirigé : une analyse des interactions entre apprenant et conseillère. »
Sous la direction de Sophie Bailly (ATILF | Université de Lorraine – CNRS) et Virginie André (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 8 novembre 2016
Capucine Herbert
« Les récits de voyages du XIVe et du XVe siècles lemmatisés : apports lexicographiques au Dictionnaire du moyen français. »
Sous la direction de Sylvie Bazin (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 26 février 2016
L’étude des récits de voyages des XIVe et XVe siècles permet donc à travers l’étude de la langue, le moyen français, d’accéder à la perception qu’avaient du monde ces voyageurs.
Notre travail consistera tout d’abord en l’élaboration d’un lexique de ces récits, qui viendra compléter le Dictionnaire du moyen français, puis en l’étude lexicale et sémantique des vocables français liés à la topographie, ce qui devrait permettre de comprendre la perception du relief chez les voyageurs de la fin du Moyen Âge.
Kyuma Bernard Nzuki
« Les causes de l’abandon de l’étude du français au Kenya : étude didactique et sociolinguistique. »
Sous la direction de Sophie Bailly (ATILF | Université de Lorraine – CNRS) et Francis Carton (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 17 décembre 2015
Étant en cotutelle entre la France et le Kenya, ce travail de thèse se réalisera essentiellement grâce à une enquête de terrain au Kenya qui permettra de recueillir des informations auprès des acteurs éducatifs, des apprenants jeunes et adultes, des parents d’élèves et du monde de l’entreprise. Les informations recueillies constitueront ainsi une base de données statistiques et aussi qualitatives. Les grandes lignes de l’enquête se réaliseraient auprès des questionnaires et aussi d’une observation des cours afin d’analyser des méthodes utilisées / ou faire une étude comparative et éventuellement, c’est-à-dire aller en personne dans les salles classe pour confirmer/voir les stratégies que les enseignants utilisent pour que nous puissions accomplir une étude pratique.
A l’issue de cette recherche, nous devrions pouvoir mieux comprendre les interactions entre l’apprenant de langue étrangère et les contextes micro, méso et macro (la classe, l’école, la famille et la société) et leur rôle dans le processus qui mène à l’abandon de l’étude d’une langue étrangère. Concernant l’étude du français, la compréhension de ce processus permettrait de penser des solutions didactiques susceptibles de favoriser sa promotion et sa diffusion.
Laure Budzinski
« Dictionnaire historique et étymologique de la terminologie linguistique française. »
Sous la direction d’Eva Buchi (ATILF | CNRS – Université de Lorraine) et Yan Greub (ATILF | CNRS – Université de Lorraine)
Thèse soutenue le 30 novembre 2015
La thèse pourra contribuer à un progrès méthodologique dans un secteur faible de la science étymologique, progrès d’autant plus significatif que celui-ci est crucial pour notre connaissance du fonctionnement actuel de la création lexicale en français.
Élaborer un dictionnaire historique et étymologique de la terminologie de la linguistique nécessitera d’en reconsidérer l’ensemble des représentations dans les grands monuments étymologiques, afin d’identifier les lacunes à combler. Ainsi, un des premiers aspects de notre travail consistera à représenter le plus largement possible tous les sémantismes n’ayant pas été distinguée par les principaux dictionnaires étymologiques comme le FEW, Dauzat, Bloch & Wartburg ou le TLF. Le deuxième aspect de notre travail consistera en une analyse détaillée de l’origine des lexèmes étudiés, afin de vérifier dans quel cas il y a eu emprunt, calque ou construction française. Le troisième aspect de notre travail sera d’exploiter les données du dictionnaire pour un regard synthétique sur la constitution de la terminologie linguistique française : quel est le pourcentage de créations internes et d’emprunts ? Quels sont les patterns de formation les plus utilisés ? Quelle part de la science considérée comme établie est‐elle vraiment sûre ?
Fabien Python
« La duplicité du vocabulaire français. Étude des doublets étymologiques relevant de la dichotomie populaire/savant. »
Sous la direction d’Eva Buchi (ATILF | CNRS – Université de Lorraine) et Henri Vernay
Thèse soutenue le 26 septembre 2015
Sandrine Ollinger
« Le raisonnement analogique en lexicographie, son informatisation et son application au Réseau Lexical du Français. »
Sous la direction d’Alain Polguère (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 15 décembre 2014
Émilienne-Nadège Mékina
« Description du fang-nzaman, Langue bantoue du gabon : Phonologie et classes nominales. »
Sous la direction de Bernard Combettes (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 15 décembre 2012
Dans le cadre syntaxique, l’identification de différents énoncés, leurs catégories grammaticales et lexicales a contribué à la détermination des classes. Ceci a introduit l’étude du fonctionnement des accords, la distribution des classes, la valeur sémantique des préfixes, l’appariement des classes en opposition singulier/pluriel. La langue s’organise avec des connexions d’unités qui gravitent au tour du noyau central qui peut être : un verbe, un connecteur, une anaphore…En fin le cadre lexical définit un corpus limité de termes qui permet d’éclairer sur le choix des énoncés représentatifs.
Jinjing Wang
« Causes de l’échec d’apprentissage du français par des étudiants chinois en France. »
Sous la direction de Sophie Bailly (ATILF | Université de Lorraine – CNRS) et Francis Carton (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 30 novembre 2012
Aurore Koehl
« La construction morphologique des noms désadjectivaux suffixés en français. »
Sous la direction de Fiammetta Namer (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 30 novembre 2012
Comment détermine-t-on les RCL ? Une première hypothèse est qu’à un exposant formel identifié correspond une RCL à laquelle s’oppose une seconde hypothèse selon laquelle à une seule RCL correspondent plusieurs exposants. Il s’agit de déterminer quelle est l’influence de la valeur des exposants dans le dénombrement des RCL. Cela implique (i) d’étudier les conditions de sélection des bases et (ii) d’étudier les critères aboutissant aux différentes formes de noms désadjectivaux. La première question relève d’une logique liée aux conditions d’application des règles, la seconde relève des motivations du locuteur/scripteur intervenant dans les conditions de concurrence entre les suffixes. Pour chaque suffixation, nous menons une étude sur la disponibilité de chaque suffixe, en comparant les noms contenus dans le Trésor de la langue française et les créations des locuteurs/scripteurs en recourant au corpus électronique du journal Le Monde et à la Toile. Nous étudions également si les RCL subissent d’autres influences que celles des exposants, en analysant les contextes d’apparition des doublons de noms construits sur une même base adjectivale (e.g. tendresse / tendreté).
Parallèlement à cette étude, nous avons créé une base de données morphologique des dérivations d’adjectif à nom (nommée MORDAN) qui enregistre 3750 couples (adjectif, nom) assortis d’informations formelles, sémantiques, historiques et pragmatiques. Chaque nouvelle forme est accompagnée d’un contexte d’apparition qui permet son interprétation. Cette base de données est une ressource libre qui sera mise en ligne à la date de la soutenance.
Lolita Berard
« Dépendances à distance en français contemporain – Étude sur corpus « c’est ce qu’on pense qui devrait être fait ». »
Sous la direction de Jeanne-Marie Debaisieux (ATILF | Université de Lorraine – CNRS) et Henri-José Deulofeu (Université Aix Marseille)
Thèse soutenue le 26 novembre 2012
Notre objectif est de décrire les propriétés syntaxiques, lexicales et sémantico-pragmatiques des constructions comportant des dépendances à distance en français contemporain puis d’en mesurer la fréquence. Une attention particulière est portée aux unités lexicales impliquées. La méthode utilisée est donc corpus-driven. Nous nous appuyons sur des corpus écrits et oraux variés : presse, littérature, forum internet, annonces, écrits scientifiques, discours politiques, échanges entre un ‘visiteur’ et un administratif, conversations du quotidien, entretiens, émissions de radio et de télévision, conversations téléphoniques, échanges entre adultes et enfants, etc. Après avoir décrit les tendances générales, il s’agit de préciser les différences observées selon les types de constructions (complétives et infinitives), de structures (relatives, interrogatives, clivées) et de situations de communication.
Églantine Guély Costa
« Distance transactionnelle et apprentissage autodirigé de langue étrangère avec soutien : ouverture, dialogue, autonomie et appropriation de dispositif de formation. »
Sous la direction de Sophie Bailly (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 5 juillet 2012
Pour cela, elle tente d’appréhender le processus d’appropriation (Paquelin, 2004, 2009) d’un dispositif de formation auto-dirigée de l’anglais (Holec, 1979, 1981, 1988) en s’appuyant sur la perception de l’ouverture (Jézégou, 2004, 2005, 2007, 2010) des acteurs à un moment T de la conception (dispositif prescrit), un moment T de la formation (dispositif perçu des formateurs et personnels), et un moment T de l’apprentissage (dispositif perçu des apprenants), grâce à des données issues de questionnaires, d’entretiens, et de traces d’apprentissage. Ces données sont comparées afin de montrer des mouvements en cours au sein du processus d’appropriation, puis des freins et des leviers sont analysés dans le double mouvement d’appropriation du dispositif et de développement de l’autonomie de l’apprenant. Les résultats tendent à montrer qu’il existe bien une relation de dépendance entre structure, dialogue et autonomie et à en étayer la hiérarchie au sein de ce dispositif particulier, représensatif d’une forme particulière de dispositif ouvert visant l’apprentissage auto-dirigé.
Note : Pour des raisons de confidentialité, le volume d’annexes n’est pas disponible en ligne.
Coralie Reutenauer
« Vers un traitement automatique de la néosémie : approche textuelle et statistique. »
Sous la direction de Jean-Marie Pierrel (ATILF | CNRS – Université de Lorraine), Evelyne Jacquey (ATILF | CNRS – Université de Lorraine) et Mathieu Valette (ATILF | CNRS – Université de Lorraine)
Thèse soutenue le 20 janvier 2012
Nous définissons un modèle théorique sur l’émergence d’un nouveau sens pour une unité lexicale ayant déjà un sens codé. Le phénomène ciblé est la néologie sémantique, ou néosémie, définie comme une variation sémantique marquée en cours de diffusion. Nous la modélisons à partir d’indices quantitatifs articulés à des principes issus de la sémantique textuelle. Le sens codé est représenté
comme un ensemble structuré de traits sémantiques. Il est modulé en discours sous l’effet de récurrences d’autres traits. La dynamique du sens est représentée à l’aide de descripteurs de granularité sémantique variable.
Ensuite, nous proposons des ressources et outils adaptés, relevant de la linguistique de corpus. Les ressources sont de deux types, lexicographiques pour le sens codé et textuelles pour le sens en
discours. En pratique, le Trésor de la Langue Française informatisé fournit les sens codés. Une plateforme transforme ses définitions en ensembles de traits sémantiques. Trois corpus journalistiques des années 2000 servent de ressources textuelles. Les outils mathématiques, essentiellement statistiques, permettent de jouer sur la structure des ressources, d’extraire des unités saillantes et d’organiser l’information.
Enfin, nous établissons les grandes lignes d’une procédure pour allouer de façon semi-automatique un nouveau sens. Elles sont étayées par des expériences illustratives. Le déroulement de la procédure repose sur des niveaux de description de plus en plus fins (domaines, unités lexicales puis traits sémantiques). Il s’appuie sur des jeux de contrastes multiples, permettant de nuancer l’information
sémantique.
Tiphanie Bertin
« Grammaticalisation du langage de l’enfant : processus interactionnel d’appropriation des articles et des clitiques sujets chez des enfants francophones entre 1 et 3 ans. »
Sous la direction de Denis Apothéloz (ATILF | Université de Lorraine – CNRS), Anne-Salazar-Orvig (Université Sorbonne Nouvelle) et d’Emmanuelle Canut (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 3 décembre 2011
Iveta Chovanová
« Morphologie constructionnelle du slovaque et éléments de comparaison avec le français : les adjectifs dénominaux construits par composition et dérivation. »
Sous la direction de Fiammetta Namer (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 2 décembre 2011
► Télécharger la thèse
► Télécharger les annexes
► Télécharger les données
Magali Husianycia
« Caractérisation de types de discours dans des situations de travail. »
Sous la direction de Richard Duda (ATILF | Université de Lorraine – CNRS) et Emmanuelle Canut (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 2 décembre 2011
► Télécharger la thèse
► Télécharger les annexes
► Télécharger le corpus complet
Delphine Beauseroy
« Syntaxe et sémantique des noms abstraits statifs. Des propriétés verbales et adjectivales aux propriétés nominales. »
Sous la direction de Marie-Laurence Knittel (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 5 décembre 2009
Dorota Sikora
« Les verbes de manière de mouvement en polonais et en français. Eléments pour une étude comparée des propriétés structurelles de prédicats. »
Sous la direction de Denis Apothéloz (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le Thèse soutenue le 5 décembre 2009
Ciulla e Silva Alena
« Os processos de referência e suas funções discursivas – o universo literário dos contos. »
Sous la direction de Mônica Magalhães Cavalcante (Universidade Federal do Ceará, Fortaleza, Brasil) et Denis Apothéloz (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 24 avril 2008
Coralie Reutenauer
« Analyse et modélisation sémantiques à partir de ressources lexico-sémantiques. »
Sous le tutorat d’Evelyne Jacquey (ATILF | CNRS – Université de Lorraine), Mathieu Valette (ATILF | CNRS – Université de Lorraine), Jean-Marie Pierrel (ATILF | CNRS – Université de Lorraine) et Pierre Chauvet
Mémoire de stage réalisé en 2008
Sébastien Haton
« Analyse et modélisation de la polysémie verbale dans une perspective multilingue : le dictionnaire bilingue vu dans un miroir. »
Sous la direction de Jean-Marie Pierrel (ATILF | CNRS – Université de Lorraine) et Bernard Combettes (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 25 novembre 2006
Virginie André
« Construction collaborative du discours au sein de réunions de travail en entreprise : de l’analyse micro-linguistique à l’analyse socio-interactionnelle. »
Sous la direction de Philip Riley (Université de Lorraine)
Thèse soutenue le 2 juin 2006