Thèses soutenues

Thèses soutenues

Hazem Al Saied

« Analyse automatique par transitions pour l’identification des expressions polylexicales. »
Sous la direction de Mathieu Constant (ATILF | Université de Lorraine – CNRS) et Marie Candito (Université Paris-Diderot)
Thèse soutenue le 20 décembre 2019 à Nancy (Campus Lettres et Sciences Humaines | Bâtiment A | Salle A104)

Résumé
Cette thèse porte sur l’identification des expressions polylexicales, abordée au moyen d’une analyse par transitions. Une expression polylexicale (EP) est une construction linguistique composée de plusieurs éléments dont la combinaison montre une irrégularité à un ou plusieurs niveaux linguistiques : morphologique (« grand-mère »), syntaxique (« bel et bien »), sémantique (« carte bleue ») ou pragmatique (« à table »), qui confère à l’expression un statut d’unité lexicale.

La tâche d’identification d’EPs consiste à annoter en contexte les occurrences d’EPs dans des textes, i.e à détecter les ensembles de tokens formant de telles occurrences. Par exemple, dans la phrase « Cette série ne vit finalement jamais le jour. », les tokens « vit », « le » et « jour » seraient marqués comme formant une occurrence de l’EP « voir le jour ». La tâche est formellement complexe, dans la mesure où une EP peut être discontinue et un token peut appartenir à plusieurs EPs.

L’analyse par transitions est une approche célèbre qui construit une sortie structurée à partir d’une séquence d’éléments, en appliquant une séquence d’actions (appelées « transitions ») choisies parmi un ensemble prédéfini, pour construire incrémentalement la structure de sortie. L’utilisation de l’apprentissage automatique permet d’optimiser un classifieur pour réaliser le choix de la transition à opérer à chaque étape, et ainsi choisir au final une structure de sortie parmi un ensemble en général très grand de structures possibles.

Dans cette thèse, nous proposons un système par transitions dédié à l’identification des EPs au sein de phrases représentées comme des séquences de tokens, et étudions diverses architectures pour le classifieur qui sélectionne les transitions à appliquer, permettant de construire l’analyse de la phrase. La première variante de notre système utilise un classifieur linéaire de type machine à vecteur support (SVM). Les variantes suivantes utilisent des modèles neuronaux : un simple perceptron multicouche (MLP), puis des variantes intégrant une ou plusieurs couches récurrentes.

Le scénario privilégié est une identification d’EPs n’utilisant pas d’informations syntaxiques, alors même que l’on sait les deux tâches liées. Nous étudions ensuite une approche par apprentissage multitâche, réalisant et mettant à profit conjointement l’étiquetage morphosyntaxique, l’identification des EPs par transitions et l’analyse syntaxique en dépendances par transitions.

La thèse comporte une partie expérimentale importante. Nous avons d’une part étudié quelles techniques de ré-échantillonnage des données permettent une bonne stabilité de l’apprentissage malgré des initialisations aléatoires. D’autre part nous avons proposé une méthode de réglage des hyperparamètres de nos modèles par analyse de tendances au sein d’une recherche aléatoire de combinaison d’hyperparamètres. Nous produisons des systèmes avec la contrainte d’utiliser le même hyperparamétrage pour différentes langues. Nous utilisons en effet de manière privilégiée les données des deux compétitions internationales PARSEME (1.0 et 1.1), contenant des annotations d’EPs verbales pour 18 et 20 langues.

Nos variantes produisent de très bons résultats, et notamment les scores d’état de l’art pour de nombreuses langues des jeux de données PARSEME 1.0 et 1.1. L’une des variantes s’est classée première pour la plupart des langues lors de la campagne PARSEME 1.0. Comparées aux autres méthodes de la littérature, nos variantes MLP et SVM montrent une bonne performance en particulier pour les EPs discontinues ou les EPs correspondant à des variantes d’occurrences vues à l’apprentissage. Mais comme les autres systèmes, nos modèles ont des performances faibles sur les EPs non vues à l’apprentissage. Nous constatons cela dit que les variantes récurrentes et notre approche multitâche ont des performances globales peu compétitives, mais prometteuses pour ce qui est des EPs inconnues. Ceci suggère que l’accent doit être mis sur la découverte d’EPs utilisant des données non annotées en grosse quantité.

Mots clés :
Expressions polylexicales, Identification des expressions polylexicales, Analyse par transitions, Modèles linéaires, Modèles neuronaux, Réglage d’hyperparamètres de tendances, Classification avec données déséquilibrées

 

Marine Borel

« Les formes verbales surcomposées en français. »
Sous la direction de Denis Apothéloz (ATILF | Université de Lorraine – CNRS) et Françoise Revaz (Université de Fribourg)
Thèse soutenue le 7 juin 2019 à Fribourg (Université de Fribourg | Faculté des Lettres | Salle du Sénat)

Résumé
Les temps du système verbal français se répartissent, morphologiquement, en trois catégories : une série de temps simples (je chante, je chantais, etc.) ; une série de temps composés (j’ai chanté, j’avais chanté, etc.), qui correspondent aux temps simples et qui se construisent avec un auxiliaire (être ou avoir) et le participe passé du verbe conjugué ; enfin, une série de temps dits « surcomposés » (j’ai eu chanté, j’avais eu chanté, etc.), formés d’un auxiliaire (être ou avoir) à un temps composé et du participe passé du verbe conjugué.

Il existe, en français, neuf formes surcomposées, qui sont toutes attestées dans la littérature francophone : un infinitif (avoir eu chanté), un participe (ayant eu chanté), deux formes au subjonctif (que j’aie eu chanté, que j’eusse eu chanté) et cinq formes à l’indicatif (j’ai eu chanté, j’avais eu chanté, j’eus eu chanté, j’aurai eu chanté et j’aurais eu chanté). Seul l’impératif surcomposé (*Aie eu chanté !) n’est pas attesté.

Les premières formes surcomposées semblent être apparues dans la langue française à la fin du XIIe siècle. Depuis cette époque, elles sont attestées sans discontinuer jusqu’à l’époque moderne, et l’on trouve des attestations de ces formes dans tous les types de textes, aussi bien littéraires ou épistolaires que juridiques ou journalistiques.

C’est à l’analyse, notamment morphologique et sémantique, de ces formes surcomposées que je consacre mon projet de thèse. Mon but est de parvenir à comprendre et à décrire très précisément le sens de chacune de ces neuf formes surcomposées ainsi que les fonctions qu’elles remplissent dans la langue française. Pour mener à bien cette recherche, d’ordre qualitatif, je travaille sur des données réelles, que j’ai recueillies et référencées. Le corpus sur lequel se base ma recherche est actuellement composé de plus de 4000 occurrences authentiques, datant de toutes les époques et provenant de tous les types de textes.

 

Lorraine Vézy De Beaufort

« Learning French in Hong Kong : A sociocultural and narrative perspective on language learner identity in the context of globalization. »
Sous la direction de Dominique Macaire (ATILF | Université de Lorraine – CNRS) et John Trent (EdUHK)
Thèse soutenue le 10 mai 2019

Résumé
L’objectif principal de cette étude est de discuter le développement identitaire chez des apprenants de FLE dans le contexte multilingue de Hong Kong ainsi que dans un contexte général de superdiversity (Vertovec, 2007).

À la différence de l’anglais qui est une langue obligatoire à Hong Kong dès le plus jeune âge, le français ne l’est pas. S’il existe un grand nombre d’études à Hong Kong liées à l’apprentissage de l’anglais et du mandarin, il en existe peu sur des langues que je qualifierai de ‘langues additionelles’ (voir pour commentaire Hammarberg 2011; Jessner 2008) pour ce contexte.

L’étude s’attache à commenter la construction de l’identité liée à l’aprentissage du français à travers ce que Lemke (2000) appelle le multi-timescale dynamical system qui consiste à appréhender la construction de l’identité en tant qu’ensemble de procédés complexes, simultanés et complémentaires à différentes échelles de temps et d’espace (Blommaert 2007, 2010 ; Wortham, 2005) en relation avec l’environnement socioculturel immédiat et avec l’imaginaire (voir Kanno & Norton 2003 ; Ryan & Irie 2014) ainsi qu’avec les idéologies sociales (Heller 2007 ; Blommaert and Rampton 2011) et les pratiques de la langue (Pennycook 2010).

La thèse s’adosse à une étude qui consiste à « penser par cas» (Passeron et Revel, 2005) soit, à la compréhension de vrais individus dans leur milieu social et non pas d’individus conceptualisés (Ushioda 2012; Block, 2003; Lantolf & Thorne, 2006). Pour se faire, elle engage une approche méthodologique connue sous le nom de narrative inquiry (voir Barkhuizen et al. 2014 ; Clandinin, 2013), de type ‘études de récits’.

L’étude apporte des éléments sur la compréhension de la fluidité (Plivart, 2010 ; Dervin, 2011) en contexte de superdiversity (voir Blommaert 2010 ; Pennycook, 2010 ; Macaire, 2015) et propose une réflexion sur la ‘multidimentionalité’ sociale (Clark 2010) de l’apprenant. A travers l’éclairage qu’elle apporte, elle convoque également une réflexion sur l’éducation interculturelle en situation multilingue.

 

Sarah Kremer

« La réalisation matérielle du Französisches Etymologisches Wörterbuch. Impact de la mise en forme typographique sur le développement d’un projet lexicographique. »
Sous la direction de Yan Greub (ATILF | CNRS – Université de Lorraine) et Alice Savoie (ANRT | ENSAD Nancy)
Thèse soutenue le 20 décembre 2018 à Nancy (ATILF | Salle Imbs)

Résumé
Le dictionnaire étymologique du français de Walther von Wartburg, le Französisches Etymologisches Wörterbuch (FEW), est en cours d’informatisation. Ses 25 volumes, répartis sur plus de 16000 pages, sont saisis puis jalonnés de balises sémantiques XML par une série d’algorithmes afin de permettre la mise en place d’un FEW électronique et son interaction avec différentes ressources extérieures. Or, l’encodage des données saisies ainsi que leur affichage dépendent directement de polices de caractères qui soient en mesure de formater l’ensemble du contenu du FEW, notamment une série de caractères inédits utilisés pour la notation de transcriptions phonétiques.

L’objet de cette thèse consiste dans l’étude de la réalisation matérielle du FEW, en particulier sa typographie, des premières publications d’articles en 1922 jusqu’à leur diffusion actuelle sous une forme uniquement numérique. L’étude s’appuie pour cela sur une analyse des évolutions de la présentation du dictionnaire en abordant ses changements, d’ordre lexicographique mais aussi technique. Cette analyse est complétée par l’observation d’une série d’autres dictionnaires dont la mise en forme typographique est remarquable. La thèse participe ainsi à mettre en évidence la manière dont le FEW est un objet lexicographique unique.

Le résultat concret de la thèse correspond à la création d’une famille de caractères adaptée aux usages du FEW. Ces polices sont exploitées au sein de deux interfaces : la première accompagne les rédacteurs du FEW lors de l’élaboration de nouveaux articles, la seconde permet aux utilisateurs de consulter et d’interagir avec la base de données du FEW informatisé. Issue d’une collaboration entre linguistes, informaticiens et designers, cette thèse propose un modèle d’intégration du design typographique au sein des humanités numériques.

 

Élisabeth Berchtold

« Dictionnaire de l’ancien francoprovençal : conception d’un projet lexicographique et réalisation sectorielle. »
Sous la direction de Yan Greub (ATILF | CNRS – Université de Lorraine) et Andres Kristol (Université de Neuchâtel)
Thèse soutenue le 19 décembre 2018 à l’Université de Neuchâtel

Résumé
L’objectif de cette thèse est de combler des lacunes scientifiques dans la connaissance de l’histoire du francoprovençal et de son lexique. En effet, à l’heure actuelle aucun travail de synthèse ne regroupe les matériaux anciens du francoprovençal et dans le Französisches Etymologisches Wörterbuch (FEW), qui pourrait remplir cette fonction, les états anciens du francoprovençal sont sous-représentés en raison de l’absence d’un tel travail. La conséquence est un grand déséquilibre avec la connaissance que nous avons de l’ancien français et occitan qui sont les langues romanes anciennes les mieux décrites.

Les sources en francoprovençal sont relativement peu nombreuses parce que cette langue a été de tout temps confiné à un usage essentiellement oral. La littérature ancienne se borne à quelques textes d’édification et un traité juridique, surtout des traductions. À partir du XVIe siècle se développe une littérature en patois le plus souvent fortement ancrée localement. Les auteurs qui voulaient toucher un publique plus large ont très tôt opté pour le français. Les sources documentaires sont plus nombreuses, mais très inégalement réparties dans l’espace. Les sources issues de la partie française du domaine ont pour la plupart été éditées, mais beaucoup d’entre elles sont difficilement exploitables en l’absence de glossaires. La situation est plus favorable en Suisse romande où le Glossaire des patois de la Suisse romande (Gl.) documente non seulement les dialectes modernes, mais aussi leurs états anciens. Pour cette raison nous nous sommes concentrée sur la partie française du domaine et nous nous sommes basée sur le Gl. pour la partie suisse. En collaboration avec une autre doctorante, Laure Grüner, nous avons rassemblé les sources intéressantes pour l’étude de l’ancien francoprovençal de France et nous avons procédé à des dépouillements étendus.

Sur cette base, nous avons élaboré un modèle de description lexicographique adapté à l’ancien francoprovençal et nous avons rédigé la tranche f de ce Dictionnaire de l’ancien francoprovençal, qui représente environ un vingtième du dictionnaire complet, afin de prouver la faisabilité du projet et d’évaluer son apport à la connaissance de l’ancien francoprovençal. Plus de la moitié de nos articles documentent des unités lexicales qui n’étaient pas encore attestées en ancien francoprovençal de France dans le FEW et dans une bonne partie des autres cas nous pouvons compléter les matériaux. Sur la base des 386 articles rédigés, nous évaluons la nomenclature complète du dictionnaire à 7’500 articles et le temps de rédaction à une bonne douzaine d’années de travail d’une personne à temps plein. Nous avons aussi envisagé plusieurs possibilités pour obtenir des résultats tangibles dans des délais plus courts.

 

Bianca Mertens

« Figement et renouvellement du lexique protoroman : recherches sur la création lexicale. »
Sous la direction d’Eva Buchi (ATILF | CNRS – Université de Lorraine) et Marie-Guy Boutier (Université de Liège)
Thèse soutenue le 20 janvier 2018

Résumé
Cette thèse est consacrée à l’étude du suffixe protoroman */-‘ur-a/ et, par ce biais, à l’étude de la morphologie dérivationnelle du protoroman. D’une part, nous fournissons un examen approfondi et détaillé des unités lexicales protoromanes présentant le suffixe */-‘ur-a/ et, d’autre part, nous offrons une analyse pointue des propriétés phonologiques, morphologiques et sémantiques du suffixe */-‘ur-a/. La première partie de ce travail consiste en une brève introduction et en la présentation de la méthodologie dont nous nous sommes servie pour nos recherches : celle de la reconstruction comparée et celle de la reconstruction interne. Ensuite, nous jetons un coup de projecteur sur les deux domaines qui sont particulièrement intéressants dans le cadre de l’étude d’un suffixe protoroman : la reconstruction en domaine roman et la reconstruction morphologique. Cette première partie se conclut par l’explication de notre choix de nomenclature – avec une brève analyse des lexèmes rejetés –, par l’explicitation de nos processus de recherche et par la présentation de la microstructure utilisée pour les articles étymologiques. Dans la deuxième partie de cette thèse figurent les articles étymologiques des 45 étymons protoromans portant le suffixe */-‘ur-a/ que nous avons pu reconstruire. Chaque article étymologique est accompagné d’une carte linguistique qui donne une vue globale sur la distribution aréologie de l’étymon en question.Enfin, la troisième partie de notre travail se veut une analyse approfondie et détaillée des propriétés phonologiques, morphologiques et sémantiques du suffixe */-‘ur-a/ ainsi qu’une analyse de la variation diasystémique de la protolangue.

 

Marie-Sophie Pausé

« Structure lexico-syntaxique des locutions du français et incidence sur leur combinatoire. »
Sous la direction d’Alain Polguère (ATILF | Université de Lorraine – CNRS) et Sylvain Kahane (Université Paris Nanterre)
Thèse soutenue le 3 novembre 2017

Résumé
En tant que syntagmes sémantiquement non-compositionnels, les locutions sont des unités lexicales à part entière, qui doivent avoir leur propre entrée dans un modèle du lexique. Elles doivent donc recevoir une définition, ainsi que des caractéristiques grammaticales ; caractéristiques grammaticales qui doivent prendre en compte leur signifiant particulier. En effet, en vertu de la nature de leur signifiant, les locutions peuvent subir, à des degrés divers, des variations syntagmatiques – passivation, insertion de modifieurs, etc. – et paradigmatiques – substitution de certains constituants.

Notre hypothèse est qu’une description des locutions combinant à la fois l’identification des unités lexicales qui les composent, et à la fois les relations de dépendance syntaxique qui unissent les unités constituantes, permettra de prédire leurs différents emplois possibles en discours. Une telle description n’est possible que dans un modèle du lexique décrivant précisément la combinatoire des lexèmes.

L’objectif de notre thèse est de développer un modèle de description lexicographique des locutions vérifiant cette hypothèse et applicable au TAL et à la didactique. Notre recherche, basée sur les principes de la Lexicologie Explicative et Combinatoire (Clas et coll. 1995), exploitera et enrichira les données du Réseau Lexical du Français (RL-fr) (Lux-Pogodalla et Polguère 2011), ressource en cours de développement à l’ATILF. Notre travail visera dans un premier temps à affiner la classification des locutions selon les variations qu’elles admettent ou non dans les corpus. Dans un second temps, il s’agira de coupler les structures lexico-syntaxiques (association d’un patron syntaxique à des unités lexicales) des locutions à des arbres de dépendance, nous permettant de rentre compte de la structure syntaxique des locutions non linéarisée, et ainsi d’ouvrir aux différents agencements possibles des unités constituantes.

 

Kim Mi Hyun

« Étude contrastive de la phraséologie des noms d’éléments du corps en français et coréen. »
Sous la direction d’Alain Polguère (ATILF | Université de Lorraine – CNRS) et Seong Heon Lee (Université Nationale de Séoul)
Thèse soutenue le 17 février 2017

Résumé
Notre travail a pour but de d’abord comparer la structuration des lexiques français et coréens des noms d’éléments du corp (dorénavant NÉC) et puis de comparer les collocations contrôlées par ces unités lexicales. Les unités lexicales dénotant des éléments du corps sont essentielles dans toutes les langues et elles contrôlent énormément de phraséologie. L’étude contrastive de la phraséologie du lexique des NÉC en français et coréen effectuée dans notre thèse nous donnera l’occasion de vérifier l’importance de la modélisation formelle du lexique français et coréen.

L’hypothèse de notre travail est que la comparaison de la lexicalisation des NÉC dans les deux langues – le français et le coréen – va montrer, bien évidemment, de nettes différences de conceptualisation du corps dans les deux cultures correspondantes, mais que la comparaison des collocations contrôlées par les NÉC va mettre en lumière des écarts beaucoup plus variés, liés à la conceptualisation des fonctions pratiques et sociales des entités physiques que les NÉC dénotent. Ce travail approfondira un phénomène de la collocation à la fois générique et spécifique.

À partir de nos hypothèses de départ, notre thèse se divisera en deux grandes parties. Dans la première partie, nous allons comparer la structuration des lexiques français et coréen des NÉC. Nous supposerons plusieurs cas logiques de (non-)correspondances entre les deux langues. Nous utiliserons le Natural Semantic Metalanguage ou NSM (Wierzbicka 1996) pour la comparaison sémantique des lexiques des NÉC en français et coréen. Dans la seconde partie, nous allons tout d’abord établir la liste des collocations dont la base est un NÉC. Nous définissons la collocation comme un phrasème particulier, fondé sur une relation de combinatoire restreinte entre deux unités lexicales. Nous allons ensuite comparer les collocations du français et coréen, pour chaque NÉC. La correspondance de la collocation entre deux langues est variée. À cette étape de la comparaison, nous allons utiliser un encodage des collocations fondé sur le système formel des Fonctions Lexicales de la théorie Sens-Texte (Mel’čuk 2001), en nous appuyant sur la base Réseau Lexical Français ou RLF(Lux-Pogodalla et Polguère 2011) et sur un échantillon de base du coréen, Réseau Lexical Coréen ou RLC, que nous développerons. Nous allons utiliser non seulement les fonctions lexicale dites standards, mais aussi les fonctions lexicale non standards.

Télécharger la thèse

 

Guillaume Nassau

« Les émotions en entretien de conseil dans un dispositif d’apprentissage de langue auto-dirigé : une analyse des interactions entre apprenant et conseillère. »
Sous la direction de Sophie Bailly (ATILF | Université de Lorraine – CNRS) et Virginie André (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 8 novembre 2016

Résumé
Des recherches en psychologie fonctionnaliste et en psychologie sociale ont établi de manière robuste l’existence de liens entre les émotions et la cognition, entre les émotions et l’apprentissage de langues et entre les émotions et les performances en langues étrangères. Cette thèse, inscrite dans le champ des sciences du langage – et de la didactique des langues, a pour objectif de décrire et d’analyser les manifestations verbales des émotions dans des entretiens de conseil à partir d’un corpus constitué d’authentiques séquences de travail enregistrées et transcrites. L’analyse porte sur les épisodes émotionnels et sur les énoncés d’émotions dans le contexte de l’entretien de conseil. La méthodologie utilisée pour repérer les épisodes émotionnels comporte deux étapes : une première étape où des signaux linguistiques considérés comme signalant potentiellement une émotion sont repérés, et par accumulation, indiquent des séquences particulières dans les entretiens de conseil, et une seconde étape où les séquences ainsi isolées sont étudiées qualitativement afin de mettre en évidence la présence ou l’absence d’émotion. Sur le plan des épisodes émotionnels, nos analyses mettent en évidence une gamme d’émotions plus large chez les apprenants, et une tendance chez les conseillères à utiliser leurs propres émotions afin d’effectuer du travail émotionnel auprès de l’apprenant. Sur le plan discursif, l’observation des énoncés d’émotions permet tout d’abord de mettre en évidence la place centrale de l’apprenant : une large majorité des énoncés d’émotions désignent en effet l’apprenant comme personne concernée par l’émotion. Par ailleurs, des postures différentes ont pu être identifiées chez les conseillères et chez les apprenants quant à l’utilisation des termes d’émotion. L’apprenant utilise principalement les énoncés d’émotion afin de s’auto-attribuer des émotions tandis que les conseillères utilisent les énoncés d’émotion afin de projeter des émotions chez les apprenants. Les observations effectuées permettent également de mettre en évidence un lien entre les émotions évoquées dans les entretiens de conseil et le déroulement de la formation. De manière générale, les émotions (épisodes émotionnels et énoncés d’émotion) apparaissent comme des indicateurs précis du déroulement de la formation.

Télécharger la thèse

 

Capucine Herbert

« Les récits de voyages du XIVe et du XVe siècles lemmatisés : apports lexicographiques au Dictionnaire du moyen français. »
Sous la direction de Sylvie Bazin (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 26 février 2016

Résumé
Les XIVe et XVe siècles représentent une période privilégiée pour étudier les récits de voyages. En effet, les pèlerins sont de plus en plus nombreux à se rendre en Terre Sainte et la soif de découverte pousse de nombreux voyageurs à explorer le monde. Pour raconter leurs périples, ces voyageurs privilégient de plus en plus le français pour s’exprimer.

L’étude des récits de voyages des XIVe et XVe siècles permet donc à travers l’étude de la langue, le moyen français, d’accéder à la perception qu’avaient du monde ces voyageurs.

Notre travail consistera tout d’abord en l’élaboration d’un lexique de ces récits, qui viendra compléter le Dictionnaire du moyen français, puis en l’étude lexicale et sémantique des vocables français liés à la topographie, ce qui devrait permettre de comprendre la perception du relief chez les voyageurs de la fin du Moyen Âge.

 

Kyuma Bernard Nzuki

« Les causes de l’abandon de l’étude du français au Kenya : étude didactique et sociolinguistique. »
Sous la direction de Sophie Bailly (ATILF | Université de Lorraine – CNRS) et Francis Carton (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 17 décembre 2015

Résumé
Dans un système éducatif, l’apprentissage de langues étrangères est l’un des volets généralement imposés au public. Pour une langue étrangère donnée, en fonction de certains facteurs pédagogiques et sociologiques relatifs aux apprenants et à leur pays d’origine, l’évolution de son enseignement peut se présenter de manière plus ou moins spécifique. Comme dans de très nombreux pays, le français fait partie des langues étrangères enseignées depuis plusieurs années au Kenya, pays anglophone, notamment dans quatre catégories d’établissements scolaires : écoles secondaires (collèges et lycées – en France), collèges, Alliances Françaises et universités). Le français fait aussi partie des langues étrangères enseignées dans des écoles élémentaires privées, surtout pour la classe d’élite.

Étant en cotutelle entre la France et le Kenya, ce travail de thèse se réalisera essentiellement grâce à une enquête de terrain au Kenya qui permettra de recueillir des informations auprès des acteurs éducatifs, des apprenants jeunes et adultes, des parents d’élèves et du monde de l’entreprise. Les informations recueillies constitueront ainsi une base de données statistiques et aussi qualitatives. Les grandes lignes de l’enquête se réaliseraient auprès des questionnaires et aussi d’une observation des cours afin d’analyser des méthodes utilisées / ou faire une étude comparative et éventuellement, c’est-à-dire aller en personne dans les salles classe pour confirmer/voir les stratégies que les enseignants utilisent pour que nous puissions accomplir une étude pratique.

A l’issue de cette recherche, nous devrions pouvoir mieux comprendre les interactions entre l’apprenant de langue étrangère et les contextes micro, méso et macro (la classe, l’école, la famille et la société) et leur rôle dans le processus qui mène à l’abandon de l’étude d’une langue étrangère. Concernant l’étude du français, la compréhension de ce processus permettrait de penser des solutions didactiques susceptibles de favoriser sa promotion et sa diffusion.

 

Laure Budzinski

« Dictionnaire historique et étymologique de la terminologie linguistique française. »
Sous la direction d’Eva Buchi (ATILF | CNRS – Université de Lorraine) et Yan Greub (ATILF | CNRS – Université de Lorraine)
Thèse soutenue le 30 novembre 2015

Résumé
Une recherche consacrée à l’étymologie et à l’histoire de la terminologie linguistique permettra un gain important en connaissances historico‐étymologiques. Ce gain dans la description de lexèmes particuliers devrait avoir des répercussions plus générales : une meilleure connaissance des processus de formation du vocabulaire de la linguistique, et des indications sur les conséquences pour la sous-discipline étymologique.

La thèse pourra contribuer à un progrès méthodologique dans un secteur faible de la science étymologique, progrès d’autant plus significatif que celui-ci est crucial pour notre connaissance du fonctionnement actuel de la création lexicale en français.
Élaborer un dictionnaire historique et étymologique de la terminologie de la linguistique nécessitera d’en reconsidérer l’ensemble des représentations dans les grands monuments étymologiques, afin d’identifier les lacunes à combler. Ainsi, un des premiers aspects de notre travail consistera à représenter le plus largement possible tous les sémantismes n’ayant pas été distinguée par les principaux dictionnaires étymologiques comme le FEW, Dauzat, Bloch & Wartburg ou le TLF. Le deuxième aspect de notre travail consistera en une analyse détaillée de l’origine des lexèmes étudiés, afin de vérifier dans quel cas il y a eu emprunt, calque ou construction française. Le troisième aspect de notre travail sera d’exploiter les données du dictionnaire pour un regard synthétique sur la constitution de la terminologie linguistique française : quel est le pourcentage de créations internes et d’emprunts ? Quels sont les patterns de formation les plus utilisés ? Quelle part de la science considérée comme établie est‐elle vraiment sûre ?

 

Fabien Python

« La duplicité du vocabulaire français. Étude des doublets étymologiques relevant de la dichotomie populaire/savant. »
Sous la direction d’Eva Buchi (ATILF | CNRS – Université de Lorraine) et Henri Vernay
Thèse soutenue le 26 septembre 2015

Résumé
À venir

 

Sandrine Ollinger

« Le raisonnement analogique en lexicographie, son informatisation et son application au Réseau Lexical du Français. »
Sous la direction d’Alain Polguère (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 15 décembre 2014

Résumé
La lexicographie contemporaine, en s’appliquant à décrire le lexique de la langue de manière formelle et cohérente, met à la disposition de la communauté des ressources offrant de multiples possibilités d’exploitations automatiques telles que les réseaux lexicaux. Le présent projet de thèse propose de vérifier automatiquement les propriétés formelles d’une telle ressource au cours de sa constitution. Les objectifs de cette vérification sont multiples. D’une part, elle permet de renforcer la cohérence du réseau lexical en élaborant des stratégies de semi-automatisation de l’activité lexicographique. En effet, en fournissant l’ensemble des informations pertinentes déjà encodées dans la base lexicale pour la description d’une nouvelle unité, la régularité des descriptions se trouvera renforcée. En appliquant un raisonnement analogique aux modélisations déjà disponibles dans la ressource, l’ébauche automatique d’entrées lexicographiques semble envisageable, de même que l’extraction automatique de propriétés générales associables à des classes sémantiques de lexies. D’autre part, effectuée en étroite collaboration avec l’équipe de lexicographes construisant la ressource, elle offre l’opportunité de faire évoluer la formalisation des données pour une meilleure prise en compte des cas particuliers rencontrés. Pour aboutir à une représentation à la fois cohérente, fine et juste de la langue, il est important de prendre en compte les particularités soulignées par les lexicographes et de s’appliquer à décrire les phénomènes linguistiques mis en évidence par d’éventuelles irrégularités.

Télécharger la thèse

 

Émilienne-Nadège Mékina

« Description du fang-nzaman, Langue bantoue du gabon : Phonologie et classes nominales. »
Sous la direction de Bernard Combettes (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 15 décembre 2012

Résumé
Parlé dans la région de l’Ogooué-Ivindo au nord-est du Gabon, le fang-nzaman est une langue bantoue appartenant au groupe A70, selon la classification de M. Guthrie. Les différents points que nous avons mis en valeur sont : un succinct aperçu de l’environnement dans lequel elle évolue, l’organisation sociale et culturelle. Entrant dans le vif du sujet, la partie phonologique avec l’identification de différents phonèmes (consonantiques et vocaliques) qui apparaissent dans la langue. Le fonctionnement des affixes (les préfixes de classe) et leurs tons (ponctuels et modulés) font la particularité des langues bantoues.

Dans le cadre syntaxique, l’identification de différents énoncés, leurs catégories grammaticales et lexicales a contribué à la détermination des classes. Ceci a introduit l’étude du fonctionnement des accords, la distribution des classes, la valeur sémantique des préfixes, l’appariement des classes en opposition singulier/pluriel. La langue s’organise avec des connexions d’unités qui gravitent au tour du noyau central qui peut être : un verbe, un connecteur, une anaphore…En fin le cadre lexical définit un corpus limité de termes qui permet d’éclairer sur le choix des énoncés représentatifs.

Télécharger la thèse

 

Jinjing Wang

« Causes de l’échec d’apprentissage du français par des étudiants chinois en France. »
Sous la direction de Sophie Bailly (ATILF | Université de Lorraine – CNRS) et Francis Carton (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 30 novembre 2012

Résumé
Cette thèse s’inscrit dans le domaine de la didactique du français langue seconde. Elle concerne les causes de la réussite ou de l’échec de l’apprentissage du français par des étudiants chinois en France. Plus précisément, elle prend appui sur la perception de la réussite ou de l’échec d’apprentissage parmi ce public dont l’effectif ne cesse de croître et au sein duquel de nombreux individus éprouvent de grandes difficultés à apprendre la langue du pays d’accueil. Afin d’interroger les causes des sentiments de réussite ou d’échec dans l’apprentissage, trois hypothèses sont posées : le sentiment de réussite ou d’échec est conditionné par l’adaptation à la nouvelle culture d’apprentissage/enseignement ; certains traits de personnalité favorisent l’apprentissage de la langue ; la motivation des apprenants a des conséquences sur leur investissement et sur leur utilisation de stratégies dans l’apprentissage du français. Cette étude tend à montrer que le sentiment de réussite ou d’échec d’apprentissage résulte d’un cumul d’expériences émotionnellement positives ou négatives. Elle fait apparaître certains des facteurs qui facilitent ou empêchent l’apprentissage du français par des étudiants chinois en France. Par exemple, l’adaptation à la culture d’enseignement française favoriserait l’apprentissage et induirait chez l’apprenant un sentiment de réussite. Parmi les facteurs qui seraient susceptibles d’engendrer un sentiment d’échec, l’introversion empêcherait l’acquisition de compétences dans le domaine de l’expression orale et l’absence de contacts réguliers avec le français dans la vie quotidienne affaiblirait la motivation d’apprentissage.

Télécharger la thèse
Télécharger les annexes

 

Aurore Koehl

« La construction morphologique des noms désadjectivaux suffixés en français. »
Sous la direction de Fiammetta Namer (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 30 novembre 2012

Résumé
Menée dans le cadre de la morphologie lexématique, cette thèse a vocation de faire progresser la réflexion sur l’une des questions centrales de la morphologie constructionnelle des langues, à savoir les critères d’identification des règles de construction de lexèmes (RCL), en prenant le cas des noms désadjectivaux du français comme support. Nous traitons les suffixes –ité (banalité), –eur (blancheur), –esse (tendresse), –itude (amplitude), –ise (gourmandise) et –erie (cochonnerie) qui sont utilisés comme exposants de règle dans la construction de noms sur la base de lexèmes adjectivaux. Les noms étudiés proviennent du Trésor de la langue française informatisé, du journal électronique Le Monde et de la Toile.

Comment détermine-t-on les RCL ? Une première hypothèse est qu’à un exposant formel identifié correspond une RCL à laquelle s’oppose une seconde hypothèse selon laquelle à une seule RCL correspondent plusieurs exposants. Il s’agit de déterminer quelle est l’influence de la valeur des exposants dans le dénombrement des RCL. Cela implique (i) d’étudier les conditions de sélection des bases et (ii) d’étudier les critères aboutissant aux différentes formes de noms désadjectivaux. La première question relève d’une logique liée aux conditions d’application des règles, la seconde relève des motivations du locuteur/scripteur intervenant dans les conditions de concurrence entre les suffixes. Pour chaque suffixation, nous menons une étude sur la disponibilité de chaque suffixe, en comparant les noms contenus dans le Trésor de la langue française et les créations des locuteurs/scripteurs en recourant au corpus électronique du journal Le Monde et à la Toile. Nous étudions également si les RCL subissent d’autres influences que celles des exposants, en analysant les contextes d’apparition des doublons de noms construits sur une même base adjectivale (e.g. tendresse / tendreté).

Parallèlement à cette étude, nous avons créé une base de données morphologique des dérivations d’adjectif à nom (nommée MORDAN) qui enregistre 3750 couples (adjectif, nom) assortis d’informations formelles, sémantiques, historiques et pragmatiques. Chaque nouvelle forme est accompagnée d’un contexte d’apparition qui permet son interprétation. Cette base de données est une ressource libre qui sera mise en ligne à la date de la soutenance.

Télécharger la thèse
Télécharger le corpus

 

Lolita Berard

« Dépendances à distance en français contemporain – Étude sur corpus « c’est ce qu’on pense qui devrait être fait ». »
Sous la direction de Jeanne-Marie Debaisieux (ATILF | Université de Lorraine – CNRS) et Henri-José Deulofeu (Université Aix Marseille)
Thèse soutenue le 26 novembre 2012

Résumé
Les linguistes tentent depuis de nombreuses années d’expliquer les conditions requises pour qu’un élément en tête d’énoncé puisse être dépendant d’un verbe enchâssé. Pourquoi à qui crois-tu qu’il a dit ça est-il un énoncé grammatical et *à qui crois-tu qu’il a fait ce poème pour plaire ne l’est-il pas ? Chomsky (1977) et ses successeurs ont été les premiers à proposer des règles pour expliquer la possibilité pour un verbe de contrôler un élément à distance dans certains cas, et l’impossibilité dans d’autres cas. Ces travaux et d’autres plus récents prenant en compte la structure informationnelle (Erteschik-Shir 1997) sont cependant loin d’avoir exploré tous les types de contraintes qui pèsent sur ces constructions. Ainsi, en s’appuyant sur des corpus, Arie Verhagen (2005) a mis au jour des contraintes lexicales et pragmatiques sur le phénomène des dépendances à distance dans les interrogatives partielles en néerlandais. Il a remarqué dans l’usage une grande régularité dans le lexique verbal et pronominal utilisés entre un recteur et son objet extrait (penser et la 2ème personne). Une contrainte pragmatique se dégageait de ces observations : la séquence ‘pronom + verbe’ module une relation intersubjective entre les interlocuteurs.

Notre objectif est de décrire les propriétés syntaxiques, lexicales et sémantico-pragmatiques des constructions comportant des dépendances à distance en français contemporain puis d’en mesurer la fréquence. Une attention particulière est portée aux unités lexicales impliquées. La méthode utilisée est donc corpus-driven. Nous nous appuyons sur des corpus écrits et oraux variés : presse, littérature, forum internet, annonces, écrits scientifiques, discours politiques, échanges entre un ‘visiteur’ et un administratif, conversations du quotidien, entretiens, émissions de radio et de télévision, conversations téléphoniques, échanges entre adultes et enfants, etc. Après avoir décrit les tendances générales, il s’agit de préciser les différences observées selon les types de constructions (complétives et infinitives), de structures (relatives, interrogatives, clivées) et de situations de communication.

Télécharger la thèse

 

Églantine Guély Costa

« Distance transactionnelle et apprentissage autodirigé de langue étrangère avec soutien : ouverture, dialogue, autonomie et appropriation de dispositif de formation. »
Sous la direction de Sophie Bailly (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 5 juillet 2012

Résumé
Cette thèse s’inscrit dans les recherches sur les dispositifs de médiations (Peraya, 2003, 2006, 2009), et plus spécifiquement les dispositifs de formation en langue étrangère, et sur les usages qui en sont faits (Rabardel, 1995) ; dans le contexte de la diversification des pratiques provoquée par l’essor des technologies d’information et de communication en formation. Elle cherche à interroger la notion de distance, et plus particulièrement de distance transactionnelle (Moore, 1993), c’est-à-dire les rapports entre structure d’un dispositif, dialogue et autonomie, au regard de l’hybridisme technique et pédagogique d’un dispositif contemporain de formation auto-dirigée de l’anglais avec soutien.

Pour cela, elle tente d’appréhender le processus d’appropriation (Paquelin, 2004, 2009) d’un dispositif de formation auto-dirigée de l’anglais (Holec, 1979, 1981, 1988) en s’appuyant sur la perception de l’ouverture (Jézégou, 2004, 2005, 2007, 2010) des acteurs à un moment T de la conception (dispositif prescrit), un moment T de la formation (dispositif perçu des formateurs et personnels), et un moment T de l’apprentissage (dispositif perçu des apprenants), grâce à des données issues de questionnaires, d’entretiens, et de traces d’apprentissage. Ces données sont comparées afin de montrer des mouvements en cours au sein du processus d’appropriation, puis des freins et des leviers sont analysés dans le double mouvement d’appropriation du dispositif et de développement de l’autonomie de l’apprenant. Les résultats tendent à montrer qu’il existe bien une relation de dépendance entre structure, dialogue et autonomie et à en étayer la hiérarchie au sein de ce dispositif particulier, représensatif d’une forme particulière de dispositif ouvert visant l’apprentissage auto-dirigé.

Télécharger la thèse

Note : Pour des raisons de confidentialité, le volume d’annexes n’est pas disponible en ligne.

 

Coralie Reutenauer

« Vers un traitement automatique de la néosémie : approche textuelle et statistique. »
Sous la direction de Jean-Marie Pierrel (ATILF | CNRS – Université de Lorraine), Evelyne Jacquey (ATILF | CNRS – Université de Lorraine) et Mathieu Valette (ATILF | CNRS – Université de Lorraine)
Thèse soutenue le 20 janvier 2012

Résumé
L’enjeu de cette thèse est l’acquisition automatique de nouveaux sens lexicaux.
Nous définissons un modèle théorique sur l’émergence d’un nouveau sens pour une unité lexicale ayant déjà un sens codé. Le phénomène ciblé est la néologie sémantique, ou néosémie, définie comme une variation sémantique marquée en cours de diffusion. Nous la modélisons à partir d’indices quantitatifs articulés à des principes issus de la sémantique textuelle. Le sens codé est représenté
comme un ensemble structuré de traits sémantiques. Il est modulé en discours sous l’effet de récurrences d’autres traits. La dynamique du sens est représentée à l’aide de descripteurs de granularité sémantique variable.

Ensuite, nous proposons des ressources et outils adaptés, relevant de la linguistique de corpus. Les ressources sont de deux types, lexicographiques pour le sens codé et textuelles pour le sens en
discours. En pratique, le Trésor de la Langue Française informatisé fournit les sens codés. Une plateforme transforme ses définitions en ensembles de traits sémantiques. Trois corpus journalistiques des années 2000 servent de ressources textuelles. Les outils mathématiques, essentiellement statistiques, permettent de jouer sur la structure des ressources, d’extraire des unités saillantes et d’organiser l’information.

Enfin, nous établissons les grandes lignes d’une procédure pour allouer de façon semi-automatique un nouveau sens. Elles sont étayées par des expériences illustratives. Le déroulement de la procédure repose sur des niveaux de description de plus en plus fins (domaines, unités lexicales puis traits sémantiques). Il s’appuie sur des jeux de contrastes multiples, permettant de nuancer l’information
sémantique.

Télécharger la thèse

 

Tiphanie Bertin

« Grammaticalisation du langage de l’enfant : processus interactionnel d’appropriation des articles et des clitiques sujets chez des enfants francophones entre 1 et 3 ans. »
Sous la direction de Denis Apothéloz (ATILF | Université de Lorraine – CNRS), Anne-Salazar-Orvig (Université Sorbonne Nouvelle) et d’Emmanuelle Canut (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 3 décembre 2011

Résumé
Le besoin social de l’enfant de communiquer avec son entourage entraine une grammaticalisation progressive de son langage, qui passe notamment par l’acquisition des morphèmes grammaticaux libres. Plusieurs études mentionnent et analysent la présence de formes précurseures de ces éléments, souvent appelées fillers. A partir de corpus longitudinaux de quatre enfants en interaction avec un adulte, nous nous sommes intéressées au rôle de ces formes dans l’acquisition des articles et des clitiques sujets. L’utilisation du terme « formes de transition », et non de « fillers », nous a permis de décrire des formes produites par les enfants notamment à la fin de l’acquisition des articles et des clitiques sujets. Alors qu’une majorité des études sur les fillers se focalise sur le langage de l’enfant, notre objectif est de mettre en évidence le rôle fondamental de l’interaction entre l’enfant et l’adulte dans le processus d’appropriation des articles et des clitiques sujets. Une étude de l’évolution de la production de formes de transition nous a permis de décrire des tendances générales de développement chez les enfants observés, suivant un certain nombre de variations de l’émergence jusqu’à la maîtrise complète des articles et clitiques sujets. Une analyse de l’évolution des reprises chez l’enfant et l’adulte et du déroulement de leurs échanges nous a conduite au repérage de séquences d’interaction où l’adaptation des reprises de l’adulte aux tâtonnements de l’enfant entraine une progression dans les essais et les productions de ce dernier nous permettant d’illustrer le rôle d’une interaction immédiate adaptée dans le processus d’appropriation des articles et des clitiques sujets.

Télécharger la thèse

 

Iveta Chovanová

« Morphologie constructionnelle du slovaque et éléments de comparaison avec le français : les adjectifs dénominaux construits par composition et dérivation. »
Sous la direction de Fiammetta Namer (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 2 décembre 2011

Résumé
Ce travail, qui s’appuie sur une étude de corpus, analyse deux types d’adjectifs dénominaux en slovaque : les adjectifs suffixés en -ský (NskýA) et les adjectifs composés d’un adjectif et d’un nom (ANA). Les résultats obtenus pour le slovaque sont mis en correspondance, et seulement quand cela est pertinent, avec les réalisations sémantiquement équivalentes du français. Les analyses pour le slovaque sont vérifiées et testées à chaque fois à l’aide d’une expérience réalisée sous forme de questionnaires soumis aux locuteurs slovaques. La formation des ANA (MODROOKÝA « ayant les yeux bleus ») répond à un triple faisceau de contraintes (i) entre l’ANA et le nom recteur (Nr), e.g. modrookéA dievcaNr « fille aux yeux bleus », (ii) entre le composant nominal (N) et le Nr (OKON « oeil » et dievca « fille »), et (iii) entre le composant adjectival (A) et le N (MODRÝA « bleu » et OKON « oeil »). Ces adjectifs désignent une propriété inhérente de l’entité à laquelle réfère le Nr. L’interprétation sémantique majoritaire est la relation méronymique : le N dénote une partie constitutive et visible de l’entité désignée par le Nr. La suffixation en -ský sélectionne essentiellement les noms propres de lieu (toponymes) et de personne (anthroponymes) en position de base. Le contenu sémantique de ces adjectifs est identique à celui de leurs bases. Les NskýA toponymiques comme LIBANONSKÝA « libanais » peuvent référer au lieu ainsi qu’aux habitants d’un lieu. Seule la valeur du Nr permet de désambiguïser la référence d’un NskýA toponymique. Les NskýA anthroponymiques comme STALINSKÝA « stalinien » peuvent avoir, outre l’interprétation relationnelle : « de Staline », un sens qualifiant : « comparable à Staline ».

Télécharger la thèse
Télécharger les annexes
Télécharger les données

 

Magali Husianycia

« Caractérisation de types de discours dans des situations de travail. »
Sous la direction de Richard Duda (ATILF | Université de Lorraine – CNRS) et Emmanuelle Canut (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 2 décembre 2011

Résumé
L’objectif de cette étude consiste en la caractérisation de types de discours dans des situations de travail. Nous avons tenté de définir des types de discours à partir de critères linguistiques et en considérant les cadres actionnels qui sous-tendent les discours. Dans un premier temps, nous précisons le cadre théorique et méthodologique de notre travail en nous positionnant sur le concept de « type de discours » que nous différencions de celui de « genre ». En outre, pour définir notre cadre théorique, nous avons mené une réflexion sur l’histoire de la place du langage dans les activités de travail depuis le XVIIè siècle, et nous nous sommes appuyée sur des analyses de pratiques langagières en situation de travail menées au sein de différentes disciplines. À partir de ce cadre théorique pluridisciplinaire, nous avons pu développer une méthodologie pour le recueil et la constitution de corpus et une méthodologie d’analyse fondée sur un découpage séquentiel des discours. Notre recherche a fait sept types de séquence regroupés en trois types linguistiques (langage expositif, langage de co-action et langage péri-professionnel) et correspondant à trois types de discours (langage sur le travail, langage comme travail et langage dans le travail). Chaque type de séquence est caractérisé par des critères linguistiques récurrents soumis à une analyse qualitative et quantitative. Le type de séquence dominant détermine le type linguistique majeur et donc le type de discours. Cette analyse, couplée avec une analyse du cadre actionnel des activités, nous permet de mettre en évidence l?interdépendance entre langage et activité, et nous conduit à caractériser des types de discours en lien avec le type d’activité.

Télécharger la thèse
Télécharger les annexes
Télécharger le corpus complet

 

Delphine Beauseroy

« Syntaxe et sémantique des noms abstraits statifs. Des propriétés verbales et adjectivales aux propriétés nominales. »
Sous la direction de Marie-Laurence Knittel (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 5 décembre 2009

Résumé
Le but de ce travail est d’examiner les propriétés sémantiques et morphosyntaxiques des noms abstraits apparentés à des prédicats verbaux ou adjectivaux. D’un point de vue sémantique, nous montrons que la notion d’aspect, généralement réservée au domaine verbal, est pertinente dans le domaine nominal et que les ‘noms abstraits intensifs’ (Van de Velde 1995 et Flaux & Van de Velde 2000) forment une classe aspectuelle homogène puisque tous partagent le trait [-DYNAMIQUE]. En nous fondant sur l’hypothèse que le caractère statif commun à ces noms permet une analyse unifiée, nous proposons une étude de leurs différents emplois et montrons notamment qu’outre une acception stative, ces noms peuvent avoir une seconde lecture et dénotent alors des occurrences. Dans la seconde partie, nous nous intéressons au comportement syntaxique des noms statifs, i.e. le nombre et la détermination, mais aussi la modification adjectivale. Ceci nous permet de dégager deux comportements morphosyntaxiques distincts, corrélés à la distinction entre les deux lectures mise en évidence dans la première partie. Dans leur lecture stative, ces noms ont un comportement proche de celui des noms massifs concrets et fonctionnent comme des noms relationnels : ils nécessitent un argument avec lequel ils entrent dans une relation syntaxique de prédication. Inversement, dans leur lecture d’occurrence, ces noms se comportent comme des noms comptables concrets et ne sont pas intrinsèquement relationnels. L’analyse des noms statifs que nous proposons tend à montrer que ceux-ci partagent leurs propriétés sémantiques avec certains types de prédicats verbaux et adjectivaux, et leurs propriétés syntaxiques avec diverses classes de noms concrets.

Télécharger la thèse

 

Dorota Sikora

« Les verbes de manière de mouvement en polonais et en français. Eléments pour une étude comparée des propriétés structurelles de prédicats. »
Sous la direction de Denis Apothéloz (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le Thèse soutenue le 5 décembre 2009

Résumé
La thèse a pour objectif d’observer le fonctionnement des verbes de manière de mouvement en tant que prédicats en polonais et en français. Il s’avère que les structures argumentales des prédicats sont responsables de certaines caractéristiques et des « comportements » grammaticaux des membres de cette classe verbale dans les deux langues. La thèse répertorie et analyse l’influence des différences structurelles des prédicats sur les propriétés grammaticales des verbes de manière de mouvement en polonais et en français. Le premier chapitre expose les bases théoriques et méthodologiques adoptées dans les analyses. Les chapitres suivants sont consacrés spécifiquement aux verbes déterminés polonais (chapitre 2), aux verbes indéterminés en polonais (chapitre 3) et aux verbes de manière de mouvement français (chapitre 4). Le chapitre 5 est un bilan comparatif. Il montre clairement qu’il n’y a pas d’équivalence entre la classe des verbes de manière de mouvement français et l’une des deux catégories de ces mêmes verbes en polonais. Marcher, rouler, courir, nager, voler, ramper partagent un certain nombre de propriétés avec les verbes indéterminés en polonais chodzic, jezdzic, plywac, biegac, latac, fruwac, pelzac, sans pour autant accepter les mêmes modifieurs. La différence principale entre les verbes polonais des deux groupes et leurs équivalents français se situe sur le plan du prédicat : en polonais, ils sélectionnent l’argument Terminus en formant ainsi des prédicats téliques. Par là même, ils acceptent de modifier les propriétés aspectuelles déterminées par le sens du lexème verbal. En français, à l’exception de courir, les prédicats que forment les verbes de manière de mouvement rejettent l’argument Terminus, car il est incompatible avec l’aspect lexical déterminé par le sens du lexème.

Télécharger la thèse

 

Ciulla e Silva Alena

« Os processos de referência e suas funções discursivas – o universo literário dos contos. »
Sous la direction de Mônica Magalhães Cavalcante (Universidade Federal do Ceará, Fortaleza, Brasil) et Denis Apothéloz (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 24 avril 2008

Résumé

 

Coralie Reutenauer

« Analyse et modélisation sémantiques à partir de ressources lexico-sémantiques. »
Sous le tutorat d’Evelyne Jacquey (ATILF | CNRS – Université de Lorraine), Mathieu Valette (ATILF | CNRS – Université de Lorraine), Jean-Marie Pierrel (ATILF | CNRS – Université de Lorraine) et Pierre Chauvet
Mémoire de stage réalisé en 2008

Résumé

 

Sébastien Haton

« Analyse et modélisation de la polysémie verbale dans une perspective multilingue : le dictionnaire bilingue vu dans un miroir. »
Sous la direction de Jean-Marie Pierrel (ATILF | CNRS – Université de Lorraine) et Bernard Combettes (ATILF | Université de Lorraine – CNRS)
Thèse soutenue le 25 novembre 2006

Résumé
On observe dans les dictionnaires bilingues une forte asymétrie entre les deux parties d’un même dictionnaire et l’existence de traductions et d’informations « cachées », i. E. Pas directement visibles à l’entrée du mot à traduire. L’objectif de cette thèse est de proposer une méthodologie de récupération des données cachées ainsi que la « symétrisation » du dictionnaire grâce au TAL. L’étude d’un certain nombre de verbes et de leurs traductions en plusieurs langues a conduit à l’intégration de toutes les données, visibles ou cachées, au sein d’une base de données unique et multilingue. La réflexion est enrichie par une étude du comportement de certains verbes en contexte. L’objectif est d’enrichir les données lexicographiques par les données attestées sans remettre en cause les premières. Enfin, l’exploitation de la base de données a été rendue possible par l’écriture d’un algorithme de création de graphe synonymique qui lie dans un même espace les mots de langues différentes.

Télécharger la thèse

 

Virginie André

« Construction collaborative du discours au sein de réunions de travail en entreprise : de l’analyse micro-linguistique à l’analyse socio-interactionnelle. »
Sous la direction de Philip Riley (Université de Lorraine)
Thèse soutenue le 2 juin 2006

Résumé
Cette thèse cherche à explorer le fonctionnement discursif et interactif de réunions de travail. Différents champs disciplinaires sont convoqués pour les analyser étant donné que les pratiques et les activités discursives actualisées dans ce genre de discours sont imbriquées dans des situations de travail et de communication particulières insérées dans des enjeux sociaux, culturels, identitaires et relationnels complexes. Cette étude s’intéresse plus particulièrement aux corrélations entre les pratiques langagières des interactants et les facteurs extralinguistiques des réunions de travail. L’analyse d’un corpus de quarante heurres d’enregistrements et de 331 000 mots transcrits permet d’identifier les pratiques langagières contribuant à la collaboration du discours entre les participants. Quatre phénomènes discursifs et interactionnels sont étudiés : l’énonciation conjointe, la reprise, les apparitions du marqueur hein et du couple oui non.

Télécharger la thèse