laboratoire Analyse et Traitement Informatique de la Langue Française (ATILF)
CNRS Université de Lorraine

Membre de
ILF
FEDER
Accueil > La recherche > Équipes > Discours > IV. Thématiques de recherche

IV. Thématiques de recherche

1. Marquage lexical et grammatical


• La temporalité
Les travaux portent sur l’aspectologie et la sémantique verbale et discursive. Ils s’intéressent non seulement à l’aspect verbal dans sa forme lexicale et grammaticale, mais aussi à d’autres éléments porteurs d’informations aspectuo-temporelles, les adverbiaux temporels. Centré principalement sur des travaux contrastifs, les recherches a pour but d’éclairer les modes d’expression, la signification et les usages de la perfectivité, de l’imperfectivité et de la résultativité, à partir d’investigations sur deux langues romanes (français, italien), deux langues germaniques (anglais, allemand) et une langue slave (polonais). Le programme s’appuie sur un groupe de recherche depuis 2005, et un accord international de coopération scientifique entre l’Université de Lorraine, l’ATILF et l’Université Pédagogique de Cracovie, courant jusqu’en 2018. Il est prévu d’en demander le renouvellement. Les thèmes privilégiés pour les années à venir sont : les prétérits allemands et anglais et leur(s) traduction(s) en français ; les concepts de perfectivité, d’imperfectivité et de résultativité en polonais, français et italien ; la surcomposition verbale. La thèse de Marine Borel, en cotutelle avec la Suisse, sous la direction de Denis Apothéloz et Françoise Revaz, est en cours sur les formes verbales surcomposées en français.

• Les mots du discours
Les mots du discours se divisent en deux grands ensembles : les connecteurs et les particules. Les premiers relèvent du domaine de la cohésion, des relations de discours et de l’argumentation, les seconds renvoient au domaine de la Deixis, de l’énonciation et de la subjectivité. Les travaux peuvent être organisés en quatre catégories.
— L’approche sémantique et pragmatique des particules discursives du français, mais également d’autres langues comme l’espagnol. Les langues sont étudiées pour elles-mêmes et aussi de manière contrastive : espagnol/français et si possible cantonais/français (projet PROCORE, en cours d’évaluation). Dans les années à venir, en plus de développer ces deux approches, nous souhaitons développer une collaboration spécifique avec les membres de l’équipe Lexique travaillant sur les mots du discours de l’allemand (Maurice Kauffer, René Métrich), pour bénéficier de leur expérience dans le domaine lexicographique.
— L’approche prosodique.
Il s’agit de décrire systématiquement et automatiquement les propriétés prosodiques des mots du discours dans des corpus oraux (en français : PARDI !, CPER Prosodie). A moyen terme, deux actions sont programmées : la poursuite du projet PARDI ! ; la création et la diffusion d’une base de données importante, segmentée et annotée, des particules du français. Les corpora-références sont issus du laboratoire (TCOF) ou de projets collaboratifs (ESTER, ETAPE dans le cadre du CPER Prosodie). Par ailleurs, une collaboration est en cours avec le projet ANR SynPaFlex (synthèse de la parole flexible pour l’expressivité), projet avec lequel des connexions pertinentes pourront être établies, en particulier sur la question de l’expressivité.
— L’approche diachronique concerne les connecteurs et les particules. Des travaux sont en cours sur les marqueurs de concession issus de la comparaison, ainsi que sur l’éclairage historique du marqueur d’autant que. Les analyses ont pour objectif de mettre en évidence des schémas de grammaticalisation et de pragmaticalisation. Enfin, une collaboration est souhaitée avec l’équipe Linguistique historique et des chercheurs étrangers pour étendre l’étude des marqueurs de discours à la période préclassique.
— L’acquisition
Cette dimension est plus programmatique et ne fait pas encore l’objet d’un projet spécifique. Néanmoins, nous envisageons une collaboration sur l’acquisition de certains connecteurs en français, sur la base de corpus déjà constitués (CORPECS, TCOF, Colaje), pour étudier la correspondance entre la diversité lexicale et la mise en place chez l’enfant de certaines relations de discours plus ou moins complexes cognitivement.

• Les expressions endophoriques
Plusieurs membres s’intéressent au phénomène communément répertorié sous le terme d’anaphore, c’est-à-dire à des expressions dont la réalisation référentielle renvoie nécessairement à un autre élément du cotexte. Il s’agit d’un processus d’interprétation complexe, reposant sur les connaissances de la langue, la prise en compte de l’unité textuelle et les connaissances individuelles et partagées. Les travaux en cours, ou envisagés, sont les suivants : réflexion sur la cataphore, plus contrainte que l’anaphore ; thèse de Mélynda Salcedo Daval sur l’anaphore associative ; synthèse historique sur le pronom dans les grammaires. Bien que ne rentrant pas complètement dans le champ de l’endophore, l’étude des structures du type « Lui, SN » peut trouver sa place ici. Il s’agira de faire une recherche systématique de ce patron dans Frantext et de l’analyser dans le cadre des Grammaires de construction

• La place de l’adjectif épithète
L’objectif de l’analyse est de comparer les résultats présentés par CBen (CMLF 2014), sur la place des adjectifs épithètes en français parlé, à ceux que l’on peut obtenir dans des corpus d’enfants. Les deux participants possèdent de solides compétences sur le français parlé et en psycholinguistique et acquisition. Les corpus TCOF et Colaje seront exploités à l’aide du logiciel TXM afin d’extraire automatiquement les couples « adj. + nom ». La collaboration vise à mettre en évidence des étapes dans la stabilisation de la place de l’adjectif épithète dans des productions d’enfants francophones.


2. Structuration rhétorique et logico-argumentative
Ce volet touche à des phénomènes de cohérence sans marquage lexical obligatoire.

• L’enchaînement des segments de discours
La cohérence textuelle et discursive passe par la production et la reconnaissance de liens, d’articulations entre des segments complexes – de nature prédicative –, qui peuvent aller du lexème au paragraphe entier. Des formes verbales, des connecteurs et des constructions mentionnés ci-dessus correspondent au marquage de cette cohérence. Mais elle peut reposer sur un processus essentiellement inférentiel, sans marque spécifique. C’est le cas par exemple des énoncés dits asyndétiques. La question de base est celle des contraintes qui président aux possibilités d’enchaînement de deux segments de discours (que faut-il dans un segment A et dans un segment B pour créer un lien de concession, de causalité, de succession entre eux ? Y-a-t-il des cas d’ambiguïté ? Les relations de discours demandent-elles toutes le même effort cognitif ?, etc. ) Les travaux de l’équipe dans le domaine vont dans deux directions : d’une part, l’analyse des relations de discours (temporelles et logiques), d’autre part le repérage de ruptures de la cohérence dans le discours psychotique. Dans les deux cas, la réflexion repose sur des données de corpus (enregistrement, transcriptions annotées) et des protocoles expérimentaux (oculométrie – eye-tracking – et électro-encéphalographie – EEG – dans la mesure du possible) et vise une modélisation des contraintes évoquées.
— Relations de discours
Ce sous-thème était déjà présent dans le programme de recherche précédent (par exemple projet PARADIS), notamment à travers les travaux sur les constructions asyndétiques, les conditionnelles et les temporelles. Ces recherches se poursuivent, se spécialisent sur telle ou telle relation, se situent plus explicitement des cadres théoriques permettant sinon une modélisation au moins une explicitation systématique des propriétés (CxG, RST, SDRT, modèle de Genève). On pointera : (i) un travail descriptif déjà bien entamé sur la concession (sa différence avec le contraste, la conséquence, la causalité, la comparaison) ; (ii) un relevé de certaines relations de discours spécifiques et des marqueurs éventuellement associés dans le discours typique et non typique (comparaison sujets schizophrènes et sujets témoins dans le cadre du projet Interactions regard-discours et pathologie). La question est la relativité de la richesse des relations sémantiques présentes chez les deux types de sujets. (iii) Une collaboration est engagée avec un chercheur de l’Institut des Sciences Cognitives de Lyon et certains de ses étudiants, afin de comparer le traitement cognitif des relations de discours marquées et non marquées (eye-tracking et EEG).
Par ailleurs, une recherche est menée sur le rôle de la répétition dans le discours. Elle anticipe un modèle de la cohérence discursive, basé sur les relations de discours, en montrant que ce type de comportement contribue à l’établissement d’un common ground entre les interlocuteurs comme étant à la fois l’un des substrats de la cohérence discursive et un dispositif représentationnel facilitant l’intercompréhension.
— Ruptures discursives
L’observation de ruptures discursives constitue en quelque sorte le négatif du point précédent. Cette recherche correspond globalement à un projet en cours, mettant en lien plusieurs institutions, dont un centre hospitalier psychiatrique à Aix-en-Provence, CHS Montperrin (demande au Comité de Protection des Personnes – CPP – acceptée). La participation de l’équipe Discours à ce projet consiste à étudier les « ratés », les bifurcations inattendues dans le discours de patients atteints de schizophrénie et de paranoïa. Les schémas de ruptures récurrents seront modélisés et permettront d’enrichir l’étude de ces pathologies et leurs manifestations linguistiques, voire leur diagnostic. Le protocole prévoit pour le moment un captage visuel (saccades oculaires) des interactions entre le thérapeute et son patient, au moyen d’un double eye-tracker appartenant à l’équipe. Marie-Hélène Pierre, doctorante, est en charge du recueil des données et inscrit son travail de thèse dans le projet de l’équipe et de la collaboration avec l’établissement hospitalier. Différentes étapes devaient permettre de recueillir un corpus diversifié (tests, entretiens à bâtons rompus, expérience de lecture). L’utilisation de la technique de l’EEG n’est pas encore certaine, compte tenu des pathologies en jeu.

• L’acquisition de constructions
La dimension acquisitionnelle est amenée à évoluer au sein de l’équipe et à se développer, dans deux directions au moins : l’analyse des interactions entre adultes et enfants, atteints ou non de troubles du langage/communication ; la constitution d’un modèle d’apprentissage de la lecture sur la base de la syllabe et non du phonème, dès la classe de maternelle.
— Les interactions adultes-enfants dans les systèmes de communication augmentée ont déjà fait l’objet d’un projet financé par la MSH Lorraine (2015), reconduit en 2016 par l’ATILF. Compte tenu des résultats, il est prévu que ce projet se poursuive. CORPECS repose sur l’analyse des productions d’enfants de 3 à 10 ans présentant des troubles du langage ou de la communication (autisme, trisomie, retard de développement). Plusieurs phénomènes sont en cours d’analyse, selon que l’on se centre sur l’adulte (stratégies d’étayage : offres, reprises, reformulations, structures clivées, utilisation d’énoncés syntaxiquement complexes/bénéfices de ces stratégies sur les capacités de l’enfant), ou sur l’enfant (longueur moyenne d’énoncé, richesse lexicale, catégorisation syntaxique des énoncés). Un autre intérêt majeur de ce projet et de son devenir est la constitution d’un corpus multimodal spécialisé, montrant la mise en œuvre d’un système de communication augmentée pour faciliter l’expression et la compréhension du langage (utilisation simultanée de plusieurs modalités (vocale, visuelle et/ou gestuelle).
— L’apprentissage de la lecture
Si, à première vue, cette recherche peut paraître excentrée par rapport aux thématiques de l’équipe – notamment en ce qui concerne l’unité d’analyse privilégiée – la méthode (expérimentale, linguistique cognitive/psycholinguistique), la combinaison d’une réflexion intégrative et compositionnelle, la finalité (faciliter l’apprentissage de la lecture) et les conséquences (remise en cause de la pratique pédagogique majoritaire) ne sont pas en total décalage avec l’étude du discours. L’originalité de cette recherche réside dans l’analyse qui est faite de la conscience phonémique et des modalités de son acquisition en maternelle. Il s’agit, d’une part, de placer la syllabe au centre de l’apprentissage et d’autre part d’ancrer la reconnaissance des phonèmes dans leur(s) équivalent(s) graphique(s), afin de réifier une entité trop abstraite et artificielle pour les jeunes élèves. La démarche est aussi contrastive, dans la mesure où deux situations linguistiques et pédagogiques sont comparées : la situation en France et la situation en Corée.
La discursivité est en jeu dans les deux directions, de manière différente mais certaine : soit parce que la situation de communication est un lieu d’observation (les interactions en situation écologique) ou une contrainte pesant sur l’acquisition (procédés d’étayage de l’adulte en corrélation avec les possibilités de progression de l’enfant), soit parce que la communication est une fin : la lecture (la facilitation du déchiffrage graphique cible un accès au sens global du texte).


Aller à :
I. Présentation
II. Membres
III. Orientation scientifique

  Annuaire | Contact | Courriel | Intranet | Plan d'accès | Autres sites | Crédits | Mentions légales