Autres projets ressources

AdVeNance | Adjectifs, Verbes et Noms en -ance | héritage transcatégoriel des propriétés sémantiques

Les projets AdVeNance puis Adjant étudient de l’héritage des propriétés sémantiques à travers les catégories lexico-grammaticales, par l’observation de l’appariement des noms en -ance, des adjectifs en -ant et des verbes apparentés.
À la suite de ces projets, nous avons étendu notre recherche aux triplets noms en -ence / adjectifs en -ent / verbes apparentés.
Sur la base de ces données, nous vérifions s’il existe des appariements privilégiés entre noms massifs, verbes atéliques et/ou adjectifs non-bornés d’une part, et noms comptables, verbes téliques et/ou adjectifs bornés d’autre part.
Notre analyse se fonde sur les propriétés morphosyntaxiques et sémantiques des unités lexicales du français, repérées dans des ressources telles que lexiques (Lexique3), corpus (notamment FrWac) et dictionnaire (TLFi).

Financement : MSH Lorraine (2020-2021), ATILF (2022), Pôle CLCS (2022)

Responsable du projet : Marie Laurence Knittel (ATILF / Université de Lorraine – CNRS) | Membre : Rafael Marín (STL & Université de Lille)

Partenaires : MSH Lorraine, Pôle CLCS

Site Web : https://cenhtor-msh-lorraine.cnrs.fr/s/advenance/page/projet
Télécharger la ressource Naence (format xslx)

Publications :
Knittel, M.L. & Marín, R. (2022). L’héritage transcatégoriel des propriétés sémantiques : le cas des noms en -ance et des verbes et adjectifs apparentés. Actes du CMLF 2022, F. Neveu, S. Prévost, A. Steuckardt, G. Bergounioux and B. Hamma (eds.) https://www.shs-conferences.org/articles/shsconf/pdf/2022/08/shsconf_cmlf2022_07001.pdf.
Knittel, M.L. & Marín, R. (2021). Developing a resource for -ance nouns, and related verbs and adjectives. Proceedings of the 3rd International workshop on resources and tools for derivational morphology. Nancy, 9-10/O9/ 2021. F Namer, N. Hathout, S. Lignon, M.Ševˇcíková & Z. Žabokrtsk eds. http://nabil.hathout.free.fr/DeriMo2021.

Alesy | Apprentissage du Langage Écrit via la SYllabe

Selon le Programme international pour le suivi des acquis des élèves (PISA, OCDE, 2019), 20 % des élèves en France ne maîtrisent pas les savoirs fondamentaux à la sortie de l’école primaire, et c’est encore plus vrai dans les zones d’éducation prioritaire (dans le système français, REP et REP+), où le poids du déterminisme socio-économique est encore très fort. La clé de la réussite des activités scolaires est la lecture. L’objectif du projet Apprentissage du Langage Écrit via la SYllabe (ALESY) est de déterminer quelle est la meilleure stratégie à adopter avant l’apprentissage du code alphabétique, lorsque les enfants sont encore pré-lecteurs, afin de faciliter leur apprentissage lorsqu’ils l’abordent à l’école primaire. Pour ce faire, nous évaluons le rôle que l’apprentissage statistique joue dans les mécanismes d’acquisition de la littératie en maternelle et dans la première année de primaire dans des écoles REP/REP+.

Alesy est un projet soutenu par le GIS | Groupement d’Intérêt Scientifique Education et Formation

Laboratoires impliqués : ATILF, LISEC, 2LPN

Porteure du projet : Samantha Ruvoletto.

Site Web : https://www.gis-education-et-formation.fr/soutien-a-la-recherche/projets-en-cours/projet-alesy

Visualiser le projet en vidéo

Aliento | Analyse Linguistique Interculturelle d’ÉNoncés sapientiels et de leur Transmission de l’Orient à l’occident et de l’occident à l’orient

Aliento vous propose d’explorer des textes de sagesse anciens, en partant du Moyen Âge (IXe siècle) et de l’Orient, en passant par al-Andalus et en allant vers l’Occident et le temps présent.
La base de données vous permettra d’entrer dans la sagesse médiévale arabe, hébraïque, latine, espagnole, catalane, judéo-espagnole, d’y trouver de précieux conseils, et de rechercher maximes, sentences et proverbes dont beaucoup sont encore en usage aujourd’hui.

Aliento est un projet financé par l’ANR (ANR-13-BSH3-0009-3) de 2014 à 2018 qui réunit l’atilf (CNRS – UL), la MSH Lorraine et l’inalco

Responsables scientifiques : Marie-Christine Bornes-Varol et Marie-Sol Ortola.
Responsable informatique : Benjamin Husson.

Site Web : https://www.aliento.eu
Consulter la base de données : https://base.aliento.eu/accueil

APIPreSui | Analyse Participative et Interdisciplinaire d’un chat de Prévention du Suicide

Le projet APIPreSui (Analyse Participative et Interdisciplinaire d’un chat de Prévention du Suicide) est une recherche participative interdisciplinaire sur un dispositif numérique de prévention du suicide par chat. L’analyse est co-construite avec l’association de prévention, ses formateurs, psychologues et bénévoles d’une part, et les chercheurs en sciences du langage (sociolinguistique – analyse du discours – lexicométrie – TAL), en informatique, et en psychologie sociale, d’autre part.

Un premier volet du projet consiste en une analyse de discours outillée des 10 ans du corpus de chat (2005-2015), en combinant approches qualitatives et quantitatives. L’analyse de la totalité du corpus dans ses caractéristiques sociolangagières et discursives a pour but de mieux comprendre le fonctionnement de ces conversations sensibles. L’exploration lexicale, énonciative et interactionnelle permettra de mettre à jour les conditions de félicité et de dysfélicité (bon/dys-fonctionnement) du discours des écoutants. Et ainsi de pouvoir proposer des pistes d’amélioration du dispositif dans son fonctionnement discursif, et dans la formation dispensée aux bénévoles. Des séminaires de travail réguliers réunissant les formateurs et bénévoles de l’association et les chercheurs permettront de travailler, par hétéro-confrontation, les différentes phases d’analyse du corpus systématiquement, en combinant mutuellement des expériences de terrain et de recherche de toute l’équipe.

La coopération au sein de l’axe De la syntaxe au discours de l’ATILF se construit autour de l’analyse macro-syntaxique de l’argumentation ‘ordinaire’, combinée à l’exploration du fonds Claire Blanche-Benveniste, qui avait commencé à explorer ce phénomène : se situant à l’intersection des recherches syntaxiques sur le français parlé et de l’analyse de discours (Deulofeu 2016), cette étude se concrétisera sur ce corpus d’écrit électronique, non étudié à ce jour, lequel se révèle fortement argumentatif.

Coordination générale : Gudrun Ledegen (Université Rennes 2 – PREFICS, en délégation CNRS à l’ATILF / Université de Lorraine – CNRS en 2024-2025).

Partenaires : PREFICS (Université de Rennes 2, Université Bretagne Sud et Université de Nantes), CEDITEC, Université Paris Est Créteil, IRISA-UMR 6074, Université Bretagne Sud, LP3C, Université de Rennes 2, LPPS, Université Paris 8.

Financement : ANR (https://anr.fr/Projet-ANR-23-SSRP-0004)

2024 à 2026

Site Web : https://lignedecoute.hypotheses.org/
Télécharger l’affiche Sortir du silence… Les lignes d’écoute et vous

Base de civilisation romaine (XIIᵉ-XVᵉ s.)

Cette base vise à récolter les matériaux nécessaires à l’histoire de la formation du lexique de la civilisation romaine en français médiéval. Elle repose sur le dépouillement de nombreux textes (en particulier des traductions) encore inédits à ce jour. Son point de départ est le concept latin, auquel sont rattachés des « équivalents » français, qu’il s’agisse de lexèmes du vocabulaire courant ou de latinismes néologiques. Les gloses recensées permettent de se faire une idée plus juste de la représentation de la Rome antique et, éventuellement, de repérer une tradition textuelle.

Responsable scientifique : Frédéric Duval.
Responsable informatique : Sandrine Ollinger.

Site Web : https://realia.atilf.fr/

Base des mots-fantômes

Depuis 2005, cette base répertorie les mots qui sont enregistrés dans les dictionnaires mais qui sont en réalité des erreurs. Elle complète et corrige le Dictionnaire de Godefroy ainsi que le FEW.
Elle comprend 670 mots-fantômes.

Responsable : Nadine Steinfeld.
Collaborateurs à l’ATILF : Nadine Steinfeld, Jean-Paul Chauveau, Yan Greub, Gilles Souvay.
Relecteurs internationaux.

Site Web : http://www.atilf.fr/MotsFantomes/

BEL-RL-fr : révision et enrichissement

Ce projet regroupe différents travaux autour de la valorisation et de l’exploitation de la base de citations lexicographique du RL-fr | Réseau Lexical du Français, distribuée en tant que corpus autonome sur la plateforme ORTOLANG (https://hdl.handle.net/11403/examples-ls-fr). Ce projet s’inscrit dans le cadre des travaux sur les Systèmes Lexicaux menés sous la responsabilité d’Alain Polguère.

BEL-RL-fr a bénéficié de financement de la part du consortium CORLI, du CPER LCHN et d’IMPACT OLKi-LUE

Responsable : Sandrine Ollinger, ingénieure d’études CNRS
Collaboration

Début : 2018

BHVF | Base historique du vocabulaire français (Datations et Documents Lexicographiques)

Site Web : http://atilf.atilf.fr/jykervei/ddl.htm

Bibliographie du Dictionnaire de l’ancienne langue française et de tous ses dialectes du IXᵉ au XVᵉ siècle de Godefroy (1881-1902)

Cette base complète les 10 volumes du Dictionnaire de l’ancienne langue française et de tous ses dialectes du IXᵉ au XVᵉ siècle (1881-1902) de Godefroy, qu’il s’agisse des ouvrages cités (bibliographie), des auteurs des exemples, ou de rectifications diverses.
Elle comprend 18 800 fiches.

Responsable : Jean-Loup Ringenbach.

Mise en ligne : 2007.

Site Web : http://www.atilf.fr/BbgGdf/

Cité de Dieu

Édition critique de la première traduction en français (1371-1375), par Raoul de Presles, de La Cité de Dieu de saint Augustin. Cette édition permet d’observer l’origine du lexique politique français en relation avec l’histoire de la pensée politique ; elle sera complété par un glossaire.

Projet financé de 2008 à 2013 par l’ERC, responsable O. Bertrand.

Responsables : Olivier Bertrand (Université de Cergy-Pontoise), Béatrice Stumpf.

Deux volumes sont parus en 2013 et 2015 (La Cité de Dieu de saint Augustin traduite par Raoul de Presles (1371-1375), sous la direction d’Olivier Bertrand, tome I/1 et tome I/2, Paris, Champion, 981 et 478 p.), un troisième paraîtra en 2021.

CIPRADEF | Classes d’immersion : pratiques discursives d’évaluation et de feed-back

Ce projet interroge les pratique en immersion dans les écoles Jean Jaurès et Guynemer à Nancy.

Chercheures impliquées : Véronique Lemoine-Bresson, Stéphanie Lerat, Anne Choffat-Dürr et Latisha Mary (LILPA strasbourg)

Financement : ATILF en partenariat avec l’Inspé et le rectorat Nancy-Metz

CNRTL | Centre National de Ressources Textuelles et Lexicales

Créé en 2005 par le CNRS, le CNRTL fédère au sein d’un portail unique, un ensemble de ressources linguistiques informatisées et d’outils de traitement de la langue.
Le CNRTL intègre le recensement, la documentation (métadonnées), la normalisation, l’archivage, l’enrichissement et la diffusion des ressources.
La pérennité du service et des données est garantie par l’adossement à l’UMR ATILF (CNRS – Nancy Université), le soutien du CNRS ainsi que son intégration dans le projet d’équipement d’excellence ORTOLANG.

Site Web : https://www.cnrtl.fr/

CODIM | Compositionality and Discourse Markers (Compositionalité et marqueurs discursifs)

Le projet CODIM porte sur les deux ressources linguistiques principales qui permettent d’organiser les monologues et les conversations dans le langage naturel : les M(arqueurs) D(iscursifs) (par ex. « donc », « ben », « bon », etc.) et leur prosodie (en particulier l’intonation). Le projet évaluera leur fonctionnement par rapport aux deux visions principales de la communication langagière : la compositionnalité, c’est-à-dire la possibilité de combiner des expressions porteuses de sens en expressions porteuses de sens plus complexes, et les approches fondées sur la notion de motif ou de construction, c’est-à-dire l’idée que les locuteurs exploitent des séquences de mots en partie figées. On comparera les propriétés sémantiques et prosodiques de MD simples et complexes (par ex. « ah » + « bon »), extraits de corpus écrits et oraux, en utilisant un ensemble de techniques telles que la fouille de texte à base de catégories morphosyntaxiques, l’agrégation (statistiques et apprentissage automatique) et la recherche en sémantique formelle et prosodie (mesures de durée et d’intensité, représentation des contours). Le projet CODIM repose sur la collaboration entre linguistiques et informaticiens.

**********************************

The CODIM project focuses on the two main linguistic resources for organizing monologues or conversations in human languages : D(iscourse) M(arkers) (therefore/donc, well/ben,bon etc. in English/French) and prosody (in particular, intonation). It will evaluate their status with respect to two major views on communication: compositionality (the possibility of combining meaningful expressions into more complex meaningful expressions) and pattern- or construction-based approaches (the idea that language users exploit partly ‘frozen’ strings of words). We will compare the semantic and prosodic properties of simple and complex French DM (e.g. ah + bon) found in corpora for written and spoken French, using a variety of technical tools for DM identification (category-driven text mining), clustering (statistics and Machine Learning) and research in prosody (duration and intensity measures, contour representation). The project fosters a number of collaborations between linguists and computer scientists.

Coordination générale : Mathilde Dargnat (ATILF / Université de Lorraine – CNRS).

Partenaires : LLF / Université Paris Cité – CNRS (resp. Jonathan Ginzburg), LORIA / Université de Lorraine – CNRS – INRIA (resp. Yannick Toussaint).

Financement : ANR

Début et durée du projet scientifique : 2023 à 2026.

Site Web : https://www.codim-project.org/

Contact : mathilde.dargnat [at] univ-lorraine.fr

Composantes temporelles et mélodiques dans l’identification des frontières prosodiques au cours du traitement du langage parlé chez les adultes dyslexiques

Dans ce projet, nous cherchons à évaluer les compétences prosodiques d’une population d’adultes dyslexiques étudiant à l’université, dont les troubles phonologiques sont stabilisés (Miller-Shaul, 2005).

Membres : Samantha Ruvoletto (Université de Lorraine), Pascale Colé (Aix-Marseille Université), Maria Paola D’Imperio (Aix-Marseille Université).

Connaissances relatives à la fréquence de doublement des lettres influencent-elles l’apprentissage de l’orthographe lexicale lorsque le doublement des consonnes a une contrepartie phonologique, comme en italien ?

Les doubles consonnes en italien font l’objet de cette étude. Sur la base des recherches concernant l’anglais (Hayes et al. 2006 ; Treiman et al., 2016), notre hypothèse est que, même si la présence d’un doublet modifie la prononciation et donc permet un codage phonologique (y compris en lecture silencieuse) de la présence/absence d’un doublet en italien, les participants (des adultes alphabétisés) utilisent des contraintes de fréquence à l‘écrit pour apprendre des nouveaux mots contenants ces doubles consonnes.

Responsables : Samantha Ruvoletto (Université de Lorraine), Sébastien Pacton (Université Paris 5).

CoRe2AD | Corpus et ressources : annotation, apprentissage, désambiguïsation

CoReA2D vise le développement d’un outil d’aide à l’annotation générique, ergonomique, conforme aux normes ISO de représentation (annotations déportées) et disposant de fonctionnalités permettant une gestion explicite d’une campagne d’annotation. Il prévoit l’utilisation de la méthodologie de l’apprentissage actif (alternative à la propagation d’étiquettes et à la pré-annotation totalement automatique). Dans cette perspective, il s’appuie sur différents outils : GLOZZ, GATE Teamware, un outil issu du projet TermITH, l’interface Idefix ainsi que sur TXM7.8 qui, sans être un outil d’aide à l’annotation, a récemment intégré des fonctionnalités d’annotation à celles de l’exploration statistique et lexicale des corpus. Ces outils seront étendus ou serviront de base au développement d’un outil nouveau.
L’originalité de la méthode envisagée est de renouveler la question de la propagation des annotations via l’exploitation d’une classification par similarité de l’ensemble des contextes d’apparition d’une même forme à annoter.Le premier résultat attendu est une synthèse de l’étude exploratoire menée sur les outils existants choisis. Elle sera fondée sur des expérimentations mises en œuvre sur des ressources déjà bien connues des membres du projet :

les terminologies construites dans le projet ANR TermITH (ORTOLANG)
les terminologies produites à partir d’une expérience réalisée dans le cadre de la facette recherche d’ISTEX sur un corpus en anglais centré sur le vieillissement
les lexiques transdisciplinaires (ORTOLANG et OLST)
deux ressources phraséologiques (TLF’Phraseo, ORTOLANG)
la ressource produite par le projet ANR PARSEME-FR

Le second résultat attendu est l’outil lui-même qui fera usage de l’apprentissage actif, d’une propagation renouvelée des annotations et disposera d’une gestion maîtrisée des campagnes d’annotation.

Coordination : Evelyne Jacquey

Laboratoires participants : ATILF (Nancy), CLLE (Toulouse), Inist (Nancy), Lidilem (Grenoble), Loria (Nancy), OLST (Montréal)

Financement : CPER LCHN et Istex-R

Corpus Les Vocaux

Le corpus Les Vocaux est réalisé dans le cadre du projet ORALIDIA : Oralité et diachronie : une voie d’accès au changement linguistique. Malgré le développement des corpus oraux, l’accès à l’oral spontané reste difficile. Le projet ORALIDIA vise à la constitution d’un corpus inédit de français parlé spontané : les « sms vocaux » ou « vocaux ». Ces données sont spontanément produites en dehors de toute enquête ou entretien linguistique, et constituent une voie d’accès à la parole spontanée non surveillée, nécessaire pour la description de la langue naturelle. Ces données sont ainsi le lieu privilégié d’étude de la diffusion des formes émergentes ou de leur disparition, et du français parlé dans différents contextes, en particulier informels. Les SMS du corpus ont été recueillis en 2021 et en 2022.

Le projet a reçu le financement de l’IDEX Exploratoire de l’Université de Strasbourg (oct. 2022-déc 2024), du laboratoire ATILF et de l’Université de Lorraine (2022), ainsi que le soutien du CNRS (délégation CNRS de J. Glikman 2021-2023)

Porteuse du projet : Julie Glikman (Université de Lorraine, ATILF)
Membres principaux du projet : Christophe Benzitoun (Université de Lorraine, ATILF), Camille Fauth (Université de Strasbourg, LiLPa), Nicolas Mazziotta (Université de Liège, Traverses).

Page Web : https://www.atilf.fr/ressources/corpus-les-vocaux/

CoText | Outil d’Aide à la Préparation de l’épreuve de français du Diplôme National du Brevet

L’outil CoText se fonde, comme LyText, sur une base d’extraits de textes permettant d’exercer les collégiens aux épreuves du Diplôme National du Brevet et sur un modèle de connaissances regroupant les informations analytiques, génériques et linguistiques qui favoriseront la compréhension et l’interprétation des textes.

L’Académie Nancy-Metz a inscrit CoText dans le Projet Lorrain Ambition Numérique en Territoire pour l’Education (PLANETE).

Cofinancé par le Fonds Européen de Développement Régional, dans le cadre du programme opérationnel FEDER-FSE Lorrain et Massif des Vosges 2014-2020.

Voir la vidéo de présentation de CoText

Contacts : etienne.petitjean [at] atilf.fr | benjamin.husson [at] atilf.fr

Dictionnaire des actes de langage stéréotypés (ALS) en français et en allemand

Le Dictionnaire des actes de langage stéréotypés (ALS) est un dictionnaire contrastif et contextuel en ligne autour d’un petit nombre d’unités phraséologiques pragmatiques en français et en allemand, dont certains comprennent un verbe du dire, par exemple les ALS français c’est vite dit / dis donc / tu parles ou les ALS allemands na sag mal / (und) das sagst du mir. Ce dictionnaire a été conçu et élaboré par le Groupe de lexicographie franco-allemande (GLFA) entre 2011 et 2021 sous la direction de M. Kauffer (collaboration : Y. Keromnes / R. Métrich / A.-M. Nahon-Raimondez / C. Pernot / A. Smith). Les entrées ont été élaborées en suivant une méthode d’analyse basée sur corpus : les exemples d’emploi authentiques proviennent, d’une part, d’un corpus bi-texte littéraire issu des travaux de R. Métrich et d’E. Faucher sur les Invariables Difficiles (1998 – 2002), débouchant sur le Wörterbuch deutscher Partikeln (2009), ainsi que des corpus et ressources tels que le Digitales Wörterbuch der deutschen Sprache (DWDS), la Datenbank für gesprochenes Deutsch (DGD) ou encore divers sites de discussion trouvés sur internet d’autre part. L’informatisation a été réalisée avec le soutien logistique et financier de l’ATILF.

*******************************************

The Dictionary of Stereotypical Speech Acts (StSpA) is an online contrastive and contextual dictionary based on a small number of French and German pragmatic phraseological units, some of which contain a speech verb (dire, parler, … sagen, …) for example dire in the French ALS c’est vite dit (easier said than done…) or sagen in the German ALS na sag mal (come on…). This dictionary was conceived and developed by the Groupe de Lexicographie Franco-Allemande (GLFA) between 2011 and 2021 under the direction of M. Kauffer (collaboration: Y. Keromnes / R. Métrich / A.-M. Nahon-Raimondez / C. Pernot / A. Smith). The entries have been compiled using a corpus-based method of analysis: the authentic usage examples come from a literary bi-textual corpus that originated with the work of R. Métrich and E. Faucher on Tricky Particles (Fr. Invariables difficiles), which led to their Wörterbuch deutscher Partikeln (2009), as well as corpora and resources such as the Digitales Wörterbuch der deutschen Sprache (DWDS), the Datenbank für gesprochenes Deutsch (DGD) and various discussion forums on the Internet. The computerisation was carried out with the logistical and financial support of ATILF.

DCV16 | Dictionnaire en ligne des constructions du verbe français au XVIe siècle

Les verbes du français du XVIe siècle peuvent se construire comme en français moderne (ex. : envoyer quelque chose à quelqu’un), mais aussi de façon différente (ex. : approcher le rivage), et parfois même d’une façon qui peut égarer le lecteur moderne (ex. : éloigner Pierre qui signifie « s’éloigner de Pierre »).
Le dessein de ce dictionnaire est de recenser les constructions syntaxiques des verbes du français à partir de l’observation et du commentaire de leurs emplois dans un corpus issu de Frantext (œuvres comprises entre 1500 et 1630). À ce corpus s’ajouteront des œuvres françaises liées à la Lorraine, soit par leur contenu, soit en raison de l’origine de leur auteur, comme celles de Pierre Fourier, Louis des Masures ou Alphonse de Rambervillers. La plupart d’entre elles sont des imprimés d’époque, conservés dans le fonds patrimonial de la Bibliothèque Municipale Stanislas de Nancy.
Ce projet en humanités numériques pourra intéresser linguistes et littéraires, spécialistes de cette époque ou même d’une autre, et plus largement toute personne férue de langue française. La terminologie grammaticale utilisée sera accessible aux non-spécia- listes. Les textes lorrains ou liés à la Lorraine seront édités en ligne dans un format numérique, en partenariat avec la Bibliothèque Municipale Stanislas, et ainsi rendues facilement accessibles à tous.

Financement 2019-2021 par la Métropole du Grand Nancy.

Responsable : Sylvie Bazin.
Membres : Bernard Combettes et Jean-Michel Jézéquel.

Durée estimée du projet : 5 ans.

DECLICS | Dispositifs D’études Cliniques sur les Corpus de Santé

Financement : MSH Clermont

Responsables : M. Blasco (Université Clermont-Auvergne), E. Slusarczyk (Université de Clermont-Auvergne).
Membre : Mathilde Dargnat (Université de Lorraine).

DÉCT | Dictionnaire Électronique de Chrétien de Troyes

Le Dictionnaire Électronique de Chrétien de Troyes (DÉCT) constitue à la fois un lexique complet de cet écrivain du XIIe siècle et une base textuelle qui permet de lire ou d’interroger les transcriptions de ses cinq romans (Érec, Cligès, Lancelot ou le Chevalier à la Charrette, Yvain ou le Chevalier au Lion, Perceval ou le Conte du Graal).
► Collaboration avec le Laboratoire de français ancien de l’Université d’Ottawa (https://www.francaisancien.net/presentation.html).

Responsable du projet : Pierre Kunstmann (Université d’Ottawa).
Collaborateurs : Hiltrud Gerner, May Plouzeau, Gilles Souvay.

Site Web : http://www.atilf.fr/dect/

DFS | Donnez votre français à la science

L’objectif de ce projet financé par la DGLFLF est de développer et mettre librement à disposition une plateforme de collecte de données orales et écrites.

Responsable : Julie Glikman (Université de Strasbourg)
Membres : Jean-Philippe Goldman, Philippe Boula de Mareüil (LIMSI), Christophe Benzitoun (Université de Lorraine), Mathieu Avanzi (Sorbonne Université)

D.Hi.Co.D.E.R. | Dictionnaire historique des concepts descriptifs de l’entité romane (19e–21e siècles)

Le projet consiste à réaliser un dictionnaire électronique des concepts descriptifs de l’entité romane, à partir de nouvelles ressources lexicographiques et textuelles. L’objectif, à terme, est de revisiter l’historiographie de la linguistique romane et de reconsidérer les paradigmes habituels.

Responsable : Anne-Marie Chabrolle-Cerretini.
Collaborateurs : Bérengère Bouard et 4 membres extérieurs au laboratoire.

DIPERLANG | Interculturalité en formation d’enseignants et école primaire

Le projet DIPERLANG a comme objectif de comprendre la manière dont les étudiants en formation initiale à l’ESPÉ s’approprient des savoirs et savoir-faire sur l’interculturalité essentiels pour une professionnalisation réussie. Dans le cadre de ce projet, nous étudions des écrits relatant des expériences personnelles vécues en situation interculturelle. Dans cet atelier interactif, nous proposons aux participants de co-élaborer la réflexion autour des problèmes méthodologiques qui se posent dans l’analyse de ces écrits.

Chercheures impliquées : Véronique Lemoine-Bresson, Stephanie Lerat

EDOlang | Environnement et Dispositifs Ouverts pour l’apprentissage des langues

Le projet EDOlang a permis de construire une plateforme pensée, dès sa genèse, pour soutenir l’apprentissage auto-dirigé des langues en Centre de ressources en langues (CRL) et en faire la promotion.

Chercheurs impliqués : Anne Chateau, Sophie Bailly, Carine Martin, Carmenne Kalyaniwala, Justine Paris et Nicolas Molle

Financement : projet FEDER

Durée : 2015 à 2018

Site Web : https://edolang-app.univ-lorraine.fr/accueilMenu/carnetBord

EGICS | Exploration des inégalités de genre sur internet par la sociolinguistique computationnelle | Projet ANR-24-AERC-0011

Selon un adage popularisé sur le forum 4chan, « il n’y a pas de filles sur internet ». Aussi provocateur qu’il puisse paraitre, cet adage contient un fond de vérité. Loin d’être le « grand égalisateur » espéré au début des années 1990 (Wojahn, 1994), c’est-à-dire un espace où il y aurait moins de sexisme et de racisme que dans le monde « réel », internet reproduit et amplifie les inégalités de genre, si bien que nous vivons aujourd’hui dans un contexte mondial de « ségrégation numérique » (Friesen et al., 2021). Le projet EGICS (Exploration des inégalités de genre sur internet par la sociolinguistique computationnelle) vise à mettre en lumière la façon dont les femmes et les hommes participent aux discussions sur diverses plateformes internet (Reddit, YouTube, médias sociaux, forums en ligne et sections de commentaires des sites médiatiques, etc.). EGICS utilise des méthodes sociolinguistiques computationnelles, qui combinent traitement automatique des langues (TAL) et questions sur la dimension sociale du langage. Puisque le langage est central dans les interactions en ligne, cette approche a le potentiel de nous aider à mieux comprendre les inégalités de genre sur internet. Basé sur de grands jeux de données, EGICS propose de développer une approche fine et nuancée des identités en ligne, qui prend en compte non seulement les identités de genre, mais aussi la manière dont ces identités sont créées par le langage dans divers contextes.
EGICS s’articule autour de trois phases : PARTICIPATION, DÉ-CONSTRUCTION, et ACTION. La phase PARTICIPATION adoptera une approche multifactorielle pour mesurer la participation en ligne d’individus de différentes catégories sociales, explorant la manière dont le genre interagit avec la classe sociale, l’âge, la sexualité et le handicap. L’objectif de la deuxième phase, DÉ-CONSTRUCTION, est d’étudier comment les approches discursives peuvent être utiles pour étudier les inégalités dans la participation en ligne. Elle s’éloigne de l’étude des identités sociales pour s’intéresser aux performances sociolinguistiques : la façon dont les individus utilisent différentes ressources linguistiques pour communiquer des informations sur eux-mêmes dans différents contextes. Des algorithmes de clustering seront utilisés pour grouper les internautes en fonction de leurs choix linguistiques, et les « identités sociolinguistiques » ainsi obtenues seront comparées aux identités sociales de la phase 1 pour voir dans quelle mesure elles s’alignent. Enfin, la phase ACTION étudie la manière dont les identités sociales et sociolinguistiques sont muselées ou au contraire valorisées en ligne, avec des études portant sur les propos misogynes, trans/homophobes et racistes, et, à l’opposé, sur le langage de l’antidiscrimination.
EGICS est un projet ambitieux, car les analyses linguistiques très détaillées qu’il propose sont plus chronophages que celles habituellement réalisées dans le domaine du TAL. Il vise ainsi à fournir une meilleure compréhension de la source des inégalités de genre en ligne, ainsi que des pistes pour les réduire. Innovant et interdisciplinaire, EGICS mêle TAL, sociolinguistique, études de genre et ethnographie numérique, et apportera des contributions scientifiques à tous ces domaines. Un grand soin sera apporté à la création de corpus inclusifs, afin de réduire les disparités dans les jeux de données : en effet, en raison de la manière dont ils sont construits (en s’appuyant sur les interfaces de programmation de sites comme Reddit), les grands corpus d’internet marginalisent souvent encore plus les femmes (D’Ignazio & Klein, 2023). J’émets l’hypothèse que cette nouvelle approche permettra d’obtenir une image beaucoup plus complète de la participation en ligne des individus, et dans un éventail de contextes beaucoup plus large, qu’il n’en existe actuellement.

Financement : ANR

Responsable du projet : Marie Flesch (ATILF / Université de Lorraine – CNRS, axe de recherche Didactique des langues et sociolinguistique)

Site Web : https://anr.fr/Project-ANR-24-AERC-0011

EuLAwa – Projet ANR MRSEI 2023

Financement : ANR – Plan d’action 2023 « Construction de l’Espace Européen de la Recherche et Attractivité Internationale », programme MRSEI

Coordinatrice : Hélène Vinckel-Roisin.

Institution leader : Université de Lorraine, Laboratoire ATILF.
Universités partenaires : Copenhague, Erlangen-Nürnberg, Mannheim, Milan, Poznan, Varsovie, Zurich.

EVALANG | Constituer une base de données pour comprendre les processus développementaux typiques et atypiques

La recherche EVALANG Évaluation des compétences langagières d’enfants (tout-venant et dysphasiques en situations spontanées) a pour objectif principal de créer un outil d’évaluation, fiable et objectif, des compétences langagières d’enfants avec ou sans troubles du développement du langage âgés entre 5 et 7 ans. Cette grille ne peut être élaborée qu’en tenant compte des productions réelles d’enfants engagés dans des interactions verbales adulte-enfant.

Responsable : C. da Silva Genest (Université de Lorraine)
Membres : G. de Weck (Université de Neuchâtel), S. Jullien (Université de Neuchâtel), M. Le Mené (Université de Strasbourg), C. Masson (Université Sorbonne Nouvelle), A. Salazar Orvig (Université Sorbonne Nouvelle).

Femme, j’écris ton nom… Guide d’aide à la féminisation des noms de métiers, titres, grades et fonctions

L’INaLF (l’établissement qui a précédé l’ATILF) a entrepris en 1998 des recherches sur le féminin dans ses modalités morphologiques, morphosyntaxiques et discursives. Ce travail s’est traduit par la publication, en juin 1999, de « Femme, j’écris ton nom… Guide d’aide à la féminisation des noms de métiers, titres, grades et fonctions ».
En complément à l’ouvrage imprimé, le site présente en ligne les règles de féminisation et le lexique.

Site Web : http://www.atilf.fr/Feminisation

FEW | Französisches Etymologisches Wörterbuch

Le FEW, œuvre de Walther von Wartburg, continuée depuis 1993 par le laboratoire, répertorie et étymologise, dans une perspective d’étymologie-histoire des mots, le lexique galloroman dans toute sa diversité diachronique, diatopique et diastratique. Il a été depuis le début de sa publication en 1922 le principal laboratoire de recherche sur les méthodes de l’étymologie.

Financement partiel par le Fonds national suisse de la recherche scientifique depuis 1993.

Responsable : Yan Greub.
Collaborateurs : Jean-Paul Chauveau, doctorants et post-doctorants, français et étrangers.

Site Web : http://www.atilf.fr/FEW/

FL2I | Français Langue d’Intégration et d’Insertion

Le projet Portail FL2I a été créé en 2015 par l’axe de recherche Langage, Travail et Formation | LTF. Cet axe rassemble des spécialistes de la formation des adultes en insécurité langagière et travaille en lien étroit avec les acteurs de terrains tels que les formateurs en FL2I, qu’ils soient professionnels ou bénévoles. Ce projet a notamment pu voir le jour grâce au soutien de la DAAEN et de l’UFR Sciences Humaines et Sociales de l’Université de Lorraine. Il a également reçu le soutien de la Délégation Générale à la Langue Française et aux Langues de France (DGLFLF – Ministère de la Culture).

Porteur du projet : Hervé Adami

Financement : DGLFLF

Site Web : https://fli.atilf.fr/

FRACOV | Français contemporain vernaculaire

Mise à disposition de fiches descriptives portant sur le français vernaculaire.

Financement : ILF

Responsables : Pierre Larrivée (Université de Caen), Florence Lefeuvre (Université Sorbonne Nouvelle).
Rédaction de notices : Christophe Benzitoun (Université de Lorraine)

Site web : http://fracov.org

FRONTERME | À la frontière du terme et du non-terme : le cas du lexique de la chimie

Projet doctoral financé par la Région Grand Est (France)

Référents scientifiques : Alain Polguère, professeur Université de Lorraine et directeur de thèse en codirection avec Francesca Ingrosso, maître de conférences Université de Lorraine (LPCT / UL – CNRS) ; doctorante : Polina Mikhel

Durée : septembre 2018 à août 2021

Génération automatique de définitions lexicographiques

Ce projet vise l’implémentation d’un système de génération dynamique de définitions lexicographiques à partir des graphes sémantiques des définitions du Réseau Lexical du Français | RL-fr

Projet financé par le Conseil de recherches en sciences humaines du Canada CRSH (Canada).

Alain Polguère, professeur Université de Lorraine est collaborateur. Autre membre du projet : François Lareau, chercheur principal.

Durée : juin 2018 à mai 2020

GETEC | pratiques discursives et formatives des tuteurs inspé auprès des étudiants fonctionnaires stagiaires

Chercheurs impliqués : Guillaume Nassau, Séverine Behra

Grande Grammaire Historique du Français

Grammaire paru en 2021.

Responsables : Anne Abeillé (Université de Paris), Danielle Godard (Université de Paris), Antoine Gautier (Sorbonne Université).
Rédaction de sections : Bernard Combettes (Université de Lorraine), Mathilde Dargnat (Université de Lorraine).

HAS-Dariah | Humanities at Scale: Evolving the DARIAH-ERIC

Implication de l’équipe sous les auspices d’Huma-Num.

Site Web : http://has.dariah.eu

IDProf | Identité Professionnelle des (futurs) enseignants de langues

Le projet de recherche IDProf concerne l’étude de l’identité professionnelle d’enseignants (du premier degré, du second degré, ainsi que ceux du supérieur), dans sa construction dynamique, ses dimensions émotionnelles et sociales, en particulier en ce qui concerne les langues-cultures.
Attaché à différents dispositifs de formation (pré-)professionnalisante, IDProf vise à identifier des indicateurs constitutifs de l’identité professionnelle, des points d’attention aux dilemmes externes et internes rencontrés au cours du processus formatif ou de moments significatifs de la carrière.
IDProf s’inscrit comme projet de recherche à visée transformative de l’école à travers l’identification de leviers potentiels pour de futures actions de formation. Le projet de recherche aborde les liens entre Recherche et Formation sur la question des langues-cultures, leurs composantes individuelles et sociales dans le processus de développement de l’identité et de la professionnalité des (futurs) enseignants.
Un mémoire de master soutenu en 2021 se prolonge par un doctorat en lien avec ce projet de recherche.
IDProf prévoit de se déployer dans un groupe de travail inter-laboratoires et interdisciplinaire. Il s’articule avec le RTP Éducation du CNRS, auquel contribue l’ATILF.

Membres du projet : Séverine Behra, MCF, UL-INSPÉ, ATILF (coordination)
Agathe Chassard, doctorante, enseignante et formatrice, ATILF
Hélène Erikson, doctorante, formatrice UL-INSPÉ, ATILF
Églantine Guely-Costa, MCF, UL-INSPÉ, ATILF
Guillaume Nassau, MCF, UL-INSPÉ, ATILF
Julie Prévost, docteure, enseignante et formatrice, ATILF
Hani Qotb, HDR, Université de Koweït, ATILF
Kossi Seto Yibokou, MCF, UL, ATILF
Wu Jing, Professeure invitée (Chine), ATILF

Financement : Université de Lorraine : Pôle CLCS, Composante INSPÉ ; laboratoire ATILF

ISIS | plate-forme de publication en ligne de dictionnaires

C’est une plate-forme qui permet de gérer des données au formats XML. Contrôle des articles, mise à jour de la base d’articles, gestion de la bibliographie, gestion des pages du site. La gestion est faite par le responsable du projet sans besoin de compétence en informatique. Les dictionnaires gérés par l’outil sont le DMF (http://www.atilf.fr/dmf), DERom (http://www.atilf.fr/DERom), le DECT (http://www.atilf.fr/dect), TLF-etym (http://www.atilf.fr/tlf-etym), Bibliographie Godefroy (http://www.atilf.fr/BbgGdf), TLFsup (http://stella.atilf.fr/TLFsup)

Référent scientifique : Gilles Souvay

ISTEX | ANR

ISTEX est une plateforme qui a pour ambition d’offrir, à l’ensemble de la communauté de l’enseignement supérieur et de la recherche française qui le souhaite, un accès en ligne aux collections rétrospectives de la littérature scientifique dans toutes les disciplines. À ce réservoir inégalé en ressources multidisciplinaires s’ajoute un nombre important de services à valeur ajoutée permettant d’en optimiser l’exploitation grâce à des outils de fouille de contenus (TDM) et de valorisation interactive.

Financement : ANR-10-IDEX-0004-02

Référent scientifique : Jean-Marie Pierrel, Chargé de Mission UL & CPU
Partenaires : CNRS, CPU, Université de Lorraine, ABES, Couperin

Durée : 2012-2018
Site Web : https://www.istex.fr/

Journal de Gilles de Gouberville

Avec son Journal, Gilles de Gouberville nous emmène au cœur de la Normandie rurale du XVIe siècle. Minutieusement, ce Livre de raison raconte l’Histoire á travers la vie de tous les jours d’un petit gentilhomme campagnard, dans son manoir du Mesnil-au-Val situé entre Valognes et Cherbourg.

Cette édition du Journal, numérisée et encodée au format XML/TEI, a été réalisée par le Comité Gilles de Gouberville dans le cadre d’un projet éditorial initié et conduit par Philippe René-Bazin.

L’encodage XML/TEI a été réalisé par Philippe René-Bazin sous la direction de Gilles Souvay. La relecture humaine a été faite par Marcel Roupsard, Philippe René-Bazin et d’autres membres du Comité Gilles de Gouberville, la relecture computationnelle par Gilles Souvay.

Page Web : http://www.atilf.fr/dmf/JournalGouberville/

Jeux en jeu | pratiques ludiques et apprentissage des langues

Porteuse du projet : Virginie Privas-Bréauté

Kidilang | Le « plurilinguisme en herbe » à l’école maternelle

Chercheures impliquées : Séverine Behra, Dominique Macaire

Page Web : https://www.atilf.fr/recherche/equipes/didactique-des-langues-et-sociolinguistique/kidilang/

LEGCOD | The Lexicon of the Environment and Green Chemistry in Ordinary Discourse. Using Social Networks as Corpora

LEGCOD est un projet interdisciplinaire qui porte sur l’étude du vocabulaire noyau des champs de l’environnement et de la chimie verte, avec en vue la thématique de l’interaction entre l’usage scientifique technique de ce vocabulaire – en tant que terminologie spécifique – et son usage dans le discours ordinaire (productions linguistiques du grand public) trouvé sur Internet, en s’intéressant tout particulièrement aux réseaux sociaux. Le projet bénéficie d’une double collaboration, locale et internationale. Au sein de l’Université de Lorraine, une collaboration a été mise en place sur les aspects épistémologiques de l’utilisation des notions de chimie sur Internet avec deux chercheurs du laboratoire Archives Henri-Poincaré à Nancy.
Sur le plan international, LEGCOD collabore sur la thématique de la terminologie (construction et exploitation de corpus pour l’étude des langues de spécialité, lexicographie des vocabulaires spécialisés, terminologie verbale) avec l’Observatoire de linguistique Sens-Texte OLST de l’Université de Montréal.
Une collaboration additionnelle s’est développée avec L. Wanner (ICREA & Université Pompeu Fabra, Barcelone) pour ce qui concerne la construction et l’exploitation de corpus linguistiques issus des réseaux sociaux.

Projet doctoral financé par IMPACT OLKi – LUE, bourse doctorale et subvention de fonctionnement.

Référent scientifique : Alain Polguère, professeur Université de Lorraine, directeur de thèse en codirection avec Francesca Ingrosso, maître de conférences Université de Lorraine (LPCT / UL – CNRS) (chimie théorique) ; doctorante : Tomara Gotkova

Durée : septembre 2019 à août 2022

LELREP | Lexique et Enseignement de la Langue en Réseau d’Éducation Prioritaire

Cette collaboration avec le REP+ La Fontaine prend la forme de formations et de conférences auprès des enseignants, mais aussi de recherches actions pour essayer de mettre en évidence les difficultés rencontrées par les élèves et essayer de proposer des pistes de remédiation.
► Convention de collaboration de recherche entre l’ATILF et la Direction des Services Départementaux de l’Éducation Nationale de Meurthe-et-Moselle (DSDEN 54).

Membres : Alain Polguère (Université de Lorraine), Veronika Lux-Pogodalla (ATILF), Bérengère Bouard (Université de Lorraine), Bernard Combettes (Université de Lorraine), Christophe Benzitoun (Université de Lorraine), Mathilde Dargnat (Université de Lorraine), Emmanuelle Carette (Université de Lorraine), Emmanuel Thiébaut (Université de Lorraine).

Site Web : https://perso.atilf.fr/vlux/projets/projets-relatifs-a-lenseignement-du-lexique/le-projet-lelrep/

Lexhnology

Given the growing extraterritoriality of American law, this domestic law is increasingly impacting other countries’ jurisdictions, as the recent data privacy issues for transferring personal data from Europe to the USA through the GAFAM show. The capacity to understand the reasoning supporting judicial decisions is a universal necessity in the fields of law. Within this context, it is of prime importance that foreign or second-language (L2) users of legal English be able to analyze case law.

Thus, identifying rhetorical divisions of these texts is a precursor for users’ understanding and exploiting of the reasoning behind judicial decisions. Indeed, there is a growing premise that communication is greatly facilitated by making text divisions explicit. This notably helps L2 learners to identify the information structure and communication objectives necessary to understanding documents in languages for specific purposes (LSP) [1]. Within linguistics, these discourse divisions have been called moves 2 (e.g. claim, support, refutation).

Move analysis was originally developed by [2] to teach L2 learners of academic English how to structure their articles in a way that adheres to the prototypical research article. While prescriptive recommendations about writing judicial opinions exist [3], very little linguistic research approaches moves in legal genres with an descriptive or analytic objective, see [4] [5], [6], [7]. Within natural language processing (NLP), the task of move analysis is called argumentative structure analysis and requires performing several processes: text segmentation, communicative role classification, segment linking and relation labeling. Like in linguistics, the attention has so far been focused on analyzing academic and scientific writing [8]. Despite the recent massive increase of access to online legal texts and the development of NLP tools for legal language, no technology is currently able to automatically identify moves in case law. However, automatic moves analysis in case law is challenging for the predominant deep learning approach in the domain, because, as mentioned by [9], legal documents are long, linguistically complex, and difficult to understand “even for humans because everyday terms can take on new technical meanings in a legal context”.

Finally, teaching moves to L2 learners is a widely accepted method in LSP L2 teaching/learning and may help learners understand the legally-binding rationale behind judicial decisions. In this context, a tool for automatically detecting moves with NLP methods would be of great aid to L2 students of legal English. However, the effectiveness of such a teaching method for increasing the speed and accuracy of comprehension of legal English has not yet been measured.

These gaps raise several research questions:

1. What typology of moves and prototypes for judicial opinions can be established using move analysis combined with corpus linguistics augmented by NLP methods ?
2. Does interaction with a corpus with annotated moves improve reading comprehension of case law?
3. What needs and use cases exist for L2 learners of legal English and LSP teachers concerning the task of reading case law?
4. How does access to a corpus with annotated moves foster learner and teacher autonomy in reading case law in L2 students and jurists?
5. How do current neural language models represent the discourse structure underlying the moves? How can self-supervised learning take discourse information into “attention”? How can linguistic knowledge be injected into computational models, making them more self-explanatory? How to design predictive neural architectures to make them discourse aware ?

To answer these questions, Lexhnology will take an innovative interdisciplinary approach – linguistic, NLP, LSP teaching/learning. It will define moves, automatizing their detection and identification, while measuring the effectiveness of using moves in LSP teaching/learning. By creating an annotated corpus and tagging tool this project fills the gaps in the research about moves. This corpus and tool will be integrated into an open access platform for students, teachers, and jurists Lexhnology will contribute to the strategic priorities for research identified by the French government and the National Research Agency (ANR): interdisciplinary research, digital transformation, artificial intelligence, education and technology, and digital humanities. The project adheres to Unesco’s open science recommendations (SDG43).

Financement ANR (Projet-ANR-22-CE38-0004).
Budget total : 511.956 € (ATILF : 150.560 €)

Coordinatrice scientifique : Mary Lavissière (CRINI, Université de Nantes)
Partenaires : ATILF (Alex Boulton, Carmenne Kalyaniwala, Warren Bonnard), LS2N (U. Nantes), LAIRDIL (U. Toulouse).

Durée : 2023 à 2026
Site Web : https://lexhnology.hypotheses.org/

LGeRM | Lemmes Graphies et Règles Morphologiques, gestion des états anciens du français

LGeRM, prononcer « elle germe », est initialement un lemmatiseur conçu pour gérer la variation graphique des états anciens du français. Il a été développé pour le moyen français (1330-1500) puis adapté au français du XVIe et XVIIe. Il est utilisé principalement pour la consultation du Dictionnaire de Moyen Français (http://www.atilf.fr/dmf/). Une chaîne de traitement pour lemmatiser et étiqueter les textes ante 1850 du corpus Frantext est en cours de développement.
LGeRM est aussi le nom désignant deux lexiques morphologiques : un lexique adapté au français médiéval et un second lexique adapté au français du XVIIe. Une variante du lexique XVIIe permet de moderniser des formes anciennes.
Enfin LGeRM est aussi un plate-forme collaborative permettant de corriger le résultat de la lemmatisation et de l’étiquetage en morphosyntaxe d’un texte encodés aux normes XML / TEI et d’étudier son vocabulaire afin de préparer son glossaire. Les résultats peuvent être exportés ou mis à disposition en ligne. Un exemple de réalisation : http://www.atilf.fr/dmf/ChansonAspremont/.

Lexicologie Explicative et Combinatoire du russe | LEC-ru

Ce projet est une entreprise à long terme de construction d’un Réseau Lexical du Russe | RL-ru, dans le cadre des travaux sur la lexicologie et lexicographie des systèmes lexicaux qu’Alain Polguère, professeur Université de Lorraine mène à l’ATILF. Le financement obtenu sert à la mise en place de séances de travail en lexicographie formelle réunissant à Paris et à Nancy les chercheurs de l’INALCO et de l’ATILF.
Une convention de collaboration entre l’ATILF et l’INALCO pour ce projet a été signée en 2017.

Projet financé (missions de chercheurs) par le Conseil Scientifique, Direction de la Recherche et des études doctorales, INALCO (Paris).

Ce projet est une collaboration entre le laboratoire ATILF, CREE de l’INALCO et l’OLST Université de Montréal.
Autres membres de l’équipe : Svetlana Krylosova, chercheuse principale, Elena Akborisova et Igor Mel’čuk.

Début : 2015

Lexiques nucléaires

Subvention de groupe financée par le Fonds québécois de recherche sur la société et la culture FQRSC (Québec, Canada).

Alain Polguère, professeur Université de Lorraine est collaborateur de ce projet.
Autres membres de l’équipe : Patrick Drouin (chercheur principal), François Lareau (Université de Montréal), Marie-Claude L’Homme (Université de Montréal), Dominic Anctil (Université de Montréal), Lyne Da Sylva (Université de Montréal), Pascale Lefrançois (Université de Montréal), Igor Mel’čuk (Université de Montréal), Anna Joan Casademont (TÉLUQ), Philippe Langlais (Université de Montréal), Antonio San Martin Pizarro (Université du Québec à Trois-Rivières), Jasmina Milićević (Université Dalhousie), Ophélie Tremblay (Université du Québec à Montréal), Fabienne Venant (Université du Québec à Montréal).

Durée : avril 2019 à mars 2023

LMR | Lexique Musical de la Renaissance

For people working on Early Music (musicians, scholars, amateurs), one important question often arises: what is the real sense of terms associated with music? Since we do not have any exact definition of these terms, we usually use analogies, or our own intuition, or we just choose the easy option and use modern equivalents. But ambiguities are far too frequent to allow us to understand the subtle meaning of some concepts: what does “harmony”, “consonance”, “counterpoint” or “tiento” mean before 1650? LMR was created to answer these and other questions, with its main objective being to place every term within a clear context in which it makes sense.

Cristina Diego Pacheco, LMR coordinator, musicology lecturer at University of Lorraine, France, and researcher at the CESR (CNRS Tours, France)
Louis Jambou, creator of the LMR, emeritus professor of music at the University of La Sorbonne, Paris (France)
Collaborators
Musicologists: Amaya García Pérez (University of Salamanca, Spain), Ascensión Mazuela-Anguita (CSIC-Barcelona, Spain), Giuseppe Fiorentino (University of Cantabria, Spain), Paulo Estudante (University of Coimbra, Portugal), José Abreu (University of Coimbra, Portugal), Ana López (University of Valladolid), Marie-Bénédicte Le Hir (University of Tours, CESR, France), Jonathan Auclair (ATILF, CNRS – UL), Sabina Sánchez de Enciso.
Linguists: Yan Greub (ATILF, CNRS – UL, France), Philippe Reynes (University of Amiens, France).

Site Web : https://lexiquemusical.atilf.fr/

LTF | Test de mesure de l’insécurité langagière des francophones natifs en compréhension

Chercheurs impliqués : Virginie André, Valérie Langbach, Guillaume Nassau, Hervé Adami, Anouchka Divoux, Maud Ciekanski

Site Web : https://reseaultf.atilf.fr/

LyText | Outil d’Aide à la Préparation du Baccalauréat de Français

LyText est un outil logiciel qui permet d’accéder à une base de textes littéraires équipés en vue de construire une démarche de type lecture analytique. Conçu et développé par le laboratoire ATILF (CNRS/Université de Lorraine), en partenariat avec le Rectorat de l’Académie de Nancy-Metz, cet outil est destiné à offrir aux élèves une modalité d’aide et d’entraînement à l’épreuve orale de l’EAF.

Site Web : https://lytext.atilf.fr/

MACPER | Macrosintaxis del discurso persuasivo: construcciones y operadores

Le projet vise à décrire la macro-syntaxe de l’argumentation, en identifiant et en analysant les différents éléments que le locuteur utilise pour exprimer la persuasion. En utilisant la méthodologie de la linguistique pragmatique, nous définirons les paradigmes des opérateurs, une catégorie macrosyntaxique spécifique, et nous décrirons leur comportement syntaxique et les fonctions argumentatives qu’ils expriment. Nous l’étendrons à d’autres structures, ainsi qu’à des compléments périphériques dans le but d’étudier les différentes manifestations de la dimension argumentative dans les textes. Cette étude théorique-pratique sur le corpus sera complétée par la conception de protocoles d’application pour atteindre une plus grande efficacité persuasive dans la production discursive professionnelle, en traduction et dans l’apprentissage des langues.

Financement : Junta de Andalucía. Proyectos PAIDI Frontera

Responsable : Catalina Fuentes Rodríguez (Universidad de Sevilla), Ester Brenes Peña (Universidad de Córdoba).
Membres du laboratoire : Carlos Meléndez Quero (Université de Lorraine).
Autres membres : Marina González Sanz, Víctor Pérez Béjar, José Manuel López, Damián Moreno, Soledad Padilla Herrada, José García Pérez, Francisco Javier Perea Siller

Durée : 1er janvier 2020 au 31 décembre 2022

MIFPE | Mobilité Internationale et Formation Pré-professionnelle en Éducation

Le projet de recherche MIFPE entend étudier la mobilité internationale entrante en formation préprofessionnelle de futurs enseignants asiatiques qui n’ont pas pour objectif la maîtrise de la langue du pays hôte pour autant. Par-delà leur cheminement vers les compétences professionnelles visées, sont sollicités leur expérientiel et la réflexivité sur les médiations dans des espace-temps multiformes et soumis à variations. L’étude adossée aux sessions de recherche-formation entend également mettre en lumière et questionner des représentations et émotions nommées par voie directe et indirecte. Nous cherchons à identifier (ce) qui les provoque et quelles en sont les caractéristiques ainsi que ce à quoi elles sont associées. La construction d’une compétence transculturelle préprofessionnelle à l’œuvre peut ainsi être observée pas à pas.

Membres du projet : Séverine Behra, MCF, UL-INSPÉ, ATILF
Maud Ciekanski, MCF, UL-Département de sciences du langage, ATILF
Yazdan Choubsaz, Université de Lorraine, ATILF (2019-20), Shahid Chamran University of Ahvaz, Ahvaz, Iran
Lorraine de Beaufort, docteure, ATILF
Dominique Macaire, professeure des universités, UL-INSPÉ, ATILF (pilote)
Guillaume Nassau, MCF, UL-INSPÉ, ATILF
Claire Noël, étudiante de master 2 FLE, 2019-20, département sciences du langage, Université de Lorraine

Financement : INSPÉ de Lorraine ; ED 78 ; département SDL de l’Université de Lorraine ; ATILF

Actions liées à la recherche-formation
2016 : signature d’un partenariat entre l’UL et l’Education University of Hong Kong
2017 : conférence plénière et ateliers à l’Education University of Hong Kong
2017 – 2019 : dispositif de recherche-formation : Research on Teacher Education – Scientific and (Inter)cultural mediation, International course for PhD Students in France (Master Level)

Visite EdUHK décembre 2017
Voir le programme

Visite EdUHK décembre 2018
Voir le programme

Visite EdUHK décembre 2019
Voir le programme
Voir le retour en images

2021 : organisation d’un séminaire de recherche, Le trans- et l’interculturel en questions, 19 novembre 2021, CLSCH, Nancy.
Invités : Jean-Paul Narcy-Combes, Université Paris 3 Sorbonne Nouvelle ; Christian Ollivier, Université de la Réunion.

Publications
Behra, S., Ciekanski, M., Choubsaz, Y., Macaire, D. & Nassau, G. (2020). “An emotional path to preprofessional skills? Mobility competence of EduHK students attending summer courses in France”. Dans Yamina Bettahar et Aline Gohard-Radenkovic (dirs.). De mobilités pré-professionnelles à l’étranger vers des mobilités professionnelles internationales ? Enjeux, parcours, stratégies des divers acteurs. Journal of International Mobility (JIM), 8, 73-97.
Behra, S., Ciekanski, M., Macaire, D. & Nassau, G. (2020). Dessiner la mobilité : une activité de formation et de recherche, Études en didactique des Langues (EDL), 35, 27-49.
Macaire, D., Jeanson, L., Filet, J. & Deleant, L. (2017). When researchers get involved elsewhere, The Conversation Global, 13.09.2017. https://theconversation.com/when-researchers-get-involved-elsewhere-83816
Macaire, D., Jeanson, L., Filet, J. & Deleant, L. (2017). Chercheurs, soyez collaboratifs !, The Conversation France, 03.09.2017.

Communications
Behra, S., Macaire, D. & Quenet, S. (2021). Conférence internationale invitée, Internationalisation et mobilité / Internationalisierung und Mobilität, Bergische Universität Wuppertal, 20 novembre 2021.
Macaire, D. & Behra, S. (2021). Médiation transculturelle et disruptions en formation d’enseignants, XVIIIème Congrès International de l’ARIC, L’interculturel par temps de crises : regards croisés à l’aune des bouleversements contemporains, Nice, 29 octobre 2021.
Behra, S., Ciekanski, M., Choubsaz, Y., Macaire, D. & Nassau, G. (2021). Les médiations éducatives à l’épreuve du collectif en mobilité internationale : expérimenter, expériencer, partager. Colloque UCO Médiation(s) et médiatisation(s) en classe de langue. Quelle(s) mise(s) en œuvre ? quelles conséquences ?, Angers, 27 septembre 2021.
Macaire, D. (2017). Build your own brand: how to share your research within an intercultural community?, The Education University of Hong Kong, International Postgraduate Roundtable and Research Forum Cum Summer School 2017 – Building Students as Academic Leaders, 03 juillet 2017.

Valorisation
Livret historique des 20 ans de l’ATILF, p. 27, Université d’éducation de Hong Kong.
https://www.atilf.fr/actualites/livret-historique-des-20-ans/

Mots du discours

Il s’agit d’étudier la grammaticalisation des « mots du discours », tels que connecteurs et modalisateurs. La période prise en considération sera essentiellement celle du moyen français et du français préclassique.

Responsables : Mathilde Dargnat et Bernard Combettes.

OEF | Ovide en français

Le projet, en cours, prévoit l’édition critique et commentée de l’Ovide moralisé, texte du début du 14e siècle. Publication : Ovide moralisé, livre I, Paris, Société des anciens textes français, 2018, 2 vol.

Projet financé par l’Agence nationale de la recherche, la Deutsche Forschungsgemeinschaft, le Fonds national suisse, le Fonds national belge de la recherche scientifique.

Responsable à l’ATILF : Yan Greub.
Collaborateurs à l’ATILF : Bertrand Gaiffe, Sarah Kremer, Alessandro Lagioia, Gilles Souvay.
Collaboration internationale, avec des membres des universités de Bruxelles, Genève, Louvain-la-Neuve, Lyon-II, Milan, Paris-Sorbonne, Zurich.

ORFEO | Outils et ressources sur le français écrit et oral

La plate-forme ORFEO | Outils et Ressources sur le Français Écrit et Oral propose un ensemble unique de textes écrits et de transcriptions d’enregistrements en français contemporain ainsi que des outils pour les exploiter, que ce soit dans le cadre de la recherche en linguistique, en traitement automatique des langues | TAL, pour l’enseignement ou pour simplement satisfaire sa curiosité à propos du fonctionnement du français contemporain : emploi d’un mot, d’une expression ou d’une forme grammaticale (fréquence, contexte, exemples à l’écrit ou à l’oral, …). L’orientation principale a été néanmoins de se placer du point de vue du linguiste qui veut étudier les formes de l’énoncé et de ses composantes à travers les divers usages de la langue française.

ORFEO est un projet qui a été financé par l’ANR (ANR 12-CORP-0005).

Responsables : Jeanne-Marie Debaisieux (Université Sorbonne Nouvelle), Christophe Benzitoun (Université de Lorraine) – pour la partie sur les données orales.

Site web : http://www.projet-orfeo.fr/

OrthoCorpus

Le corpus OrthoCorpus regroupe 1253 articles parus entre 1997 et 2022 dans la revue Rééducation Orthophonique, revue de référence fondée en 1962 par Suzanne Borel-Maisonny. Ces articles ont été écrits par des orthophonistes, par d’autres professionnel·les de santé ou de l’éducation (psychologues, médecins, linguistes, kinésithérapeutes…) ou par d’autres parties prenantes (représentant·es d’associations, parents…). Ils concernent tout l’exercice de l’orthophonie, et comportent des points théoriques sur les pathologies dont s’occupent les orthophonistes, des points sur les traitements et les rééducations, les évaluations, ainsi que des comptes-rendus d’études et quelques témoignages.

Cette ressource (plus de 6 millions de mots) a été constituée dans le cadre du projet éponyme OrthoCorpus (2015-2017), et augmentée, corrigée et enrichie en 2019 (V1.1), 2020 (V2), 2022 (V3) et 2025 (V4). Le projet OrthoCorpus a permis la construction et l’exploitation de corpus de spécialité en orthophonie, dans une perspective d’analyse terminologique. Il a été réalisé avec le concours financier de la Région Lorraine, du laboratoire ATILF, du Centre Hospitalier de Bar-le-Duc et de la Fédération Nationale des Orthophonistes.

Ce corpus a été enrichi en métadonnées qui comportent : le statut de l’auteur·rice (orthophoniste ou non), si l’auteur·rice écrit seul·e ou pas, le pays de l’auteur·rice principal·e, le numéro, sa thématique et l’année de sa parution, la rubrique assignée à l’article, la catégorie et le sous-thème (pathologie) de l’article, s’il concerne une population d’enfants ou non. Les résumés, mots clés en anglais et en français ont été conservés, ainsi que la structuration des documents (titres et sous-titres, introduction, conclusion…). Les figures, les tableaux et les annexes, ainsi que les références bibliographiques ont été exclues.

Dans OrthoCorpus V4, les notes de bas de page ont été regroupées en fin de chaque fichier (représentant un article) afin de faciliter leur exploitation. De plus, des problèmes lors de la segmentation en paragraphes ont été étudiés et résolus, permettant un traitement des données plus pertinent.

OrthoCorpus est disponible dans deux formats : un en XML-TEI, le deuxième permet une interrogation directe sous TXM. Une version complémentaire à la V4 (appelée CASFIN V4), segmentée en phrases est également rendue disponible. L’utilisation de procédures inadéquates de traitement de texte (usage d’un retour paragraphe au lieu d’un saut de ligne au sein d’un paragraphe) par les auteurs et autrices de la revue avait entraîné des erreurs de segmentation des phrases

OrthoCorpus est accessible aux membres de l’ESR, et aux orthophonistes praticiens-chercheurs (sur demande à l’adresse de contact, pour des projets de recherche).

OrthoCorpus est réalisé avec le concours financier de la Région Lorraine, du laboratoire ATILF, du Centre Hospitalier de Bar-le-Duc et de la Fédération Nationale des Orthophonistes

Membres : Frédérique Brin-Henry, Jessika Cardinali, Evelyne Jacquey, Sandrine Ollinger (ATILF / CNRS – UL), Concettina Husson-Giardina

Site web : https://hdl.handle.net/11403/orthocorpus/v4

Contact : frederique.henry [at] atilf.fr

OTO | Observatoire Terminologique en Orthophonie

L’Observatoire Terminologique en Orthophonie expose les travaux engagés depuis 2006 par une équipe pluridisciplinaire d’experts en orthophonie, linguistique, terminologie, ontologie, ingénierie des connaissances et d’ingénieurs.
Il ne s’agit pas d’un site décrivant les troubles ou les difficultés rencontrées par les patients, mais d’une vitrine de travaux scientifiques, portant sur les termes usités en orthophonie.

D’un point de vue terminologique et linguistique, nous nous intéressons à ce que disent les orthophonistes des pathologies (et comment), de leur discipline, et de leurs patients.
D’un point de vue conceptuel, nous tentons de redéfinir les concepts des pathologies du langage en partant des représentations des orthophonistes, mises en évidence dans leur discours.

Nous travaillons principalement à partir de corpus regroupant des écrits professionnels et scientifiques du domaine.
Ce site est destiné à toute personne intéressée par le domaine de l’orthophonie, la terminologie, les langues de spécialités ou l’analyse de corpus spécialisés. Chaque page introduit brièvement les domaines explorés ou les projets poursuivis, les ressources utilisées.

Site web : https://oto-fr.atilf.fr/

Contact : frederique.henry [at] atilf.fr

PALM | Préprofessionnalisation et Appropriation des Langues avec la Marionnette

Ce projet de recherche-formation est lié à un dispositif d’ingénierie pédagogique autour de la manipulation de marionnettes en formation de futurs enseignants du premier degré qui se destinent à enseigner l’anglais. Les marionnettes sont pensées comme un medium pour déjouer l’empêchement langagier en LCE des futurs professeurs des écoles en facilitant le lâcher prise pour enseigner l’anglais autrement. Le projet PALM a pour visée l’étude des relations entre l’art marionnettique, l’incarnation de la langue dans un medium et la créativité des apprenants. La recherche s’appuie sur la théorie de l’énaction (Varela, 1996) et s’inscrit dans une action pédagogique globale visant une prise en compte du corps dans l’apprentissage des langues. De l’étude de la centration sur le geste de la main pour faire parler la marionnette, on attend une amélioration en production orale, notamment en termes de fluidité et de qualité phonologique.
Une thèse de doctorat a débuté en 2021 en relation avec le projet PALM.

Membres du projet : Séverine Behra, UL-INSPÉ, ATILF
Hélène Erikson, UL-INSPÉ, ATILF
Eglantine Guély Costa, UL-INSPÉ, ATILF
Dominique Macaire, UL-INSPÉ, ATILF
Guillaume Nassau, UL-INSPÉ, ATILF
Virginie Privat-Bréauté, UL, ATILF

Références :
Tracé, printemps 2021, n°85, p.6, FORMATION et RECHERCHE, Learning and Teaching English … With Puppets
http://inspe.univ-lorraine.fr/sites/default/files/commun/docs/TRAC%C3%89/2021/21_Le-Trac%C3%A9_85_INSP%C3%89-de-Lorraine_printemps-2021_web_light.pdf
Erikson, H. (2021). Donne ta langue à ta main : la marionnette pour déjouer l’empêchement langagier en anglais de futurs professeurs des écoles, Mélanges Crapel, 42/2, 131-151. https://www.atilf.fr/wp-content/uploads/publications/MelangesCrapel/Melanges_42_2_7_Erikson.pdf

PRIMERA | Pratiques en immersion et recherche autonomisante

Référentes scientifiques : Véronique Lemoine-Bresson (Université de Lorraine) et Latisha Mary (Université de Strasbourg).
Membres ATILF du projet : Anne Choffat-Dürr (Université de Lorraine), Carmenne Kalyanywala (Université de Lorraine), Sophie Bailly (Université de Lorraine)

Durée : 2021 – 2024

Site Web : http://ife.ens-lyon.fr/lea/le-reseau/les-differents-lea/ecole-jean-jaures-et-college-guynemer-nancy-grand-est

PROSOPHON

Prosophon s’intéresse aux prononciations qui co-existent dans la société – une forme de pluriphonie, plus particulièrement à la manière dont le construit d’« accent » traverse et imprègne les questions autour de l’apprentissage d’une langue additionnelle et par extension, l’insertion sociale et professionnelle.

Financement : GIS Grand Est Education & Formation

Responsable : Grégory Miras (ATILF/Université de Lorraine – CNRS).

Site Web : https://prosophon.atilf.fr/

PROTEXT

Étude des processus de textualisation : modélisations linguistiques, psycholinguistique et d’apprentissage automatique.

Financement : ANR

Responsable : Georgeta Cislaru (Université Sorbonne Nouvelle).
Membres du laboratoire : Christophe Benzitoun (Université de Lorraine), Mathilde Dargnat (Université de Lorraine)

RE-PAIRS | Rechercher ensemble sur le plurilinguisme articulé à l’immersion et faire ressources entre pairs

Le collectif (membres des universités de Lorraine et Strasbourg) et l’équipe Jaurès de Nancy, enseignant l’anglais en immersion, a participé au projet PRIMERA (LéA 2021-2024). La collaboration a permis l’évolution d’un enseignement bilingue cloisonné en pratiques plurilingues inclusives par la coformation intense entre enseignant·es et chercheur·es. PRIMERA a documenté les pratiques, pour un meilleur développement des compétences dans les fondamentaux et les compétences psychosociales. Le projet RE-PAIRS, nouveau LéA 2024-2027, se concentre sur la création de contenus d’enseignement et de formation par les pairs pour/avec 2 autres écoles à Nancy, pour/avec le groupe de travail LéA langues de l’Ifé (CREAD Université de Bretagne), pour/avec des collègues à l’international (projet européen ECML,“Favoriser le bien-être plurilingue des enseignant·es de langues”).

Le bilan PRIMERA LéA 2021-24 amène à considérer l’importance des changements de rôles des diverses actrices et acteurs pour soutenir le codéveloppement professionnel. 2 nouvelles dimensions sont intégrées au projet : (1) la prise en compte de la voix des parents dans la production de ressources (entretiens à poursuivre) et (2) la diffusion internationale des ressources produites (plateforme du CELV). Les choix de la coformation consolident la solidarité entre écoles, le lien entre terrain et recherche et renforcent le développement d’une éducation plurilingue éthique.

Référente scientifique : Véronique Lemoine-Bresson (Université de Lorraine).

Durée : 2024 – 2027

Représentations linguistiques lexicales et sous-lexicales et leurs évolutions avec l’acquisition de l’écrit

Ce projet a pour but de comprendre la nature et la structure des représentations linguistiques lexicales et sous-lexicales et leurs évolutions avec l’acquisition de l’écrit en français. L’hypothèse au centre de cette recherche est que l’acquisition de l’orthographe influence la perception de la langue orale et également les représentations phonologiques associées aux productions phonétiques.

Responsable : Daniel Zagar (Université de Lorraine)
Membres : Katarina Bartkova (Université de Lorraine), Samantha Ruvoletto (Université de Lorraine), Hélène Maire (Université de Lorraine).

TermITH | Terminologie et Indexation de textes en sciences Humaines

TermITH s’intéresse à l’accès à l’information des documents numériques par le biais d’une indexation fondée sur les termes qu’ils contiennent, ce qui suppose reconnaissance, désambiguïsation et analyse des termes.
La démarche développée par TermITH suppose de croiser des occurrences désambiguïsées de termes candidats avec des lexiques transdisciplinaires et les ressources terminologiques disponibles pour isoler les termes propres au domaine étudié. Elle présente deux intérêts principaux :

la désambiguïsation et le croisement avec les lexiques transdisciplinaires et les ressources terminologiques à disposition réduit l’effort humain de vérification des termes (ou descripteurs) proposés et l’analyse manuelle du contenu des documents
la mise à jour automatisée des ressources terminologiques devient envisageable

Sur le plan théorique, TermITH présente l’originalité d’articuler et de rendre complémentaires des disciplines de recherches actuellement parallèles :

la désambiguïsation contextuelle
la fouille de données
la textométrie
la détection automatique des candidats termes
la projection de ressources et de lexiques

Sur le plan expérimental, TermITH s’intéresse en particulier à un champ scientifique très ambigu entre langue terminologique de spécialité et langue générale : les sciences humaines et sociales. La méthodologie, mise au point sur une discipline test – la linguistique – sera validée sur l’archéologie, la psychologie (psychanalyse, psychologie sociale et sciences cognitives), les sciences de l’information, et la chimie. Si les premiers résultats sont positifs, l’indexation de documents relevant de disciplines moins ambigües sera facilitée par l’application de notre méthodologie.

Coordination : Evelyne Jacquey, assistée de Laurence Kister

Laboratoires participants : ATILF (Nancy), Inist (Nancy), Lidilem (Grenoble), Lina (Nantes), Inria (Nancy Grand-Est), Inria (Saclay Île-de-France)

Financement : ANR Contint (CONTenus et INTeractions)

Durée : 15 novembre 2012 – 14 mai 2016

Site Web : https://web-data.atilf.fr/ressources/termith/

TLF-Étym

Révision, enrichissement et actualisation des notices étymologiques du Trésor de la Langue Française, notamment par des mots nouveaux (sciences et techniques).
Il comprend 523 notices étymologiques et 4511 notices bibliographiques.

Responsable : Nadine Steinfeld, avec la collaboration de Frankwalt Möhren.
Les membres internes : Éva Buchi, Jean-Paul Chauveau, Yan Greub, Maria-Victoria Costa Alvarez, Gilles Souvay, Nadine Seinfeld.
Relecteurs nationaux et internationaux, en particulier Franz Rainer (Université de Vienne).

Site Web : http://www.atilf.fr/tlf-etym/

ATILF | CNRS-UL