Systèmes Lexicaux

Les Systèmes Lexicaux sont des modèles lexicographiques du type réseaux lexicaux. Contrairement aux modèles textuels traditionnels que sont les dictionnaires, les Systèmes Lexicaux structurent l’information lexicale de façon fondamentalement relationnelle : chaque unité lexicale est principalement caractérisée par un ensemble de liens paradigmatiques et syntagmatiques qui la connectent aux autres unités lexicales de la langue.

Projet RELIEF (2011-2014)

Présentation

RELIEF a été un projet d’envergure de l’ATILF en lexicographie synchronique, officiellement lancé en juin 2011 et achevé en décembre 2014. Sa finalité était de développer une ressource lexicale de nouvelle génération – le Réseau Lexical du Français (RL-fr) – et de travailler à la valorisation de cette ressource, notamment dans le contexte du traitement informatique de l’information textuelle.

Ce projet a bénéficié du soutien de l’Agence de Mobilisation Économique de la Région Lorraine et du FEDER Lorrain.

Il a été effectué, pour la composante valorisation et outils lexicographiques, en collaboration avec la société MVS de Saint-Dié.

Les travaux sur le RL-fr et d’autres réseaux lexicaux se poursuivent maintenant à l’ATILF dans le cadre des recherches sur les Systèmes Lexicaux.

Comité d’organisation

Responsables

  • Alain Polguère – responsable projet
  • Jean-Marie Pierrel – chef de file

Gestionnaire administrative

  • Émilie Dethine

Équipe lexicographique de l’ATILF

  • Delphine Beauseroy
  • Jean-Luc Benoit
  • Candice Delaite
  • Anaïs Ferté
  • Sébastien Haton
  • Aurore Koehl
  • Veronika Lux-Pogodalla
  • Christelle Ménétrier
  • Sandrine Pescarini
  • Alain Polguère

Collaborateurs à l’ATILF

  • Pascale Bernard
  • Yann Desalle
  • Geneviève Fléchon
  • Bertrand Gaiffe
  • Karen González Orellana – doctorante
  • Évelyne Jacquey
  • Éva Juroszek – étudiante master 2
  • Mi Hyun Kim – doctorante
  • Sandrine Ollinger – doctorante
  • Marie-Sophie Pausé – étudiante master 2
  • Étienne Petitjean

Collaborateurs externes

  • Lucie Barque (Paris 13)
  • Paolo Frassi (Univ. de Vérone, Italie)
  • Nabil Gader (MVS, Saint-Dié)
  • Bruno Gaume (CLLE , CNRS & U. de Toulouse-Le Mirail)
  • Svetlana Krylosova (INALCO, Paris)
  • Jose Levices (MVS, Saint-Dié)
  • Igor Mel’čuk (OLST, Univ. de Montréal, Canada)
  • Jasmina Milićević (Dalhousie Univ., Canada)
  • Alexis Nasr (LIF, Aix-Marseille 2)
  • Dorota Sikora (Université du Littoral-Côte d’Opale & HLLI EA4030)
  • Inka Wissner

Objectifs

Le projet RELIEF, pour REssource Lexicale Informatisée d’Envergure sur le Français, a officiellement débuté à l’ATILF en juin 2011 pour se conclure en décembre 2014.
Il s’est agi d’un projet de R&D majeur, qui visait à générer à sa suite une activité particulièrement intense en lexicographie synchronique du français à l’ATILF. Il a été l’occasion d’un redémarrage de ce secteur, qui était graduellement en perte de puissance depuis la fin du projet du Trésor de la Langue Française (TLF).

RELIEF a eu pour objectifs :

  • le développement d’une modélisation informatisée à large couverture du lexique français, le Réseau Lexical du Français ou RL-fr, conçue comme ressource générique pouvant trouver son application dans des contextes aussi variés que l’enseignement/apprentissage du vocabulaire ou le traitement automatique de la langue ;
  • la valorisation de cette ressource, notamment dans le cadre des activités de la société MVS (Saint-Dié), par l’enrichissement de la solution « MVS Editorial » avec des fonctionnalités de recherche de données textuelles exploitant les relations lexicales encodées dans le RLF.

Acquis sur lesquels s’appuie RELIEF

Le projet RELIEF, dans sa globalité, s’est appuyé sur des compétences développées à l’ATILF en lexicographie française et en valorisation informatique des ressources lexicales. L’architecture du RL-fr, quant à elle, repose en grande partie sur les recherches menées antérieurement à Montréal en lexicologie et lexicographie par Alain Polguère, maintenant à l’ATILF, et son collègue de l’Université de Montréal Igor Mel’čuk. Ces travaux, effectués dans le cadre des activités de l’Observatoire de linguistique Sens-Texte (OLST), ont conduit à la réalisation de ressources lexicales de deux types :

1. des dictionnaires – cf. le Dictionnaire explicatif et combinatoire du français contemporain DECFC (Mel’čuk et coll. 1984, 1988, 1992, 1999) et le Lexique actif du français LAF (Mel’čuk & Polguère 2007) ;

2. des bases lexicales – cf. le DiCo (Polguère 2000) et ses versions en ligne Dicouèbe (accès par requêtes SQL) ou Dicopop (navigation « grand public » dans les données du DiCo).

L’approche de la Lexicologie Explicative et Combinatoire (Mel’čuk et coll. 1995 ; Mel’čuk 2006), sur laquelle reposent ces travaux, a donné lieu à des applications lexicographiques pour des langues autres que le français (notamment le russe, l’espagnol et l’anglais). De plus, elle a déjà inspiré des applications liées au traitement informatique de la langue, en génération automatique de textes en particulier. Les travaux de l’OLST ont aussi été une source d’inspiration pour des compagnies développant des logiciels langagiers. Citons notamment le cas de la suite Antidote de Druide informatique, qui a introduit dans l’ensemble des dictionnaires joints au correcteur orthographique un dictionnaire de « cooccurrences », selon un mode d’identification et de présentation inspiré des principes de modélisation des collocations de la Lexicologie Explicative et Combinatoire (Charest et coll. 2007).

Le RL-fr : vers une lexicographie des dictionnaires virtuels

Le RL-fr est conçu comme appartenant à une nouvelle génération de ressources lexicales du type « dictionnaires virtuels » (Selva et coll. 2003), en harmonie, de par sa structure et son mode d’élaboration, avec la technologie informatique de traitement de l’information – de la même façon que les dictionnaires traditionnels ont pu être considérés comme étant en harmonie, de par leur conception, avec la technologie du livre.

La construction du RL-fr est un projet de longue haleine, qui continue, à la suite du projet RELIEF, dans le cadre des travaux sur les Systèmes Lexicaux. À long terme, le RLF couvrira le français contemporain courant.

Les travaux sur le RL-fr ont donné lieu à la production de Mémos RL-fr, qui sont de courts textes traitant de problèmes lexicographiques très ponctuels liés à la rédaction des articles lexicographiques. Ces mémos sont énumérés dans la bibliographie ci-dessous.

On trouvera aussi dans cette bibliographie un article de présentation générale du projet de construction du RL-fr (Lux-Pogodalla & Polguère 2011), rédigé peu après le lancement du projet RELIEF. Cet article présente notamment :

  • la structure formelle du RL-fr – graphe de type système lexical (Polguère 2009) tissé par les liens paradigmatiques et syntagmatiques de fonctions lexicales (Mel’čuk 1996) ;
  • sa nomenclature ;
  • la méthodologie d’écriture des articles, fondée sur la construction d’un éditeur lexicographique dédié.

Ressources lexicales informatisées apparentées au RL-fr

DiCo – Dictionnaire de combinatoire (OLST, Université de Montréal)

Il s’agit d’un projet dont RELIEF-RL-fr a pris le relais. Les données du DiCo sont accessibles en ligne de deux façons.

1. Le DiCouèbe : accès en mode « formulaire » aux données du DiCo stockées sous forme de tables SQL.

2. Le DiCoPop : interface de génération à la volée d’articles lexicographiques « vulgarisés » à partir des données du DiCo sous forme SQL.

DiCE – Diccionario de colocaciones del Español (Universidade da Coruña)

La base DiCE est accessible au moyen d’une interface sophistiquée d’exploration des collocations de l’espagnol.

Bibliographie sur RELIEF/RL-fr

Articles publiés

Thèse

Mémos RL-fr

Bibliographie de référence

  • Charest S., Brunelle É., Fontaine J., Pelletier B. (2007) Élaboration automatique d’un dictionnaire de cooccurrences grand public. Actes de TALN-RECITAL 2007, Université de Toulouse-le-Mirail, IRIT Press, vol. 1, 283–292.
  • Mel’čuk I. (1996) Lexical Functions : A Tool for the Description of Lexical Relations in the Lexicon. Dans L. Wanner (dir.) : Lexical Functions in Lexicography and Natural Language Processing, coll. « Language Companion Series », 31, Amsterdam/Philadelphie, John Benjamins, 37–102.
  • Mel’čuk I. (2006) Explanatory Combinatorial Dictionary. Dans G. Sica (dir.) : Open Problems in Linguistics and Lexicography, Monza, Polimetrica, 225–355.
  • Mel’čuk I., Polguère A. (2007) Lexique actif du français. L’apprentissage du vocabulaire fondé sur 20 000 dérivations sémantiques et collocations du français, coll. « Champs linguistiques », Bruxelles, De Boeck & Larcier.
  • Mel’čuk I., Clas A., Polguère A. (1995) Introduction à la lexicologie explicative et combinatoire, Paris/Louvain-la-Neuve, Duculot.
  • Mel’čuk I. et coll. (1984, 1988, 1992, 1999) Dictionnaire explicatif et combinatoire du français contemporain. Recherches lexico-sémantiques I–IV, Montréal, Les Presses de l’Université de Montréal.
  • Polguère A. (2000) Une base de données lexicales du français et ses applications possibles en didactique, Revue de linguistique et de didactique des langues (Lidil) 21, 75–97.
  • Polguère A. (2009) Lexical systems : graph models of natural
    language lexicons, Language Resources and Evaluation
    43(1), 41–55.
  • Selva T., Verlinde S., Binon J. (2003) Vers une deuxième génération de dictionnaires électroniques. Traitement Automatique des Langues 44(2), 177–197.

Événements

1re Journée RELIEF – 22 mai 2012

2e Journée RELIEF – 21 février 2013

Télécharger le programme de la journée.

3e Journée RELIEF – 13 juin 2013

Cette 3e Journée RELIEF a été l’occasion de développer des sujets qui ont émergé lors des discussions précédentes et de présenter les réflexions linguistiques qui s’inspirent des travaux déjà réalisés dans le cadre du projet, tout en stimulant leur progression.