laboratoire Analyse et Traitement Informatique de la Langue Française (ATILF)
CNRS Université de Lorraine

Membre de
ILF
FEDER
Accueil > La recherche > Équipes > Lexique > Lexique et corpus > Présentation générale de l’axe « Lexique et corpus »

Présentation générale de l’axe « Lexique et corpus »

Membres

- Christophe Benzitoun, MCF Sciences du Langage
- Evelyne Jacquey, CR Linguistique
- Laurence Kister, MCF Sciences du Langage
- Frédérique Brin-Henry, Membre associée, Orthophoniste, Directrice des Etudes de l’Ecole d’Orthophonie de Lorraine
- Günter Schmale, PR

Cadre des recherches

Les recherches développées dans l’axe « Lexique et corpus » s’articulent autour de trois secteurs principaux qui sont envisagés à partir de données attestées :

  • la néologie et l’évolution du lexique du français contemporain ;
  • la sémantique lexicale, l’étude et la modélisation du sens des lexèmes ;
  • l’annotation morphosyntaxique et la lemmatisation de données orales et écrites.

Ces questions sont abordées en considérant le texte ou le corpus de texte, de langue générale ou de spécialité, comme unité opératoire pour l’observation et la modélisation du sens lexical. Même si nos recherches sont plutôt orientées vers l’analyse de corpus écrits, les données orales font également l’objet d’une attention particulière dans le cadre de l’annotation morphosyntaxique.

Par ailleurs, les recherches sont développées dans et avec une perspective de traitement automatique des langues. Autrement dit, elles s’appuient sur des traitements automatisés et/ou ont pour objectif la production de ressources, textuelles et lexicales, et de méthodologies pertinentes pour le traitement automatique des langues (recherche d’information, gestion électronique de documents, communication homme-machine).

Vision de l’articulation entre lexique et texte

La prise en compte du texte en tant qu’unité opératoire permet de rendre compte d’usages des lexèmes qui ne sont habituellement pas référencés dans les approches tenant de la tradition logico-grammaticale, où l’unité maximale de description reste majoritairement la phrase (Lexique Génératif, théorie Sens-Texte, Cruse). A la suite de (Rastier et Valette, 2009), on peut observer que, dès lors que l’on étudie les usages textuels du lexème caviar par exemple, celui-ci se voit associer, en plus de ses facettes définitoires et référentielles telles qu’on les trouverait dans un dictionnaire, deux facettes sémantiques supplémentaires [/luxueux/, /couleur_sombre/].

L’approche textuelle du sens lexical est donc plutôt englobante que concurrente avec la sémantique lexicale habituellement développées dans les cadres des approches logico-grammaticales.

De plus, cette approche textuelle du sens lexical est pertinente pour la compréhension de certaines néologies sémantiques comme l’exemple ci-dessous (repris des auteurs sus-cités), issu du parler sportif, où l’on rencontre caviar au sens de ’excellente passe’ :

Confirmation ici, d’un centre précis, [David Beckham] trouvait la tête de Franck Lampard qui n’avait plus qu’à régler la mire pour ouvrir la marque et transformer ce caviar en but. Site Sports.fr, 14/06/2004


Une approche textuelle du sens lexical est possible par l’entremise de sa décomposition en traits sémantiques et leur représentation structurée. Le trait sémantique est un outil élémentaire de description repris de la sémantique structurale et mis à jour par la sémantique interprétative/textuelle. L’unité « texte » et le sens lexical partagent alors le même outil de caractérisation sémantique, permettant ainsi l’interaction entre différents niveaux de description (lexical, syntagmatique, phrastique, textuel, etc).

Cependant, obtenir et manipuler des grands ensembles de traits sémantiques, déterminer ceux qui apparaissent régulièrement dans des corpus de textes et/ou identifiant des usages particuliers de lexèmes suppose de disposer d’un certain nombre d’outils et de ressources que nous regroupons sous le terme d’instrumentation de la linguistique.

Éléments bibliographiques

- Cruse D. A. (1986) Lexical Semantics. Cambridge : Cambridge University Press.
- Cruse D. A. (1995) Polysemy and related phenomena from a cognitive linguistic view-point. In Computational lexical semantics, P. Saint Dizier and E. Viegas (eds), Cambridge : Cambridge University Press.
- Cruse D. A. (1996) Lexical Semantics. Cambridge : Cambridge University Press.
- Polguère A. (2008) Lexicologie et sémantique lexicales, Notions fondamentales. Nouvelle édition revue et augmentée. Les presses universitaires de Montréal.
- Pustejovsky J. (1995) The Generative Lexicon. MIT Press.
- Rastier F., Valette M. (2009) De la polysémie à la néosémie, Le français moderne, S. Mejri, éd., La problématique du mot, 77, 97–116.

  Annuaire | Contact | Courriel | Intranet | Plan d'accès | Autres sites | Crédits | Mentions légales