historique 2002 séminaires

Historique 2002 des séminaires de l’ATILF

◄ 2001

2003 ►

Séminaire ATILF

Grammaire du dictionnaire / dictionnaire de la grammaire: pour une nouvelle complémentarité conceptuelle

Gérard Reb (Université de Strasbourg)

Résumé

Principe: «l’aspect cognitif du langage, non seulement admet mais requiert, l’interprétation au moyen d’autres codes, c’est-à-dire la traduction» (Jakobson, 1963: 84)
Fil directeur: la formalisation de la grammaire et la formalisation du dictionnaire permettent la formalisation du sens.
Le problème: il importe de valider l’hypothèse que les langues naturelles sont «compilables»; et donc de construire une grammaire non contextuelle.

Télécharger l’intervention de Gérard Reb (format PDF)

Séminaire ATILF

Résumé automatique multilingue tenant compte de la thématique du texte

Abderrafih Lehmam (Pertinence Mining)

Résumé

La société de l’information apporte une extraordinaire abondance de textes informatisés et diffusables de manière instantanée et met à portée de tous l’accès à des données qui restaient inaccessibles, car n’étaient jamais publiées. La généralisation des micro ordinateurs dans les entreprises, dans les foyers, à l’école et à l’Université permet une formidable diffusion de connaissances. Les outils de résumé automatique de texte peuvent apporter une réponse efficace à l’acquisition et la gestion des connaissances. Nous présentons dans ce cadre, une description d’un outil de résumé appelé Pertinence qui a pour particularité de traiter six langues européennes et trois langues asiatiques tout en tenant compte de la couleur thématique du texte à résumer. Informatiquement réalisé en XML/JAVA, Pertinence se fonde exclusivement sur des techniques linguistiques (analyse du discours, morphologie, synonymie, terminologie).

http://www.pertinence.net/

Séminaire ATILF

Le dictionnaire, élément pivot, assistant l’homme dans le traitement de la langue

Michael Zock (Limsi-CNRS)

Résumé

L’objectif de mon exposé sera de montrer ce qu’on peut faire à partir d’un dictionnaire électronique bien construit. Les applications discutées vont du plus simple (ne demandant pratiquement aucun travail de recherche supplémentaire) au plus compliqué (une grande partie du travail reste à faire). Les dictionnaires électroniques ont un potentiel considérable, potentiel largement sous-exploité à l’heure actuelle. En dotant ces dictionnaires de quelques fonctionnalités supplémentaires, nous pourrions assister l’homme de diverses manières: (a) l’aider à obtenir des renseignements sur un mot donné (traduction, sens, informations grammaticales); (b) l’aider à mémoriser les mots ou les structures fondamentales d’une langue; (c) l’aider à trouver le mot qu’il a sur le bout de la langue; etc. Une grande partie de l’exposé sera consacré à ce dernier problème.
Tout le monde s’est déjà trouvé dans la situation suivante : on cherche un mot (ou le nom d’une personne) que l’on connaît, sans être en mesure d’y accéder à temps. Les travaux des psychologues montrent que les personnes se trouvant dans cet état savent énormément de choses sur le mot recherché (sens, nombre de syllabes, etc.), et que le mot avec lequel ils le confondent lui ressemble étrangement (lettre ou son initial, catégorie syntaxique, champ sémantique, etc.). Par ailleurs, l’analyse des erreurs de discours spontané révèle que les mots sont stockés sous deux modes: par la forme (sons ou graphèmes) et par le sens. Ceci étant, on pourrait imaginer un programme tirant bénéfice de cet état de fait, afin d’assister un locuteur ou rédacteur à (re)trouver le mot qu’il a sur le bout de la langue.
Notre argument concernant l’accès par la forme est fondé sur l’hypothèse suivante : ce qui empêche d’accéder au mot recherché est une certaine ressemblance formelle (graphème ou phonème) avec le mot cible. Etant donné que celle-ci est souvent due à une confusion ou inversion de graphème(s) ou phonème(s), nous pouvons nous servir du même mécanisme en l’inversant pour (re)-trouver le mot que le producteur avait sur le bout de la langue : nous permutons des phonèmes ou des syllabes, puis nous sélectionnons les candidats vraisemblables. Tout en ayant quelques caractéristiques propres, la méthode utilisée est proche de celle utilisée pour la correction orthographique. Notre argument concernant l’accès par le sens est fondé sur l’idée que le dictionnaire mental est un vaste réseau dont les mots sont les nœuds et les liens les associations activées en les entendant (ou en les voyant). Retrouver un mot consisterait donc à entrer dans ce réseau, puis suivre les liens. Si l’accès par la forme est implémenté, l’accès par le sens reste à construire. Cependant, avant de se lancer il serait bon de trouver une réponse aux questions suivantes :

quels sont ces liens entre les mots ou concepts? Les inventaires existants sont très incomplèts.
parmi ces liens, lesquels sont les plus fréquemment utilisés par les êtres humains? En d’autres termes, quels liens faut-il mettre dans un dictionnaire?
peut-on automatiquement identifier la nature et la fréquence des liens? Autrement dit, est-il possible/raisonnable d’avoir recours à l’analyse de corpus?

Télécharger « L’ordinateur assistant l’être humain … » (format PDF)

Séminaire ATILF

Linguistique variationnelle historique et traitement informatique de textes: présentation d’une méthode d’analyse

Harald Völker (Université de Berlin)

Résumé

Au cours de ces dix dernières années, la linguistique variationnelle a connu un grand succès dans le domaine de la linguistique contemporaine. Sachant qu’on a perdu non seulement une partie des sources textuelles, mais encore leurs situations d’énonciation et leurs contextes d’origine, la linguistique variationnelle doit surmonter davantage d’obstacles avant qu’elle puisse être utilisée pour l’analyse et l’interprétation de la variation typique des langues des siècles passés. À partir d’un corpus de chartes françaises du XIIIe siècle, Harald Völker se propose de présenter une méthode d’analyse qui parvient à distinguer d’une façon nouvelle les facteurs extra-linguistiques qui sont à l’origine des variations dans ces textes historiques en question.

Télécharger l’intervention de Harald Völker(format PDF)

Séminaire ATILF

L’anthroponymie en Lorraine

Aude Wirth (ATILF – CNRS / Université Nancy 2)

Résumé

Contrairement à ce que pourrait laisser croire la multitude des publications (de qualité et d’intérêt très variables) sur le sujet, l’anthroponymie (étude des noms de personnes) est une science relativement jeune et qui n’a encore que peu retenu l’attention des linguistes.
Cette intervention se veut une introduction à cette discipline ; elle présentera de façon concrète les méthodes de travail et les différents outils de recherche sur les noms de personnes en s’appuyant sur des exemples tirés de documents originaux et inédits. A partir de ceux-ci seront ensuite esquissées les principales caractéristiques du système anthroponymique lorrain à travers le temps (noms uniques, doubles, triples, catégorisation, fixation en noms de famille, etc.) ainsi que les apports de cette science à d’autres disciplines, qu’elles soient linguistiques ou non.

Séminaire ATILF

L’intonation du français

François Lonchamp (ATILF – CNRS / Université Nancy 2)

Résumé

Il est possible de prévoir de manière quasi-algorithmique l’intonation d’une phrase française canonique (sujet – verbe – complément(s) – circonstant(s) ) à valeur rhématique. Les principales étapes sont:
– création des mots prosodiques, composés d’un mot lexical (substantif, verbe, adjectif…) et du ou des mots grammaticaux qui le précèdent (déterminants, auxiliaire, prépositions …).
– création des groupes prosodiques, composés d’un ou plusieurs mots prosodiques, et obéissant à deux contraintes principales
1 – contrainte d’eurythmie: tous les groupes prosodiques doivent avoir un nombre de syllabes sensiblement égal, de l’ordre de 7 syllabes pour un débit modéré
2 – contrainte syntaxique: aucun groupe prosodique ne peut être constitué exclusivement d’un ‘frère droit’ et de son ‘oncle’ sur l’arbre syntaxique de la phrase
– Le dernier groupe reçoit une intonation terminale (contour de finalité), et les groupes qui précèdent un contour de continuation majeure. exemple : Il a décidé de passer son permis cet été mots prosodiques (il a décidé) (de passer) (son permis) (cet été) groupes prosodiques: la règle d’eurythmie suggère le découpage (il a décidé de passer) (son permis cet été), mais la règle syntaxique l’interdit car le second groupe est constitué exclusivement d’un ‘frère droit’ (complément du verbe ‘passer’) et son ‘oncle, le circonstant ‘en été’, ce qui impose le découpage non eurythmique (il a décidé) (de passer son permis) (cet été) Nous terminerons cet exposé par une revue rapide de quelques structures non canoniques: dislocation à gauche et à droite, présentatif, opposition thème-rhème.

Séminaire ATILF

Etude lexicale et modélisation de la polysémie verbale dans une perspective multilingue

Sébastien Haton (ATILF – CNRS / Université Nancy 2)

Résumé

Dans un premier temps, notre recherche porte sur le recensement et l’analyse des éléments pertinents pour différencier chaque occurrence d’une unité verbale donnée en français. A la conclusion de cette étude préalable, nous proposons une relecture de la notion de polysémie qui dépasse largement le simple cadre définitoire et étymologique, afin de l’adapter à nos objectifs d’implémentation. Le but de ce travail est d’élaborer des modèles lexico-conceptuels susceptibles de faire le lien entre différentes langues (français, anglais, espagnol et italien) pour essayer d’améliorer les systèmes de traduction automatique.
La prise en compte initialement très large des facteurs jugés pertinents pour le passage d’une langue à l’autre nous oblige à réfléchir sur la nécessité de simplifier les modèles précités. Une des solutions envisagées consiste à intégrer les unités verbales dans un réseau sémantique multi-dimensionnel dont l’algorithme est essentiellement basé sur le calcul de la distance sémantique entre les mots ainsi que sur la mise en relation des traits implantés pour chacun d’entre eux. Nous montrerons comment cette méthode permet en apparence de régler le problème de non-parallélisme lexical entre les langues.

Séminaire ATILF

Les expressions verbales figées dans quatre variétés du français (Belgique, France, Québec, Suisse : projet « BFQS »)

Jean Klein (Université de Louvain-la-Neuve)

Résumé

Depuis un certain nombre d’années, dans le cadre théorique du lexique-grammaire, Maurice Gross et le Laboratoire d’Automatique Documentaire et Linguistique (LADL) se sont consacrés à l’analyse syntaxique des phrases simples du français, mais aussi des phrases idiomatiques. Le corpus des phrases figées représente, de nos jours, environ 40.000 items, du moins en ce qui concerne la variété "centrale" ou "standard" du français: le projet BFQS s’attache à décrire, en outre, les variantes régionales (hors de France) des expressions verbales figées, à savoir en français de Belgique, du Québec et de Suisse. Le projet, en cours de réalisation, et qui associe des chercheurs représentant les quatre variétés de français, s’assigne un triple objectif, en partant des tables syntaxiques établies au LADL pour le seul français de France:
1° déterminer les expressions communes aux quatre variétés, soit les expressions BFQS;
2° ajouter au corpus du français "standard" les expressions inusitées en France;
3° établir des sous-catégories d’expressions communes à certaines variétés (BF, BQ, BS, FS, FQ, BQS, etc), sans oublier la variété F ("francisme") à ne pas confondre avec le français "standard". Le but final du projet est de réaliser un dictionnaire (électronique et en version papier) des expressions verbales figées du français et d’en fournir une classification syntaxique.

Séminaire ATILF

L’édition d’un texte dialectal du XVIIIe siècle : problèmes lexicographiques

Fernand Carton (Université Nancy 2)

Résumé

Je termine l’édition des Vers naïfs en vray patois de Lille de Jacques Decottignies (1706-1762), qui sera publiée chez Champion (2002). C’est la première publication des oeuvres de cet auteur méconnu, fils du chansonnier lillois Brûle-Maison dont j’ai publié les oeuvres (1965), et qui a longtemps influencé la littérature dialectale du Nord. Il s’agit de l’édition diplomatique, avec glossaire, de 45 pièces (chroniques, chansons, pasquilles, stances etc…) à partir de sources dispersées : imprimés originaux, feuilles volantes, copies manuscrites inédites. Le vocabulaire en est très riche, notamment en matière de mercerie, de modes et d’ustensiles de ménage. Il est constitué de picard plus ou moins archaïque, d’argot et de poissard (parisien ?). Nous exposerons la manière dont nous avons abordé certains problèmes de signification et de datation (timbres des chansons, détails historiques…).

Télécharger le bon de commande de Vers naïfs, pasquilles et chansons en vrai patois de Lille (format DOC)

Séminaire ATILF

Informatiser un dictionnaire ancien, ou comment rétroconvertir un document structuralement chaotique: le cas du Dictionaire critique de la langue française de Jean-François Féraud (Marseille, Mossy 1787-1788, 3 vol.)

Fernand Carton (Université Nancy 2)

Résumé

Le Dictionnaire critique de la langue française est, dans la chaîne des dictionnaires français, un maillon important car il actualise vers 1780 les résultats du considérable effort critique effectué aussi bien par les lexicographes que par les remarqueurs et les grammairiens de la période classique. Actualiser, c’est-à-dire à la fois citer, corriger et compléter le travail de ses précédesseurs, y compris et surtout l’Académie française. Par rapport à ses contemporains, il se signale notamment par un souci de mise à jour de l’information linguistique tout à fait remarquable. Mais les innovations ne s’arrêtent pas là: réforme conséquente de l’orthographe, premier effort systématique de notation phonétique et prosodique, précision fine des restrictions de l’usage d’un signe, recherche d’une meilleure visualisation architecturale de l’article. Cela dit, son informatisation se heurte à un problème structural de fond: par sa genèse ( premier état en 1761 sous le titre Dictionnaire grammatical de la langue française; édition augmentée en 1768), le D.C. est une collection de remarques classées par ordre alphabétique. La composante définitionnelle n’apparaît que tardivement dans le projet, ce qui confère à ce répertoire un caractère chaotique. Toute tentative de décrire et de modéliser l’enchaînement des composants se heurte à la variété des réalisations et des syntaxes d’un composant. De plus la typographie offre notamment des cas de polysémie et d’homonymie qui empêchent la récupération optimale de l’information. Actuellement dans un état de saisie philologiquement propre au deux tiers ( la fin de l’opération de saisie-correction est prévue pour juillet 2002), le texte-machine doit ensuite subir un transcodage WPF – XML. Il sera d’abord empoigné par le logiciel PHILOLOGICA pour figurer sur le site Dictionnaires d’autrefois. Mais deux nouveautés devront être apportées à cette base pour qu’elle remplisse pleinement sa fonction: d’une part un travail de lemmatisation devrait permettre de faciliter les requêtes; d’autre part le volumineux supplément manuscrit devrait être offert à la consultation en ligne en offrant au lecteur la possibilité d’en consulter in situ une version finement scannée. C’est cette étape qui nécessite la collaboration de l’ATILF. Pour un premier tour d’horizon, consulter le premier état du site Féraud à l’adresse suivante: http://www.mshs.univ-poitiers.fr/feraud/feraud.htm Il offre notamment le renvoi au cahier de saisie et un premier état de description du dictionnaire. Fin de la proposition de séminaire.

Séminaire ATILF

Comment enrichir l’information phraséologique du TLF ?

Franz-Josef Hausmann (Université d’Erlangen)

Résumé

La mise à jour du TLF devrait profiter de l’information cachée dans les profondeurs du dictionnaire. Celle-ci est immense. Certes, le TLFi permet à l’utilisateur averti d’aller chercher lui-même cette information, mais cette opération est souvent délicate ou laborieuse. Elle concerne en premier lieu les collocations cachées dans les articles des collocatifs et absentes des articles-bases, ensuite les locutions dont l’information est souvent éparpillée sur plusieurs articles – ou cruellement insuffisante, et pour finir, les bases d’allusion, en nombre insuffisant, mal accessibles et souvent absentes parce que nées avant 1789. Or, il faut reconnaître que telle citation célèbre de Molière (p. ex. "Cachez ce sein que je ne saurais voir") fait partie du français actuel.

Séminaire ATILF

Les grands dictionnaires de langue français, le TLF et ses contemporains : images, analyses et prospectives

Jean Pruvost (Université de Cergy-Pontoise)

Résumé

          Resituer les seize volumes du TLF dans le paysage lexicographique et dictionnairique de la seconde moitié du XXe siècle, en partant d’un regard comparatif et contrastif, tel pourrait être un premier objectif. On peut, au passage, prendre ainsi du recul sur les dynamiques qui étaient mises en présence, repérer plus précisément les types d’énergies privées et institutionnelles alors en œuvre dans des projets assez différents, avec des réceptions bien distinctes et des prolongements divers, voire contradictoires.
          Proposer ensuite, de manière volontairement imprudente, sans autocensure, diverses pistes pour continuer la magnifique entreprise représentée par le TLF pourrait constituer un second objectif. J’essaierai au passage de lister les attentes de tous les publics potentiels, qu’il s’agisse du dictionnaire papier, d’hier, ou du dictionnaire sur support électronique, d’aujourd’hui et de demain. Les perspectives sont ici à appréhender dans la double dimension, lexicographique et dictionnairique.
          Enfin, dans un troisième temps, en partant d’exemples concrets, je souhaiterais évoquer ce que j’ai dénommé " la triple investigation ", une sorte de preuve par neuf pour un dictionnaire de langue, et un type de mise en abyme, qui puisse permettre une exploitation encore plus efficace d’un grand dictionnaire de langue comme le TLF. Un propos un peu sibyllin que j’espère rendre clair lors de notre rencontre.
          Quelques ouvrages personnels ou dirigés qui pourront entre autres servir d’appui : Dictionnaires et nouvelles technologies (PUF, 2000) Les dictionnaires de langue française (PUF, Que sais-je ?) (à paraître en décembre) Les dictionnaires de langue française, Dictionnaires d’apprentissage, Dictionnaires spécialisés de la langue, Dictionnaires de spécialité (H. Champion, 2001)

◄ 2001

2003 ►

Historique 2002 des séminaires de l’ATILF

Séminaire ATILF

Séminaire ATILF

Séminaire ATILF

Séminaire ATILF

Séminaire ATILF

Séminaire ATILF

Séminaire ATILF

Séminaire ATILF

Séminaire ATILF

Séminaire ATILF

Séminaire ATILF

Séminaire ATILF

ATILF | CNRS-UL