Historique 2001 des séminaires de l’ATILF
Séminaire ATILF

Présentation de la théorie de la grammaticalisation et des recherches actuelles dans ce domaine
Bernard Combettes (ATILF)
Vendredi 7 décembre 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs
– Illustration par quelques exemples :
+ l’évolution des modalisateurs ("en principe", "de toutes façons")
+ l’évolution des introducteurs de topique ("pour ce qui regarde", "en ce qui concerne")
Séminaire ILD&ISTC

Gestion de données terminologiques
Alan Melby (Brigham Young University – Provo) et Kara Warburton IBM (Toronto)
Lundi 12 novembre 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle A008
Kara Warburton, terminologue à IBM (Toronto), présentera les différentes ressources terminologiques utilisées à IBM comme exemple des problèmes de gestion de données terminologiques en milieu industriel: glossaires unilingues traditionnels, bases de données terminologiques, lexiques bilingues pour la traduction , et listes de termes préscrits, parmi d’autres. Elle démontrera les stratégies possibles pour adapter une base de données terminologiques aux besoins de différents utilisateurs et elle abordera quelques problèmes de compatibilité entre les données lexicographiques et les données terminographiques.
14h00-15h00 | Alan Melby – Formats normalisés de terminologie pour l’industrie de la localisation
15h00-15h20 | discussion
15h20-15h30 | Pause
15h30-16h30 | Kara Warburton – Gestion des thésaurus et terminologie dans un grand groupe industriel : le cas d’IBM
16h30-17h00 | Discussion
Séminaire ATILF

De l’universel à la langue et retour par les choses dans la lexicographie française (1798-1890)
Jacques-Philippe Saint-Gérand (ATILF)
Vendredi 26 octobre 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs
Les titres associent volontiers désormais les deux déterminations d’universel et de langue, dans un souci évident de brouiller cette distinction de la langue et des choses au profit de la seule exhibition de nomenclatures toutes plus exhaustives les unes que les autres, ou souhaitant tout du moins l’être… Cette distinction méthodologique, que nos collègues d’outre-Rhin résument dans l’expression de Wörter und Sachen, pose en effet la question du rapport chronologique de l’une à l’autre. La langue et les mots préexistent-ils aux choses qu’ils vont servir à définir, ou, inversement, est-ce l’existence empiriquement constatée des choses qui justifie la production d’entités lexicales spécialement conformées à leur désignation ?
Pour certains lexicographes, il s’agit d’exposer par là une ambition nominaliste, dont la finalité est celle de permettre à l’utilisateur d’embrasser la totalité du monde en projetant sur l’infini de sa diversité les rets d’un lexique qui lui soit co-extensif. Illusion, prétention, utopie, aveuglement ? peut-être… Restent les témoignages de Boiste (1800 – 1857), Rolland (1812), Gattel (1812 – 1841), Rochette (1819), Nodier et Verger (1826), Raymond (1829), de Poitevin même en 1856, jusqu’au Grand Dictionnaire universel du XIXe siècle de Pierre Larousse (1866-1876)…
Pour les autres, la précision de dictionnaire de langue française, venant appuyer en sous-titre l’intitulé Dictionnaire universel, suffit à exposer sinon à justifier l’idée selon laquelle les mots, singulièrement en français, constituent des nomenclatures capables d’épuiser la richesse du monde empirique.
Le projet présenté ici voudrait définir la place du concept d’universalité dans le dictionnaire de langue français du XIXe siècle, et son rapport au type du dictionnaire général. La langue française, par sa nature – ce que les prédécesseurs nommaient son génie – est-elle apte à embrasser toute la diversité de cet universel que les progrès du monde contemporain ne cessent d’étendre à l’infini ? Autrement dit, le dictionnaire universel est-il destiné à rassembler la langue de tous, ou est-il un outil dont la finalité est de propager un lexique unique et de délimiter un lexique unique qui exprimerait toute la langue ? L’universalisation lexicale est-elle alors conçue comme un fait de diffusion d’un lexique modélisé, ou comme le processus de fusion d’un nombre indéfini de lexiques particuliers ? Sommes-nous alors en présence d’une démultiplication ou d’une somme de lexiques ?
Voilà qui nous renvoie à la distinction jadis énoncée par Alain Rey entre fonction normative et fonction descriptive des dictionnaires. Cette répartition des fonctions jette une lumière neuve sur l’opposition théorétique de d’Alembert entre les dictionnaires de choses et les dictionnaires de langue ; mais elle ne résout pas la difficulté que constitue dans ce panorama l’irruption du prédicat universel. Bernard Quemada a d’ailleurs noté cette aporie de la description en soulignant que c’est la qualification problématique d’universel qui a justement permis à d’Alembert de formuler historiquement l’opposition qui le rendit célèbre : " introduite en France par Furetière, la dénomination de dictionnaire universel rallia le plus grand nombre d’adhésions dans la mesure où elle impliquait une nomenclature étendue. Elle fut utilisée par tous les types de contenus lexicographiques, plus particulièrement au XVIIIe siècle pour les dictionnaires de termes techniques dont le vocabulaire connaissait une extension jusque là sans exemple " (p. 165)…
On voit ici le poids accordé à la question de l’extension de la nomenclature dans la définition du dictionnaire universel. La fin du XVIIIe siècle et les premières années du XIXe, seraient-elles donc le moment d’une succession typologique définie de façon fonctionnelle, ou bien devrions-nous considérer qu’il s’agit là d’une évolution terminologique recouvrant des réalités complexes et imbriquées mettant en relation le langage, la pensée du langage et l’univers extra-linguistique ? Est-il alors pertinent de situer l’universalité du seul côté de l’extension de la nomenclature ? Et ne serait-il pas plus judicieux d’envisager plutôt la question du côté de la destination du dictionnaire et des réponses métalexicographiques qu’il propose ? La masse documentaire à traiter ici, fournie par le seul XIXe siècle saisi dans une définition extensive, est abondante et l’on commencera dans ce séminaire à en examiner les premières caractéristiques.
Séminaire ATILF

Présentation de ses orientations de recherche
Susanne Alt-Salmon (ATILF)
Vendredi 12 octobre 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs
Séminaire ATILF

Du nom de famille au surnom, du surnom au lexème. Ou l’inverse. L’aventure lexicographique du projet PatRom
Jean Germain (Université de Louvain-la-Neuve)
Vendredi 5 octobre 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs
Titres de références :
- Kremer (Dieter) (coord.), 1997. Dictionnaire historique de l’anthroponymie romane (PatRom). Présentation d’un projet, Tübingen, Niemeyer.
- Cano González (Ana María)/Germain (Jean)/Kremer (Dieter) (éd.), 2004. Dictionnaire historique de l’anthroponymie romane. Patronymica Romanica
(PatRom). Volume II/1. L’Homme et les parties du corps humain (première partie), Tübingen, Niemeyer (il reste cinq volumes à paraître)
Séminaire ATILF

Le Dictionnaire des gallicismes de l’espagnol et les bases de données textuelles en langue espagnole
André Thibault (Université de Strasbourg)
Vendredi 7 septembre 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs
Soutenance de DEA

La négation en patois lorrains de Meurthe et Moselle et des Vosges, dimensions morpho-syntaxiques.
Christelle Millot
Vendredi 29 juin 2001 – 10h00
Nancy | Campus Lettres et Sciences Humaines | LANDISCO
Séminaire ATILF

La représentation du français à la lumière de la notion de « patrimoine linguistique » : le cas du Québec
Claude Poirier (Trésor de la langue française au Québec)
Mardi 12 juin 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs
Par ailleurs, l’apparente assurance que paraissent traduire chez les Québécois leurs productions artistiques et même lexicographiques a comme contrepartie une indécision chronique concernant les choix normatifs et une inquiétude quant à la survie de leur langue en Amérique du Nord. Cette conférence posera comme hypothèse que cette situation complexe découle d’une méconnaissance de l’histoire du français québécois, ce qui engendre une analyse erronée de la nature de cette variété. Le français du Québec est-il un rameau du français, comme on l’a proclamé, ou un rejeton? Adopter la seconde hypothèse, comme le fera le conférencier, c’est ouvrir des perspectives nouvelles pour ce qui est de la représentation qu’on peut se faire de ce français d’Amérique, et peut-être aussi quant aux orientations à privilégier pour l’avenir du français comme langue internationale.
Séminaire ATILF

Le Dictionnaire des régionalismes du français ou la fin d’un dialogue de sourds
Pierre Rézeau (ATILF)
Vendredi 8 juin 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs
Or la pratique et la confrontation de ces deux ensembles amènent vite à constater le manque flagrant de dialogue entre eux. Il devient non moins évident que : la prise en compte des standards de la lexicographie générale doit être un principe de base de la lexicographie différentielle (dans le choix de la nomenclature, dans l’élaboration des définitions, dans l’indication des marques d’usage) ;
les dictionnaires généraux ont beaucoup à puiser dans les travaux de lexicographie différentielle pour améliorer leur description du français (définition, aire géographique, exemplification, histoire).
À l’aide de nombreux exemples, on montrera comment le Dictionnaire des régionalismes de France, fruit d’une double pratique lexicographique (générale et différentielle), a su faire dialoguer ces deux ensembles au bénéfice d’une meilleure description du français.
Séminaire ILD&ISTC

Le temps en lambda-DRT typée
Pascal Amsili (TALANA, Paris 7)
Jeudi 7 juin 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013
Séminaire ILD&ISTC

Une grammaire d’unification d’arbres pour une analyse topologique de l’allemand
Kim Gerdes (LATTICE, Université de Paris 7)
Jeudi 31 mai 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013
Je formalise un concept traditionnel en linguistique germanique, le modèle topologique, dans lequel les mots sont placés dans des séquences préfigurées de cases, qui peuvent être emboîtées les unes dans les autres. Nous appelons la structure résultante une hiérarchie de domaines topologiques. Cette structure de domaines peut être vue comme arbre syntagmatique représentant exclusivement l’ordre et le groupement de mots, fournissant ainsi des interfaces naturelles avec la structure prosodique et avec la structure communicative (travail en collaboration avec Sylvain Kahane).
Je m’intéresse à modéliser le lien entre la sous-catégorisation, que je représente dans un arbre de dépendance syntaxique, et l’arbre topologique dans un formalisme d’arbres lexicalisés. Le formalisme de grammaire d’arbres adjoints (TAG), construisant une structure syntagmatique habituelle, n’est pas suffisamment puissant pour représenter le modèle topologique. Il faudra aussi permettre, de manière restreinte, la sister adjunction et l’éclatement d’une entrée lexicale en plusieurs arbres (TAG ensembliste). Le résultat est un formalisme d’unification d’arbres qui permet facilement d’obtenir tous les ordres de mots possibles et leurs structures topologiques pour un arbre de dépendance (arbre de dérivation) donné. La complexité de l’algorithme d’ analyse est d’ordre O(n3+2k), n étant le nombre de mot, et k le nombre de noeuds mis en jeux dans une configuration non-projective.
Séminaire ILD&ISTC

Un modèle théorique d’inférence de structures sémantiques et discursives dans le cadre de la génération automatique de textes
Laurent Roussarie (LATTICE, Université de Paris 7)
Jeudi 17 mai 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013
Séminaire ATILF

L’édition électronique et l’analyse linguistique de sources documentaires françaises du Moyen Âge à l’aide du langage script TUSTEP
Martin Glessgen (Université Marc Bloch, Strasbourg)
Vendredi 4 mai 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs
M. Gleßgen présentera l’état d’avancement des travaux : structuration du balisage, routines d’édition et d’interrogation lexicologique (et graphématique). Par ailleurs, il essaiera de décrire les objectifs d’histoire linguistique qui ont déterminé les choix des textes et des méthodes : les chartes, textes originaux, doivent permettre d’établir, au moins en partie, le réseau des scriptoria de la France médiévale. Celui-ci pourra servir à son tour de référence pour l’étude de textes littéraires d’ancien et de moyen français : il est important d’identifier la place qu’occupe un témoin textuel dans le diasystème historique selon des paramètres d’espace, de temps, de prestige social et de fonctions communicatives.
Enfin, M. Gleßgen présentera brièvement le langage script TUSTEP à l’aide duquel les programmes sont élaborés. L’exposé conduira à une réflexion sur les problèmes méthodologiques sensibles que soulève, à l’heure actuelle, la linguistique de corpus dans l’historiographie linguistique et sur le niveau d’exigence qu’elle doit atteindre : la conservation de données à long terme, la transparence de l’encodage et l’élaboration d’une épistémologie pour cette nouvelle discipline.
Séminaire ILD&ISTC

Quelle est la nature des objets lexicaux auxquels s’appliquent les opérations morphologiques ?
Françoise Kerlevoux
Jeudi 26 avril 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013
Séminaire ILD&ISTC

Alexandre Dikovsky (IRIN, Université de Nantes)
Jeudi 19 avril 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013
Lors de l’analyse syntaxique, la discontinuité détruit le principe de programmation dynamique qui est à la base de tous les algorithmes polynômiaux d’analyse. Elle pose aussi problème de l’interprétation sémantique car la structure syntaxique rompue n’est pas bien adaptée aux définitions récursives compositionnelles.
Il existe plusieurs solutions partielles de ce problème : une approche transformationnelle, une approche, basée sur le contrôle de la montée des groupes dans les arbres syntaxiques, une approche logique basée sur le calcul des séquents avec la commutativité ponctuelle, etc. Aucune ne donne de solution véritablement efficace en terme de complexité. Nous proposons une nouvelle approche à ce problème en termes de dépendances syntaxiques locales et explicites, et de valences (positives pour les gouverneurs, et négatives pour les dépendants). La saturation des valences correspond à l’établissement de dépendances longues discontinues.
Nous trouvons des critères de décidabilité d’une telle saturation élégants de point de vue mathématique, simples à réaliser et qui s’accordent bien avec la complexité réelle de déplacement des constituants dans les langues naturelles.
Séminaire ILD&ISTC

Synoterm : un outil d’aide a l’acquisition de relations sémantiques spécialisées a partir de ressources lexicales
Thierry Hamon (Université de Villetaneuse)
Jeudi 29 mars 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013
Séminaire ILD&ISTC

Construire une unité lexicale : plus qu’une simple question de forme
Georgette Dal (UMR 8528 » SILEX » et GDR 2220, CNRS & Un. Lille 3)
Jeudi 22 mars 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013
Dans un second temps, j’exposerai dans ses grandes lignes le projet MorTAL mené avec Nabil Hathout, Chritian Jacquemin et Fiammetta Namer, et dont la partie émergée est une base de données constructionnelles enrichies d’informations sémantiques.
Dans un dernier temps, je montrerai comment le TAL peut tirer bénéfice d’une telle appréhension des phénomènes constructionnels.
Séminaire ILD&ISTC

MAT – A Machine Aided Translation System
Dr. K. Narayana Murthy (Dept. of Computer and Info. Sciences, University of Hyderabad)
Mercredi 14 mars 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle A006
MAT is a parser based translating system – it works at sentence level, not word by word. MAT uses the UCSG (Universal Clause Structure Grammar) parsing system developed at the University of Hyderabad, India. A quick overview of UCSG parsing system will be included here for completeness. MAT is intended to assist human translators in primarily two ways. Firstly, it generates raw translations quickly. Secondly, it provides many useful tools such as on-line dictionaries, thesaurus, morphological analyser and generator, and a variety of post editing tools. The talk includes a quick view of these tools using examples.
Séminaire ILD&ISTC

Modélisation de la langue par une correspondance sens-textes
Sylvain Kahane (LATTICE, Université Paris 7)
Jeudi 8 mars 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013
Conférence U.F.R. de langues et littératures étrangères

Übersetzung und Linguistik im engeren Sinne. Quasi una fantasia
Jörn Albrecht (directeur de l’Institut de Traduction et d’Interprétariat de l’Université de Heidelberg, R.F.A.)
Jeudi 22 février 2001 | 18h00
Nancy | Campus Lettres et Sciences Humaines | Bâtiment B | salle B 10
Exposé en allemand.
Conférence U.F.R. de langues et littératures étrangères

La formation des traducteurs dans les instituts universitaires en Allemagne et ailleurs
Jörn Albrecht (directeur de l’Institut de Traduction et d’Interprétariat de l’Université de Heidelberg, R.F.A.)
Jeudi 22 février 2001 | 16h15
Nancy | Campus Lettres et Sciences Humaines | Bâtiment B | salle B 10
Exposé en français.
Séminaire ILD&ISTC

Une analyse thématique fondée sur l’amorçage
Olivier Ferret (CEA Saclay DTI/SIIA/GPST)
Jeudi 22 février 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013
Séminaire ILD&ISTC

Méthodologie informatique des produits de l’INaLF
Jacques Dendien (ATILF, ex INaLF-Nancy)
Jeudi 11 janvier 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013
1) outils divers : gestion des expressions régulières étendues, tris par B-arbres, conjugaison et fléchissement des mots de la langue française, lemmatisation, etc.
2) Interfaces WWW : gestion automatique de la notion de session et des espaces disque serveur associés, collecte de formulaires, menus déroulants à base de technologie Java, etc.
3) Système de gestion de bases textuelles structurées : fabrication de bases à compacité optimale, fonctions d’accès aux objets atomiques (mots), fabrication d’objets textuels arbitrairement complexes et de leurs moteurs de recherche, compilateur de langage de requête et de grammaires formelles.
Compte tenu du volume de cet ensemble, seuls seront présentés les caractéristiques les plus saillantes du point 3 :
– Indexation des objets atomiques et fonctions d’accès : la méthode d’indexation présentée est mathématiquement optimale et génère des index hyper-compacts gage de hautes performances.
– Théorie des objets textuels complexes et des moteurs de recherche : cette théorie propose une formulation mathématique des objets textuels et des moteurs de recherche. En dépit de son apparente simplicité, elle débouche sur la possibilité de combiner les objets textuels entre eux pour aboutir à des objets d’une complexité arbitrairement élevé dont le moteur de recherche est automatiquement disponible.
Cette théorie débouche également sur son implémentation informatique (les différentes classes d’objets textuels) permettant de créer un univers indéfiniment extensible, par la réalisation de nouvelles classes conformes à un modèle abstrait (notion de d’objet textuel natif). Elle permet également d’introduire du " savoir linguistique " à différents niveaux (adjonction de constructeurs à des classes existantes, réalisation de " classes savantes ", mise en oeuvre des grammaires formelles).