historique 2001 séminaires

Historique 2001 des séminaires de l’ATILF

Séminaire ATILF

Présentation de la théorie de la grammaticalisation et des recherches actuelles dans ce domaine

Bernard Combettes (ATILF)

Vendredi 7 décembre 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
– Les principales notions : réanalyse, analogie, "affaiblissement" sémantique
– Illustration par quelques exemples :
   + l’évolution des modalisateurs ("en principe", "de toutes façons")
   + l’évolution des introducteurs de topique ("pour ce qui regarde", "en ce qui concerne")

Séminaire ILD&ISTC

Gestion de données terminologiques

Alan Melby (Brigham Young University – Provo) et Kara Warburton IBM (Toronto)

Lundi 12 novembre 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle A008

Résumé
Alan Melby, professeur associé à la Brigham Young University (Provo), présentera le format TBX, adopté par l’industrie de la localisation pour la représentation de données terminologiques multilingues. Il montrera comment ce format est le fruit d’une évolution initié dans le cadre de la Text Encoding Initiative (TEI) et poursuivie au sein de l’ISO (ISO 12200, ISO 12620, ISO CD 16642). Il présentera un exemple d’utilisation de TBX ainsi que le type d’environnement nécessaire pour gérer et valider des données dans ce cadre.
Kara Warburton, terminologue à IBM (Toronto), présentera les différentes ressources terminologiques utilisées à IBM comme exemple des problèmes de gestion de données terminologiques en milieu industriel: glossaires unilingues traditionnels, bases de données terminologiques, lexiques bilingues pour la traduction , et listes de termes préscrits, parmi d’autres. Elle démontrera les stratégies possibles pour adapter une base de données terminologiques aux besoins de différents utilisateurs et elle abordera quelques problèmes de compatibilité entre les données lexicographiques et les données terminographiques.

 

14h00-15h00 | Alan Melby – Formats normalisés de terminologie pour l’industrie de la localisation
15h00-15h20 | discussion
15h20-15h30 | Pause
15h30-16h30 | Kara Warburton – Gestion des thésaurus et terminologie dans un grand groupe industriel : le cas d’IBM
16h30-17h00 | Discussion

Séminaire ATILF

De l’universel à la langue et retour par les choses dans la lexicographie française (1798-1890)

Jacques-Philippe Saint-Gérand (ATILF)

Vendredi 26 octobre 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Depuis l’article de d’Alembert dans l’Encyclopédie du XVIIIe siècle , le dictionnaire de choses et le dictionnaire de langue apparaissent comme deux objets que distinguent leur choix dans la nomenclature et leur dessein, c’est-à-dire leur objectif définitoire. Mais au XIXe siècle, cette distinction de principe tend à perdre dans les faits de sa pertinence théorique – si tant est qu’elle en ait eu une – principalement en raison du retour inattendu de la notion d’universel que la lexicographie du XVIIe siècle, puis celle du XVIIIe siècle débutant, avaient pourtant largement sollicitée. Mais cette résurgence d’un semblable prédicat n’est en aucune manière reprise à l’identique de cette notion. C’est ainsi que sous l’étiquetage des signes de langue fluctuent les limites formelles et substantielles des représentations de la réalité produites par l’esprit rationnel. De même que la notion de grammaire générale qui se dessine au milieu du siècle de Girault-Duvivier, de Napoléon Landais ou de Célestin Ayer n’a plus rien en commun avec celle qu’envisageait Port-Royal en 1660, de même les dictionnaires universels qui vont se multiplier à l’époque des Bescherelle, Poitevin ou Larousse ne répondent-ils plus que partiellement aux desseins définis par leurs prédécesseurs de l’âge classique.
Les titres associent volontiers désormais les deux déterminations d’universel et de langue, dans un souci évident de brouiller cette distinction de la langue et des choses au profit de la seule exhibition de nomenclatures toutes plus exhaustives les unes que les autres, ou souhaitant tout du moins l’être… Cette distinction méthodologique, que nos collègues d’outre-Rhin résument dans l’expression de Wörter und Sachen, pose en effet la question du rapport chronologique de l’une à l’autre. La langue et les mots préexistent-ils aux choses qu’ils vont servir à définir, ou, inversement, est-ce l’existence empiriquement constatée des choses qui justifie la production d’entités lexicales spécialement conformées à leur désignation ?
Pour certains lexicographes, il s’agit d’exposer par là une ambition nominaliste, dont la finalité est celle de permettre à l’utilisateur d’embrasser la totalité du monde en projetant sur l’infini de sa diversité les rets d’un lexique qui lui soit co-extensif. Illusion, prétention, utopie, aveuglement ? peut-être… Restent les témoignages de Boiste (1800 – 1857), Rolland (1812), Gattel (1812 – 1841), Rochette (1819), Nodier et Verger (1826), Raymond (1829), de Poitevin même en 1856, jusqu’au Grand Dictionnaire universel du XIXe siècle de Pierre Larousse (1866-1876)…
Pour les autres, la précision de dictionnaire de langue française, venant appuyer en sous-titre l’intitulé Dictionnaire universel, suffit à exposer sinon à justifier l’idée selon laquelle les mots, singulièrement en français, constituent des nomenclatures capables d’épuiser la richesse du monde empirique.
Le projet présenté ici voudrait définir la place du concept d’universalité dans le dictionnaire de langue français du XIXe siècle, et son rapport au type du dictionnaire général. La langue française, par sa nature – ce que les prédécesseurs nommaient son génie – est-elle apte à embrasser toute la diversité de cet universel que les progrès du monde contemporain ne cessent d’étendre à l’infini ? Autrement dit, le dictionnaire universel est-il destiné à rassembler la langue de tous, ou est-il un outil dont la finalité est de propager un lexique unique et de délimiter un lexique unique qui exprimerait toute la langue ? L’universalisation lexicale est-elle alors conçue comme un fait de diffusion d’un lexique modélisé, ou comme le processus de fusion d’un nombre indéfini de lexiques particuliers ? Sommes-nous alors en présence d’une démultiplication ou d’une somme de lexiques ?
Voilà qui nous renvoie à la distinction jadis énoncée par Alain Rey entre fonction normative et fonction descriptive des dictionnaires. Cette répartition des fonctions jette une lumière neuve sur l’opposition théorétique de d’Alembert entre les dictionnaires de choses et les dictionnaires de langue ; mais elle ne résout pas la difficulté que constitue dans ce panorama l’irruption du prédicat universel. Bernard Quemada a d’ailleurs noté cette aporie de la description en soulignant que c’est la qualification problématique d’universel qui a justement permis à d’Alembert de formuler historiquement l’opposition qui le rendit célèbre : " introduite en France par Furetière, la dénomination de dictionnaire universel rallia le plus grand nombre d’adhésions dans la mesure où elle impliquait une nomenclature étendue. Elle fut utilisée par tous les types de contenus lexicographiques, plus particulièrement au XVIIIe siècle pour les dictionnaires de termes techniques dont le vocabulaire connaissait une extension jusque là sans exemple " (p. 165)…
On voit ici le poids accordé à la question de l’extension de la nomenclature dans la définition du dictionnaire universel. La fin du XVIIIe siècle et les premières années du XIXe, seraient-elles donc le moment d’une succession typologique définie de façon fonctionnelle, ou bien devrions-nous considérer qu’il s’agit là d’une évolution terminologique recouvrant des réalités complexes et imbriquées mettant en relation le langage, la pensée du langage et l’univers extra-linguistique ? Est-il alors pertinent de situer l’universalité du seul côté de l’extension de la nomenclature ? Et ne serait-il pas plus judicieux d’envisager plutôt la question du côté de la destination du dictionnaire et des réponses métalexicographiques qu’il propose ? La masse documentaire à traiter ici, fournie par le seul XIXe siècle saisi dans une définition extensive, est abondante et l’on commencera dans ce séminaire à en examiner les premières caractéristiques.

Séminaire ATILF

Présentation de ses orientations de recherche

Susanne Alt-Salmon (ATILF)

Vendredi 12 octobre 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Ce séminaire sera consacré à une présentation de mes travaux et intérêts de recherche dans le but de faciliter le contact avec mes nouveaux collègues de l’ATILF. Mon exposé aura pour fil rouge le problème de l’interprétation référentielle en langue naturelle : par référence, j’entendrai la façon dont un interlocuteur identifie, à partir d’une expression linguistique (pro)nominale, l’entité extralinguistique en question. Je présenterai un modèle de la référence qui part de l’hypothèse que toute expression référentielle s’interprète dans un contexte limité – son domaine de référence – à l’intérieur duquel elle identifie son référent sur des caractéristiques propres à sa détermination (indéfini, défini, pronom…) et à la sémantique de ses composantes. A partir du travail effectué jusque là, je présenterai quelques unes des mes perspectives de recherche, en mettant l’accent sur celles susceptibles d’impliquer mes collègues de l’ATILF.

Séminaire ATILF

Du nom de famille au surnom, du surnom au lexème. Ou l’inverse. L’aventure lexicographique du projet PatRom

Jean Germain (Université de Louvain-la-Neuve)

Vendredi 5 octobre 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Les noms de famille peuvent-ils apporter quelque chose à la lexicographie, à la parémiologie, voire à la sémantique ? Ainsi pourrait se résumer l’objet de cet exposé profitant de l’expérience récente du projet PatRom. Pour rappel, celui-ci vise à établir un dictionnaire historique et génétique de l’anthroponymie d’origine lexicale des divers pays de langues romanes. A travers quelques exemples choisis, de quelques itinéraires étymologiques vécus, on tâchera de baliser le parcours méthodologique qui vise à établir une recherche anthroponymique non plus hasardeuse mais reposant sur les bases les plus rigoureuses possibles.

 

Titres de références :

  • Kremer (Dieter) (coord.), 1997. Dictionnaire historique de l’anthroponymie romane (PatRom). Présentation d’un projet, Tübingen, Niemeyer.
  • Cano González (Ana María)/Germain (Jean)/Kremer (Dieter) (éd.), 2004. Dictionnaire historique de l’anthroponymie romane. Patronymica Romanica
    (PatRom). Volume II/1. L’Homme et les parties du corps humain (première partie), Tübingen, Niemeyer (il reste cinq volumes à paraître)

Séminaire ATILF

Le Dictionnaire des gallicismes de l’espagnol et les bases de données textuelles en langue espagnole

André Thibault (Université de Strasbourg)

Vendredi 7 septembre 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
La lexicographie de langue espagnole, qui accuse un fort retard face à celle du monde francophone, dispose depuis quelques années de nouveaux instruments de recherche qui permettront à ceux qui veulent bien s’en donner la peine d’améliorer substantiellement l’état de nos connaissances sur l’histoire du lexique castillan. De nombreux cédéroms mettent aujourd’hui à notre disposition des masses considérables de textes, littéraires ou non, interrogeables grâce à des logiciels de recherche plus ou moins performants ; en outre, le site internet de la Real Academia Española met gratuitement à la disposition des chercheurs du monde entier deux banques de textes, l’une diachronique (des débuts de la langue à 1975 – CORDE) et l’autre synchronique (de 1975 à nos jours – CREA), ainsi que la totalité du texte des 21 éditions de son dictionnaire. Nous essaierons de présenter en temps réel le fonctionnement de ces nouveaux instruments informatiques, en illustrant la démarche à partir d’exemples tirés de notre futur "Dictionnaire des gallicismes de l’espagnol".

 

Télécharger l’exposé d’André Thibault (format PDF)

Soutenance de DEA

La négation en patois lorrains de Meurthe et Moselle et des Vosges, dimensions morpho-syntaxiques.

Christelle Millot

Vendredi 29 juin 2001 – 10h00
Nancy | Campus Lettres et Sciences Humaines | LANDISCO

Séminaire ATILF

La représentation du français à la lumière de la notion de « patrimoine linguistique » : le cas du Québec

Claude Poirier (Trésor de la langue française au Québec)

Mardi 12 juin 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Le français du Québec a une réputation d’"enfant terrible" au sein de la francophonie. Les Québécois se distinguent nettement des autres francophones quand on considère l’écart entre leur façon de parler et la norme parisienne. Pourtant, ils semblent trouver plaisir à donner mauvaise conscience à la France quand il est question de fierté de la langue, de lutte contre l’anglicisation, ou encore de féminisation.
Par ailleurs, l’apparente assurance que paraissent traduire chez les Québécois leurs productions artistiques et même lexicographiques a comme contrepartie une indécision chronique concernant les choix normatifs et une inquiétude quant à la survie de leur langue en Amérique du Nord. Cette conférence posera comme hypothèse que cette situation complexe découle d’une méconnaissance de l’histoire du français québécois, ce qui engendre une analyse erronée de la nature de cette variété. Le français du Québec est-il un rameau du français, comme on l’a proclamé, ou un rejeton? Adopter la seconde hypothèse, comme le fera le conférencier, c’est ouvrir des perspectives nouvelles pour ce qui est de la représentation qu’on peut se faire de ce français d’Amérique, et peut-être aussi quant aux orientations à privilégier pour l’avenir du français comme langue internationale.

 

http://www.tlfq.ulaval.ca

Séminaire ATILF

Le Dictionnaire des régionalismes du français ou la fin d’un dialogue de sourds

Pierre Rézeau (ATILF)

Vendredi 8 juin 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Dans la liste des ouvrages mis à contribution par le Dictionnaire des régionalismes de France (De Boeck/Duculot, 2001), le corpus lexicographique est d’une importance particulière : d’une part, les dictionnaires de la langue générale, d’autre part les dictionnaires, glossaires, études intéressant le français d’une région ou d’une ville.
Or la pratique et la confrontation de ces deux ensembles amènent vite à constater le manque flagrant de dialogue entre eux. Il devient non moins évident que : la prise en compte des standards de la lexicographie générale doit être un principe de base de la lexicographie différentielle (dans le choix de la nomenclature, dans l’élaboration des définitions, dans l’indication des marques d’usage) ;
les dictionnaires généraux ont beaucoup à puiser dans les travaux de lexicographie différentielle pour améliorer leur description du français (définition, aire géographique, exemplification, histoire).
À l’aide de nombreux exemples, on montrera comment le Dictionnaire des régionalismes de France, fruit d’une double pratique lexicographique (générale et différentielle), a su faire dialoguer ces deux ensembles au bénéfice d’une meilleure description du français.

 

Télécharger l’article de Pierre Rézeau « Le Dictionnaire des régionalismes de France (DRF), mode d’emploi » (format PDF)

Séminaire ILD&ISTC

Le temps en lambda-DRT typée

Pascal Amsili (TALANA, Paris 7)

Jeudi 7 juin 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Résumé
La DRT s’est longtemps vu reprocher de ne pas être compositionnelle, et différentes propositions se sont faites jour pour rendre le processus de construction de DRS compositionnel. La lambda-DRT proposée par (Asher, 93) répond à cet objectif, à condition toutefois qu’on munisse le calcul d’un système de types qui permette (1) de représenter certaines informations dans les DRS en pendant la construction, et (2) de contrôler les bêta-réductions (Amsili & Hathout, 98). C’est cette "lambda-DRT typée" que je présenterai pendant cet exposé, d’abord en termes généraux, et ensuite en l’appliquant à la construction de DRS temporalisées.

Séminaire ILD&ISTC

Une grammaire d’unification d’arbres pour une analyse topologique de l’allemand

Kim Gerdes (LATTICE, Université de Paris 7)

Jeudi 31 mai 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Résumé
La structure syntagmatique contient deux sortes d’information linguistique : l’information sur la sous-catégorisation et l’information sur l’ordre de mots. Dans les langues à cas, contrairement aux langues anglo-romanes, la sous-catégorisation verbale est déterminée par le marquage casuel et l’ordre de mots détient une fonction communicative. Il s’impose de séparer la sous-catégorisation et l’ordre de mots en deux niveaux d’analyse linguistique.
Je formalise un concept traditionnel en linguistique germanique, le modèle topologique, dans lequel les mots sont placés dans des séquences préfigurées de cases, qui peuvent être emboîtées les unes dans les autres. Nous appelons la structure résultante une hiérarchie de domaines topologiques. Cette structure de domaines peut être vue comme arbre syntagmatique représentant exclusivement l’ordre et le groupement de mots, fournissant ainsi des interfaces naturelles avec la structure prosodique et avec la structure communicative (travail en collaboration avec Sylvain Kahane).
Je m’intéresse à modéliser le lien entre la sous-catégorisation, que je représente dans un arbre de dépendance syntaxique, et l’arbre topologique dans un formalisme d’arbres lexicalisés. Le formalisme de grammaire d’arbres adjoints (TAG), construisant une structure syntagmatique habituelle, n’est pas suffisamment puissant pour représenter le modèle topologique. Il faudra aussi permettre, de manière restreinte, la sister adjunction et l’éclatement d’une entrée lexicale en plusieurs arbres (TAG ensembliste). Le résultat est un formalisme d’unification d’arbres qui permet facilement d’obtenir tous les ordres de mots possibles et leurs structures topologiques pour un arbre de dépendance (arbre de dérivation) donné. La complexité de l’algorithme d’ analyse est d’ordre O(n3+2k), n étant le nombre de mot, et k le nombre de noeuds mis en jeux dans une configuration non-projective.

Séminaire ILD&ISTC

Un modèle théorique d’inférence de structures sémantiques et discursives dans le cadre de la génération automatique de textes

Laurent Roussarie (LATTICE, Université de Paris 7)

Jeudi 17 mai 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Séminaire ATILF

L’édition électronique et l’analyse linguistique de sources documentaires françaises du Moyen Âge à l’aide du langage script TUSTEP

Martin Glessgen (Université Marc Bloch, Strasbourg)

Vendredi 4 mai 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Le projet s’appuie sur un corpus de documents non-littéraires en ancien français. Le noyau de textes actuellement à l’étude pour une édition (combinée papier et électronique, avec l’établissement d’un glossaire) est un ensemble de chartes du XIIIe siècle conservées aux A.D. de la Meurthe-et-Moselle, publiées sous forme dactylographiée par Michel Arnod en 1974. Cette édition s’inscrira dans le cadre de la collection des " Plus anciens documents linguistiques de la France " dirigée par Françoise Vieillard et Olivier Guyotjeannin et servira de modèle pour les futurs volumes de la collection. La base de données qui se constitue peu à peu, s’enrichit dès maintenant d’autres textes en ancien et moyen français, appartenant à des genres variés (scientifique, narratif ou poétique) et reproduits d’après des manuscrits.
M. Gleßgen présentera l’état d’avancement des travaux : structuration du balisage, routines d’édition et d’interrogation lexicologique (et graphématique). Par ailleurs, il essaiera de décrire les objectifs d’histoire linguistique qui ont déterminé les choix des textes et des méthodes : les chartes, textes originaux, doivent permettre d’établir, au moins en partie, le réseau des scriptoria de la France médiévale. Celui-ci pourra servir à son tour de référence pour l’étude de textes littéraires d’ancien et de moyen français : il est important d’identifier la place qu’occupe un témoin textuel dans le diasystème historique selon des paramètres d’espace, de temps, de prestige social et de fonctions communicatives.
Enfin, M. Gleßgen présentera brièvement le langage script TUSTEP à l’aide duquel les programmes sont élaborés. L’exposé conduira à une réflexion sur les problèmes méthodologiques sensibles que soulève, à l’heure actuelle, la linguistique de corpus dans l’historiographie linguistique et sur le niveau d’exigence qu’elle doit atteindre : la conservation de données à long terme, la transparence de l’encodage et l’élaboration d’une épistémologie pour cette nouvelle discipline.

Séminaire ILD&ISTC

Quelle est la nature des objets lexicaux auxquels s’appliquent les opérations morphologiques ?

Françoise Kerlevoux

Jeudi 26 avril 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Séminaire ILD&ISTC

Alexandre Dikovsky (IRIN, Université de Nantes)

Jeudi 19 avril 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Résumé
Le traitement des syntagmes discontinus est un problème linguistique classique qui est un des problèmes difficiles des théories syntaxiques. Un syntagme discontinu est composé des unités lexicales plus ou moins éloignées dans l’énoncé. En Français les plus connus sont : la mise en relief : "ces poissons, le mazout les a tués tous" les clitiques pronominaux : "je l’y trouve contraire" les déplacement d’un groupe nominal : "et de cette journée il grava à jamais le souvenir dans sa mémoire" etc.
Lors de l’analyse syntaxique, la discontinuité détruit le principe de programmation dynamique qui est à la base de tous les algorithmes polynômiaux d’analyse. Elle pose aussi problème de l’interprétation sémantique car la structure syntaxique rompue n’est pas bien adaptée aux définitions récursives compositionnelles.
Il existe plusieurs solutions partielles de ce problème : une approche transformationnelle, une approche, basée sur le contrôle de la montée des groupes dans les arbres syntaxiques, une approche logique basée sur le calcul des séquents avec la commutativité ponctuelle, etc. Aucune ne donne de solution véritablement efficace en terme de complexité. Nous proposons une nouvelle approche à ce problème en termes de dépendances syntaxiques locales et explicites, et de valences (positives pour les gouverneurs, et négatives pour les dépendants). La saturation des valences correspond à l’établissement de dépendances longues discontinues.
Nous trouvons des critères de décidabilité d’une telle saturation élégants de point de vue mathématique, simples à réaliser et qui s’accordent bien avec la complexité réelle de déplacement des constituants dans les langues naturelles.

Séminaire ILD&ISTC

Synoterm : un outil d’aide a l’acquisition de relations sémantiques spécialisées a partir de ressources lexicales

Thierry Hamon (Université de Villetaneuse)

Jeudi 29 mars 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Résumé
De nombreuses applications dans les domaines de spécialité exploitent des terminologies. Constituer ces ressources nécessite d’identifier les termes du domaine, et de les structurer en les mettant en relation. La synonymie est précieuse pour le terminologue qui doit isoler le terme vedette de ses variantes sémantiques. Nous nous sommes intéressé à l’acquisition de cette relation sur des corpus spécialisés. Dans notre outil d’aide à la structuration de terminologie (SynoTerm), des règles exploitent des informations sémantiques extraites de ressources de nature différente pour inférer des relations entre termes complexes. Celles-ci sont ensuite validées par un terminologue. L’implémentation de ces règles soulevant des problèmes d’optimisation, nous proposons une représentation des termes dans un graphe. Des algorithmes efficaces permettent d’obtenir des temps de calcul adaptés aux contraintes de la structuration d’une terminologie. L’exploitation de ressources lexicales dans des conditions réelles nous a permis de caractériser l’apport des ressources générales et l’intérêt de les combiner à des données très spécialisées. Nous proposons une présentation structurée des résultats pour guider le travail de validation du terminologue et des critères évaluant de multiples paramètres, les mesures de précision et de rappel reflétant imparfaitement l’avis des terminologues.

Séminaire ILD&ISTC

Construire une unité lexicale : plus qu’une simple question de forme

Georgette Dal (UMR 8528  » SILEX  » et GDR 2220, CNRS & Un. Lille 3)

Jeudi 22 mars 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Résumé
Cette intervention, intitulée " Construire une unité lexicale : plus qu’une simple question de forme ", se propose de montrer que les opérations linguistiques régissant la construction des unités lexicales construites ne se limitent pas à de simples mises en relation de catégories lexicales. Dans un premier temps, je ferai en effet apparaître que les contraintes à l’¦uvre dans la construction des unités lexicales construites sont avant tout sémantiques, et que les autres types de contraintes (formelles et catégorielles) sont pour la plupart consécutives de ces contraintes sémantiques fondamentales.
Dans un second temps, j’exposerai dans ses grandes lignes le projet MorTAL mené avec Nabil Hathout, Chritian Jacquemin et Fiammetta Namer, et dont la partie émergée est une base de données constructionnelles enrichies d’informations sémantiques.
Dans un dernier temps, je montrerai comment le TAL peut tirer bénéfice d’une telle appréhension des phénomènes constructionnels.

Séminaire ILD&ISTC

MAT – A Machine Aided Translation System

Dr. K. Narayana Murthy (Dept. of Computer and Info. Sciences, University of Hyderabad)

Mercredi 14 mars 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle A006

Résumé
This talk is about a Machine Aided Translation system called MAT. MAT was developed originally for translating between English and Indian languages but the technology can be extended for other languages as well.
MAT is a parser based translating system – it works at sentence level, not word by word. MAT uses the UCSG (Universal Clause Structure Grammar) parsing system developed at the University of Hyderabad, India. A quick overview of UCSG parsing system will be included here for completeness. MAT is intended to assist human translators in primarily two ways. Firstly, it generates raw translations quickly. Secondly, it provides many useful tools such as on-line dictionaries, thesaurus, morphological analyser and generator, and a variety of post editing tools. The talk includes a quick view of these tools using examples.

Séminaire ILD&ISTC

Modélisation de la langue par une correspondance sens-textes

Sylvain Kahane (LATTICE, Université Paris 7)

Jeudi 8 mars 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Résumé
La présentation débutera par une introduction à la théorie Sens-Texte, une théorie linguistique basée sur la dépendance développée depuis 40 ans par Igor Mel’cuk. Nous comparerons la formalisation usuelle de la TST (grammaires de correspondance) avec une formalisation de type grammaire d’unification inspirée à la fois de HPSG et des grammaires de combinaison d’arbres à la TAG. Dans une deuxième partie, nous intéresserons à la lexicalisation de la grammaire. Nous montrerons qu’une grammaire complètement lexicalisée peut facilement être obtenue par combinaison de règles non lexicales et que différentes lexicalisations sont possibles selon la façon dont on répartit les informations linguistiques entre les unités lexicales. Nous effectuerons une comparaison détaillée avec les TAG lexicalisées et la méta-grammaire de Candito.

Conférence U.F.R. de langues et littératures étrangères

Übersetzung und Linguistik im engeren Sinne. Quasi una fantasia

Jörn Albrecht (directeur de l’Institut de Traduction et d’Interprétariat de l’Université de Heidelberg, R.F.A.)

Jeudi 22 février 2001 | 18h00
Nancy | Campus Lettres et Sciences Humaines | Bâtiment B | salle B 10

Résumé

Exposé en allemand.

Conférence U.F.R. de langues et littératures étrangères

La formation des traducteurs dans les instituts universitaires en Allemagne et ailleurs

Jörn Albrecht (directeur de l’Institut de Traduction et d’Interprétariat de l’Université de Heidelberg, R.F.A.)

Jeudi 22 février 2001 | 16h15
Nancy | Campus Lettres et Sciences Humaines | Bâtiment B | salle B 10

Résumé

Exposé en français.

Séminaire ILD&ISTC

Une analyse thématique fondée sur l’amorçage

Olivier Ferret (CEA Saclay DTI/SIIA/GPST)

Jeudi 22 février 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Résumé
L’analyse thématique est une étape importante pour de nombreuses applications en traitement automatique des langues et en recherche d’information, telles que le résumé ou l’extraction d’information par exemple. Elle ne peut être réalisée pleinement sur le plan fonctionnel et avec une bonne précision qu’en exploitant une source de connaissances structurées sur les thèmes, laquelle est difficile à constituer à une large échelle. Nous proposons de résoudre ce problème par un principe d’amorçage : une première analyse thématique, fondée sur l’utilisation d’une source de connaissances faiblement structurée mais relativement aisée à construire, un réseau de collocations, permet d’apprendre de façon incrémentale et non supervisée des représentations explicites de thèmes, appelées signatures thématiques. Ces dernières sont ensuite utilisées pour mettre en oeuvre une seconde analyse thématique, plus précise, plus complète et plus fiable.

Séminaire ILD&ISTC

Méthodologie informatique des produits de l’INaLF

Jacques Dendien (ATILF, ex INaLF-Nancy)

Jeudi 11 janvier 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Résumé
Les produits de l’INaLF sont réalisés grâce à une boîte à outils (Stella) qui offre les services suivants :
1) outils divers : gestion des expressions régulières étendues, tris par B-arbres, conjugaison et fléchissement des mots de la langue française, lemmatisation, etc.
2) Interfaces WWW : gestion automatique de la notion de session et des espaces disque serveur associés, collecte de formulaires, menus déroulants à base de technologie Java, etc.
3) Système de gestion de bases textuelles structurées : fabrication de bases à compacité optimale, fonctions d’accès aux objets atomiques (mots), fabrication d’objets textuels arbitrairement complexes et de leurs moteurs de recherche, compilateur de langage de requête et de grammaires formelles.
Compte tenu du volume de cet ensemble, seuls seront présentés les caractéristiques les plus saillantes du point 3 :
– Indexation des objets atomiques et fonctions d’accès : la méthode d’indexation présentée est mathématiquement optimale et génère des index hyper-compacts gage de hautes performances.
– Théorie des objets textuels complexes et des moteurs de recherche : cette théorie propose une formulation mathématique des objets textuels et des moteurs de recherche. En dépit de son apparente simplicité, elle débouche sur la possibilité de combiner les objets textuels entre eux pour aboutir à des objets d’une complexité arbitrairement élevé dont le moteur de recherche est automatiquement disponible.
Cette théorie débouche également sur son implémentation informatique (les différentes classes d’objets textuels) permettant de créer un univers indéfiniment extensible, par la réalisation de nouvelles classes conformes à un modèle abstrait (notion de d’objet textuel natif). Elle permet également d’introduire du " savoir linguistique " à différents niveaux (adjonction de constructeurs à des classes existantes, réalisation de " classes savantes ", mise en oeuvre des grammaires formelles).