historique 1999 – 2010 séminaires

Historique 2010 des séminaires de l’ATILF

Séminaire ATILF

Définir et quantifier la productivité morphologique

Georgette Dal (Université de Lille 3 – STL)

Vendredi 10 décembre 2010 | 10h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Il s’agira ici de poser une définition de ce qu’on appelle « productivité morphologique » et, essentiellement, d’indiquer comment elle peut être quantifiée au-delà de l’intuition du linguiste. Cet exposé sera également l’occasion de donner quelques-uns des résultats d’un travail collectif* mené dans le GDR 2220 « Description et modélisation en morphologie » obtenus en français à partir de cette méthode de calcul, et d’ouvrir d’autres pistes de recherche.

 

*Ces résultats sont consignés dans Dal Georgette, Fradin Bernard, Grabar Natalia, Lignon Stéphanie, Namer Fiammetta, Plancq Clément, Yvon François & Zweigenbaum Pierre (2008), « Quelques préalables linguistiques au calcul de la productivité des règles constructionnelles et premiers résultats », /in/ Durand J., Habert B. & Laks B. éds, /Actes du premier Congrès mondial de linguistique française (CMLF-08), Paris, 9-12 juillet 2008/, pp. 1587-1599.

Séminaire ATILF

/ça l’fait grave/ ou le statut des nouveaux univers langagiers en didactique du français et des langues

Corinne Weber & Sandrine Wachs (Université de Paris III – DILTEC 2288)

Vendredi 5 novembre 2010 | 10h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
L’enseignement des langues est aujourd’hui difficilement concevable sans la prise en compte de la communication médiatisée par ordinateur (sms, forums, blogs, facebook, twitter, etc.). Ces nouveaux supports langagiers permettent d’enrichir les variétés du français en proposant un usage original : parler en écrivant. La parole s’installe à l’écrit et les frontières entre la langue écrite et la langue orale s’effacent.

 

En savoir plus …

Séminaire Syntaxe, Morphologie et Sémantique

Analyse syntaxique automatique à l’aide de connaissances linguistiques fines

Bruno Guillaume (INRIA Lorraine – LORIA), Guy Perrier (INRIA Lorraine – LORIA)

Vendredi 25 juin 2010 | 14h15
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Nous présenterons LEOPAR, un analyseur syntaxique automatique qui utilise des connaissances linguistiques fines pour analyser des phrases sous deux formes : des arbres syntagmatiques ou des graphes de dépendance. Il sera appliqué au français avec une grammaire à relativement large couverture. Nous illustrerons notre propos par une grande variété de phénomènes syntaxiques.
Enfin, nous détaillerons un exemple pour montrer le formalisme linguistique qui est à l’oeuvre derrière LEOPAR : les grammaires d’interaction. Ce formalisme est fondé sur la métaphore de la molécule chimique : les mots sont vus comme des atomes pourvus de valences et ils interagissent entre eux pour saturer leurs valences et former des phrases qui sont vues elles comme des molécules.

Séminaire ATILF

La phraséologie : perspective théorique et descriptive

Igor Mel’cuk (OLST – Département de linguistique et de traduction – Université de Montréal)

Vendredi 4 juin 2010 | 10h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Dans ma présentation, j’aborderai la notion de phraséologie selon deux angles complémentaires et indissociables : 1) la caractérisation théorique de la notion et 2) le problème de sa modélisation lexicographique. Je procèderai en 4 étapes.
1. Caractérisation des phrasèmes en tant que syntagmes non libres.
2. Identification de quatre classes de phrasèmes, réparties en deux grandes familles :
(i) phrasèmes compositionnels : pragmatèmes, clichés et collocations ;
(ii) phrasèmes non compositionnels : locutions.
3. Principes de description lexicographique des phrasèmes : locutions vs collocations, etc.
4. Fonctions lexicales.

Séminaire ATILF

« Modéliser l’évolution grammaticale : Des cas aux adpositions, un passage obligé ? »

Benjamin Fagard (Lattice – CNRS/ENS-Ulm)

Vendredi 28 mai 2010 | 10h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
La disparition du système casuel indo-européen dans un grand nombre de langues indo-européennes est un phénomène bien connu. Je voudrais aborder quelques-uns des problèmes qui se posent encore à ce sujet. Il s’agira de voir, notamment, s’il est possible d’expliquer d’une part pourquoi de nombreuses langues indo-européennes ont perdu ce système, et d’autre part pourquoi certaines ne l’ont pas perdu, et l’ont même (du moins à certaines périodes) renforcé.
Je propose, à cette fin, d’utiliser une approche multiple (corpus, typologie, modélisation), dont je ne ferai pour le moment que poser les bases méthodologiques. Il s’agit plus précisément :
a) d’étudier, à partir d’une analyse de corpus, l’évolution du système casuel dans quelques langues (3 langues indo-européennes et 2 langues non-indo-européennes) ;
b) d’observer l’évolution des systèmes casuels d’un point de vue typologique (pour les langues dont on connaît l’histoire, peut-on déterminer la vitesse de création et de disparition du système casuel ?) ;
c) de modéliser cette évolution, à partir d’une étude sur corpus et d’analyses de fréquence à grande échelle, sur les cinq langues retenues.

Séminaire ATILF

De la modélisation du traitement morphologique d’un point de vue cognitif

Hélène Giraudo (Laboratoire CLLE-ERSS – CNRS & Université de Toulouse, France)

Vendredi 9 avril 2010 | 10h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
L’objet de cette contribution consiste à présenter une approche psycholinguistique de la modélisation des mécanismes cognitifs impliqués lors de la perception de mots morphologiquement complexes en s’attachant à articuler les concepts et hypothèses issus de la psycholinguistique avec ceux qui proviennent de la linguistique afin d’en démontrer leur nécessaire complémentarité. Nous débuterons ainsi par un exposé des recherches psycholinguistiques consacrées au traitement morphologique chez le lecteur expert, puis nous aborderons plus précisément la question du rôle et de la représentation des informations morphologiques au sein du lexique mental. Nous décrirons dans ce cadre, les modélisations cognitives actuelles de l’accès lexical. Enfin, nous tenterons de défendre une approche basée sur le lexème en nous appuyant sur un ensemble de résultats expérimentaux provenant de l’étude de la morphologie dérivationnelle du français et en étayant notre propos de considérations d’ordre linguistique.

Séminaire Syntaxe, Morphologie et Sémantique

Quelles expériences pour l’étude de la sémantique de la prosodie ?

Jean-Marie Marandin (Directeur de Recherche au CNRS, Laboratoire de Linguistique Formelle (LLF) – Paris 7)

Vendredi 26 mars 2010 | 10h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Séminaire ATILF

Annotation lexicale collaborative de textes littéraires: un projet Web 2.0 en cours

Maureen Jameson (University at Buffalo, State University of New York)

Vendredi 12 mars 2010 | 10h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Le projet qui sera présenté est une archive numérique qui réunit des textes littéraires en diverses langues, tous agrémentés de notes lexicales visibles sur demande. Celles-ci sont préparées de façon artisanale par des collaborateurs dont la responsabilité se limitait à une compétence linguistique et culturelle, puisque l’intégration de leurs apports aux textes restait le travail d’une seule personne. Le projet a vite atteint les limites réelles de cette première approche centralisée. Ainsi, soutenu par une bourse de la National Endowment for the Humanities, a été créée une nouvelle gestion de contenu, qui permet non seulement que la note lexicale mais aussi, le cas échéant, une image et un enregistrement sonore soient directement insérés par l’expert linguistique. La GC requiert aussi que l’ensemble des suppléments textuels apportés par un contributeur inexpérimenté soit validé par un collaborateur de plus haut rang dans la hiérarchie scientifique, sans que ni l’un ni l’autre n’ait à maîtriser la technologie sous-jacente.
Le site se destinait à l’origine à un public doublement réfractaire aux langues étrangères et à plus forte raison aux littératures écrites en ces langues. Mais les capacités de la GC permettent d’autres usages, dont le plus évident serait l’annotation en n’importe quelle langue d’un texte de n’importe quelle autre langue. On peut envisager l’apposition de suppléments qui soient érudits plutôt que lexicaux et l’utilité donc du système, même loin des départements de littérature.
Mais pour en arriver là, il faudra que la nouvelle GC se déploie pour de bon, et que la vaste équipe de collaborateurs qui ont élaboré Litgloss 1.0 soit secondée par de nouveaux collaborateurs, dont la première contribution, très précieuse, sera la critique.

Séminaire Syntaxe, Morphologie et Sémantique

Analysis by synthesis of speech prosody – from data to models

Daniel Hirst (Directeur de Recherche au CNRS, LPL-Aix-en-Provence)

Vendredi 5 mars 2010 | 10h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Conférence en anglais, discussion possible en français

Séminaire ATILF

Structuration et balisage sémantique du Trésor de la Langue Française informatisé

Lucie Barque (Post-doctorante (Projet ANR JC Nomage), STL, Université Lille 3)

Vendredi 12 février 2010 | 10h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Le projet Definiens vise la conversion des définitions du Trésor de la Langue Française informatisé sous une forme structurée. Il n’existe pas à l’heure actuelle pour le français de base de données lexicale, libre d’accès et à large couverture, proposant pour chaque unité lexicale décrite une définition explicitement structurée. Definiens entreprend de combler ce manque en indiquant pour chaque définition que compte le TLFi (environ 270 000) :
1. la structure en composantes définitionnelles de type genre prochain et différences spécifiques ;
2. le rôle joué par chaque composante dans la caractérisation du sens de l’unité lexicale définie.

En savoir plus …

Séminaire Syntaxe, Morphologie et Sémantique

Parataxes : contraintes d’interprétation et de représentation

Mathilde Dargnat (ATILF)

Vendredi 29 janvier 2010 | 14h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Dans cet exposé, je vais parler d’une recherche en cours (personnelle et en collaboration) sur des énoncés du type : « J’ai essayé d’y aller j’ai pas trouvé », « Tu écris tes mémoires tu leur donnes quel titre ? », « Avoir une auto j’irais certain » (FQ), « Il lui court après il est amoureux », « Il y a des grèves de train j’arriverai en retard ». Les questions que je soulèverai ne concernent pas la terminologie employée pour les désigner mais portent sur l’interface syntaxe-prosodie-interprétation. Ces énoncés ont-ils des propriétés communes/spécifques ? Sont-ils des combinaisons spécifques de propriétés ? Ceci rejoint en partie la problématique, discutée, de la non-compositionnalité.
Actuellement, pour des raisons de compatibilité avec d’autres projets en cours, je me concentre sur des particularités prosodiques (les contours dits continuatifs) et sur les énoncés qui ont/peuvent avoir une interprétation conditionnelle du type « si A, B ». Ces derniers ont des contraintes spécifques, qu’on les compare aux autres parataxes (par ex. formes verbales, types de procès), ou aux variantes avec connecteur explicite (par ex. toutes les valeurs du « si » ne sont pas possibles en parataxe).
L’objectif est, petit à petit, de distinguer des sous-classes de constructions paratactiques. Il est intéressant, dans ce cadre, de les représenter sous forme d’agrégats de propriétés, ou structures de traits, organisables en hiérarchies d’héritages, comme le proposent des grammaires du type HPSG ou CxG.

Exemplier (format pdf – 100 Ko)
Résumé (format pdf – 376 Ko)

Historique 2009 des séminaires de l’ATILF

Séminaire ATILF

Gestion des langues en classe dans les écoles bilingues de quelques pays du sud (zones arabophone, créolophone et subsaharienne de la francophonie)

Colette Noyau (Professeure en Sciences du Langage, Université Paris-X Nanterre)

Vendredi 18 décembre 2009 | 10h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Après un programme plurilatéral sur l’appropriation du français en contexte diglossique au Togo et au Bénin à travers l’école classique tout-français (2000-2005), nous avons effectué des enquêtes sur des systèmes scolaires bilingues (Mali, Mauritaine, Seychelles, puis Niger).
De ce vaste corpus des écoles primaires de pays du sud francophones : séquences de classe de/en français et de/en L1 dans divers contextes multilingues, où la transition de l’enseignement en L1 à l’enseignement en français L2 nécessite des passages entre L1 et L2 dans les activités de classe, nous avons tiré un DVD de séquences vidéo en vue de la formation des [formateurs de] maitres aux passages L1-L2.
La conférence exposera les voies par lesquelles s’effectue chez les élèves le passage de la L1 à la L2, et en quoi les pratiques enseignantes les y aident ou non, en l’illustrant de passages analysés de ces séquences de classe. Notre approche est centrée sur les apprenants. Nous décrivons les parcours cognitifs ménagés par l’école pour établir des ponts entre les langues, en fonction des contraintes de curriculum et de la formation des maitres qui met peu l’accent sur cet aspect du travail.

 

Références (en partie disponibles sur le site http://colette.noyau.free.fr)
Noyau C., ed. (2007) : /Actes du colloque international « Appropriation du français et construction de connaissances via la scolarisation en situation diglossique »/, Paris-X-Nanterre, COMETE, CD-rom.
Noyau, Colette (2007): « Les langues partenaires du français dans la scolarisation en francophonie subsaharienne. Atouts et obstacles pour leur mise en pratique ». Dans : /Les actions sur les langues : Synergie et partenariat/. G. Chevalier, ed. EAC / AUF.
Noyau C. (2009) : /Modalités d’optimisation du passage de L1 à L2 dans l’enseignement primaire en contexte multilingue, Mauritanie, Mali, Seychelles/. OIF / Eds. Le Web pédagogique, 304 p.

Séminaire ATILF

La modélisation formelle de la paraphrase et de ses applications

Jasmina Milic’evic’ (Department of French, Dalhousie University, Halifax, Canada)

Vendredi 27 novembre 2009 | 10h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Nous commençons par caractériser la notion de paraphrase (relation de quasi-synonymie entre phrases et opération de production de phrases quasi-synonymes) en mettant en évidence son importance en langue et en linguistique. Nous présenterons ensuite une typologie du paraphrase, les règles de production de paraphrases proposées par la théorie linguistique Sens-Texte et les applications possibles de telles règles en traitement automatique et enseignement des langues.

Séminaire ATILF

La contribution des noms abstraits à la cohérence discursive

Olga Anokhina (UMR 8132 CNRS /ENS, ITEM, Paris)

Vendredi 5 juin 2009 | 10h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Lors de mon travail de thèse Étude sémantique du nom abstrait en français (2000), j’ai constaté que la parenté entre les noms abstraits (les nominalisations) et leur terme de base dérivationnelle (adjectif ou verbe) contribue à mettre en place la cohérence dans le discours. En analysant de nombreux textes tirés d’œuvres littéraires, d’interview, d’ouvrages de sciences humaines et d’articles de presse, j’ai observé qu’il existe une logique du développement du discours. Cette logique contribue à instaurer la cohérence discursive en mettant en œuvre des mécanismes bien précis. Un des mécanismes les plus répandus consiste à mentionner d’abord un terme de base qui sera repris plus tard sous forme d’un nom abstrait. Ainsi, le nom abstrait et son terme de base forment une sorte d’anaphore référentielle. Ce mécanisme se retrouve également dans les dialogues où le locuteur a recours à un nom abstrait en le reliant avec sa base mentionnée par un autre locuteur. Dans la présente communication, je chercherai à montrer comment, grâce à la nominalisation, s’élabore la continuité discursive.

Séminaire ATILF

Polysignifiance et changement de sens du nom propre. Questions et options méthodologiques pour l’interprétation en corpus du toponyme Outreau.

Michelle Lecolle (CELTED, Université Paul Verlaine-Metz)

Vendredi 29 mai 2009 | 10h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Le cadre général de l’exposé porte sur la question de l’interprétation du toponyme (ici, le nom de lieu habité) lorsqu’il n’a plus (uniquement) sa valeur initiale : on prendra pour exemple le cas du nom propre de ville Outreau. Ce toponyme peut avoir, en contexte, des sens différents (polysignifiance). Mais surtout, il a vu, dans une période restreinte (2001-2006), son sens évoluer totalement jusqu’à se stabiliser, à partir de 2005-2006, comme renvoyant principalement à « l’erreur judiciaire par excellence ». La polysignifiance du nom de lieu habité et l’évolution de son sens rendent la question du contexte et de l’interprétation particulièrement cruciale.
On rapportera et discutera ici les options théoriques (changement de « sens » du toponyme) et méthodologiques de l’analyse menée. En recourant à un corpus de presse contemporaine partitionné en cinq sous-corpus relevant de tranches historiques différentes, l’analyse, aidée par le recours au concordancier Antconc, se donnait pour objectif de rendre compte, d’une part de ce qui construit le changement du sens de Outreau, d’autre part des éléments d’interprétation pertinents des différents sens du nom. Elle croise plusieurs paramètres d’interprétation, relevant de paliers syntagmatiques différents : niveau du syntagme et de la phrase, niveau textuel (article de presse) et niveau intertextuel (corpus). On discutera ici la part d’interprétation basée sur l’utilisation du concordancier et la part d’interprétation humaine qui demeure nécessaire, selon les différents paliers mentionnés.

Séminaire ATILF

Les traductions médiévales françaises de la Légende dorée : tentative de caractérisation d’un corpus.

Olivier Collet (Univ. Genève, Département de langues et littératures françaises et latines médiévales)

Lundi 4 mai 2009 | 10h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Si le succès de la « Légende dorée » est amplement attesté par sa diffusion originale, les traductions qui en sont issues en français offrent en comparaison un témoignage plus nuancé, voire contrasté. Précoce, la tradition vernaculaire est aussi durable, mais elle reste somme toute assez peu fournie. Presque toujours anonymes, non autographes, dénuées d’attaches temporelles et d’ancrage géographique explicites, comme de marques de destination, les translations qui la composent forment donc un corpus privilégié pour une « étude de terrain » destinée à révéler les attitudes, stratégies et finalités des traducteurs. Mais d’après quelles méthodes ? Le tour d’horizon qui sera proposé à partir de quelques textes vise surtout à sonder les moyens aptes à nous éclairer sur de telles œuvres et sur les résultats auxquels l’analyse peut prétendre.

Séminaire ATILF

Vers une approche plurilingue des apprentissages langagiers

Joaquim Dolz (Univ. Genève), Marielle Rispail (Univ. Grenoble, LIDILEM) et Stéphanie Clerc (Univ. Avignon, ICAR et ICTT)

Vendredi 24 avril 2009 | 10h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Séminaire ATILF

Les enjeux de l’uniformisation linguistique d’un champ de connaissances : le cas de la langue du droit européen

Marc Debono (Université de Tours)

Vendredi 20 mars 2009 | 10h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
La question de l’opportunité de l’uniformisation linguistique du droit européen s’est posée à l’occasion de la publication, en 2004, d’un manifeste « en faveur de la langue française comme langue juridique de l’Europe » et de la reprise de cette idée à travers une campagne de lobbying lancée en 2007.

En savoir plus …

Séminaire de syntaxe et de sémantique

La qualification nominale : approche typologique

Loïc Perrin (LLACAN UMR 8135)

Vendredi 13 mars 2009 | 14h15
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé

Séminaire ATILF

Présentation de la base de données lexicographiques panfrancophone (BDLP) internationale

Christel Nissille et Willy Stumpf (ATILF)

Vendredi 13 mars 2009 | 10h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Dans cette présentation, nous décrirons quelques aspects de l’élaboration d’une base de données lexicographiques internationale : ses implications lexicographiques, la méthode de saisie et les possibilités de consultation.
A- Le concept de la BDLP-Internationale
La Base de données lexicographiques panfrancophone (BDLP) a pour objet la description lexicographique des français régionaux de la francophonie. Elle est actuellement en voie de réalisation pour les français de France (dans le cadre du laboratoire ATILF, CNRS-Nancy Université) et de Suisse (Centre de dialectologie de l’Université de Neuchâtel), dont nous parlerons plus particulièrement, mais aussi de l’Acadie, de l’Algérie, de la Belgique, du Burundi, de la Louisiane, du Québec, etc. (voir www.bdlp.org). L’objectif est de constituer et de regrouper des bases (locales ou régionales) représentatives du français de chacun des pays et de chacune des régions de la francophonie à partir d’une structure commune. Les bases de données sont conçues de façon à pouvoir être consultées sur Internet et forment un réseau de données régionales dans lequel il est possible d’effectuer des recherches transversales à travers les banques de données individuelles (familles lexicales, sémantiques) ainsi que des rapprochements entre les usages des diverses communautés (recherches inter-bases).
B- La description du français régional
« La base de données consiste en un fonds informatisé réunissant des données déjà organisées résultant d’une analyse de corpus. Sans être elle-même un dictionnaire, la BDLP est une collection de dossiers concernant des mots de la langue régionale » (Poirier et al. 2003 : 11).
Le cadre de la base de données révèle en quelque sorte le travail du lexicographe du français régional, qui est avant tout un observateur cherchant à faire état des diverses formes qu’il rencontre dans l’usage. Si dans un article de dictionnaire traditionnel ces informations glanées servent de toile de fond permettant la rédaction du commentaire, dans la base de données ces informations sont fournies au lecteur, explicitées et réparties dans une série de rubriques dont les contenus peuvent être exploités de façon multiple. Elles sont de plus mises en valeur puisqu’il est possible d’y insérer des informations non seulement linguistiques, mais aussi culturelles par le biais de matériaux multimédia afin de présenter à l’utilisateur les réalités propres à une région de façon claire et démonstrative.
Bibliographie : C. Poirier et al. (2003), Document de présentation de la BDLP, www.bdlp.org.

Séminaire de syntaxe et de sémantique

Classes nominales et noms abstraits en yilumbu (langue bantoue)

Ghislaine Gamille (doctorante, dir. M-L Knitel, éq Lexique)

Vendredi 6 février 2009 | 14h15
Nancy | Campus Lettres et Sciences Humaines | Bâtiment B | Salle B 10

Résumé

Exemplier à venir

Historique 2008 des séminaires de l’ATILF

Séminaire de syntaxe et de sémantique

Les diathèses, une notion nouvelle relevant d’une linguistique à trois niveaux

Emmanuel Deronne (ATILF)

Vendredi 21 novembre 2008 | 14h15
Nancy | Campus Lettres et Sciences Humaines | Bâtiment B | Salle B 10

Résumé

Séminaire ATILF

Les entités syntagmatiques du lexique et leur modélisation

Alain Polguère (OLST – Département de linguistique et de traduction – Université de Montréal)

Vendredi 17 octobre 2008 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
L’entité linguistique type étudiée par la lexicologie et modélisée par la lexicographie est bien entendu le lexème : sens exprimé par un mot-forme (ou par un ensemble de mots-formes qui sont autant de variantes flexionnelles). Il est cependant bien établi que l’étude du lexique prend aussi en considération des entités lexicales de nature syntagmatique, comme les locutions. De telles entités sont particulièrement intéressantes puisque, d’une part, elles sont un point d’articulation entre lexique et syntaxe et, d’autre part, elles représentent une portion très importante de la connaissance lexicale. Dans ma présentation, je ferai tout d’abord un examen des différents types d’entités syntagmatiques enchâssées dans le lexique des langues (locutions, collocations, structures de régimes, etc.). J’aborderai ensuite le problème de leur modélisation lexicographique, en m’appuyant notamment sur les travaux menés à l’OLST dans le cadre de la recherche en lexicologie/lexicographie explicative et combinatoire.

 

Télécharger l’exposé d’Alain Polguère

Séminaire de syntaxe et de sémantique

Quelle(s) unité(s) syntaxique(s) maximale(s) en français parlé ? Discussions autour de quelques problèmes rencontrés

Christophe Benzitoun (ATILF)

Vendredi 3 octobre 2008 | 14h15
Nancy | Campus Lettres et Sciences Humaines | Bâtiment B | Salle B 10

Résumé
Depuis quelques années, de nombreuses études ont vu le jour, notamment dans le cadre de la perspective macrosyntaxique, remettant en cause la pertinence de la notion de phrase comme unité délimitant le champ d’investigation de la syntaxe (cf. notamment Béguelin, 2000 & 2002 ; Berrendonner, 2002 et Blanche-Benveniste, 2002). Ces études fournissent un cadre apte à intégrer de manière cohérente des éléments dans et hors rection et proposent des unités de substitution jugées plus opératoires que la phrase, unités qui ont été essentiellement élaborées en s’appuyant sur des corpus oraux. Et dès lors que l’on travaille sur le français parlé, c’est tout naturellement vers ces unités macrosyntaxiques que l’on s’oriente, que l’on soit à la recherche « d’unités minimales de discours » (Degand & Simon, 2005) ou d’unités syntaxiques (Rossi-Gensane, 2007).
Pour autant, la question des unités syntaxiques maximales est loin d’être résolue et la segmentation systématique de textes oraux est une tâche extrêmement complexe. Dans notre présentation, nous nous attacherons essentiellement à pointer quelques problèmes en nous basant sur des exemples extraits de corpus oraux.

Télécharger l’exemplier

Séminaire ATILF

Discours pédagogique, littératie, inégalités scolaires.

Élisabeth Bautier (Université de Paris 8 – Laboratoire ESSI-Escol)

Vendredi 3 octobre 2008 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
À l’heure où les exigences d’une littératie étendue sont de plus en plus prégnantes dans la société, comme dans les attendus scolaires (cf. l’évaluation PISA de l’OCDE), analyser le discours pédagogique, les échanges langagiers dans la classe permet, en particulier en référence aux catégories bernsteiniennes de Discours horizontal vs vertical, régulateur vs instructeur, de cadrage et de classification (Bernstein, 2007), d’identifier le développement du discours horizontal et régulateur. Un genre conversationnel se construit dans les classes susceptible de leurrer les (des) élèves sur les véritables enjeux cognitifs des situations et dispositifs mis en place, ce genre paradoxalement éloigne une partie des élèves de l’entrée dans la littératie étendue.

Séminaire ATILF

L’Ontology Web Language et le lexique gallo-roman. Le cas de l’Atlas Linguistique de la Wallonie.

Nicolas Mazziotta (Université de Liège)

Vendredi 13 juin 2008 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
L’exposé comportera trois parties. Dans un premier temps, nous présenterons l’Ontology Web Language (OWL), un langage métaconceptuel issu des recherches développées dans le cadre du web sémantique. Nous montrerons comment il peut être utilisé pour objectiver des concepts et des relations entre ces concepts. Dans un deuxième temps, en prenant l’exemple de la notice «nèfle» de l’Atlas Linguistique de la Wallonie (ALW), nous montrerons concrètement comment il est possible d’employer OWL dans le but de produire des notices informatisées. Cette utilisation ne dénature pas le travail d’analyse tel qu’il a été réalisé jusqu’à présent par ses rédacteurs, mais elle permet de l’objectiver et d’en garder une trace. En guise de prolongement, nous
proposerons, suivant le même principe, d’employer OWL pour modéliser les articles du FEW. Nous comparerons la structure que nous proposons à celle des notices rédigées actuellement en XML, en prenant l’exemple de l’article « basiolum » en cours de rédaction.

Séminaire ATILF

CLELIA : Développement d’un corpus littéraire et linguistique par le biais d’un dialogue interdisciplinaire

Thomas Lebarbé (Laboratoire LIDILEM, EA 609, Université Stendhal – Grenoble 3)

Vendredi 6 juin 2008 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
La Bibliothèque de Grenoble possède la quasi totalité des manuscrits de Stendhal. Cet ensemble de plus de seize mille feuillets compte parmi les plus importants des fonds de manuscrits littéraires modernes et par sa taille et par la présence de textes majeurs, entre autres Lucien Leuwen, ou Vie de Henry Brulard.

En savoir plus …

Séminaire de syntaxe et de sémantique

La structure interne des correlatives

Corrina Anderson (Université de Yale)

Vendredi 6 juin 2008 | 14h15
Nancy | Campus Lettres et Sciences Humaines | Bâtiment B | Salle B 10

Résumé

Séminaire ATILF

De la didactique du français à la socio-didactique des langues

Marielle Rispail (MCF en Sciences du langage, IUFM / Université de Nice, Laboratoire LIDILEM de Grenoble)

Vendredi 23 mai 2008 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | Bâtiment B | Salle B 10

Résumé
La didactique des langues, qu’elles soient dites « maternelles », « secondes » ou étrangères », croise sans arrêt des champs disciplines connexes qui l’interrogent et l’enrichissent. Nous voudrions retracer ici les étapes de son contact avec la sociolinguistique :
– dans notre parcours personnel
– sur le plan chronologique
– à travers quelques exemples où s’actualise le concept de « socio-didactique » dans des contextes complexes de plurilinguisme (la Lorraine francique, l’Algérie, le sud-est asiatique).
Nous terminerons sur les voies ouvertes par cette notion, entre autre sur le plan méthodologique et pour l’enseignement des langues aux publics issus de l’immigration.

Séminaire MSH

Projet d’informatisation du Du Cange et du Nouveau Du Cange et les corpus liés

Bruno Bon (CNRS-IRHT) et Anita Guerreau-Jalabert (CNRS-IRHT)

Vendredi 16 mai 2008 | 10h00-11h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Profiter de la révolution technologique en cours pour encourager une véritable révolution scientifique, en particulier dans les domaines de l’histoire et de la philologie médiévales, c’est ce qui a motivé la décision de l’Ecole nationale des chartes de s’attaquer de front à un monument toujours irremplacé, le « Glossarium » du latin médiéval de Charles Du Cange (17e s.), dans son édition du 19e s.
Au delà d’un simple changement de support, déjà disponible en plusieurs endroits du Web, il s’agit surtout de donner les moyens aux chercheurs d’extraire le plus d’informations possible d’un ouvrage aussi riche que sous-exploité, grâce au développement d’une interface conçue par des chercheurs pour des chercheurs.
Ce projet s’intègre dans un programme plus large, proposé à l’ANR, destiné à mettre en place, entre autres, une plateforme interactive de philologie médiolatine, qui regrouperait, autour de l’ancien Glossarium de Du Cange, les nouveaux dictionnaires de latin médiéval en cours de rédaction, en France (Novum Glossarium) comme en Europe.
Nous saisirons l’occasion pour tenter de montrer comment la lexicographie médiolatine doit faire sa révolution, et comment la préparation de ce programme a nourri notre réflexion sur l’avenir de notre travail de rédacteurs de dictionnaires : la rationalisation de la structure et de la longueur des notices, et surtout le soutien d’un réseau de collaborateurs interactif pourraient compenser en partie la faiblesse critique des moyens humains disponibles ; l’analyse conjointe des langues vernaculaires et du latin, ouverte à grande échelle par le développement des corpus virtuels, devrait permettre d’améliorer l’efficacité et la pertinence de notre travail.

Séminaire MSH

Corpus et diachronie

Axe 2 MSH « Langues, textes et documents » – Frédéric Duval (U. Metz)

Vendredi 16 mai 2008 – 14h
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
CORPUS ET DIACHRONIE
Présentation : Frédéric Duval (U. Metz)
Céline Guillot (ENS-LSH Lyon) : « Méta-données de la Base de Français Médiéval (BFM) et exploitation linguistique ».
Anita Guerreau-Jalabert (CNRS-IRHT) : « Sémantique historique latine et vernaculaire : la notion de sang dans les représentations de la parenté au Moyen Age ».
Gilles Siouffi (Montpellier-IUF) : « Etat des corpus et desiderata pour le XVIIe siècle ».
Cette séance de séminaire sera suivie d’une brève réunion organisationnelle sur les projets de l’axe.

Séminaire ATILF

Effets de la tendance dissimilative en français

Marc Plénat (UMR 5263 – Axe DUMAL)

Vendredi 16 mai 2008 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | Bâtiment B | Salle B 10

Résumé
On sait depuis longtemps que des tendances dissimilatives sont à l’oeuvre dans les langues en général et dans les langues romanes en particulier (cf. Grammont 1895). La linguistique moderne a fait de cette tendance l’un de ses plus sérieux candidats au titre de contrainte universelle…

En savoir plus …

Séminaire ATILF

« Un ciel… gris de chez gris… » : de la construction « X de chez X » à « Adj de chez Adj »: du locatif à l’intensif

Catherine Schnedecker (Université de Strasbourg)

Vendredi 11 avril 2008 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Réputée représentative du « parler jeune » et du français oral, la construction « Adj de chez adj » (gris de chez gris) est d’autant plus intéressante d’un point de vue strictement linguistique qu’elle est pour le moins inattendue, compte tenu des contraintes syntaxiques du français. Pour en comprendre l’émergence, il est nécessaire de s’interroger sur son histoire de manière à repérer ce qui, à partir d’une construction à fonction de localisation, fortement contrainte au niveau du verbe-recteur et de la nature du complément, a «permis» syntaxiquement l’apparition de l’adjectif et sémantiquement l’expression de l’intensité.

Séminaire ATILF

Décrire et formaliser des constructions paradigmatiques : Application aux disfluences et coordinations dans une grammaire du français

Marie-Laure Guénot (LIA-CERI Avignon)

Vendredi 4 avril 2008 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Les grammaires formelles actuelles ne représentent que des constructions syntagmatiques ou des structures dépendancielles équivalentes. Pourtant, dès lors que l’on s’intéresse à la formalisation des descriptions linguistiques de corpus, on constate que la prise en compte de la dimension paradigmatique des structures est dans certains cas nécessaire aux analyses proposées. Je montrerai ici comment, sur la
base de l’étude de productions linguistiques spontanées écrites et orales et en m’inspirant de travaux de l’Approche Pronominale, j’ai représenté cet axe de structuration linguistique dans mon modèle de grammaire formelle du français, et j’illustrerai mon propos à l’aide d’exemples d’analyses de coordinations et de disfluences.

 

Mots-clés: Approche Pronominale, Grammaires de Construction (CxG), Grammaires de Propriétés, Syntaxe, Interaction entre différents domaines d’analyse, Développement de grammaire, Linguistique descriptive,
Linguistique formelle, Coordination, Disfluences, Entassements paradigmatiques.

Séminaire ATILF

La phraséologie médicale. Etude contrastive français-allemand

Anne-Marie Nahon-Raimondez

Vendredi 21 mars 2008 | 10h30-12h00
ATILF Bâtiment CNRS, salle de réunion 2e étage

Résumé
Mon travail est une analyse phraséologique contrastive qui repose sur un corpus parallèle de textes de spécialité français et allemands. Le corpus choisi est un corpus d’articles médicaux parus dans la presse médicale spécialisée. Afin de travailler sur un corpus « homogène », je me suis limitée à une pathologie : l’asthme…

En savoir plus …

Séminaire de syntaxe et de sémantique

Les adjectifs taxinomiques du français : une approche syntaxique

Marie-Laurence Knittel (ATILF / Nancy-Université & CNRS)

Vendredi 14 mars 2008 | 14h15
Nancy | Campus Lettres et Sciences Humaines | Bâtiment B | Salle B 10

Résumé

Séminaire ATILF

Etude de l’influence des pratiques langagières enseignantes sur l’acquisition de la langue orale chez des élèves entre quatre et cinq ans

Nathalie Charvy (IUFM Dijon (Université de Bourgogne) – EA170 CALIPSO-ED 268, Paris 3)

Vendredi 7 mars 2008 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Au cours de mon intervention j’examinerai l’influence des pratiques langagières enseignantes sur l’acquisition de la langue orale chez l’élève de quatre à cinq ans (classe de moyenne section d’école maternelle). Notre étude s’appuiera sur une analyse linguistique de corpus longitudinaux (sur une année scolaire) d’interactions individuelles enseignant-élève…

En savoir plus …

Séminaire ATILF

Discours et identité : approches et problèmes

Philip Riley (ATILF / Nancy-Université & CNRS équipe CRAPEL)

Vendredi 15 février 2008 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
1/ Introduction : Identité et modernité : Fernando Pessoa et al. … et Ferdinand de Saussure. L’ ‘engouement identitaire’ – et quelques publications récentes. Vers une ‘théorie générale’ de la relation discours-identité ?
2/ Survol de quelques approches ‘discursives’ de la construction de l’identité.
3/ Présentation du livre Language, Culture and Identity : An Ethnolinguistic Perspective (London : Continuum, 2007)

En savoir plus …

Séminaire de syntaxe et de sémantique

Variation formelle dans la construction de lexèmes en hébreu moderne : Le cas des nom en /ut/

Aurore Koehl (ATILF / Nancy-Université & CNRS)

Vendredi 18 janvier 2008 | 14h15
Nancy | Campus Lettres et Sciences Humaines | Bâtiment B | Salle B 10

Résumé

Historique 2007 des séminaires de l’ATILF

Séminaire ATILF

« Le corpus et la vérité »

Tobias Scheer (CNRS – Université de Nice)

Vendredi 21 décembre 2007 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Depuis une dizaine d’années, nous vivons le retour de l’empirisme en sciences (et plus généralement d’ailleurs). L’empirisme, ancré dans la culture anglo-saxonne (Hume, Locke, Russell) et s’opposant au rationalisme continental (Descartes, Kant, von Humboldt, Popper), propose que la vérité – toute la vérité – est contenue dans les données, et que **rien** ne peut contribuer à la découverte scientifique en dehors de leur inspection…

En savoir plus …

 

Complément :
Article de Bernard Laks (Université de Paris X, laboratoire MoDyCo) : « Pour une phonologie de corpus »

Télécharger l’article de Bernard Laks

Historique 2007 des séminaires de l’ATILF

Séminaire ATILF

« Faut-il /remettre les pendules /de la subordination temporelle/ à l’heure /? »
« Description de deux fonctionnements de /quand /et /avant que/de/ »

Christophe Benzitoun (ATILF, équipe Macrosyntaxe de l’écrit et de l’oral)

Vendredi 9 novembre 2007 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Cela fait bien longtemps que les linguistes travaillant sur le français ont remarqué un usage singulier de /quand/ n’exprimant pas une simple localisation temporelle. Cet emploi a reçu originellement le nom de « /quand/ de péripétie » (Séchehaye 1926) puis « subordination inverse ». L’exemple suivant en constitue une bonne illustration :
(1) Pécuchet venait d’en remettre la note à Bouvard quand tout à coup le tonnerre retentit et la pluie tomba (roman)
Dans cette configuration, la construction introduite par /quand/ ne constitue pas un repère temporel, contrairement aux exemples « canoniques » du type :
(2) Il nous a abandonnés, ma mère et moi, quand j’avais à peine un an. (roman)
Plus récemment, Le Draoulec (2003) et Delort (à paraître_a ) se sont intéressées à un fonctionnement impliquant /avant que/ et /avant de/ ressemblant étrangement à (1).
(3) 61 personnes, sur les 111 salariés présents sur le site chalonnais hier, ont débrayé de 14 h à 15 h, avant de reprendre ensuite normalement leur travail. (presse)
De la même façon, il s’oppose aux exemples en /avant que/de/ fonctionnant comme un repère temporel :
(4) Le 6 juillet, avant de me coucher, j’ai placé sur ma table du vin, du lait, de l’eau, du pain et des fraises. (roman)
Ces deux fonctionnements de /quand/ et /avant que/de/ ont fait l’objet de nombreuses analyses pragmatiques, sémantiques et discursives, si bien que l’on est désormais capable de caractériser précisément ces deux interprétations à travers notamment la distinction entre la présupposition et l’assertion (cf. Le Draoulec 2003 & 2006). Mais personne, ou presque, n’a abordé de manière précise les propriétés syntaxiques de ces constructions, excepté Benzitoun (2006) (sur /quand/ uniquement). Nous nous proposons donc de poursuivre ce premier travail en mettant en évidence les caractéristiques syntaxiques des constructions en /avant que/de/ et /quand/ du même type que celles des exemples ci-dessus. Nous montrerons notamment qu’il existe une congruence entre syntaxe et sémantique, pour peu que le cadre syntaxique que l’on adopte ne soit pas trop imprégné de la conception scolaire de la subordination. Nous espérons ainsi parvenir à « remettre les pendules à l’heure » entre la syntaxe et la sémantique afin d’approfondir la question de leur interaction. Néanmoins, nous nous limiterons à l’étude spécifique des deux fonctionnements exemplifiés ci-dessus. Cela nous permettra de poser les prémisses d’un travail plus ambitieux concernant l’interface entre la syntaxe et la sémantique.
Dans la première partie, nous retracerons l’histoire de la « subordination inverse » et des différents termes successifs qui ont été employés pour désigner les exemples en /quand/ tels que ?(1), afin de mettre en lumière leur caractère polysémique et généralement contradictoire. Dans la deuxième partie, nous rappellerons brièvement les principales propriétés dégagées dans les études sémantiques. Dans la troisième partie, nous proposerons une analyse qui montre que l’opposition sémantique entre présupposition et assertion est doublée d’une opposition syntaxique entre dépendance et autonomie. Enfin, dans la dernière partie, nous proposerons des pistes de recherche portant sur d’autres exemples.

Séminaire ATILF

« Les emplois de /anti/- en français contemporain : réflexion sur les catégories traditionnelles Préfixes /versus/ Prépositions »

Franziska Heyna (Université de Fribourg)

Vendredi 26 octobre 2007 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Dans cette communication, on s’intéresse à certains emplois actuels du morphème anti–, tels qu’ils sont attestés sur le web et dans la presse écrite. Les faits empiriques dont on va rendre compte montrent que le morphème anti–, dans un certain type d’écrits, figure de plus en plus souvent dans les contextes syntaxiques que l’on pourrait qualifier approximativement de « prépositionnels »

En savoir plus …

Séminaire ATILF

« Existe-t-il des emprunts au gaulois en français ? Réflexions à partir du traitement du lexique d’origine gauloise dans le TLF »

Rebecca Loeb (Université de Bâle)

Vendredi 5 octobre 2007 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
L’idée que les Gaulois sont les ancêtres des Français est omniprésente dans la pensée collective, encore aujourd’hui. Je vais essayer d’éclaircir à quel degré cette idée se retrouve dans le domaine linguistique. Le point de départ est de savoir s’il existe des emprunts au gaulois en français.
Comment repérer le vocabulaire qui pourrait présenter des emprunts du français au gaulois
La version informatisée du Trésor de la langue française facilite énormément cette tache, vu que l’on peut chercher tous les articles qui contiennent la notion « gaulois ».
La liste du TLFi
On arrive à une liste de 220 mots français, d’origine gauloise (pas d’emprunts !). Ces mots se laissent diviser dans de différents groupes. Le premier groupe est constitué de mots d’origine gauloise. Le deuxième, de mots avec des étymons latins d’origine gauloise. Le troisième, de mots où le gaulois n’apparaît qu’en second lieu. Le quatrième, de mots dont l’origine est incertaine.
Commentaire et critique de cette liste
Finalement, les deux premiers groupes sont plus intéressants que les deux autres. Ainsi, ils méritent un regard plus précis. On y trouve des points forts, mais aussi des détails malheureux qu’il convient de relever et proposer des améliorations.
L’actualisation de l’article alose
Une explication de chaque pas de la démarche pour l’actualisation de l’article alose qui est maintenant consultable en ligne, sur le site du TFL-Etym.
Conclusion
Les emprunts au gaulois en français ne sont pas possibles. Premièrement, entre le gaulois et le français, il manque d’autres langues, parce que le français n’a pas suivi temporellement le gaulois. Le gaulois a pu influencer les langues latines, qui l’ont suivi directement. C’est dans les langues romanes qu’on trouve les étymons du lexique français. Deuxièmement, aussi les emprunts savants sont impossibles, vu que le gaulois est presque inconnu aujourd’hui.
Le TLF prouve clairement que ces emprunts n’existent pas. Il y a un seul article où figure dans la partie étymologique un emprunt au gaulois. Ainsi, la question du début se modifie un peu. Il est alors intéressant d’étudier tous les mots d’origine gauloise, ce qui nous mène à la liste du TLFi des 220 mots. A partir de là, s’offre une multitude d’autres questions sur le lexique d’origine gauloise et son traitement dans le TLF, ce que nous allons faire en partie.

Séminaire ATILF

« L’importance du travail d’attestation pour le chercheur en droit »

Michel Séjean (Université Panthéon-Assas – Paris II)

Vendredi 22 juin 2007 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Que peut faire la linguistique pour la recherche en droit? Les rapports entre linguistique et droit sont à la fois récents, ténus et diversement appréhendés par la doctrine. Dans ce contexte, le travail particulier d’attestation peut-il être utile au chercheur en droit?
A partir d’une étude sur la genèse des mots « unilatéral » et « bilatéral », réalisée dans le cadre d’une thèse de droit, seront examinées les conclusions auxquelles peut mener une remontée dans le temps, au fil de ces deux adjectifs.
Les conclusions sont doublement surprenantes.
Sur le plan linguistique, d’abord, elles conduiront à des antédatations des adjectif « unilatéral » et « bilatéral ». Cette découverte est aussi étonnante que dépaysante, car la remontée dans le temps s’accompagne d’un voyage dans l’espace, de la Rome de Justinien à la Byzance de Basile, en passant par la Saxe de Pufendorf, ou encore la Toulouse de Cujas et l’Orléans de Pothier.
Sur le plan juridique, ensuite, une datation plus précise permettra de séparer les deux fonctions prêtées à une distinction notionnelle en droit. En effet, les classifications juridiques participent activement à la structure du droit, comme un édifice rationnel et cohérent. Mais ces classifications ont une double fonction.
Elles servent en premier lieu d’outil pédagogique, pour comprendre et enseigner le droit. A cet égard, les anachronismes sont permis.
Mais elles ont également une autre fonction, plus lourde de conséquences concrètes. Elles permettent une opération essentielle à la technique juridique: la qualification juridique des faits, dont dépendent des effets de droit. Ces conséquences juridiques sont regroupées sous la notion de régime juridique. Aussi bien, nous verrons que le travail d’attestation permet de séparer les deux fonctions occupées par une seule et même distinction: sa vocation didactique d’une part, et sa fonction de qualification porteuse de régime d’autre part.
Loin de cantonner la linguistique à sa seule dimension explicative, nous proposerons donc de lui attribuer une certaine capacité démonstrative, en gardant néanmoins à l’esprit qu’une telle proposition ne se formule utilement qu’avec prudence et modestie.

Séminaire ATILF

« Les logiciels pour le traitement de corpus oraux en français »

Magali Husianycia (ATILF)

Vendredi 15 juin 2007 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Dans ce séminaire, je présenterai le travail de recherche d’outils informatiques mis à disposition pour le traitement des corpus. J’ai répertorié différents types de logiciels (concordanciers, logiciels de transcription, étiqueteurs, logiciels d’analyse lexicale et syntaxique et logiciels d’analyse sémantique.) en accès libre sur internet. Après une sélection de logiciels, en fonction de leur accessibilité, je les ai testé sur des corpus transcrits et numérisés. Je vous présenterai les logiciels analysés et testés et montrerai que les divers outils sont conçus principalement pour travailler à partir de l’écrit et que les technologies du TAL sont difficilement transposables à l’oral et comportent donc des limites.
Puis, je mènerai une brève réflexion sur la notion de typologie textuelle et sur le rôle qu’elle peut avoir dans la linguistique de corpus.

Séminaire ATILF

« Two examples of Cuban pedagogical lexicography : the Diccionario Escolar Ilustrado and the Diccionario Básico Escolar »

Leonel Ruiz Myares (Director del instituto de linguistica applicada de Santiago de Cuba)

Vendredi 8 juin 2007 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
The urgent need to provide Cuban school children with affordable dictionaries in order to meet their decoding needs ? as well as to improve their knowledge of the Spanish language in general ? has compelled the Centro de Lingüística Aplicada (CLA) from Santiago de Cuba to begin a number of activities with the aim of compiling two school dictionaries on a scientific basis.
The bibliographic revision revealed that the Cuban lexicographic work had it origin in the 18th Century. However, since then there is no evidence of further attempts to produce dictionaries for Cuban children. This fact prompted us to start a national research survey to establish students´ active vocabulary and their main characterising features with a view to selecting the lemmas for inclusion in the dictionaries.
A demonstration of the electronic version of one of the dictionaries (Diccionario Básico Escolar) we will show at the speech.

Séminaire ATILF

« Une contribution à l’histoire du lexique français : étude des dénominations humaines dans l’Heptaméron de Marguerite de Navarre »

Emilie Devriendt (Université de Poitiers)

Vendredi 4 mai 2007 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Il s’agira dans cette conférence de rendre compte des résultats d’une recherche récente portant sur les principales dénominations humaines employées dans les nouvelles de Marguerite de Navarre ou Heptaméron, recueil dont la première édition complète date de 1559, et dont la composition a pu être située entre 1542 et 1547. On tâchera de mesurer les apports de cette recherche à la lexicologie historique.

En savoir plus …

Séminaire ATILF

« La syntaxe ordinaire à la Réunion »

Gudrun Legeden (Université de la Réunion)

Vendredi 27 avril 2007 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
L’étude du français « ordinaire » (Gadet 1989) tel qu’il est pratiqué à l’Île de la Réunion, Département d’Outre Mer français situé dans l’Océan Indien, éclaire l’étude du français « ordinaire » tout court. En effet, l’étude historique et sociolinguistique du français dans ce département permet d’identifier les éléments qui relèvent de la variation interlinguistique (qui est ici particulière car due aux contacts avec le créole réunionnais), et ceux qui concernent la variation intralinguistique.

En savoir plus …

Séminaire ATILF

« La morphologie flexionnelle est-elle une fonction ? »

Olivier Bonami (Université Paris 4 – Sorbonne) & Gilles Boyé (Université de Bordeaux 3)

Vendredi 20 avril 2007 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Nous montrerons que le point de vue des approches réalisationnelles de la flexion (Zwicky 1986) permet de poser une question intéressante sur la typologie des systèmes flexionnels, question qui n’est pas formulable dans les termes de la morphologie morphématique telle qu’elle se construit habituellement : la flexion est-elle une fonction ou une relation ?
Nous examinons plusieurs exemples de situations où un système flexionnel ne semble pas être fonctionnel : les lexèmes polyparadigmatiques, les formes négatives dans la conjugaison du népali, et les pronoms faibles du français, souvent considérés comme des marques flexionnelles.
Ces trois exemples sont emblématiques de trois types d’exceptions à la fonctionnalité qui n’ont pas le même statut.

Séminaire ATILF

« Les premières formes d’anaphore chez l’enfant »

Anne Salazar-Orvig (Université Paris 3)

Vendredi 30 mars 2007 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
L’exposé présentera plusieurs volets de la recherche sur « les prémices dialogiques de l’anaphore » chez le jeune enfant. Cette recherche, qui exploite un corpus relativement important de dialogues enfantins en situation naturelle, s’intéresse à l’émergence, chez des enfants âgés entre 1 ;9 et 3 ans, des pronoms clitiques et des déterminants et à leur fonctionnement dans les discours et les dialogues. Ces premières expressions référentielles ont été analysées non seulement sur le plan de la maîtrise par l’enfant des différentes formes mais aussi et surtout sur le plan de leur usage en explorant à la fois le statut attentionnel du référent, la présence de l’objet de discours dans le contexte et dans le discours de l’interlocuteur ou encore la mise en place de chaînes référentielles dans le dialogue. Les différentes analyses qui seront exposées permettent de conclure à une certaine précocité du fonctionnement anaphorique, contrairement à ce que laisse prévoir les études sur les enfants plus âgés.

Séminaire ATILF

« La Pompamo : un outil de détection des candidats à la néologie pour la veille lexicale »

Sandrine Ollinger (ATILF)

Vendredi 16 mars 2007 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
La POMPAMO est un élément d’une plateforme de veille lexicale actuellement en cours de développement. La méthode générale que nous mettons en œuvre vise à identifier les néologismes en confrontant des corpus, considérés comme des archives de pratiques linguistiques données, et des lexiques, considérés comme des simulations d’usages lexicaux attestés et correspondant à ces pratiques linguistiques.

En savoir plus …

Séminaire ATILF

« du linguicien au sémanticiste : quelques cas d’echangisme suffixal »

Stéphanie Lignon (ERSS-Université de Haute Alsace)

Vendredi 9 février 2007 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Il n’est pas rare qu’un dérivé comporte un suffixe autre que celui que laisseraient attendre son sémantisme ou la catégorie grammaticale de sa base. Le phénomène a déjà été observé par Roché (1997) avec avionneur et camionneur.

En savoir plus …

Séminaire ATILF

La virgule, de la syntaxe à l´argumentation

Véronique Dahlet (Professeur à l’Université de Sao Paulo)

Vendredi 2 février 2007 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
De même que le point et le point-virgule, la virgule a pour fonction essentielle de segmenter la chaîne écrite. Elle est cependant ressentie, à juste titre, comme le signe de ponctuation le plus complexe, tant par les usagers scripteurs que par les linguistes qui cherchent à en décrire les opérations…

En savoir plus …

Séminaire ATILF

« La périodisation des latinismes dans la langue française »

Bruno Staib (Mayence, Allemagne)

Vendredi 26 janvier 2007 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Imprégné fortement par la tradition latine, le vocabulaire du français nous offre toute une gamme de marques phonétiques, orthographiques et sémantiques qui témoignent de cette source inépuisable qu’est le latin – non seulement pour le français, mais aussi pour la plupart des langues romanes et bon nombre d’autres langues vernaculaires de l’occident…

En savoir plus …

Séminaire ATILF

« Prosodie et syntaxe »

José Deulofeu (Université de Provence – DELIC) & Philippe Martin (Université Paris 7)

Vendredi 19 janvier 2007 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Dans une première partie théorique, on présentera un modèle modulaire de l’articulation entre structures syntaxiques et structures prosodiques. La composante syntaxique est un développement de celle qui est proposée dans le cadre théorique de l’Approche pronominale Blanche-Benveniste et alii (1990), Deulofeu (1999) et qui articule deux sous-composantes …

En savoir plus …

Historique 2006 des séminaires de l’ATILF

Séminaire ATILF

« Pour un lexique de la valence verbale en français »

A. Valli (Université de Provence)

Vendredi 15 décembre 2006 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
« Nous sommes en train de construire une base de données décrivant la complémentation verbale du français qui pourra servir dans le traitement automatique des langues. »

En savoir plus …

Séminaire ATILF

« Une approche distributionnaliste et constructiviste en sémantique »

P. Jalenques & F. Thuillier (Rouen)

Vendredi 1 décembre 2006 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | Bâtiment A | Salle A 104

Résumé
« Nous entendons, lors de cette intervention, présenter une méthode d’analyse des unités polysémiques ayant cours dans le cadre de la Théorie des Opérations Prédicatives et Enonciatives (T.O.P.E.) initiée par Antoine Culioli. »

En savoir plus …

Séminaire ATILF

« Voix et diathèses »

Emmanuel Deronne (IUFM Lorraine)

Vendredi 17 novembre 2006 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Qu’il s’agisse du travail de fourmi de la composition d’un dictionnaire, de la traduction ou de réflexions plus théoriques sur les typologies de verbes, les voix, variations de la totalité des formes modales et temporelles d’un verbe, possèdent une importance particulière.

En savoir plus …

Télécharger l’intervention complète

Séminaire ATILF

« Entre interrogation plein texte et balisage fin, façon TLF: la voie moyenne du Féraud informatisé sous STELLA »

Philippe Caron (METADIF – Poitiers)

Vendredi 10 novembre 2006 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
La version Philologique du Dictionnaire critique de la langue française informatisé, mise en ligne en 2003 sur les deux sites miroirs de l’ARTFL de Chicago et de l’ATILF est une base de données textuelles interrogeable plein- texte, les seuls balisages étant référentiels (page, colonne, article) ou typographiques.
La version STELLA du Féraud informatisé, qui devrait être en ligne à partir de 2008, offre deux nouveautés qui font son originalité.

En savoir plus …

Séminaire de méthodologie en étymologie et histoire du lexique

Bilan : la méthodologie du projet TLF-Étym

Éva Buchi (ATILF | équipe Étymologie et histoire du lexique)

Mercredi 28 juin 2006 | 14h00-15h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Séminaire de méthodologie en étymologie et histoire du lexique

Écueils à éviter dans le traitement historique des belgicismes dans la lexicographie française générale

Marie-Guy Boutier (Université de Liège)

Vendredi 23 juin 2006 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Séminaire ATILF

Phraséologie et constitution de texte

Heinz-Helmut Lüger

Vendredi 2 juin 2006 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Les expressions phraséologiques (ou phrasèmes) représentent un élément incontournable de la pratique langagière. Il s’agit donc, dans une première étape, de décrire leur statut linguistique et d’élucider leurs possibilités d’emploi. Seront analysés ensuite les différentes fonctions textuelles et, plus spécialement, le rôle structurant des phrasèmes : De quelle manière favorisent-ils l’organisation du texte, dans quelle mesure contribuent-ils à la cohérence sémantique ou thématique ?

Séminaire de méthodologie en étymologie et histoire du lexique

Le traitement de la phraséologie dans les notices étymologiques du TLF

Jean Klein (Université de Louvain-la-Neuve)

Mercredi 24 mai 2006 | 14h00-15h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Etant donné la richesse particulière du TLF dans le domaine phraséologique (depuis les simples collocations jusqu’aux phrases figées et aux proverbes), il m’a paru intéressant d’examiner de plus près trois phénomènes phraséologiques : les expressions verbales figées, les phrases figées et les proverbes, avec une attention toute particulière pour ces derniers. Après une brève présentation de la base de données DicAuPro (Dictionnaire automatique et philologique des proverbes français), élaborée au CELEXROM (UCLouvain, Louvain-la-Neuve) et en voie d’achèvement, j’aborderai certains aspects descriptifs (critères distinctifs et indicateurs de catégories phraséologiques dans le TLF et le TLFi). Ensuite, je montrerai, à travers une série d’exemples, que certaines informations tirées de la base de données (variantes diachroniques depuis le Moyen Age jusqu’à nos jours) pourraient s’avérer utiles pour compléter la rubrique « Etymologie et histoire » du TLF.

Séminaire ATILF

L’empreinte indélébile de Nicolas Beauzée dans l’histoire de la phonétique française

Christophe Rey (DELIC, Aix-en-Provence)

Vendredi 21 avril 2006 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Alors que nous nous situons aujourd’hui dans une période décisive de réévaluation des rapports entre la phonétique et la phonologie, il est particulièrement édifiant de constater que nous ne possédons toujours que peu de connaissances sur l’histoire de la phonétique. Aussi, à la suite des travaux de Geneviève Clérico(1), notre thèse(2) constitue-t-elle l’une des rares initiatives destinées à combler nos lacunes sur cette discipline.
Notre exposé revient sur les conclusions de ce travail de doctorat qui en prenant pour cadre d’étude le siècle des Lumières – siècle décisif pour les progrès et la diffusion des connaissances dans la plupart des domaines scientifiques – s’est attaché à définir la nature des savoirs relatifs à la substance phonique de la langue chez les grammairiens-philosophes.
Recentrée sur l’Encyclopédie Méthodique (1782-1832) de Charles-Joseph Panckoucke – encyclopédie continuatrice de l’Encyclopédie ou Dictionnaire raisonné (1751-1777) de Diderot et d’Alembert -, notre étude a mis en évidence l’apport fondamental et pourtant méconnu du grammairien Nicolas Beauzée dans le développement, la thématisation et la diffusion de la description des sons du français.
À travers la maturation scientifique qui va de ses articles de grammaire de l’Encyclopédie, en passant par sa Grammaire générale (1767), jusqu’au dictionnaire Grammaire & Littérature (1782-1786) de l’Encyclopédie Méthodique, Beauzée fournit une réflexion sans précédents sur les sons de la langue, et sans doute la théorie la plus aboutie sur ce sujet au XVIIIe siècle.
Après avoir esquissé quelques-unes des avancées que ce grammairien formule dans la classification des unités phoniques – avancées qui préfigurent notre phonétique et notre phonologie modernes – nous insisterons sur le fait que ce dernier propose au sein de la Méthodique une importante et novatrice thématisation lexicale sur les sons, dont l’écho s’est longtemps fait entendre dans la tradition lexicographique postérieure.
L’héritage scientifique légué par Nicolas Beauzée, tant du point des vue de ses célèbres considérations syntaxiques que de celui de sa description plus marginalement connue du système phonique français, nous laisse croire à la nécessité de diffuser massivement les théories de ce grammairien. C’est en ce sens que nous avons fourni durant notre travail de thèse une réflexion sur la méthode d’informatisation des articles constituant notre corpus. En considérant les spécificités des articles de dictionnaires anciens bien souvent assez peu rigoureusement structurés, mais également l’aspect encyclopédique des entrées sur lesquelles nous avons travaillé, nous avons fait émerger le concept d’un balisage « souple » ou « flottant ».
Inspiré du balisage « analytique » prôné par Chantal Wionet et Agnès Tutin(3) , ce balisage constitue selon nous une réponse efficace à la volonté d’exploiter le plus possible les données du texte rétroconverti sans pour autant imposer une trop grande subjectivité du lexicographe dans l’identification des différents champs informationnels.


(1) Clérico, Geneviève. (1995). Analyses phoniques et prosodiques au XVIème siècle. Origine et préhistoire d’une discipline. Thèse de doctorat d’État, Université de Paris VIII Saint-Denis.
(2) Rey, Christophe. (2004). Analyse et informatisation des articles traitant de l’étude des sons dans le dictionnaire Grammaire & Littérature de Nicolas Beauzée et Jean-François Marmontel, issu de l’Encyclopédie Méthodique. Thèse de doctorat. Aix-en-Provence.
(3) Wionet, Chantal, Tutin, Agnès. (2001). Pour informatiser le Dictionnaire universel de Basnage (1702) et de Trévoux (1704) Approche théorique et pratique. Honoré Champion.

 

Télécharger l’intervention de Christophe Rey

Séminaire de méthodologie en étymologie et histoire du lexique

« Pour une mise à jour des notices historiques consacrées aux emprunts à l’ancien francique dans le Trésor de la Langue Française informatisé« 

Martina Pitz (Université de Lyon III)

mercredi 5 avril 2006 | 14h00-15h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Les relations linguistiques précoces entre la Romania et la Germania constituent l’une des préoccupations récurrentes de l’historiographie relative aux langues romanes. On peut néanmoins affirmer sans hésiter que la question du degré d’influence du superstrat francique sur le français fournit encore aujourd’hui des débats très controversés. Les diverses opinions apparaissent même opposées au point de provoquer un réel blocage sur de nombreux thèmes. Quoique le domaine lexical soit celui où l’influence du superstrat semble la mieux acceptée, cela vaut aussi pour l’étude des emprunts du français à l’ancien francique. Le projet d’une mise à jour des notices étymologiques du TLFi, qui doit rendre accessible au grand public les progrès en lexicographie historique des trente dernières années, offre ainsi une occasion privilégiée de dresser un bilan et de réfléchir aux moyens de surmonter cette aporie. Ma conférence tentera donc, en premier lieu, de présenter dans la perspective d’une germaniste l’état actuel des recherches au sujet des emprunts au francique. En second lieu, j’esquisserai les éventuelles conséquences qui en résultent pour l’analyse de ces emprunts dans le cadre du TLFi en m’appuyant sur un certain nombre d’exemples tirés des notices étymologiques existantes.

Séminaire ATILF

« Du discours au lexique : la glose »

Agnès Steuckardt (Université de Provence/DIPRALANG)

Vendredi 31 mars 2006 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
L’exposé présentera les principaux aspects de la recherche sur la glose, menée à l’Université de Provence au cours des quatre dernières années.
Pour éclairer le sens d’un mot, l’analyse de corpus privilégie traditionnellement le repérage des associations récurrentes, sans se soucier de la conscience métalinguistique qu’en a ou non le locuteur. Il nous a semblé possible de trouver dans les gloses données par les locuteurs aux mots qu’ils emploient un autre accès au sens lexical. Je présenterai dans un premier temps la définition de la glose à laquelle nous nous sommes arrêtés et les différentes configurations syntaxiques de la séquence textuelle de glose. Deux cas de figure se distinguent en première analyse : soit le mot glosé est accompagné de sa glose sans intermédiaire lexical, soit la glose est introduite par un terme de liaison. Ces termes de liaison (ou marqueurs de glose) se subdivisent eux-mêmes en plusieurs catégories ; nous avons distingué ainsi d’une part les marqueurs à métaterme (du type c’est à dire, en d’autres termes), qui affichent leur destination métalinguistique, des marqueurs sans métatermes (ou, donc, comme), qui la masquent : j’illustrerai dans un second temps leur description linguistique par l’exemple de autrement dit et celui de tel. Je me pencherai pour finir sur les perspectives d’utilisation de cette recherche : une automatisation du repérage des gloses est-elle envisageable ? La glose concerne-t-elle des cibles lexicales privilégiées ? Quelles limites intrinsèques comporte l’éclairage sémantique donné par les gloses discursives ?

 

Télécharger l’intervention d’Agnès Steuckardt

Séminaire de méthodologie en étymologie et histoire du lexique

« Apports de la base de données des plus anciens documents linguistiques de la France au projet TLF-Etym »

Martin Gleßgen (Université de Zurich)

Jeudi 30 mars 2006 | 14h00-15h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Séminaire ATILF

Une mésentente cordiale: l’anglo-normand, l’AND et la lexicographie du français

David Trotter (professeur à l’Université d’Aberystwyth et directeur de l’Anglo-Norman Dictionary)

Vendredi 17 mars 2006 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | Bâtiment B | Salle B 10

Résumé
Le but de l’Anglo-Norman Dictionary (première édition: 1977-1992 ; deuxième édition en cours) est de présenter le français de la Grande-Bretagne médiévale. Pour le faire, il exploite une gamme toujours croissante de textes des registres les plus variés. Organisé selon des principes surtout sémantiques, l’AND n’est pas et n’a jamais été un dictionnaire historique. Comme l’anglo-normand est très majoritairement du français – avec parfois d’importantes particularités sémantiques ou formelles -, l’AND peut souvent s’avérer utile pour la lexicographie historique du français.
La première édition était un dictionnaire classique sur papier ; la deuxième est disponible sur papier pour la partie A-E (publiée en 2005, en 1200 pp.), mais elle existe en même temps en ligne (www.anglo-norman.net). D’accès libre et gratuit, la version internet a plusieurs atouts : d’une part, elle permet toutes sortes de recherches ; d’autre part, l’AND lui-même fait partie d’un projet plus vaste qui inclut aussi un corpus de textes numérisés, appuyé par des articles scientifiques portant surtout sur le lexique de l’anglo-normand. Grâce à la technologie XML (encodage TEI) qui sous-tend l’ensemble, l’usager peut passer facilement du dictionnaire aux textes et vice versa.
La conférence présentera l’AND (deuxième édition) et montrera les avantages que possède la version électronique. En même temps, j’aborderai la problématique d’un dictionnaire différentiel de l’ancien français et de la définition de l’anglo-normand, variété linguistique qui a toujours été au moins une demi-sœur de la langue française

Séminaire ATILF

« Le corpus informatisé et l’importance des typologies – de la lexicométrie vers la logométrie »

Margareta Kastberg Sjöblom (UMR 6039 « Bases, Corpus et Language » de Nice)

Mardi 14 mars 2006 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Comment les techniques quantitatives peuvent-elles intervenir dans l’étude des grands corpus ? L’exploration statistique donne la possibilité d’analyses diverses notamment sur le lexique, la morphosyntaxe et la structure lexicale. Ces différentes analyses permettent non seulement d’étudier le vocabulaire et le style de l’œuvre d’un écrivain, l’écriture d’une époque, etc., mais aussi de comparer différents auteurs entre eux.
En outre, l’analyse lexicométrique et plus largement celle de la logométrie offrent une meilleure compréhension des variations typologiques. La variation entre les genres est-elle réellement si pertinente qu’elle le semble dans l’état actuel de la recherche ? Quelles variations langagières enregistre-t-on entre les différentes formes de discours ? Par quels paramètres lexicaux, sémantiques, morphosyntaxiques et structuraux les variations typologiques sont elles réellement régies ? Quelle contrainte la traditionnelle division en genres impose-t-elle aux locuteurs dans leur pratique discursive ?
L’analyse du corpus en situation montre que le lexique, la morphosyntaxe, la structure et la sémantique varient avec les genres. L’opposition entre les différentes typologies est toujours présente et souvent même prépondérante dans les différentes analyses statistiques.

Séminaire ATILF

« Projet Khartês : méthodes et outils d’analyse syntaxique »

Nicolas Mazziotta (Université de Liège)

Vendredi 10 mars 2006 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Notre exposé (1) présente tout d’abord brièvement le projet Khartês (projet d’édition et d’étude de chartes originales rédigées en français, Université de Liège). (2) Nous abordons ensuite la problématique générale de l’analyse syntaxique des états de langue qui ne sont plus pratiqués, comme l’ancien français des chartes médiévales. (3) Ces observations nous mènent à décrire le modèle que nous avons élaboré et la manière dont nous l’avons mis en oeuvre. (4) L’aspect technique de notre travail fait l’objet de la suite de l’exposé, où nous montrons comment nous avons mis les outils informatiques actuels au service de notre démarche linguistique. (5) En posant aux textes la question de leur ponctuation, nous achevons notre exposé en montrant comment une analyse formalisée, systématisée et informatisée peut être employée pour partir à la découverte de faits qu’on aurait peine à discerner sans cet outil.

Séminaire ATILF

« Les qualifications métadiscursives du dire dans les discours écrits »

Annie Kuyumcuyan

Vendredi 3 mars 2006 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Il s’agira de présenter quelques marqueurs autonymiques destinés à qualifier le discours tenu : marqueurs de discours rapportés, modalisateurs et marqueurs graphiques (ponctuants), en s’interrogeant sur l’harmonisation éventuelle de leur description.

Séminaire ATILF

Chaînage causal et schéma spatial dans la représentation des verbes

Bernard Fradin (Laboratoire de linguistique formelle)

Vendredi 17 février 2006 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
L’exposé discutera de propositions récentes faites par Croft (1991, 1998), Davis & Koenig (2000), Davis (2001) pour représenter la sémantique de verbes mettant en jeu un argument (sémantique) spatial. Ces propositions visent à montrer qu’un schéma basé sur la relation AGENT-PATIENT suffit à rendre compte du comportement syntaxique des verbes. Elles prévoient en particulier qu’il n’est pas nécessaire de postuler de verbes ayant un SN sujet locatif. Les faits tirés de la morphologie — adjectifs en –able et N déverbaux en –eur — semblent montrer que cette opinion doit être abandonnée.

Séminaire ATILF

Constitution et exploitation d’un corpus diachronique : enjeux et spécificités

Sophie Prévost (CNRS/Ecole Normale Supérieure, Paris)

Vendredi 3 février 2006 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Notre conférence portera sur les enjeux, les contraintes et les spécificités liées à la constitution et à l’exploitation d’un corpus de français médiéval envisagé dans une perspective diachronique. Après avoir rappelé les spécificités de l’objet considéré –une langue sans locuteurs et soumise à la variation tant diachronique que dialectale que de registre– nous évoquerons plus précisément l’expérience de la constitution d’une base de données textuelle et la difficile question de la représentativité des textes. En nous appuyant sur des cas d’études précis, nous développerons ensuite les apports des corpus numérisés pour notre connaissance de la langue médiévale, qu’il s’agisse de la mise au jour de nouveaux faits, de leur quantification ou de leur mise en relation.

Séminaire de méthodologie en étymologie et histoire du lexique

Réflexions sur le traitement lexicographique des termes faisant référence à la civilisation antique et médiévale du TLFi

Frédéric Duval (Université de Metz/équipe Moyen français et français préclassique)

Mercredi 18 janvier 2006 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Ce séminaire envisagera le champ très limité des mots de civilisation romaine (avec une ouverture sur les mots de civilisation médiévale). [1] On dégagera d’abord les problèmes lexicologiques posés par ces mots : définition et délimitation du champ ; les mots de civilisation sont-ils des termes ?; sémantique et encyclopédie ; les mots de civilisation en diachronie : le problème de la « référence évolutive ». [2] On tentera ensuite de voir quels enseignements la lexicographie peut et doit tirer d’une réflexion théorique sur cette question. [3] Enfin, à partir d’un parcours du domaine technique « antiquité » (et si le temps le permet de « féodalité ») du TLFi, on analysera
les défauts les plus fréquents des notices étymologiques et historiques et l’on proposera plusieurs directions pour opérer des corrections systématiques.

 

Télécharger les actes des séminaires de méthodologie en étymologie

Séminaire ATILF

Normes sémantiques et typologie textuelle

Carine Duteil-Mougel

Vendredi 6 janvier 2006 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Notre recherche porte sur la caractérisation des textes et l’étude des normes sémantiques (genres, discours). A partir d’une définition du genre, sur un plan sémantique-rhétorique, nous ferons des propositions pour la classification des textes (étiquetage global, typologie) et la structuration des bases textuelles (constitution de corpus homogènes). Nous proposerons également, dans le cadre d’un système d’aide au traitement sémantique de corpus (interprétation assistée), des balises pour le repérage de formes sémantico-rhétoriques (étiquetage local).

Historique 2005 des séminaires de l’ATILF

Séminaire de méthodologie en étymologie et histoire du lexique

La traque des premières attestations

Nadine Steinfeld (équipe Étymologie et histoire du lexique)

Mercredi 14 décembre 2005 | 14h00-15h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Parmi les éléments d’information que la lexicographie a la charge d’inventorier, l’un des plus significatifs est représenté par les premières attestations ou datations des mots, qui permettent d’avancer dans les dictionnaires étymologiques la date du premier emploi d’un terme. Si le caractère éminemment provisoire des datations proposées par les dictionnaires étymologiques est une évidence, les dates d’apparition ou les premières attestations d’une unité lexicale ou d’un sémantisme dans une langue à un moment donné sont toutefois un élément de première importance permettant de reconstituer les étapes de l’histoire d’un mot. Cependant, le lexicographe ne devrait jamais oublier qu’une simple date ne signifie rien en soi, si elle n’est entourée de données graphiques, phonétiques, morphologiques, sémantiques, stylistiques, etc., qu’elle apporte avec son contexte. La traque des premières attestations n’a de sens que si elle est soumise à une enquête minutieuse qui révèlera, grâce à un retour aux sources, un ensemble de faits et d’éléments d’information permettant d’éclairer la mentalité, le milieu, le moment, le groupe ou l’individu dont le vocabulaire paraît être l’une des formes d’expression les plus révélatrices. Qui connaît mieux que les médiévistes les pièges cachés dans les textes d’ancien et de moyen français qui imposent de soumettre les attestations systématiquement à un examen critique approfondi mené à partir d’une liste de contrôle régie par des principes philologiques, sémantiques, phonétiques, morphologiques, encyclopédiques, stylistiques, chronologiques, diatopiques et la recherche de parallèles afin de diminuer la probabilité de l’erreur. À partir de l’analyse de quelques exemples de premières attestations que j’ai proposées ou rejetées au cours de la refonte d’articles du premier volume du FEW et de TLF-Étym, je m’efforcerai d’illustrer la mise en pratique de certains de ces principes philologiques qui m’ont permis de débusquer trois « mirages lexicographiques » qui ont vécu plus d’un siècle franchissant un dictionnaire après l’autre et qui continuent à jouir d’une vie paisible dans le Dictionnaire historique de la langue française d’Alain Rey. L’adage, osé par un éminent philologue, qu’ «il n’y a pas de lexicographe sans gaffes», reçoit une nouvelle confirmation, mais c’est là précisément ce qui donne du piment au dictionnaire et l’humanise délicieusement.

Séminaire ATILF

Analyse lexicale d’une  » pierre de Rosette  » du français en Angleterre au XVe s.

Christel Nissille (Université de Neuchâtel/ATILF)

Vendredi 2 décembre 2005 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Les récentes études portant sur les manuels de langue pour l’enseignement du français en Angleterre au Moyen-Age ont permis de mettre en lumière l’utilisation d’exercices pratiques de traduction comme moyen didactique.
Un de ces exercices, l’Oxford Magdalen 188, est un manuscrit trilingue inédit du début du XVe siècle qui contient en parallèle le texte source, copie de la Somme le roi de Lorens d’Orléans (1280), et les traductions en latin et en moyen anglais.
Cette présentation en miroir des trois versions nous donne des informations assez précises sur la compréhension du texte par le traducteur anglais, que nous observons dans l’acte même de la traduction, et nous indique quels outils lexicaux et grammaticaux étaient à sa disposition.
Nous nous proposons de tenter d’analyser, grâce à cette « pierre de Rosette », de quelle manière le traducteur identifie les formes rencontrées puis les traduit.
Il s’agit donc de comprendre, en ce qui concerne la réception tout d’abord, les aides et les pièges que constitue la graphie du texte source, l’influence de la parenté des trois langues en présence et les problèmes que pose la variation diachronique et diatopique.
Du point de vue de la production, nous nous intéresserons surtout à l’utilisation du binôme synonymique et de la complémentarité des deux langues dans cette traduction.

 

Télécharger l’intervention de Christel Nissille (format PDF)

Télécharger l’exemplier (format PDF)

Séminaire ATILF

Approche cognitive de l’adjectif : sémantisme et fonction

Marie Luce Honeste (Université Rennes 2/E.A. Sens & Texte, Université de Paris-Sorbonne)

Vendredi 25 novembre 2005 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Cette conférence vise à présenter une approche cognitive des processus de formation du sens en langue et en discours à travers une application au cas de l’adjectif.
L’hypothèse développée est que les processus de formation du sens ne sont pas les mêmes dans la langue et dans le discours, parce que les mots n’y répondent pas aux mêmes types de fonctionnalités.
Dans cette perspective, l’adjectif sera donc abordé à deux niveaux :
– en langue, du point de vue de l’origine cognitive de la formation du sens lexical. À ce niveau, le statut grammatical de l’unité lexicale est moins prégnant que la notion véhiculée : il intervient comme simple forme du contenu ;
– en discours, du point de vue des mécanismes de formation du sens des énoncés, et du rôle sémantique qu’y tiennent les mots qui les composent. À ce niveau, au contraire, le statut et la fonction des unités lexicales deviennent prédominants, dans la mesure où c’est par leurs propriétés syntaxiques qu’elles participent activement à la formation du sens.

 
Télécharger l’intervention de Marie Luce Honeste (format PDF)

Séminaire de méthodologie en étymologie et histoire du lexique

Dérivation française/romane/latine à l’intérieur d’une famille étymologique

Jean-Paul Chauveau (équipe Étymologie et histoire du lexique)

Mercredi 16 novembre 2005 | 14h00-15h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
A partir de quelques exemples de dérivés ou d’une famille dérivationnelle que j’ai eus à traiter au cours de la refonte d’articles du premier volume du FEW et pour lesquels j’ai eu des divergences avec les explications étymologiques fournies par le TLF, je vais essayer de montrer qu’il n’est pas rare qu’on puisse améliorer le traitement de la dérivation dans les notices historiques et étymologiques du TLF. Un des grands avantages comparatifs du TLF, c’est que la dérivation française y est traitée de façon systématique, explicite et transparente, en ce sens que chaque (ou presque) dérivé y a droit à une notice historique et étymologique où le dérivé est décomposé en une base et un suffixe qui tous deux sont traités sous une entrée spécifique, avec notices synchronique et diachronique.
L’explication étymologique des dérivés est donc entièrement falsifiable, c’est-à-dire que son adéquation à la réalité est vérifiable à l’intérieur même du dictionnaire. Cela a pour conséquence et avantage qu’on peut très facilement vérifier :
1) si l’explication étymologique qui est donnée de tel ou tel dérivé est cohérente avec les programmes dérivationnels qui sont décrits sous les suffixes en cause, c’est-à-dire si le dérivé analysé correspond bien au modèle dérivationnel qui est explicité dans l’article consacré au suffixe;
2) si les programmes dérivationnels analysés sous chaque suffixe rendent compte de tous les événements qui affectent l’histoire, la forme et le sens de la plupart des dérivés qui contiennent cet élément, autrement dit si le programme dérivationnel est suffisamment riche et complexe pour rendre compte de l’histoire des dérivés sous lesquels il sera renvoyé à l’article traitant du suffixe.
Cette recherche de cohérence est possible maintenant qu’on dispose de l’entier du TLF. Evidemment lorsque la rédaction en était aux premiers volumes, la situation était bien différente: les articles consacrés aux suffixes n’étaient pas écrits et ces derniers ne pouvaient bénéficier de la totalité des articles où ces suffixes étaient concernés. D’où les ratés inévitables. Je rappelle la boutade de Gilliéron, l’auteur de l’Atlas linguistique de la France: ‘le questionnaire aurait été sensiblement meilleur s’il avait été constitué après l’enquête’.

 

Télécharger les actes des séminaires de méthodologie en étymologie

Séminaire de méthodologie en étymologie et histoire du lexique

L’importance de la critique des sources en étymologie

Frankwalt Möhren (DEAF, Heidelberg)

Jeudi 3 novembre 2005 | 14h00-15h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
L’exposé se basera sur l’analyse des articles jarde, jaseran, javelle, javelot, jogler, jonction, standard du TLFi.

Séminaire ATILF

Les régionalismes en ancien et en moyen français

Gilles Roques et Yan Greub

Vendredi 14 octobre 2005 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Yan Greub :
« Je présenterai la localisation d’un texte de la fin du 15e siècle, le Nouveau Pathelin, sur la base du travail effectué dans mon ouvrage Les Mots régionaux dans les farces françaises. En introduction, j’insisterai spécialement sur les conditions de présence des attestations lexicales, qui rendent particulièrement productive la prise en compte des attestations dialectales modernes, pour autant que cela se fasse dans une perspective historique. J’essaierai aussi de montrer l’utilité de la cartographie pour la localisation du lexique et des textes anciens. J’essaierai aussi d’exposer en quoi la méthode de localisation que je propose s’applique aux textes de la
période considérée, et d’indiquer que les problèmes sont peut-être différents pour d’autres documentations.
G. Roques se propose de contester le résultat de la localisation que je propose, et nos communications devrait déboucher sur une discussion, de faits et de méthode. »

Séminaire de méthodologie en étymologie et histoire du lexique

Le traitement historico-étymologique des régionalismes dans le TLFi

André Thibault (professeur à l’Université de Paris-Sorbonne)

Mercredi 5 octobre 2005 | 14h00-15h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
André Thibault, d’origine québecoise, auteur du ‘Dictionnaire suisse romand’ (1997, Editions Zoé), qui occupe la chaire « Francophonie » de la Sorbonne, est un des tout premiers spécialistes de la variation régionale du lexique français.

 

Télécharger les actes des séminaires de méthodologie en étymologie

Séminaire ATILF

Les constructions adverbiales en français contemporain

Lassaad Oueslati (Laboratoire de Linguistique Informatique)

Vendredi 30 septembre 2005 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
La littérature relative aux adverbes de modalisation est abondante. Tous les travaux s’intéressant à cette catégorie sont unanimes à définir ces adverbes comme outils servant à modaliser le discours en apportant un jugement du locuteur sur ce qu’il dit. En dépit de cette unanimité, nous nous heurtons à une diversité terminologique qui fait écho à la diversité des approches. C. Guimier, Ch. Molinier, Authier-Revuz, etc., pour ne citer que les travaux les plus récents, optent chacun pour une terminologie différente de celle des autres. Dans l’optique du traitement automatique, l’approche est toute différente. En nous appuyant sur la méthodologie adoptée au Laboratoire de Linguistique Informatique, nous allons essayer d’étudier cette classe d’adverbes en appliquant la notion d’emploi. L’analyse dichotomique emploi prédicatif/non prédicatif nous permettra d’opérer un classement de nature à faciliter le traitement automatique.

Séminaire de méthodologie en étymologie et histoire du lexique

La série du Dictionnaire de Trévoux, une source de références parfois maltraitées dans le TLF

Isabelle Turcan (équipe Métalexicographie historique)

Mercredi 21 septembre 2005 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Séminaire ATILF

Problèmes méthodologiques de la constitution et de l’analyse de corpus d’interaction adulte-enfant au cours de l’acquisition du langage

Martine Vertalier, CRALOE (Centre de Recherche sur l’Acquisition du Langage Oral et Ecrit) composante de CALIPSO (Acquisition, Cognition, Interaction,
Pratiques Sociales du Langage), Paris 3. Luiggi Sansonetti, SYLED (Systèmes Linguistiques, Enonciation et Discursivité) et CALIPSO, Paris 3.

Vendredi 16 septembre 2005 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
1. Martine Vertalier :
Nous présenterons les principaux aspects théoriques et méthodologiques d’une approche linguistique de l’acquisition du langage (oral et écrit), approche qualitative en ce qu’elle s’appuie sur des données attestées, recueillies en contexte discursif, dans des corpus longitudinaux individuels d’interactions entre un adulte et un enfant, par opposition aux approches quantitatives et comparatives souvent pratiquées en psycholinguistique.
Nous exposerons les méthodes de recueil, de transcription et d’analyse élaborées et affinées au sein du CRALOE depuis une trentaine d’années : analyse syntaxique conjointe des énoncés de l’adulte et de l’enfant (et parfois des textes écrits supports d’interaction), recherche de phénomènes d’interaction susceptibles de déclencher des processus d’apprentissage à long terme, recherche de traces d’appropriation, immédiate ou différée, par l’enfant d’introducteurs de complexité syntaxique, étude de l’évolution de la combinatoire de ces constructions complexes…
Nous évoquerons l’apport de la linguistique de corpus à cette réflexion sur les processus d’acquisition et les problèmes soulevés par une exploration informatisée de corpus où le langage est en cours d’élaboration, ainsi que notre projet de constitution d’une base de données pour la recherche en acquisition du langage, qui permettrait de systématiser les observations qualitatives et, entre autres, de confronter et d’évaluer les manières d’interagir d’adultes différents, à la lumière de la notion de « genre » de discours.
2. Luiggi Sansonetti :
Après un aperçu de différentes conventions de transcription de l’oral et des problèmes que ces variations (entre laboratoires, phénomènes observés et auteurs) posent, tant à la lecture des documents qu’aux analyses assistées par ordinateur, nous présenterons une  » aide  » à la création de nouveaux documents pour  » au moins  » standardiser les transcriptions établies au sein de l’équipe. En même temps, ce  » modèle  » permet de stocker ces nouveaux documents dans un format XML, suivant une structure définie, pour assurer une compatibilité nécessaire pour un échange de corpus avec d’autres communautés. En plus de ce cadre d’échange, nous évoquerons l’apport de ce formalisme à une analyse semi-automatique. Nous présenterons l’apport de l’utilisation de plusieurs logiciels pour la recherche de certains phénomènes d’interaction tels que reprises et reformulations entre adulte et enfant, pour les analyses syntaxiques, et pour le repérage de l’évolution langagière dans le cas de corpus longitudinaux.
Nous attendons beaucoup de l’expérience des membres de l’ATILF pour répondre à nos ambitions et à nos questionnements dans ce domaine particulier de l’acquisition du langage, où il s’agit non seulement de décrire des données linguistiques mais de saisir dans la durée la dynamique de l’élaboration d’un fonctionnement langagier et cognitif.

Atelier de découverte ATILF

Le traitement des vedettes regroupant un masculin et un féminin (catcheur, -euse) et celui des emprunts non explicites («mot anglais» plutôt que «emprunt à l’anglais») dans le TLFi et le Supplément au TLF

Pascale Bernard | Geneviève Fléchon | Marie-Josée Mathieu (ATILF)

Vendredi 1 juillet 2005 | 10h30-12h00
ATILF Bâtiment CNRS, salle de réunion du sous-sol

Résumé
Nous avons choisi de vous présenter deux points qui posent problème dans la présentation des objets d’un dictionnaire électronique. A travers des exemples tirés du TLFi et du Supplément, nous verrons comment sont présentées les entrées qui ont une forme féminine (devin, devineresse) dans le TLFi, le Supplément et les autres dictionnaires (Robert et Académie) et comment sont traités les emprunts ou les mots empruntés dans le TLFi et le Supplément. Le traitement actuel n’est pas sans conséquence dans l’interrogation du TLFi.
L’objectif de ces réflexions est de proposer une présentation de ces données optimale, voire nouvelle, en tout cas cohérente.

Séminaire ATILF

« Rationalisme » et « empirisme » en sémantique lexicale. Les approches « logiques » et « cognitives » et leur utilité dans les domaines de la lexicographie et de la « traductologie »

Jörn Albrecht (Université de Heidelberg)

Vendredi 17 juin 2005 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Depuis vingt-cinq ans, deux approches de la sémantique lexicale se livrent un combat acharné : d’une part, le modèle traditionnel des  » conditions nécessaires et suffisantes « , qui repose sur la logique classique  » aristotélicienne  » et sur une épistémologie de type rationaliste, d’autre part, la  » sémantique du prototype « , qui a ses origines dans la psychologie cognitive et dans l’épistémologie de type empiriste. A ces deux approches s’ajoute la  » sémantique du stéréotype  » de Hilary Putnam, ni logique, ni cognitive, mais plutôt  » pragmatique  » au sens du pragmatisme américain. Dans mon intervention, je tâcherai de monter que le combat entre les représentants des différentes positions est superflu : il ne s’agit pas de modèles vraiment antagonistes, mais d’approches complémentaires, dont les lexicographes et les traductologues peuvent s’inspirer avec profit.

 

Télécharger l’intervention de Jörn Albrecht (format PDF)

Séminaire ATILF

Les déterminants nominaux quantifieurs et la métaphore

Sarah Leroy (UMR CNRS 7114 MoDyCo, Paris X – Nanterre)

Vendredi 3 juin 2005 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Les noms les plus à même de construire des déterminants, dits « déterminants nominaux quantifieurs », sont les noms exprimant exclusivement la quantité : kilo (un kilo de farine), litre (un litre d’huile), heure (une heure d’anglais), etc. Mais de nombreux déterminants nominaux sont construits avec des noms non exclusivement quantifieurs : un tourbillon de fêtes, un camion de sable, un bâton de réglisse, une montagne de linge… Ces derniers déterminants nominaux, dont le nom n’est pas strictement quantifieur, sont souvent qualifiés de « métaphoriques ». Or il apparaît que cette étiquette recouvre des fonctionnements sémantiques en réalité assez différents les uns des autres ; une valise de billets est certes plutôt métonymique que métaphorique, mais une valise de soucis n’est pas exempt d’une certaine dimension métaphorique. Celle-ci n’est pourtant pas du même ordre que ce qu’on observe dans un carré de chocolat, un brin de fantaisie ou dans un torrent de larmes voire un torrent d’injures.
En fait, différentes relations métaphoriques sont en cause (quantification d’une notion non quantifiable, métaphore binominale d’identification), tandis que la valeur de quantification n’est pas toujours la plus saillante. En gardant toujours comme base de classement les différents types de noms utilisés, on proposera de classer les différentes réalisations de syntagmes Dét-N1-de-N2 selon qu’ils réalisent plutôt une opération de quantification ou une identification métaphorique.

Atelier de découverte ATILF

Analyse syntaxique et sémantique des verbes de communication (projet ILF)

Bernard Combettes et Sébastien Haton (ATILF)

Vendredi 13 mai 2005 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
"Les bases littéraires sont une inépuisable source de données linguistiques originales, parfois inattendues, toujours pertinentes. En partant du principe que les dictionnaires ou les exemples construits ne donnent pas une idée suffisamment précise du véritable potentiel de la langue, les membres du projet ILF "Transitivité" ont choisi FRANTEXT comme corpus de travail pour analyser le paradigme des verbes de parole, lesquels partagent tous le sème commun production de langage articulé humain.
L’analyse de ces verbes en contexte met en évidence qu’il n’est pas possible de les classer en vertu de la dichotomie transitifs versus intransitifs. Dans la réalité de la langue, la plupart des 900 verbes de parole analysés se comportent tantôt comme dire-transitif direct, tantôt comme parler-intransitif, ces deux verbes n’ayant eux-mêmes pas toujours un comportement "stable" en contexte. Bernard Combettes et Sébastien Haton animeront un exposé interactif et vous proposeront, le temps d’un séminaire, de vous glisser dans la peau d’un linguiste et d’effectuer avec eux le cheminement qui mène de l’élaboration des outils d’analyse à l’analyse des verbes de parole proprement dite. N’oubliez pas vos crayons !"

Séminaire ATILF

Tréma et néologie

Dominique Jacob (ATILF)

Vendredi 8 avril 2005 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Après être né au XVIe siècle et avoir connu son heure de gloire au XVIIe siècle, l’usage du tréma s’est grandement affaibli, les termes qui en étaient porteurs ont diminué à tel point qu’on peut s’interroger sur sa prochaine disparition au cours du siècle présent.
Mais, afin de mieux cerner une partie du problème, il faudrait savoir si de nouveaux mots ne sont pas en train de s’introduire dans la langue française. Depuis une vingtaine d’années, la lecture de la presse contemporaine nous a conduit à recueillir un certain nombre de mots trématés qui ne figurent pas le plus souvent dans les dictionnaires.
Voici quelques exemples suivants qui sont explicites dés le premier abord : colzaïculteur, euroïque, maoïstement, papaïser. D’autres sont plus énigmatiques. Savez-vous ce que signifie un quoïng, une cocoïste ou une joëlette ? Si vous connaissez les langues étrangères, vous saurez déchiffrer le daïkon, le sabaï-sabaï et le pulkaïste. Lorsque vous effectuez vos courses, peut être n’avez-vous pas prêté attention aux marques Baïmé, Caïro et Daï que vous glissez dans votre Caddie ?
Si leur nombre de ces mots est intéressant, les procédés de formation ne le sont pas moins, qu’il s’agisse de suffixation ou de dérivation. Nous aurons l’occasion de les étudier. Nous nous pencherons également sur les raisons de ces néologismes paradigmatiques ou syntagmatiques où l’humoristique loftoïevski côtoie le satirique derridadaïsme.
Alors le tréma de ces nouvelles créations sera-t-il éphémère ou durable ? Réponse le vendredi…

Atelier de découverte ATILF

Les locutions conjonctives temporelles: problèmes posés par l’approche historique (Projet Étude historique des «mots grammaticaux»)

Bernard Combettes et Annie Kuyumcuyan (ATILF)

Vendredi 1 avril 2005 | 10h30-12h00
ATILF Bâtiment CNRS, salle réunion 2ème étage

Atelier de découverte ATILF

La langue française du 14e au 16e siècle

Hiltrud Gerner, Gilles Souvay et al. (ATILF)

Vendredi 18 mars 2005 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Après une courte présentation des deux projets principaux, quelques membres de l’équipe exposent les différents aspects de leur travail en montrant à la fois la richesse du vocabulaire traité et les difficultés rencontrées qui nécessitent des recherches nombreuses et souvent complexes.
Quelques termes, illustrés par des miniatures, laissent entrevoir que la vie quotidienne de l’époque était somme toute assez proche de la nôtre.

Séminaire ATILF

Éléments de méthodologie pour l’étude littéraire assistée par ordinateur ou comment faire aimer l’ordinateur aux littéraires

Jean-Luc Benoit (ATILF)

Vendredi 4 mars 2005 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
L’ordinateur peut nous rendre des services pour l’étude littéraire à condition de définir des règles et des méthodes qui respectent les textes et la démarche critique. Est-il utile de rappeler que la condition première de l’étude littéraire est le respect philologique et le pari pour la recherche du sens s’appuyant notamment, mais pas seulement, sur le plan du texte ?
Allons plus loin. L’enrichissement des ressources textuelles pourrait inclure avec profit des données d’histoire littéraire contenant la chronologie des événements historiques, sociaux, politiques, économiques, la biographie des écrivains, la bibliographie, les courants littéraires, l’histoire de la culture et le mouvement des idées.
Les développements de l’informatique mettent à la disposition de tous des textes numérisés et des moyens d’informations et d’analyse puissants. Néanmoins, et plus que jamais, nous voulons souligner que le travail avec l’ordinateur n’est qu’une partie de cette démarche personnelle et toujours nouvelle qu’est la lecture. L’outil informatique n’intervient que pour aider à mettre en évidence puis à approfondir des éléments mis au jour par chaque lecteur.

Séminaire ATILF

Les constructions à verbe support avec « conseil » comme noyau (du type « demander, avoir, porter conseil« )

Lene Schøsler (Université de Copenhague)

Vendredi 25 février 2005 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Mes réflexions sur les verbes supports font partie d’une étude plus générale portant sur les constructions des verbes, l’objectif étant de décrire l’organisation et les multiples réorganisations de ces schémas du latin au français moderne tout en cherchant à en comprendre les motivations. Le but de ma présentation est de montrer la nécessité de travailler sur de vastes corpus comme celui d’ATILF, la BFM et Frantext pour bien décrire et pour essayer de comprendre l’évolution de la langue, en l’occurrence l’évolution des constructions verbales, illustrées surtout par le cas de conseil, noyau de cvsup. Plus concrètement, je me propose de décrire et d’expliquer des variations illustrées par les exemples suivants en les considérant par rapport au verbe simple conseiller :
a.  » Sire , fait il , il nos estuet bien conseil prendre et demender…  » (Renard 13e s., v. 1575 BFM)
b. et sur ce il en demandoit à avoir conseil et que on le conseillast loyaulment (Froissart, Chroniques III 1390, p. 106 ATILF)

Séminaire ATILF

La linguistique ne pourrait-elle pas servir à expliquer des processus d’acquisition ?

Emmanuelle Canut (ATILF)

Vendredi 18 février 2005 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Après un rapide détour historique pour situer la part de la linguistique dans l’étude du langage de l’enfant par rapport à la psychologie, nous exposerons les fondements d’une linguistique de l’acquisition dans laquelle s’inscrivent mes recherches. Tout en nous référant au champ de la psychologie sociale (Vygotsky 1934, Bruner 1983, Bronckart 1996), nous nous appuyons sur des travaux en linguistique de l’énonciation (Bakhtine 1929, Benveniste 1966), sociolinguistique de la variation (Gadet 1989, 1992, 1997), linguistique de corpus et syntaxe du français parlé (Biber 1988, Blanche-Benveniste 1997) pour considérer la langue, non comme un système homogène et stable, mais comme un ensemble de pratiques langagières où les modalités de l’oral et de l’écrit s’interpénètrent. Dans cette perspective, la linguistique des interactions (Kerbrat-Orecchioni 1990, Vion 1992) offre un cadre théorique de base à une observation du langage de l’enfant, et de celui qui lui est adressé, vu dans la variété de leurs pratiques. Pour rendre compte de la mise en fonctionnement du langage au cours du dialogue, nous procédons à des analyses qualitatives de corpus longitudinaux d’interactions individuelles entre un adulte et des enfants âgés de deux à sept ans en repérant dans les énoncés les reprises et tentatives de reprises par l’enfant de fonctionnements syntaxiques dans des interactions immédiates ou différées et leur évolution dans le temps. J’en donnerai quelques exemples. Pour pouvoir envisager de généraliser les résultats concernant la progression dans le processus d’appropriation des formes linguistiques jusqu’à leur stabilisation, des analyses quantitatives seraient maintenant nécessaires, mais elles posent un certain nombre de problèmes (telle l’analyse informatisée de corpus oraux) que je souhaiterais également soulever et discuter.

Séminaire ATILF

Marguerite Duras vue par la statistique lexicale

Véronique Montemont (ATILF)

Vendredi 4 février 2005 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Six textes de Marguerite Duras sont actuellement présents dans Frantext, et certains ont été écrits à plus de trente ans d’intervalle. D’Un barrage contre le Pacifique à L’Amant, cette étude se propose d’utiliser la statistique lexicale pour cerner plus précisément la manière dont a évolué le style durassien. En effet, la modification de la structure phrastique, qui va d’une phrase classique à une forme agrammaticale très étudiée, le rétrécissement des réseaux lexicaux, la prédominance de certaines catégories de mots sont des traits caractéristiques de l’écriture de cet auteur. Il peut donc être intéressant de comparer ce que la statistique nous dit de l’organisation syntaxique et sémantique des textes et la poétique, qui obéit à la même dynamique de resserrement, de répétition et d’anaphore.

 

Télécharger le diaporama du séminaire (format PDF)

Télécharger l’intervention de Véronique Montemont (format PDF)

Atelier de découverte ATILF

Initiation à l’étymologie à travers le projet TLF-Etym

Eva Buchi, Pascale Baudinot et Gilles Petrequin (ATILF)

Vendredi 21 janvier 2005 | 10h30-12h00
ATILF Bâtiment CNRS, salle réunion 2ème étage

Séminaire ATILF

Noms d’agents et noms d’instruments en -eur (-dor) dans la Galloromania

Franz Rainer (Université de sciences économiques et commerciales de Vienne, Autriche)

Vendredi 7 janvier 2005 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
C’est Meyer-Lübke, dans sa grammaire italienne de 1890, qui semble avoir lancé l’idée que le sens instrumental des successeurs romans de lat. -torem serait dû à une extension métaphorique (l’instrument vu comme agent). Depuis, cette idée semble être entrée dans le domaine commun. En ce qui concerne la Galloromania, elle a été adoptée, entre autres, par Baldinger qui, dans son essai de 1972 sur « Quelques problèmes de la suffixation dialectale », explique les formations instrumentales et locatives en -eur qu’on peut trouver dans certains dialectes du domaine d’oïl et en ancien français (ex. ovreor « ouvroir » chez Chrétien de Troyes) comme résultat d’un « changement de suffixe ». Dans ma conférence j’essaierai de montrer qu’il n’y a jamais eu, ni dans les dialectes d’oïl ni ailleurs dans la Romania, d’extension sémantique agent > instrument et que l’explication de Baldinger est donc intenable. Une explication alternative sera proposée.
La version écrite de cette conférence est parue dans la revue ‘Vox romanica’ 64 (2005), 121-140.

Historique 2004 des séminaires de l’ATILF

Atelier de découverte ATILF

Conception du réseau ATILF.FR : quels serveurs, quel type de réseau ?

Zina Tucsnak, William Sayer et Olivier Servas (ATILF)

Vendredi 17 décembre 2004 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Séminaire ATILF

Un projet de dictionnaire scientifique libre en ligne

Yannis Delmas-Rigoutsos (IUFM de Poitou-Charentes)

Vendredi 3 décembre 2004 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Ce projet est issu de plusieurs constats auxquels il entend s’efforcer d’apporter une réponse :
 
– L’offre de dictionnaires imprimés ou numériques est très insuffisante dans le domaine scientifique. Les termes et notions du niveau baccalauréat sont absents ou erronés.
 
– Des initiatives individuelles apparaissent sur Internet.
Leur contenu est parfois de bonne qualité mais il ne dispose jamais de caution scientifique.
 
– Le manque de culture scientifique et technique dans notre société a atteint un niveau dangereux.
Par ailleurs, les dictionnaires tant individuels qu’institutionnels ne sont plus adaptés aux formes modernes de recherche d’information.
Nous proposons donc une nouvelle manière de produire un dictionnaire, tant en termes d’organisation humaine, que d’organisation des données numériques ou que d’interface homme-machine. Nous insisterons, par ailleurs, sur l’importance des interfaces machine-machine.
En termes d’organisation des données, nous insisterons sur l’importance d’adhérer au cadre structurant, en cours d’établissement, du web sémantique.
Enfin, nous présenterons dans quelle mesure un tel cadre permet aux équipes de recherche qui le souhaitent de diffuser leurs résultats.

 

Télécharger l’article « Pour une conception réticulaire des dictionnaires » (format PDF)

Atelier de découverte ATILF

FEW

Jean-Paul Chauveau et Nadine Steinfeld (ATILF)

Vendredi 19 novembre 2004 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Séminaire ATILF

Dictionnaire des Notions Politiques et Sociales pour le collège et le lycée

Chrysta Pélissier et Henri-Claude Grégoire (ATILF)

Vendredi 5 novembre 2004 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Dans le cadre du projet DNPS (Dictionnaire des Notions Politiques et Sociales), nous travaillons sur la conception d’un dictionnaire des notions politiques et sociales destiné à favoriser l’apprentissage de l’éducation civique au collège et au lycée.
Au cours du séminaire, nous présenterons les grandes problématiques liées à la conception d’un tel dictionnaire sur support informatique, les premiers résultats liés à une comparaison entre le DNPS tel qu’il est actuellement envisagé et le DNPS tel qui pourrait être intéressant de le développer pour un tel public. Enfin, nous présenterons une première version d’un prototype du DNPS intéressant pour les lycéens dans le cadre de leur approche de l’éducation civique.

Séminaire ATILF

Segmentation automatique de documents

Stéphanie Audrit

Reconnaissance de la langue d’écriture d’un texte

Laurent Pierret

Vendredi 22 octobre 2004 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Séminaire ATILF

Les mots composés en allemand : du lexique au texte

Maurice Kauffer (ATILF)

Vendredi 8 octobre 2004 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Les mots composés allemands sont une des questions les plus spectaculaires et les plus difficiles de la langue allemande. Leur longueur, leur complexité et leur fréquence dans les textes effraient plus d’un germaniste, sans parler des non-germanistes… L’exposé sera centré sur une présentation des particularités et des principales difficultés méthodologiques de l’analyse des mots composés allemands, en particulier les problèmes de graphie, d’analyse sémantique, de compréhension. La dimension textuelle des composés sera également abordée: les mots composés contribuent-ils à la construction du texte ou est-ce l’inverse ? Les exemples et extraits sont tirés de la littérature, de la presse et des langues de spécialité.

 

Télécharger les actes du séminaire (format PDF)

Journées d’études

Acquisition du langage : quelles applications/implications sur le terrain ?

Comité d’organisation : Leroy Marie (Université Paris V), Godon Johanna (Université Paris 3), Canut Emmanuelle (Université Nancy 2), André Virginie (Université Nancy 2), Adami Hervé (Université Nancy 2)

Vendredi 17 et samedi 18 septembre 2004
Nancy | Campus Lettres et Sciences Humaines

Résumé
Organisées par l’ATILF CNRS – Université Nancy 2 en collaboration avec le Réseau Applications et Implications en Sciences du Langage (AISL) et le CRAPEL (laboratoire de l’UFR de Sciences du langage de l’Université Nancy 2)
Le travail du linguiste s’intéressant à l’acquisition du langage apporte un éclairage spécifique à l’étude de la mise en fonctionnement du langage oral et tente de répondre aux questions suivantes : comment l’enfant apprend-il sa (ou ses) langue(s) maternelle(s) ? Par quelles stratégies communicationnelles l’enfant s’approprie-t-il le langage ?
Quelles sont les caractéristiques linguistiques de cet apprentissage ? Quels sont les processus cognitivo-langagiers mis en œuvre…?
Le linguiste se préoccupe également de la question de l’acquisition du langage écrit (lecture et écriture) en rapport avec la maîtrise du langage oral dans le cadre :
– du premier apprentissage pour les enfants entrant à l’école élémentaire,
– d’un apprentissage tardif (enfants et adolescents nouveaux arrivants, par exemple),
– d’un réapprentissage (cas des adolescents en échec scolaire et des adultes illettrés).
Ces études s’appuient sur les connaissances et les avancées des travaux dans les différents domaines des sciences du langage : phonétique expérimentale, linguistique de l’énonciation, linguistique des interactions verbales, analyse du discours, sociolinguistique, linguistique de la variation, syntaxe du français parlé et écrit…, et elles prennent en compte les différents niveaux d’analyse linguistique, sans pour autant ignorer les aspects psychologiques et sociologiques de l’acquisition du langage oral et écrit.
Ces journées d’étude ont pour objectif une actualisation des connaissances sur les aspects linguistiques du processus d’acquisition du langage oral et écrit, en élargissant et en confrontant les résultats et les perspectives de recherche choisies avec les problématiques de terrain rencontrées par les professionnels de l’enfance (pédiatres, médecins de PMI, personnels de structures petite enfance, orthophonistes, psychomotriciens, psychologues, animateurs, éducateurs, pédagogues…), les éditeurs de littérature enfantine, ou encore les associations de lutte contre l’échec scolaire et l’illettrisme.
L’objectif sera de déterminer les retombées possibles pour les praticiens des connaissances issues de la recherche. Au-delà de la compréhension de l’apprentissage du langage oral et écrit, il s’agira de réfléchir à l’articulation entre théorie et pratique afin d’ouvrir des pistes de travail pour les praticiens et les chercheurs.

 

Programme et inscription

Séminaire ATILF

« Sémantique historique théorique et appliquée – le cas d’ancien français /jeu/ »

Thomas Städtler (Dictionnaire Etymologique de l’Ancien Français, Heidelberg)

Vendredi 10 septembre 2004 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Comme en français moderne, le mot jeu a déjà en ancien français un nombre considérable d’acceptions qui remontent, en partie, au latin, où jocus avait remplacé ludus en résorbant les valeurs de ce dernier. L’étude lexicologique que nous nous proposons a pour but d’établir une structure des significations de jeu qui tienne compte de certaines prémisses théoriques de la sémantique historique. Ainsi, on essayera, sur la base d’un choix de contextes de la littérature d’ancien français, de décrire et d’expliquer les changements des sens et le développement des emplois figurés et métonymiques.
« On lira les résultats des recherches présentées lors de cette conférence dans l’article jeu du DEAF (Dictionnaire Etymologique de l’Ancien Français, fascicule J2, parution printemps 2005). »

Séminaire ATILF

Les Atlas Sémantiques : un modèle pour la représentation du sens

Sabine Ploux (Institut des sciences cognitives, UMR 5015 CNRS-Université Lyon I)

Vendredi 18 juin 2004 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Dans cet exposé je présenterai les principes de la représentation spatiale du sens telle qu’elle est mise en œuvre dans les Atlas Sémantiques. Je montrerai comment le modèle peut être le support d’un calcul de l’appariement, entre deux langues, des valeurs sémantiques lexicales. Enfin, je présenterai les résultats obtenus par H. Ji sur la représentation du contenu des concepts à partir de relations de co-texte.

Séminaire ATILF

Quand le tréma se pose sur l’y …

Dominique Jacob (ATILF)

Vendredi 4 juin 2004 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
    Combien connaissez-vous de termes français comportant un y (i grec) porteur d’un tréma ? Deux, trois, ou quatre … en sollicitant quelque peu votre mémoire. C’est bien peu.
    Mais, au fait, aucun ouvrage grammatical, aucun dictionnaire ancien ou moderne ne mentionnent cette existence.
    Or la lettre y peut être couronnée d’un tréma. De nombreuses attestations manuscrites ou imprimées sont là pour le prouver. Dès le XVI° siècle (édition de Villon, 1532) et tout au long des époques suivantes jusqu’au XIX° siècle (Hugo). Mais quelle(s) signification(s) peut-on lui attribuer ? Comment comprendre ce phénomène ?
    Aussi bizarre que cela paraisse, cet état de choses orthoépique n’a pas disparu de nos jours. Il suffit, pour s’en convaincre, de consulter les journaux comportant notamment des patronymes, des lieux et des marques publicitaires.

Séminaire ATILF

« L’analyse de la conversation appliquée à un texte du 16e siècle : le cas du Tiers Livre de Rabelais »

Véronique Zaercher (Toul)

Vendredi 7 mai 2004 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Paru en 1546, soit une douzaine d’années après les deux premières chroniques, le Tiers Livre de Rabelais correspond au choix d’un nouveau genre, le dialogue, et à la production d’un ouvrage encore une fois complexe et protéiforme. Qu’il s’agisse de l’usage relativement fréquent de la narration, de l’agencement sériel des consultations ou du mélange de la comédie et de la philosophie selon la manière de Lucien de Samosate, ce long dialogue de Rabelais laisse apparaître à divers niveaux les marques de sa spécificité par rapport à la production de l’époque. Il se distingue aussi très nettement des autres chroniques (d’une part, Pantagruel et Gargantua publiés avant la date de 1546 ; d’autre part, le Quart Livre et le Cinquième Livre, ouvrages postérieurs, le second ayant été l’objet d’une publication posthume et faisant l’objet de controverses). Dans ce cadre constitué par le dialogue, nous nous proposons d’analyser quelques particularités significatives, présentes à l’intérieur des discours d’encadrement ou des modalités de l’interlocution du Tiers Livre, en les confrontant aux usages repérables dans le reste de l’oeuvre. Trois perspectives seront tout particulièrement privilégiées :
1) les verbes de locution et leurs variations sémantiques ;
2) la syntaxe d’un segment spécifique tel que l’incise ;
3) les interactions et les modalités d’agencement des répliques. En fonction du temps restant, nous nous interrogerons sur la pertinence qu’il pourrait y avoir à exploiter ces composantes textuelles pour évaluer l’authenticité du Cinquième Livre ou, en tout cas, la part qu’a pu avoir Rabelais dans sa rédaction.

Séminaire ATILF

Classes sémantiques de prédicats

Gaston Gross (LLI Paris)

Jeudi 22 avril 2004 | 14h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
La description des verbes, et en général des prédicats, pose des problèmes théoriques de divers ordres : comment décrire les arguments, comment rendre compte de l’actualisation, quels sont les autres paramètres d’analyse ? Ce travail de description doit être réalisé pour chaque prédicat, si l’on veut mettre au point des dictionnaires électroniques. Mais une observation empirique montre que certains d’entre eux ont des propriétés communes. Si celles-ci sont définitionnelles, il y a intérêt à regrouper en classes sémantiques l’ensemble des prédicats concernés. L’objet de l’exposé est de montrer comment on peut mettre au point des classes de cette nature. On prendra comme exemple les prédicats de « coups ».

Conférence

Sémantique textuelle appliquée : l’exemple de la plate-forme de détection PRINCIP (filtrage automatique des documents racistes et xénophobes sur Internet)

Mathieu Valette Centre de Recherche en Ingénierie Multilingue (CRIM) & Institut National des Langues et Civilisations Orientales (INaLCO), Paris

Mardi 20 avril 2004 | 14h00-16h00
Nancy | Campus Lettres et Sciences Humaines | Bâtiment B | Salle B10

Résumé
      La banalisation du document numérique constitue une opportunité pour les sciences du texte, tant en termes de prospection scientifique que de débouchés professionnels.
      Parmi les nouveaux champs d’investigation qui s’offrent aux linguistes, ceux liés à la gestion de l’information s’avèrent très prometteurs. Sur Internet en effet, la difficulté n’est pas de trouver de l’information, mais de trouver la bonne information. C’est donc l’établissement d’une problématique de l’interprétation automatique qu’on évaluera ici, en s’appuyant sur l’exemple de la plate-forme de détection de pages Web racistes PRINCIP.
      Dépassant les systèmes de filtrage automatique conventionnels basés sur des listes de mots-clés ou des annuaires d’adresses préétablies, peu efficaces et exigeant de fréquentes mises à jour, PRINCIP met en jeu une analyse linguistique globale, multicritère, et différentielle des documents reposant à la fois sur les propositions théoriques de la sémantique interprétative et sur les possibilités offertes par l’implémentation dans un système multi-agents.
      On exposera dans un premier temps les difficultés que posent les contenus à caractère idéologique en termes d’interprétation (automatique), les limites des méthodologies classiques appliquées à cette problématique (« Web sémantique », algorithmes) ; puis, on présentera quelques solutions apportées dans le cadre de PRINCIP.

Séminaire ATILF

Problèmes et méthodes de la dialectométrie (avec une présentation du logiciel VDM-Visual Dialectometry)

Hans Goebl (Université de Salzbourg)

Vendredi 2 avril 2004 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
      La dialectométrie (DM) telle que nous l’entendons et pratiquons depuis plus de deux décennies, est une discipline quantifiante dont la tâche est de déceler et d’analyser les  » structures de profondeur  » cachées dans la masse des données dialectales d’un atlas linguistique. Les méthodes-DM, définies et mises au point jusqu’au milieu des années 80 du siècle passé, ont servi de base, en 1999-2000, pour l’établissement d’un logiciel très puissant et rapide à la fois, conçu par Edgar Haimerl à Salzbourg au cours d’un stage de recherche de deux ans.
      Le but de mon intervention sera double : 1) de présenter les méthodes-DM les plus essentielles et d’en démontrer la raison d’être et l’utilité, 2) de présenter les résultats de plusieurs analyses-DM (effectuées sur les données d’un certain nombre d’atlas linguistiques : p. ex. de la France contemporaine et médiévale, de l’Italie, de l’Angleterre, des Pays Bas etc.)

Séminaire ATILF

Le Dictionnaire françois de Richelet (1680) : un illustre méconnu

Gilles Petrequin (ATILF)

Vendredi 19 mars 2004 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Le Dictionnaire françois de Richelet, paru à Genève en 1680, reste de nos jours un illustre méconnu. Certes reconnu depuis longtemps comme le premier dictionnaire entièrement monolingue en français, il n’a encore jamais fait l’objet d’une étude approfondie quant à son apport spécifique sur les divers champs informationnels qu’il aborde et par lesquels il se démarque souvent de ses concurrents par la richesse de son discours descriptif sur la langue du XVIIe siècle.
Notre recherche actuelle s’attache donc avant tout à mettre la première édition du Dictionnaire de Richelet en contextualisation, tant par rapport à ses sources littéraires, techniques ou grammaticales qu’à l’égard des autres dictionnaires de la fin du XVIIe siècle, en particulier le Furetière et le Dictionnaire de l’Académie dont l’élaboration fut contemporaine du Richelet même s’ils parurent une décennie après lui. Cette recherche sur l’édition de 1680 devra être à l’avenir prolongée dans plusieurs directions notamment en ce qui concerne la transformation et l’évolution du texte de l’ouvrage de 1680 lors de ses éditions successives, et en particulier à l’occasion de la réédition procurée par Richelet lui-même en 1693. Une étude menée sur les différentes éditions parues au XVIIIe siècle permettrait également de mieux cerner les enjeux lexicographiques et idéologiques qui opposaient le Richelet aux différentes autres entreprises éditoriales concurrentes de l’époque, le Furetière et le Trévoux notamment.
Le riche fonds de dictionnaires anciens de l’ATILF permettra de mener à bien cette enquête qui demanderait, pour être menée avec toute l’ampleur souhaitable, le concours de plusieurs chercheurs.

Séminaire ATILF

Plaidoyer pour une mise à jour permanente de la rubrique « Etymol. et hist. » des articles du TLFi

Eva Buchi (ATILF)

Vendredi 12 mars 2004 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
  Cette intervention postule qu’outre le fait d’envisager la mise à jour progressive du TLFi dans des termes de veille lexicale (enrichissement de la nomenclature), notre laboratoire se doit de mettre en chantier une réactualisation permanente de la rubrique étymologique et historique de cet ouvrage de référence en lexicologie française. Cette nécessité s’explique par trois constats :
  1) Le TLF (et donc le TLFi) contient à ce jour le dictionnaire historique du français moderne le plus fiable (« le trésor dans le Trésor »). Or la conservation de cette position de premier ordre dépend de notre aptitude à répercuter les résultats de la recherche étymologique et historique contemporaine dans les colonnes de cet opus magnum.
  2) L’ATILF adopte une position quelque peu schizophrénique en assurant une large diffusion à un TLFi représentant l’état de la recherche de 1971/1994, tout en réalisant en son sein des recherches étymologiques et historiques poussées qui en rendent les rubriques « Étymol. et Hist. » de plus en plus désuètes.
  3) Le passage du TLF au TLFi a constitué un immense pas en avant en raison des multiples possibilités d’interrogation qu’offre ce dernier. Or il s’agit à présent de profiter du second avantage que présente l’outil informatique sur l’outil papier : la facilité relative des corrections et mises à jour. Les retouches à apporter à la rubrique historique des articles du TLFi issues de recherches réalisées parmi nous sont nombreux. On peut citer par exemple :

  • Les antédatations relevées par l’équipe « Moyen français et français préclassique ». Ainsi pour adminicule (1555 > 1494/1498), arille (1808 > 1426) ou azimut (1544 > 1362)1.
  • Les étymologies corrigées dans la refonte du FEW : ainsi argent (représentant héréditaire analysé comme un emprunt au latin), autonomie (calque de l’anglais et de l’allemand à partir d’un hellénisme, analysé comme un hellénisme simple) ou loriot (occitanisme analysé comme une formation française).
  • Les étymologies revues dans le cadre de notre monographie sur les russismes romans : ainsi chaman (germanisme analysé comme un russisme), cosmonaute et maximalisme (russismes analysés comme des formations françaises) ou morse (latinisme analysé comme un russisme).

Par respect pour le texte original, nous ne proposons pas de modifier le contenu du TLF. Il s’agirait simplement de permettre aux lecteurs d’accéder par hypernavigation à une version remaniée de la rubrique « Étymol. et Hist. » qui tiendrait compte des résultats de la recherche actuelle, à commencer par celle qui se réalise à l’intérieur du laboratoire. Bien évidemment, notre propos ne revient pas à « prendre le TLF en défaut », selon l’expression de F. J. Hausmann (cf. ZFSL 102 [1992], 225-236), mais s’inscrit dans une démarche de maintien de l’excellence d’un des produits phares de notre laboratoire. La conférence sera suivie d’un débat animé par Jean-Marie Pierrel et auquel tout le monde est invité à participer.
1. Données amicalement mises à notre disposition par Hiltrud Gerner.

Séminaire ATILF

Le vocabulaire politique aux 14e et 15e siècles : Constitution d’un lexique ou émergence d’une science ?

Olivier Bertrand (Ecole Polytechnique et ATILF/CNRS)

Vendredi 5 mars 2004 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Lorsque les traducteurs de Charles V (1364-1380) se penchent sur les œuvres politiques de l’Antiquité et du moyen âge qu’ils traduisent laborieusement, ils ont conscience de créer un nouveau lexique mais prennent-ils bien la pleine mesure d’une émergence du fait politique comme entité constituée ? On sait qu’une grande partie du vocabulaire politique utilisé aujourd’hui en français fut créée aux 14e et 15e siècles par les traducteurs officiels du royaume. Cette période de l’histoire de la langue est-elle celle de la simple constitution d’un lexique qui s’étoffe peu à peu ou bien émerge-t-elle à la faveur d’une réelle conscience qu’avaient les souverains de construire une science de la politique ? La question soulevée ici est celle de l’émergence d’un lexique (celui du politique) et de son implication dans la société française à la fin du moyen âge : à la faveur des conflits tant politiques que théologiques entre papauté et royauté quant à la suprématie du pouvoir temporel, y a-t-il juste constitution d’un lexique spécialisé rendu possible par les nombreuses traductions commanditées par le roi de France ou bien mise en place d’une théorie (ou tentative de théorisation) de la politique qui s’installe, par le truchement du lexique, dans l’univers politique français ? Autrement dit, les nombreux néologismes dans le champ politique des 14e et 15e siècles s’inscrivent soit dans une production éparse de traduction des textes, soit dans une construction beaucoup plus élaborée d’une science naissante : la science politique. C’est à partir des préfaces des traducteurs, de leurs commentaires, des gloses, des textes historiques et des néologismes mêmes que nous tenterons d’évaluer si ce lexique politique naissant dépasse le cadre strictement linguistique.

Séminaire ATILF

Présence de la Lorraine dans la lexicographie française de l’Ancien Régime

Isabelle Turcan (ATILF)

Vendredi 20 février 2004 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
     Si nous nous intéressons à la présence de la Lorraine dans les dictionnaires de langue française imprimés sous l’Ancien Régime, c’est pour tenter de comprendre pourquoi le libraire nancéien, Pierre Antoine, a choisi de rééditer en Lorraine à Nancy, en 1734 puis de 1738 à 1742 et en 1752, le Dictionnaire Universel François et Latin dit de Trévoux car il fut imprimé dans cette petite ville de la Principauté de Dombes pour la première fois en 1704.
     Après avoir étudié dans quelle mesure la Lorraine fut présente, de façon modeste, dans les dictionnaires imprimés sous l’Ancien Régime avant la naissance du Dictionnaire […] de Trévoux, nous montrerons que c’est véritablement dans ce grand ensemble sériel imprimé à diverses reprises tout au long du XVIIIe siècle (1704-1771) que la Lorraine rayonnera, à divers titres, dans l’Europe francophone des Lumières, grâce à des rédacteurs et éditeurs qui ont osé entrer en concurrence avec le Dictionnaire de l’Académie française pour représenter l’usage réel d’une langue française enracinée dans une culture et ouverte au monde.

Séminaire ATILF

Le fabuleux destin du lexique français en judéoespagnol (en comparaison avec les gallicismes de l’espagnol standard)

Béatrice Schmid (Université de Bâle)

Vendredi 6 février 2004 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
     Le judéo-espagnol oriental, la variété de l’espagnol parlée et écrite dans les communautés séfarades de l’Empire Ottoman, vit son apogée au début du XXe siècle. La séfardophonie atteint alors, avec plus de 200’000 locuteurs, son point culminant, et la presse et la production littéraire séfarades vivent une prospérité impressionnante.
     Il s’agit, de plus, d’une époque de bouleversement culturel. Depuis le milieu du XIXe siècle, une modernisation et une ouverture vers le monde occidental se manifestent à une vitesse vertigineuse. En raison du prestige de la culture française et grâce au réseau d’écoles francophones établi par l’Alliance Israélite Universelle, les nouvelles idées et la vie moderne entrent dans le monde des séfarades avec un accent français, ce qui, naturellement, se fait remarquer aussi dans la langue. Au début du XXe siècle, la francisation linguistique parvient à un tel degré que Haïm V. Sephiha parle de « judéo-fragnol » pour désigner ce judéo-espagnol moderne.      L’influence française affecte tous les niveaux de la langue, pourtant c’est dans le lexique qu’elle est la plus évidente. La modernisation de la langue et l’élaboration des nouveaux registres langagiers s’accompagnent d’une occidentalisation ou « reromanisation » : non seulement le lexique français est la source principale pour l’enrichissement du vocabulaire, mais beaucoup de journalistes et d’écrivains font des efforts pour exterminer les turcismes et autres balkanismes en les remplaçant par des éléments provenant des langues occidentales « de la même mère », de préférence du français.
     La conférence vise à présenter les différents aspects de la pénétration des éléments français dans le lexique judéo-espagnol et de les comparer aux éléments que l’espagnol standard a empruntés au français au siècle des lumières.

Séminaire ATILF

L’Iconophore dans les dictionnaires français des XIXe et XXe siècles

Thora van Male (Institut d’Etudes Politiques de Grenoble)

Vendredi 23 janvier 2004 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
     Parallèlement au discours porté par son texte, le livre dictionnaire véhicule également un discours dans ses illustrations ornementales, qu’il s’agisse des ornements éditoriaux (tels qu’étudiés par Isabelle Turcan) ou du paratexte que constituent bandeaux, lettrines et culs de lampe dans le corps de l’ouvrage. À partir du XIXe siècle, grâce aux développements technologiques en matière de xylogravure et ensuite de lithographie, l’illustration prend une part de plus en plus active en lexicographie, sur les plans documentaire et ornemental.
     Si quelques chercheurs français (principalement François Corbin) travaillent sur l’illustration documentaire du dictionnaire moderne, l’ornement semble avoir été laissé pour compte. Or, il existe un gisement d’une richesse considérable et inexploitée dans ce domaine, particulièrement dans la période située entre 1830 et 1950. La lexicographie française de cette période a fait preuve d’une rare créativité sur le plan iconographique. Elle a produit un corpus d’illustrations que j’appelle iconophores (iconophore: image dont le premier trait pertinent est constitué par la lettre initiale du nom de son référent), sans égal dans la culture lexicographique de l’Occident moderne.
      Pour l’heure, seule à étudier systématiquement cette forme de paratexte lexicographique, il me semble souhaitable que ce vaste champ puisse être ouvert à d’autres chercheurs français et internationaux. Pour connaître les iconophores, ces illustrations lexicographiques qui me passionnent, consulter Le Monde2 du mois d’octobre.
     Extrait visible sur :

 

http://www-sciences-po.upmf-grenoble.fr/fr/doc/iconophore.htm

En savoir plus … (page personnelle de thora van Male)

Séminaire ATILF

Les structures du TLF

Ruth Radermacher (Université de Strasbourg)

Vendredi 9 janvier 2004 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
      Depuis quelques années, le TLF est complet, occupant plus d’un mètre sur les étagères des bibliothèques.  » Un grand dictionnaire de plus  » – se contentent de penser la plupart des linguistes.
      Ce projet de thèse, qui était au départ une enquête sur l’histoire du dictionnaire TLF, vise à faire ressortir les spécificités de cet ouvrage, notamment les progrès que l’équipe de Nancy a effectués dans différents domaines de la lexicographie. Une sorte d’exégèse du contenu nous paraît souhaitable, afin d’instruire les utilisateurs sur le profil particulier et les possibilités offertes par cet outil, d’éclairer les différentes options prises au sein de l’équipe et de montrer les apports et les limites de l’utilisation de l’informatique dans un projet lexicographique. On verra que le TLF se distingue nettement de ses homologues. Ce n’est donc pas un dictionnaire comme les autres.
      L’exposé s’articulera en trois parties. On commencera par une comparaison détaillée du TLF à son prédécesseur, le Dictionnaire alphabétique et analogique de la Langue Française. De toutes les caractéristiques révélées à travers cette approche, on n’approfondira que deux : la rubrique Etymologie et Histoire et les exemples.

Historique 2003 des séminaires de l’ATILF

Séminaire ATILF

Corpus électronique des plus anciens documents linguistiques de la France : le département de la Meuse

Anne-Christelle Matthey (Université de Zurich/FEW)

Vendredi 5 décembre 2003 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
     Cette communication présentera un travail de doctorat actuellement en cours qui s’insère dans un projet global d’édition des Plus Anciens Documents Linguistiques de la France. Ce vaste projet initié par Jacques Monfrin en 1967 a été repris par Françoise Vieillard, Olivier Guyotjeannin (tous deux Ecole Nationale des Chartes) ainsi que Martin-D. Glessgen (Université de Zürich), qui a déjà eu l’occasion de venir présenter l’avancement des travaux dans ce séminaire (cf. communication du 4 mai 2001). L’objectif de ce projet est double : il s’agit de préparer ces documents en ancienne langue pour une édition à la fois fiable et moderne. « Fiable » c’est-à-dire s’approchant le plus possible de l’original. « Moderne » parce que alliant une version traditionnelle imprimée et une version électronique. Tous les textes ainsi édités seront accompagnés d’une analyse linguistique complète ; autrement dit une analyse des particularités grapho-phonétiques, lexicologiques, morpho-syntaxiques et également onomastiques. Ma présentation dans ce séminaire se déroulera en trois temps :
1° Les 240 chartes du département de la Meuse (comprises entre 1226 et 1270).
2° Les derniers développements informatiques attachés au projet en général (critères d’édition, lemmatisation, interrogations linguistiques).
3° L’étude du phénomène de la préstandardisation du français, qui peut se dégager des résultats d’analyse linguistique (notamment lexicale) des chartes meusiennes.
« Une thématique similaire de celle abordée dans le cadre de ce Séminaire se trouve développée dans Matthey (Anne-Christelle), à paraître. « Corpus électronique des Plus Anciens Documents Linguistiques de la France: le cas du Département de la Meuse », in: Pusch (Claus D.)/Raible (Wolfgang) (éd.), Actes 2. Freiburger Arbeitstagung zur Romanistischen Korpuslinguistik (Université Albert-Ludwig Fribourg-en-Brisgau, 11-13 septembre 2003), Tübingen, Narr, 2005. »

Séminaire ATILF

La géographie linguistique : entre régularité et histoire

Marie-Guy Boutier (professeur à l’Université de Liège, directrice de l’Atlas linguistique de la Wallonie)

Vendredi 5 décembre 2003 | 10h30-12h00
Université de Nancy 2, Bâtiment B salle B10 (1° étage)

Résumé
     Qu’est-ce que la géographie linguistique ?
     Il nous semble qu’on peut la définir comme la plus « facile » et la plus « parlante » des disciplines relevant de la linguistique historique. C’est du moins ce que nous tenterons de montrer en partant de notre expérience concrète de rédactrice de l’Atlas linguistique de la Wallonie.
     Après avoir brièvement rappelé les fondements de la géolinguistique et quelques concepts traditionnels de cet art, puis présenté l’Atlas linguistique de la Wallonie et le mode particulier de rédaction de cet atlas (qui tient aussi du dictionnaire historique), nous expliciterons la façon dont nous concevons le travail (ou le jeu ?) du géolinguiste.
     Le géolinguiste manipule des objets linguistiques à la fois nombreux, homogènes, explicites et strictement attribués. Il construit grâce à eux des figures hiérarchisées (types) visant à rendre compte de leur organisation (régulière ou singulière) en même temps qu’à déceler des figures plus générales pouvant expliquer d’autres configurations d’objets analogues.
     Ces quelques principes et leur application concrète seront explicités grâce à la lecture de quelques cartes de l’ALW.

Séminaire ATILF

Déja comme mot du discours

Denis Paillard (Laboratoire LLF – UMR 7110, Université de Paris 7)

Vendredi 3 octobre 2003 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
     Les descriptions de déjà portent essentiellement sur ses emplois aspecto-temporels (cf. il est déjà parti, as-tu déjà mangé du caviar ?) même si l’existence d’emplois discursifs est largement reconnue (cf. quel est ton nom déjà ? …Déjà qu’il ne répond pas. Alors pourquoi veux-tu que….). L’exposé portera sur les emplois discursifs de déjà. Parmi les questions que soulèvent ces emplois, je discuterai en particulier des points suivants :
  – quels sont les critères qui permettent de distinguer déjà adverbe de déjà mot du discours ?
  – y a-t-il une sémantique commune à déjà adverbe et déjà mot du discours ?
  – comment définir la portée de déjà mot du discours ?
  – déjà mot du discours apparaît dans différentes positions : position initiale, position médiane, position finale. Quels sont les facteurs qui déterminent telle ou telle position ? Quels sont les effets de sens propres à telle ou telle position ?
  – déjà peut être en position détachée (à l’écrit entre virgules) ou non détachée (sans virgules), cette différence de ponctuation étant corrélée, à l’oral, à une différence intonative. On cherchera à montrer que cette différence a priori anodine, correspond en fait à une différence de portée. La description de déjà mot du discours sera faite dans le cadre du format de description élaborée dans le cadre d’un projet russe-français, dont je présenterai les principales notions (définition « en langue » des mots du discours, mise en évidence de deux sémantiques discursives : sémantique de la pertinence et sémantique de l’adéquation, reformulation discursive, polysémie des mots du discours) Ci-dessous on trouvera un tout premier corpus illustrant certains emplois de déjà.
  (1) Elle a d’autant moins d’excuses que déjà, en 66, juste avant Sedan, elle avait failli épouser un Hollandais, presque un Prusco.
  (2) Juin tirait à sa fin, et déjà il faisait sur Paris une chaleur accablante.
  (3) Le fioul n’a pas encore touché la première plage que déjà la machine judiciaire s’est mise en marche.
  (4) … Les petites virent leurs parents se diriger vers la chambre, et la peur leur glaça les joues, le nez et jusqu’aux oreilles. Déjà, ils touchaient le bouton de la porte, lorsqu’ils entendirent un sanglot derrière eux. C’était Marinette qui ne pouvait plus retenir ses larmes, tant elle avait de frayeur et de remords aussi.
  (5) Antonio toucha le chêne. Il écouta dans sa main le tremblement de l’arbre. C’était un vieux chêne plus gros qu’un homme de la montagne, mais il était à la belle pointe de l’île de Geais, juste dans la venue du courant, et, déjà, la moitié de ses racines sortaient de l’eau.
  (6) Il n’acheva pas sa phrase, car, déjà, l’homme ne l’écoutait plus.
  (7) Geneviève- dit-elle – cette vilaine pensée n’est pas digne de toi. Je suis sûre que déjà tu en as honte…
  (8) …Et puis tu vas être plongé jusqu’au cou dans la politique, tu n’auras plus une minute à toi. Déjà tu te plains de manquer de temps pour ton roman….
  (9) Allez vous en ! Déjà que vous avez perdu la guerre, vous n’allez pas nous faire tuer par dessus le marché.
  (10) C’est la première fois de ma vie que je dîne avec un comte. Vous êtes le comte comment déjà ?

Séminaire ATILF

TILT : Réalisations actuelles

Ann Pourchot et Stéphanie Biquillon

Vendredi 26 septembre 2003 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
     L’objet de ce séminaire est de présenter certaines réalisations effectuées par les intervenants dans le cadre du projet TILT (Trésor Informatisé de la Langue Technique) dont le laboratoire est partie prenante.
     TILT est mené dans le cadre du Programme Technolangue dont l’objectif est le développement, l’adaptation et l’intégration des outils logiciels linguistiques afin de traiter de gros volume de données, pour répondre aux nouveaux besoins de la société en matière de recherche d’informations.
     Le projet TILT vise à construire un corpus du français technique utilisé dans les normes AFNOR et d’aligner ce corpus sur son équivalent anglais, et à fournir les ressources indispensables au développement d’applications linguistiques ( assistance à la traduction, recherche d’informations, indexation, constitution automatique de résumé, …).
     Pour mener à bien ce projet, différentes tâches ont été effectuées.
     Dans un premier temps, nous avons été amenés à apporter une solution pour convertir des fichiers PDF au format XML. Nous avons donc mis en place une application automatisant cette conversion. Puis, nous avons évalué les résultats en sortie de conversion afin de valider les fichiers XML.
     Dans un deuxième temps, nous avons recherché un étiqueteur dans le cadre d’une demande de l’AFNOR. En effet, il est très important pour eux d’étiqueter les normes afin de permettre la recherche d’informations, l’indexation, etc.
     Enfin, nous avons effectué un re-balisage du format XML-AFNOR au format XML recommandé par la TEI.

Séminaire ATILF

Coup de projecteur sur le DNPS : dictionnaire et colloque

Danuta Bartol et Henri-Claude Grégoire (ATILF)

Vendredi 5 septembre 2003 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
    
Les 13/14/15 novembre prochains aura lieu, à Nancy, un colloque international sur le thème « Langues et sociétés de l’Europe moderne » organisé conjointement par Nancy 2 (H. Cl. Grégoire/D. Bartol) et l’ATILF. Il a pour but de mettre en lumière un projet de dictionnaire des notions politiques et sociales (le dnps). Le séminaire du 5 septembre, à l’ATILF (10h30), permettra aux gens du laboratoire de faire un peu mieux connaissance avec l’équipe du dnps et son projet de dictionnaire et de colloque.

Séminaire ATILF

Détection et correction des erreurs orthographiques des textes arabes non diacritisés

Achit Abdelmadjid (ATILF)

Vendredi 13 juin 2003 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
    La détection et la correction d’erreurs orthographiques est l’un des domaines d’application du TALN traitement automatique des langues naturelles les plus intéressants et les plus attrayants, du fait de l’intérêt croissant qu’on accorde à la qualité des textes que nous utilisons et manipulons quotidiennement dans nos administrations et dans nos correspondances personnelles. Aussi, cela est du au fait que ce genre de programme intervient dans un grand nombre d’applications. A titre d’exemple, dans les logiciels de traitement de textes, dans certains services de messageries électroniques intégrée au web dont l’exemple type est la messagerie du site www.yahoo.com qui offre la possibilité d’effectuer une vérification orthographique en ligne des textes des messages à envoyer.
    Le thème de mon stage au niveau du laboratoire ATILF Analyse et Traitement Informatique de la Langue Française, concerne le développement d’un détecteur / correcteur d’erreurs orthographiques pour des textes arabes non diacritisés. La détection se fera selon deux modes distincts et la correction nécessitera la coopération de l’utilisateur. Ce genre d’application peut s’avérer utile pour la vérification et l’évaluation de la qualité des ressources linguistiques textuelles arabes (corpus de textes) ou dans le contexte de la GED (Gestion Electronique des Documents) où on peut même songer à l’incorporer comme un module dans un logiciel intégré de GED. Et dans le cadre du projet du Trésor de la Langue Arabe TLA, on peut d’ores et déjà penser à l’utiliser comme outil ad hoc pour vérifier les textes non diacritisés saisis manuellement ou bien provenant d’une numérisation de documents papiers avec OCR arabe en vue d’être intégrés dans le TLA. Sachant entre autre, que ce genre d’applications peut traiter sous certaines conditions du texte français.
    L’étude conceptuelle a permis d’établir la possibilité d’envisager deux types d’applications:

  • Application locale
  • Application Web Server basée sur les scripts CGI (Common Gateway Script) sous Apache Sever
    qui conviendrait à un environnement Intranet / Internet.

    
Du point de vue implémentation, cela s’est concrétisé sous forme de deux applications l’une tournant en local et l’autre permettant pour le moment la détection des erreurs orthographiques en ligne au travers d’un formulaire.
    
Au cours de mon exposé, j’aurais à faire une brève présentation de ce qu’est le domaine du traitement automatique des langues naturelles TALN et en particulier le domaine de la détection/correction d’erreurs orthographiques et puis en second je parlerais de la langue arabe, de ses particularités et de l’analyse morphologique du lexique arabe. Ensuite, je présenterais l’étude conceptuelle de cette application et en dernier, je terminerais ma présentation avec une démonstration.

Séminaire ATILF

Les champs sémantiques multilingues unifiés

Sébastien Haton (ATILF)

Vendredi 6 juin 2003 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
     Notre problème est la constitution de lexiques multilingues complets illustrant la non bi-univocité des correspondances lexicales entre les langues. En effet, il est rare qu’à un terme en langue source corresponde une seule traduction en langue cible. Par surcroît, le décalage interlangue grandit de manière exponentielle à chaque ajout d’une langue dans l’étude.
     Comme lexie de référence, nous avons choisi le verbe français abandonner car il semble « faiblement » polysémique alors que le nombre de ses traductions est considérable. Pour leur recensement, nous utilisons la méthode de la fusion des données [cf. PLOUX, 1997] : en plus des traductions du verbe recueillies dans la partie français-langue cible des dictionnaires bilingues, nous avons récupéré les verbes en langue cible pour lesquels abandonner est une traduction proposée. Le recensement effectué, les traductions sont organisées dans un tableau en fonction de critères discriminatoires pertinents (des constructions syntaxiques aux variations contextuelles). Nous obtenons ainsi des micro-paradigmes de traduction pour chaque « sens » de la lexie.
     Un des constats majeurs de cette étude préliminaire est qu’il existe entre les emplois de la lexie d’origine et d’autres mots de la langue source des liens qui émergent via le paradigme de traductions. Or, ces nouveaux mots possèdent leurs propres paradigmes de traductions qui créent de nouveaux liens et ainsi de suite. Ce va-et-vient incessant rend rapidement impossible une approche séquentielle du problème. Aussi, il nous paraît nécessaire de représenter conjointement tous les emplois des lexies en langue source qui sont en relation avec la lexie à traduire. Ainsi, nous constituons un paradigme lexical autour de la notion d’abandon qu’il sera possible de confronter aux paradigmes de traductions. De même, chaque traduction proposée vient généralement « se positionner » sémantiquement entre deux lexies (ou davantage) dans la langue source, comme le font apparaître les dictionnaires bilingues que nous avons consultés.
     Pour représenter nos données, nous proposons la création de champs sémantiques multilingues unifiés, dirigés par un réseau qui fait apparaître les liens sémantiques entre les lexies d’une même langue autant qu’entre celles de langues différentes. Chaque unité du réseau est porteuse de ses propres informations linguistiques, tandis que les liens font apparaître les données qu’elle partage avec les autres unités auxquelles elle est reliée au sein du graphe.
     Ces champs permettront de construire des dictionnaires bilingues ou multilingues en utilisant n’importe quelle langue présente dans le graphe comme langue source. Elle donnera également accès au champ sémantique d’abandon sur des critères élargis et motivés.

Séminaire ATILF

Biconsonantisme et homonymie du lexique arabe

Youssef Ayache

Vendredi 16 mai 2003 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
     La recherche sur la bilitarité originelle du lexique arabe apporte un éclairage nouveau au problème endémique de l’homonymie des racines : dans l’hypothèse d’un état primitif de bilitarité (ou de biconsonantisme), la réductibilité des trilitères (et des quadrilitères) à des bases bilitères différentes fonctionnant comme des étymons semble constituer un critère “systématique” de séparation des homonymes.
     Je commencerai mon exposé en explicitant les notions de “racine” et de “famille de mots” dans le domaine arabo-sémitique, puis je présenterai de manière très succincte le cheminement et les résultats de la recherche sur la bilitarité, avant d’aborder, enfin, l’intérêt de ces résultats pour le traitement des homonymes en lexicographie arabe et pour l’élaboration d’une nouvelle nomenclature des racines.

Séminaire ATILF

Etude de graphes lexicaux à partir d’un dictionnaire électronique

Bernard Victorri et l’équipe LaTTICe

Jeudi 13 mars 2003 | 14h00-16h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Site de LaTTICe (Langues, Textes, Traitements Informatiques et Cognition) : http://www.lattice.ens.fr/

Séminaire ATILF

Extraction d’informations à partir du TLFi et modélisation d’informations lexicales

ATILF

Jeudi 13 mars 2003 | 10h00-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Séminaire ATILF

Calcul du sens d’unités polysémiques à l’aide de FRANTEXT

Bernard Victorri et l’équipe LaTTICe

Mercredi 12 mars 2003 | 15h00-17h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Site de LaTTICe (Langues, Textes, Traitements Informatiques et Cognition) : http://www.lattice.ens.fr/

Séminaire ATILF

La vision du monde de l’homme médiéval à partir de quelques mots et contextes d’ancien et de moyen français, confrontée aux connaissances actuelles

Hiltrud Gerner et Marc Chaussidon (ATILF)

Vendredi 7 mars 2003 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Dans une première partie, nous faisons le point sur le lexique de l’Astronomie (titre provisoire) : la motivation pour sa mise en chantier, son état actuel, son corpus, ses ressemblances et ses différences par rapport aux autres lexiques du Moyen Français avec une présentation de quelques articles relatifs aux sujets traités.
Dans la deuxième partie, nous proposons, à partir de quelques vedettes du lexique, une sélection thématique et illustrée d’exemples, que nous confrontons aux connaissances de notre époque telles qu’elles se présentent dans des ouvrages de vulgarisation scientifique et dans la base Frantext moderne. Les thèmes abordés sont : la terre – les planètes – les étoiles – les météorites ; ce dernier thème étant un pont vers la discipline de Marc Chaussidon (Centre de Recherches Pétrographiques et Géochimiques Nancy -UPR CNRS) qui interviendra ponctuellement pour donner le point de vue actuel des sciences de l’univers.

Séminaire ATILF

Analyse linguistique automatique des listes dans les documents structurés

Véronika Lux (ATILF)

Vendredi 28 février 2003 | 14h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Dans le TAL en analyse syntaxique, on considère classiquement la phrase comme unité privilégiée. Aussi, les listes sont-elles déroutantes pour un analyseur : souvent, ni la liste entière ni chacun de ses constituants pris séparément ne sont des phrases. Comme le montre l’exemple ci-dessous, la séquence introductrice d’une liste peut être une proposition syntaxiquement ; les éléments de liste peuvent être compléments de cette introduction, etc. Il vous suffit alors de :
1. placer un nouveau récipient sous le bec de la cuve,
2. procéder à un nettoyage rapide et automatique du panier.
Dans le contexte de documents structurés (e.g. XML, HTML) où les listes sont marquées avec un balisage particulier, nous avançons quelques propositions pour prendre en compte leurs particularités, afin d’en améliorer l’analyse syntaxique. Nous présentons la solution technique mise en œuvre avec les ressources disponibles au Centre de Recherche de Xerox (langage de transformation de structures et analyseur linguistique).

Séminaire ATILF

Base lemmatisée d’ancien français et Répertoire des formes graphiques occurrentes: histoire d’une fusion

Pierre Kunstmann (professeur à l’université d’Ottawa, responsable du laboratoire de français ancien)

Jeudi 20 février 2003 | 14h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Il s’agit de constituer une banque lexicale qui soit un répertoire, avec indice grammatical et références aux œuvres, des mots que présentent les textes d’ancien français. Rêve naguère chimérique, le projet est réalisable de nos jours avec l’appui de l’informatique, si l’on est prêt à y consacrer les moyens et le temps nécessaires. C’est le but que s’était proposé l’équipe du LFA, qui, à partir de textes numérisés (la base TFA, sur le serveur de l’ARTFL à Chicago), d’index lemmatisés, de dictionnaires de formes et de lemmes, avait entrepris d’organiser et de construire peu à peu une Base lemmatisée d’AF (BLAF), fichier (FileMaker) des formes graphiques occurrentes regroupées par vedettes pour faciliter la recherche sur le lexique (notamment sur l’évolution du vocabulaire par genre et par région), la graphématique et la morphologie du français des 12e et 13e siècles. Pour ce faire, le LFA avait adopté une politique de lemmatisation des principaux textes d’AF, à commencer par ceux du 12e siècle. Dans la base, chaque lemme serait accompagné de ses graphies, d’un indice grammatical et de la référence au texte; la base serait mise en relation avec l’ensemble de sous-bases que constituent les index lemmatisés d’œuvres particulières, où l’on peut trouver des informations plus détaillées. Depuis l’an dernier, le LFA s’est associé à une équipe allemande (M.-D. Glessgen, Strasbourg/Zurich; A. Stein, Stuttgart) qui avait conçu un projet voisin, à partir d’un corpus de chartes et visant à l’exploitation du corpus de textes littéraires constitué par A. Dees à Amsterdam. Les deux projets parallèles sont devenus un projet commun, dont le but est d’établir sur des fondements fermes et rigoureux un ensemble ordonné de formes lexicales, qui sera plus tard enrichi par apports successifs de façon à constituer une grande base des formes graphiques occurrentes de l’ancienne langue (à commencer par l’ancien français). Cet outil donnera une vue plus précise des masses lexicales, permettra aussi d’étudier la distribution des formes dans les textes particuliers et constituera un outil précieux pour tout futur dictionnaire alphabétique d’AF; il tracera une voie d’avenir pour la recherche sur le lexique (notamment sur l’évolution du vocabulaire par genre et par région), la graphématique et la morphologie du français antérieur à la Renaissance.
Post-scriptum : Le site du LFA se trouve à www.uottawa.ca/academic/arts/lfa On peut consulter le premier essai de la BLAF sur le site: direx.ca de la compagnie hulloise DIREX, qui en a conçu l’interface.

 

Télécharger la présentation des activités de recherche de Pierre Kunstmann (PDF)

son CV : http://www.uottawa.ca/academic/arts/lfa/chercheurs/kunstmann.html

Séminaire ATILF

MOSAÏQUE LORRAINE, Observation des patois lorrains romans à partir de quelques cartes de l’ALLR (Atlas linguistique et ethnographique de la Lorraine romane)

Claude Michel

Vendredi 7 février 2003 | 10h30-14h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
L’atlas lorrain roman est parmi les plus riches et les moins explorés des atlas régionaux, notamment du fait de la difficulté d’interprétation des données. La lecture et l’interprétation de quelques cartes phonétiques, morphologiques et lexicales issues de cet atlas permettra de montrer différents aspects de l’originalité de cette aire dialectale marginale, appuyée sur la frontière des parlers germaniques. Les influences y sont diverses et le territoire est une zone d’interpénétrations de toutes sortes, d’accueil d’innovations et de maintien d’archaïsmes permettant à cette aire de conserver une certaine originalité malgré les poussées des parlers de l’ouest, de l’est et bien sûr du français, présent depuis longtemps dans certaines parties de la région. Peut-on parler d’une aire dialectale lorraine au milieu de cette diversité et où parle-t-on le « patois lorrain » ?

Séminaire ATILF

Syntagmes à sens différentiel de la forme adjectif+nom ou nom+adjectif

Fabienne Baider

Vendredi 17 janvier 2003 | 10h30-14h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
     L’étude présentée porte sur les couples de la forme (nom+adjectif) ou (adjectif+nom) que l’on peut construire à partir des noms « homme » et « femme » et qui présentent un sens différentiel.
     Le point de départ est un corpus élaboré par Marina Yaguello contenant une dizaine de couples (nom, adjectif) tels que « femme légère »/ »homme léger », « femme honnête »/ »homme honnête ». Marina Yaguello (1978) a constaté que de tels syntagmes avaient un sens différentiel. L’axe de symétrie des sens de ces syntagmes correspondrait majoritairement à la distinction socioculturelle établie entre les référents « homme » et « femme ».
     La question creusée dans cet exposé concerne l’existence, l’origine et la formalisation éventuelle de ce sens différentiel. La méthodologie adoptée est basée sur la constitution et l’étude de corpus, essentiellement extraits de la base FRANTEXT et de dictionnaires en ligne. Les requêtes ont porté sur les noms « homme » et « femme », mais ont du être restreintes aux couples de la forme (homme+adjectif) et (femme+adjectif). La présentation se fera en cinq temps:

(a) l’établissement de l’existence effective de ce sens différentiel à partir d’un corpus d’occurrences en synchronie;
(b) l’évolution diachronique des adjectifs, constituant de ces syntagmes : une distinction semble devoir être établie entre les syntagmes pour lesquels le sens différentiel n’est apparu que progressivement (par exemple ceux formés avec l’adjectif « léger » chez Ronsard) et des syntagmes pour lesquels la différence existait déjà en latin (par exemple ceux formés avec l’adjectif public) ;
(c) le rôle de la syntaxe et notamment la question de l’ordre respectif du nom et de l’adjectif : la distinction sémantique parallèle à l’ordre de ces constituants semble avoir disparu au profit d’une distinction basée sur une distinction socioculturelle concernant le référent nominal (femme honnête/honnête femme) ;
(d) le degré de lexicalisation : aujourd’hui, la plupart des syntagmes de la forme (homme+adjectif) ou (femme+adjectif) évoqués par Marina Yaguello semblent fortement lexicalisés, une telle évolution pose la question de l’intérêt d’une modélisation dans le cadre l’approche compositionnelle du sens ;
(e) le rôle du socioculturel dans l’existence du sens différentiel constaté de ces syntagmes et sa formalisation: Rastier propose d’ajouter l’élément socioculturel de « faiblesse » dans le sémantisme du nom « femme » ; Comment une approche compositionnelle, par exemple modélisée dans le cadre du lexique génératif, pourrait tenir compte d’un tel constituant sémantique ?

Séminaire ATILF

De l’étude de la polysémie logique à un projet de recherche centré sur la sémantique lexicale et le traitement automatique des langues

Evelyne Jacquey (ATILF)

Vendredi 10 janvier 2003 | 10h30-14h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Le but de cette intervention est double.
1.Questions abordées durant le doctorat essentiellement et la méthodologie adoptée. Le domaine est celui de la sémantique lexicale dans le cadre du traitement automatique des langues. Le sujet d’étude est la polysémie logique, un cas particulier d’ambiguïté lexicale.

a.Propriétés L’ambiguïté lexicale se conçoit généralement pour des lexèmes affichant au moins deux sens « lexicaux » sémantiquement liés. Les lexèmes relevant de la polyémie logique, par exemple le mot « livre », possèdent aussi cette première propriété (le mot « livre » a au moins deux sens lexicaux : il dénote un contenu informationnel, « le dernier livre de Semprun », ou un objet physique, « le livre qui est dans mon sac »). Cette catégorie de d’ambiguïté lexicale possède deux propriétés supplémentaires. La première est la coprédication : plusieurs sens d’un lexème ambigu coopèrent dans une même phrase « j’ai le dernier livre de Semprun dans mon sac ». La seconde est la variation possible dans l’interprétation de la quantification : « j’ai relié tous les livres qui était dans mon sac » (« tous les » porte sur le sens physique de « livre ») ou « je n’ai traduit aucun des livres de Semprun » ("aucun des » porte sur le sens informationnel de « livre »).

b.Modélisation Les propriétés particulières des lexèmes relevant de la polysémie logique posent des questions spécifiques si l’on se place du point de vue du traitement automatique des langues : en particulier, la question du nombre d’objets désignés pour chacun des exemples quantifiés et la question de l’accès à ces objets via le contenu sémantique des lexèmes qui les désignent. Dans le cadre du doctorat, j’ai proposé une modélisation, utilisant des extensions du lambda-calcul simplement typé, pour représenter les calculs sémantiques en présence.

2.Travaux que j’aimerais mener au sein du laboratoire Ils resteront centrés sur l’étude et la modélisation en sémantique lexicale et traitement automatique des langues, mais ils vont diversifier, tant du point de vue des questions étudiées, que de celui des méthodologies adoptées. Par souci de concision, je n’en présenterai qu’un seul : vérification des propriétés des lexèmes relevant de la polysémie logique sur la base du TLFI et de FRANTEXT. J’essayerai de répondre à quelques questions qui me semblent fondamentales :

a.comparaison des trois propriétés attestées dans la littérature linguistique avec les définitions du TLFI
b.comparaison des trois propriétés attestées dans la littérature linguistique avec des corpus extraits de FRANTEXT
c.adéquation, extensions nécessaires ou infirmation de ces propriétés
Par ailleurs, je développe avec d’autres chercheurs divers travaux liés à la sémantique lexicale et la modélisation de ce type de connaissances dans le cadre du traitement automatique des langues.

d.sémantique lexicale, morphologie dérivationnelle et modélisation : soumission d’un article avec Fiammetta Namer à la conférence internationale « Représentations du sens linguistique », Montréal, mai 2002 et soumission d’un autre article au workshop international « Second International Workshop on Generative Lexicon », Genève, Avril 2002
e.sémantique lexicale et inférence en génération automatique de textes avec Claire Gardent : Groupe de travail GENI (travail sur les définitions extraites du TLFI pour quelques verbes de construction, collaboration possible avec Gérard Reb, coopération déjà avec Josette Lecomte pour les objets du TLFI et Gilles Souvay pour le tagger de Brill), Inférence pour la génération de réponse à des questions de compréhension et modélisation en sémantique plate du contenu des questions et des textes sur lesquels les questions sont posées.
f.sémantique lexicale et résolution d’anaphore avec Susanne Alt : constitution d’un corpus d’anaphores non directes et mettant en jeu un nom prédicatif ambigu entre un sens processif et un sens résultatif, évaluation de la pertinence du contenu sémantique d’un tel type de nom prédicatif pour faciliter la résolution de l’anaphore.

Historique 2002 des séminaires de l’ATILF

Séminaire ATILF

Grammaire du dictionnaire / dictionnaire de la grammaire: pour une nouvelle complémentarité conceptuelle

Gérard Reb (Université de Strasbourg)

Mardi 10 décembre 2002 | 14h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Principe: «l’aspect cognitif du langage, non seulement admet mais requiert, l’interprétation au moyen d’autres codes, c’est-à-dire la traduction» (Jakobson, 1963: 84)
Fil directeur: la formalisation de la grammaire et la formalisation du dictionnaire permettent la formalisation du sens.
Le problème: il importe de valider l’hypothèse que les langues naturelles sont «compilables»; et donc de construire une grammaire non contextuelle.

 

Télécharger l’intervention de Gérard Reb (format PDF)

Séminaire ATILF

Résumé automatique multilingue tenant compte de la thématique du texte

Abderrafih Lehmam (Pertinence Mining)

Vendredi 6 décembre 2002 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
La société de l’information apporte une extraordinaire abondance de textes informatisés et diffusables de manière instantanée et met à portée de tous l’accès à des données qui restaient inaccessibles, car n’étaient jamais publiées. La généralisation des micro ordinateurs dans les entreprises, dans les foyers, à l’école et à l’Université permet une formidable diffusion de connaissances. Les outils de résumé automatique de texte peuvent apporter une réponse efficace à l’acquisition et la gestion des connaissances. Nous présentons dans ce cadre, une description d’un outil de résumé appelé Pertinence qui a pour particularité de traiter six langues européennes et trois langues asiatiques tout en tenant compte de la couleur thématique du texte à résumer. Informatiquement réalisé en XML/JAVA, Pertinence se fonde exclusivement sur des techniques linguistiques (analyse du discours, morphologie, synonymie, terminologie).

 

http://www.pertinence.net/

Séminaire ATILF

Le dictionnaire, élément pivot, assistant l’homme dans le traitement de la langue

Michael Zock (Limsi-CNRS)

Lundi 25 novembre 2002 | 14h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
L’objectif de mon exposé sera de montrer ce qu’on peut faire à partir d’un dictionnaire électronique bien construit. Les applications discutées vont du plus simple (ne demandant pratiquement aucun travail de recherche supplémentaire) au plus compliqué (une grande partie du travail reste à faire). Les dictionnaires électroniques ont un potentiel considérable, potentiel largement sous-exploité à l’heure actuelle. En dotant ces dictionnaires de quelques fonctionnalités supplémentaires, nous pourrions assister l’homme de diverses manières: (a) l’aider à obtenir des renseignements sur un mot donné (traduction, sens, informations grammaticales); (b) l’aider à mémoriser les mots ou les structures fondamentales d’une langue; (c) l’aider à trouver le mot qu’il a sur le bout de la langue; etc. Une grande partie de l’exposé sera consacré à ce dernier problème.
Tout le monde s’est déjà trouvé dans la situation suivante : on cherche un mot (ou le nom d’une personne) que l’on connaît, sans être en mesure d’y accéder à temps. Les travaux des psychologues montrent que les personnes se trouvant dans cet état savent énormément de choses sur le mot recherché (sens, nombre de syllabes, etc.), et que le mot avec lequel ils le confondent lui ressemble étrangement (lettre ou son initial, catégorie syntaxique, champ sémantique, etc.). Par ailleurs, l’analyse des erreurs de discours spontané révèle que les mots sont stockés sous deux modes: par la forme (sons ou graphèmes) et par le sens. Ceci étant, on pourrait imaginer un programme tirant bénéfice de cet état de fait, afin d’assister un locuteur ou rédacteur à (re)trouver le mot qu’il a sur le bout de la langue.
Notre argument concernant l’accès par la forme est fondé sur l’hypothèse suivante : ce qui empêche d’accéder au mot recherché est une certaine ressemblance formelle (graphème ou phonème) avec le mot cible. Etant donné que celle-ci est souvent due à une confusion ou inversion de graphème(s) ou phonème(s), nous pouvons nous servir du même mécanisme en l’inversant pour (re)-trouver le mot que le producteur avait sur le bout de la langue : nous permutons des phonèmes ou des syllabes, puis nous sélectionnons les candidats vraisemblables. Tout en ayant quelques caractéristiques propres, la méthode utilisée est proche de celle utilisée pour la correction orthographique. Notre argument concernant l’accès par le sens est fondé sur l’idée que le dictionnaire mental est un vaste réseau dont les mots sont les nœuds et les liens les associations activées en les entendant (ou en les voyant). Retrouver un mot consisterait donc à entrer dans ce réseau, puis suivre les liens. Si l’accès par la forme est implémenté, l’accès par le sens reste à construire. Cependant, avant de se lancer il serait bon de trouver une réponse aux questions suivantes :

  • quels sont ces liens entre les mots ou concepts? Les inventaires existants sont très incomplèts.
  • parmi ces liens, lesquels sont les plus fréquemment utilisés par les êtres humains? En d’autres termes, quels liens faut-il mettre dans un dictionnaire?
  • peut-on automatiquement identifier la nature et la fréquence des liens? Autrement dit, est-il possible/raisonnable d’avoir recours à l’analyse de corpus?

 

Télécharger « L’ordinateur assistant l’être humain … » (format PDF)

Séminaire ATILF

Linguistique variationnelle historique et traitement informatique de textes: présentation d’une méthode d’analyse

Harald Völker (Université de Berlin)

Vendredi 8 novembre 2002 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Au cours de ces dix dernières années, la linguistique variationnelle a connu un grand succès dans le domaine de la linguistique contemporaine. Sachant qu’on a perdu non seulement une partie des sources textuelles, mais encore leurs situations d’énonciation et leurs contextes d’origine, la linguistique variationnelle doit surmonter davantage d’obstacles avant qu’elle puisse être utilisée pour l’analyse et l’interprétation de la variation typique des langues des siècles passés. À partir d’un corpus de chartes françaises du XIIIe siècle, Harald Völker se propose de présenter une méthode d’analyse qui parvient à distinguer d’une façon nouvelle les facteurs extra-linguistiques qui sont à l’origine des variations dans ces textes historiques en question.

 

Télécharger l’intervention de Harald Völker(format PDF)

Séminaire ATILF

L’anthroponymie en Lorraine

Aude Wirth (ATILF – CNRS / Université Nancy 2)

Vendredi 4 octobre 2002 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Contrairement à ce que pourrait laisser croire la multitude des publications (de qualité et d’intérêt très variables) sur le sujet, l’anthroponymie (étude des noms de personnes) est une science relativement jeune et qui n’a encore que peu retenu l’attention des linguistes.
Cette intervention se veut une introduction à cette discipline ; elle présentera de façon concrète les méthodes de travail et les différents outils de recherche sur les noms de personnes en s’appuyant sur des exemples tirés de documents originaux et inédits. A partir de ceux-ci seront ensuite esquissées les principales caractéristiques du système anthroponymique lorrain à travers le temps (noms uniques, doubles, triples, catégorisation, fixation en noms de famille, etc.) ainsi que les apports de cette science à d’autres disciplines, qu’elles soient linguistiques ou non.

Séminaire ATILF

L’intonation du français

François Lonchamp (ATILF – CNRS / Université Nancy 2)

Vendredi 4 septembre 2002 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Il est possible de prévoir de manière quasi-algorithmique l’intonation d’une phrase française canonique (sujet – verbe – complément(s) – circonstant(s) ) à valeur rhématique. Les principales étapes sont:
– création des mots prosodiques, composés d’un mot lexical (substantif, verbe, adjectif…) et du ou des mots grammaticaux qui le précèdent (déterminants, auxiliaire, prépositions …).
– création des groupes prosodiques, composés d’un ou plusieurs mots prosodiques, et obéissant à deux contraintes principales
1 – contrainte d’eurythmie: tous les groupes prosodiques doivent avoir un nombre de syllabes sensiblement égal, de l’ordre de 7 syllabes pour un débit modéré
2 – contrainte syntaxique: aucun groupe prosodique ne peut être constitué exclusivement d’un ‘frère droit’ et de son ‘oncle’ sur l’arbre syntaxique de la phrase
– Le dernier groupe reçoit une intonation terminale (contour de finalité), et les groupes qui précèdent un contour de continuation majeure. exemple : Il a décidé de passer son permis cet été mots prosodiques (il a décidé) (de passer) (son permis) (cet été) groupes prosodiques: la règle d’eurythmie suggère le découpage (il a décidé de passer) (son permis cet été), mais la règle syntaxique l’interdit car le second groupe est constitué exclusivement d’un ‘frère droit’ (complément du verbe ‘passer’) et son ‘oncle, le circonstant ‘en été’, ce qui impose le découpage non eurythmique (il a décidé) (de passer son permis) (cet été) Nous terminerons cet exposé par une revue rapide de quelques structures non canoniques: dislocation à gauche et à droite, présentatif, opposition thème-rhème.

Séminaire ATILF

Etude lexicale et modélisation de la polysémie verbale dans une perspective multilingue

Sébastien Haton (ATILF – CNRS / Université Nancy 2)

Vendredi 5 juillet 2002 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Dans un premier temps, notre recherche porte sur le recensement et l’analyse des éléments pertinents pour différencier chaque occurrence d’une unité verbale donnée en français. A la conclusion de cette étude préalable, nous proposons une relecture de la notion de polysémie qui dépasse largement le simple cadre définitoire et étymologique, afin de l’adapter à nos objectifs d’implémentation. Le but de ce travail est d’élaborer des modèles lexico-conceptuels susceptibles de faire le lien entre différentes langues (français, anglais, espagnol et italien) pour essayer d’améliorer les systèmes de traduction automatique.
La prise en compte initialement très large des facteurs jugés pertinents pour le passage d’une langue à l’autre nous oblige à réfléchir sur la nécessité de simplifier les modèles précités. Une des solutions envisagées consiste à intégrer les unités verbales dans un réseau sémantique multi-dimensionnel dont l’algorithme est essentiellement basé sur le calcul de la distance sémantique entre les mots ainsi que sur la mise en relation des traits implantés pour chacun d’entre eux. Nous montrerons comment cette méthode permet en apparence de régler le problème de non-parallélisme lexical entre les langues.

Séminaire ATILF

Les expressions verbales figées dans quatre variétés du français (Belgique, France, Québec, Suisse : projet « BFQS »)

Jean Klein (Université de Louvain-la-Neuve)

Vendredi 7 juin 2002 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Depuis un certain nombre d’années, dans le cadre théorique du lexique-grammaire, Maurice Gross et le Laboratoire d’Automatique Documentaire et Linguistique (LADL) se sont consacrés à l’analyse syntaxique des phrases simples du français, mais aussi des phrases idiomatiques. Le corpus des phrases figées représente, de nos jours, environ 40.000 items, du moins en ce qui concerne la variété "centrale" ou "standard" du français: le projet BFQS s’attache à décrire, en outre, les variantes régionales (hors de France) des expressions verbales figées, à savoir en français de Belgique, du Québec et de Suisse. Le projet, en cours de réalisation, et qui associe des chercheurs représentant les quatre variétés de français, s’assigne un triple objectif, en partant des tables syntaxiques établies au LADL pour le seul français de France:
1° déterminer les expressions communes aux quatre variétés, soit les expressions BFQS;
2° ajouter au corpus du français "standard" les expressions inusitées en France;
3° établir des sous-catégories d’expressions communes à certaines variétés (BF, BQ, BS, FS, FQ, BQS, etc), sans oublier la variété F ("francisme") à ne pas confondre avec le français "standard". Le but final du projet est de réaliser un dictionnaire (électronique et en version papier) des expressions verbales figées du français et d’en fournir une classification syntaxique.

Séminaire ATILF

L’édition d’un texte dialectal du XVIIIe siècle : problèmes lexicographiques

Fernand Carton (Université Nancy 2)

Vendredi 3 mai 2002 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Je termine l’édition des Vers naïfs en vray patois de Lille de Jacques Decottignies (1706-1762), qui sera publiée chez Champion (2002). C’est la première publication des oeuvres de cet auteur méconnu, fils du chansonnier lillois Brûle-Maison dont j’ai publié les oeuvres (1965), et qui a longtemps influencé la littérature dialectale du Nord. Il s’agit de l’édition diplomatique, avec glossaire, de 45 pièces (chroniques, chansons, pasquilles, stances etc…) à partir de sources dispersées : imprimés originaux, feuilles volantes, copies manuscrites inédites. Le vocabulaire en est très riche, notamment en matière de mercerie, de modes et d’ustensiles de ménage. Il est constitué de picard plus ou moins archaïque, d’argot et de poissard (parisien ?). Nous exposerons la manière dont nous avons abordé certains problèmes de signification et de datation (timbres des chansons, détails historiques…).

 

Télécharger le bon de commande de Vers naïfs, pasquilles et chansons en vrai patois de Lille (format DOC)

Séminaire ATILF

Informatiser un dictionnaire ancien, ou comment rétroconvertir un document structuralement chaotique: le cas du Dictionaire critique de la langue française de Jean-François Féraud (Marseille, Mossy 1787-1788, 3 vol.)

Fernand Carton (Université Nancy 2)

Vendredi 5 avril 2002 | 10h30-12h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Le Dictionnaire critique de la langue française est, dans la chaîne des dictionnaires français, un maillon important car il actualise vers 1780 les résultats du considérable effort critique effectué aussi bien par les lexicographes que par les remarqueurs et les grammairiens de la période classique. Actualiser, c’est-à-dire à la fois citer, corriger et compléter le travail de ses précédesseurs, y compris et surtout l’Académie française. Par rapport à ses contemporains, il se signale notamment par un souci de mise à jour de l’information linguistique tout à fait remarquable. Mais les innovations ne s’arrêtent pas là: réforme conséquente de l’orthographe, premier effort systématique de notation phonétique et prosodique, précision fine des restrictions de l’usage d’un signe, recherche d’une meilleure visualisation architecturale de l’article. Cela dit, son informatisation se heurte à un problème structural de fond: par sa genèse ( premier état en 1761 sous le titre Dictionnaire grammatical de la langue française; édition augmentée en 1768), le D.C. est une collection de remarques classées par ordre alphabétique. La composante définitionnelle n’apparaît que tardivement dans le projet, ce qui confère à ce répertoire un caractère chaotique. Toute tentative de décrire et de modéliser l’enchaînement des composants se heurte à la variété des réalisations et des syntaxes d’un composant. De plus la typographie offre notamment des cas de polysémie et d’homonymie qui empêchent la récupération optimale de l’information. Actuellement dans un état de saisie philologiquement propre au deux tiers ( la fin de l’opération de saisie-correction est prévue pour juillet 2002), le texte-machine doit ensuite subir un transcodage WPF – XML. Il sera d’abord empoigné par le logiciel PHILOLOGICA pour figurer sur le site Dictionnaires d’autrefois. Mais deux nouveautés devront être apportées à cette base pour qu’elle remplisse pleinement sa fonction: d’une part un travail de lemmatisation devrait permettre de faciliter les requêtes; d’autre part le volumineux supplément manuscrit devrait être offert à la consultation en ligne en offrant au lecteur la possibilité d’en consulter in situ une version finement scannée. C’est cette étape qui nécessite la collaboration de l’ATILF. Pour un premier tour d’horizon, consulter le premier état du site Féraud à l’adresse suivante: http://www.mshs.univ-poitiers.fr/feraud/feraud.htm Il offre notamment le renvoi au cahier de saisie et un premier état de description du dictionnaire. Fin de la proposition de séminaire.

Séminaire ATILF

Comment enrichir l’information phraséologique du TLF ?

Franz-Josef Hausmann (Université d’Erlangen)

Vendredi 8 mars 2002 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
La mise à jour du TLF devrait profiter de l’information cachée dans les profondeurs du dictionnaire. Celle-ci est immense. Certes, le TLFi permet à l’utilisateur averti d’aller chercher lui-même cette information, mais cette opération est souvent délicate ou laborieuse. Elle concerne en premier lieu les collocations cachées dans les articles des collocatifs et absentes des articles-bases, ensuite les locutions dont l’information est souvent éparpillée sur plusieurs articles – ou cruellement insuffisante, et pour finir, les bases d’allusion, en nombre insuffisant, mal accessibles et souvent absentes parce que nées avant 1789. Or, il faut reconnaître que telle citation célèbre de Molière (p. ex. "Cachez ce sein que je ne saurais voir") fait partie du français actuel.

Séminaire ATILF

Les grands dictionnaires de langue français, le TLF et ses contemporains : images, analyses et prospectives

Jean Pruvost (Université de Cergy-Pontoise)

Vendredi 11 janvier 2002 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
          Resituer les seize volumes du TLF dans le paysage lexicographique et dictionnairique de la seconde moitié du XXe siècle, en partant d’un regard comparatif et contrastif, tel pourrait être un premier objectif. On peut, au passage, prendre ainsi du recul sur les dynamiques qui étaient mises en présence, repérer plus précisément les types d’énergies privées et institutionnelles alors en œuvre dans des projets assez différents, avec des réceptions bien distinctes et des prolongements divers, voire contradictoires.
          Proposer ensuite, de manière volontairement imprudente, sans autocensure, diverses pistes pour continuer la magnifique entreprise représentée par le TLF pourrait constituer un second objectif. J’essaierai au passage de lister les attentes de tous les publics potentiels, qu’il s’agisse du dictionnaire papier, d’hier, ou du dictionnaire sur support électronique, d’aujourd’hui et de demain. Les perspectives sont ici à appréhender dans la double dimension, lexicographique et dictionnairique.
          Enfin, dans un troisième temps, en partant d’exemples concrets, je souhaiterais évoquer ce que j’ai dénommé " la triple investigation ", une sorte de preuve par neuf pour un dictionnaire de langue, et un type de mise en abyme, qui puisse permettre une exploitation encore plus efficace d’un grand dictionnaire de langue comme le TLF. Un propos un peu sibyllin que j’espère rendre clair lors de notre rencontre.
          Quelques ouvrages personnels ou dirigés qui pourront entre autres servir d’appui : Dictionnaires et nouvelles technologies (PUF, 2000) Les dictionnaires de langue française (PUF, Que sais-je ?) (à paraître en décembre) Les dictionnaires de langue française, Dictionnaires d’apprentissage, Dictionnaires spécialisés de la langue, Dictionnaires de spécialité (H. Champion, 2001)

Historique 2001 des séminaires de l’ATILF

Séminaire ATILF

Présentation de la théorie de la grammaticalisation et des recherches actuelles dans ce domaine

Bernard Combettes (ATILF)

Vendredi 7 décembre 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
– Les principales notions : réanalyse, analogie, "affaiblissement" sémantique
– Illustration par quelques exemples :
   + l’évolution des modalisateurs ("en principe", "de toutes façons")
   + l’évolution des introducteurs de topique ("pour ce qui regarde", "en ce qui concerne")

Séminaire ILD&ISTC

Gestion de données terminologiques

Alan Melby (Brigham Young University – Provo) et Kara Warburton IBM (Toronto)

Lundi 12 novembre 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle A008

Résumé
Alan Melby, professeur associé à la Brigham Young University (Provo), présentera le format TBX, adopté par l’industrie de la localisation pour la représentation de données terminologiques multilingues. Il montrera comment ce format est le fruit d’une évolution initié dans le cadre de la Text Encoding Initiative (TEI) et poursuivie au sein de l’ISO (ISO 12200, ISO 12620, ISO CD 16642). Il présentera un exemple d’utilisation de TBX ainsi que le type d’environnement nécessaire pour gérer et valider des données dans ce cadre.
Kara Warburton, terminologue à IBM (Toronto), présentera les différentes ressources terminologiques utilisées à IBM comme exemple des problèmes de gestion de données terminologiques en milieu industriel: glossaires unilingues traditionnels, bases de données terminologiques, lexiques bilingues pour la traduction , et listes de termes préscrits, parmi d’autres. Elle démontrera les stratégies possibles pour adapter une base de données terminologiques aux besoins de différents utilisateurs et elle abordera quelques problèmes de compatibilité entre les données lexicographiques et les données terminographiques.

 

14h00-15h00 | Alan Melby – Formats normalisés de terminologie pour l’industrie de la localisation
15h00-15h20 | discussion
15h20-15h30 | Pause
15h30-16h30 | Kara Warburton – Gestion des thésaurus et terminologie dans un grand groupe industriel : le cas d’IBM
16h30-17h00 | Discussion

Séminaire ATILF

De l’universel à la langue et retour par les choses dans la lexicographie française (1798-1890)

Jacques-Philippe Saint-Gérand (ATILF)

Vendredi 26 octobre 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Depuis l’article de d’Alembert dans l’Encyclopédie du XVIIIe siècle , le dictionnaire de choses et le dictionnaire de langue apparaissent comme deux objets que distinguent leur choix dans la nomenclature et leur dessein, c’est-à-dire leur objectif définitoire. Mais au XIXe siècle, cette distinction de principe tend à perdre dans les faits de sa pertinence théorique – si tant est qu’elle en ait eu une – principalement en raison du retour inattendu de la notion d’universel que la lexicographie du XVIIe siècle, puis celle du XVIIIe siècle débutant, avaient pourtant largement sollicitée. Mais cette résurgence d’un semblable prédicat n’est en aucune manière reprise à l’identique de cette notion. C’est ainsi que sous l’étiquetage des signes de langue fluctuent les limites formelles et substantielles des représentations de la réalité produites par l’esprit rationnel. De même que la notion de grammaire générale qui se dessine au milieu du siècle de Girault-Duvivier, de Napoléon Landais ou de Célestin Ayer n’a plus rien en commun avec celle qu’envisageait Port-Royal en 1660, de même les dictionnaires universels qui vont se multiplier à l’époque des Bescherelle, Poitevin ou Larousse ne répondent-ils plus que partiellement aux desseins définis par leurs prédécesseurs de l’âge classique.
Les titres associent volontiers désormais les deux déterminations d’universel et de langue, dans un souci évident de brouiller cette distinction de la langue et des choses au profit de la seule exhibition de nomenclatures toutes plus exhaustives les unes que les autres, ou souhaitant tout du moins l’être… Cette distinction méthodologique, que nos collègues d’outre-Rhin résument dans l’expression de Wörter und Sachen, pose en effet la question du rapport chronologique de l’une à l’autre. La langue et les mots préexistent-ils aux choses qu’ils vont servir à définir, ou, inversement, est-ce l’existence empiriquement constatée des choses qui justifie la production d’entités lexicales spécialement conformées à leur désignation ?
Pour certains lexicographes, il s’agit d’exposer par là une ambition nominaliste, dont la finalité est celle de permettre à l’utilisateur d’embrasser la totalité du monde en projetant sur l’infini de sa diversité les rets d’un lexique qui lui soit co-extensif. Illusion, prétention, utopie, aveuglement ? peut-être… Restent les témoignages de Boiste (1800 – 1857), Rolland (1812), Gattel (1812 – 1841), Rochette (1819), Nodier et Verger (1826), Raymond (1829), de Poitevin même en 1856, jusqu’au Grand Dictionnaire universel du XIXe siècle de Pierre Larousse (1866-1876)…
Pour les autres, la précision de dictionnaire de langue française, venant appuyer en sous-titre l’intitulé Dictionnaire universel, suffit à exposer sinon à justifier l’idée selon laquelle les mots, singulièrement en français, constituent des nomenclatures capables d’épuiser la richesse du monde empirique.
Le projet présenté ici voudrait définir la place du concept d’universalité dans le dictionnaire de langue français du XIXe siècle, et son rapport au type du dictionnaire général. La langue française, par sa nature – ce que les prédécesseurs nommaient son génie – est-elle apte à embrasser toute la diversité de cet universel que les progrès du monde contemporain ne cessent d’étendre à l’infini ? Autrement dit, le dictionnaire universel est-il destiné à rassembler la langue de tous, ou est-il un outil dont la finalité est de propager un lexique unique et de délimiter un lexique unique qui exprimerait toute la langue ? L’universalisation lexicale est-elle alors conçue comme un fait de diffusion d’un lexique modélisé, ou comme le processus de fusion d’un nombre indéfini de lexiques particuliers ? Sommes-nous alors en présence d’une démultiplication ou d’une somme de lexiques ?
Voilà qui nous renvoie à la distinction jadis énoncée par Alain Rey entre fonction normative et fonction descriptive des dictionnaires. Cette répartition des fonctions jette une lumière neuve sur l’opposition théorétique de d’Alembert entre les dictionnaires de choses et les dictionnaires de langue ; mais elle ne résout pas la difficulté que constitue dans ce panorama l’irruption du prédicat universel. Bernard Quemada a d’ailleurs noté cette aporie de la description en soulignant que c’est la qualification problématique d’universel qui a justement permis à d’Alembert de formuler historiquement l’opposition qui le rendit célèbre : " introduite en France par Furetière, la dénomination de dictionnaire universel rallia le plus grand nombre d’adhésions dans la mesure où elle impliquait une nomenclature étendue. Elle fut utilisée par tous les types de contenus lexicographiques, plus particulièrement au XVIIIe siècle pour les dictionnaires de termes techniques dont le vocabulaire connaissait une extension jusque là sans exemple " (p. 165)…
On voit ici le poids accordé à la question de l’extension de la nomenclature dans la définition du dictionnaire universel. La fin du XVIIIe siècle et les premières années du XIXe, seraient-elles donc le moment d’une succession typologique définie de façon fonctionnelle, ou bien devrions-nous considérer qu’il s’agit là d’une évolution terminologique recouvrant des réalités complexes et imbriquées mettant en relation le langage, la pensée du langage et l’univers extra-linguistique ? Est-il alors pertinent de situer l’universalité du seul côté de l’extension de la nomenclature ? Et ne serait-il pas plus judicieux d’envisager plutôt la question du côté de la destination du dictionnaire et des réponses métalexicographiques qu’il propose ? La masse documentaire à traiter ici, fournie par le seul XIXe siècle saisi dans une définition extensive, est abondante et l’on commencera dans ce séminaire à en examiner les premières caractéristiques.

Séminaire ATILF

Présentation de ses orientations de recherche

Susanne Alt-Salmon (ATILF)

Vendredi 12 octobre 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Ce séminaire sera consacré à une présentation de mes travaux et intérêts de recherche dans le but de faciliter le contact avec mes nouveaux collègues de l’ATILF. Mon exposé aura pour fil rouge le problème de l’interprétation référentielle en langue naturelle : par référence, j’entendrai la façon dont un interlocuteur identifie, à partir d’une expression linguistique (pro)nominale, l’entité extralinguistique en question. Je présenterai un modèle de la référence qui part de l’hypothèse que toute expression référentielle s’interprète dans un contexte limité – son domaine de référence – à l’intérieur duquel elle identifie son référent sur des caractéristiques propres à sa détermination (indéfini, défini, pronom…) et à la sémantique de ses composantes. A partir du travail effectué jusque là, je présenterai quelques unes des mes perspectives de recherche, en mettant l’accent sur celles susceptibles d’impliquer mes collègues de l’ATILF.

Séminaire ATILF

Du nom de famille au surnom, du surnom au lexème. Ou l’inverse. L’aventure lexicographique du projet PatRom

Jean Germain (Université de Louvain-la-Neuve)

Vendredi 5 octobre 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Les noms de famille peuvent-ils apporter quelque chose à la lexicographie, à la parémiologie, voire à la sémantique ? Ainsi pourrait se résumer l’objet de cet exposé profitant de l’expérience récente du projet PatRom. Pour rappel, celui-ci vise à établir un dictionnaire historique et génétique de l’anthroponymie d’origine lexicale des divers pays de langues romanes. A travers quelques exemples choisis, de quelques itinéraires étymologiques vécus, on tâchera de baliser le parcours méthodologique qui vise à établir une recherche anthroponymique non plus hasardeuse mais reposant sur les bases les plus rigoureuses possibles.

 

Titres de références :

  • Kremer (Dieter) (coord.), 1997. Dictionnaire historique de l’anthroponymie romane (PatRom). Présentation d’un projet, Tübingen, Niemeyer.
  • Cano González (Ana María)/Germain (Jean)/Kremer (Dieter) (éd.), 2004. Dictionnaire historique de l’anthroponymie romane. Patronymica Romanica
    (PatRom). Volume II/1. L’Homme et les parties du corps humain (première partie), Tübingen, Niemeyer (il reste cinq volumes à paraître)

Séminaire ATILF

Le Dictionnaire des gallicismes de l’espagnol et les bases de données textuelles en langue espagnole

André Thibault (Université de Strasbourg)

Vendredi 7 septembre 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
La lexicographie de langue espagnole, qui accuse un fort retard face à celle du monde francophone, dispose depuis quelques années de nouveaux instruments de recherche qui permettront à ceux qui veulent bien s’en donner la peine d’améliorer substantiellement l’état de nos connaissances sur l’histoire du lexique castillan. De nombreux cédéroms mettent aujourd’hui à notre disposition des masses considérables de textes, littéraires ou non, interrogeables grâce à des logiciels de recherche plus ou moins performants ; en outre, le site internet de la Real Academia Española met gratuitement à la disposition des chercheurs du monde entier deux banques de textes, l’une diachronique (des débuts de la langue à 1975 – CORDE) et l’autre synchronique (de 1975 à nos jours – CREA), ainsi que la totalité du texte des 21 éditions de son dictionnaire. Nous essaierons de présenter en temps réel le fonctionnement de ces nouveaux instruments informatiques, en illustrant la démarche à partir d’exemples tirés de notre futur "Dictionnaire des gallicismes de l’espagnol".

 

Télécharger l’exposé d’André Thibault (format PDF)

Soutenance de DEA

La négation en patois lorrains de Meurthe et Moselle et des Vosges, dimensions morpho-syntaxiques.

Christelle Millot

Vendredi 29 juin 2001 – 10h00
Nancy | Campus Lettres et Sciences Humaines | LANDISCO

Séminaire ATILF

La représentation du français à la lumière de la notion de « patrimoine linguistique » : le cas du Québec

Claude Poirier (Trésor de la langue française au Québec)

Mardi 12 juin 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Le français du Québec a une réputation d’"enfant terrible" au sein de la francophonie. Les Québécois se distinguent nettement des autres francophones quand on considère l’écart entre leur façon de parler et la norme parisienne. Pourtant, ils semblent trouver plaisir à donner mauvaise conscience à la France quand il est question de fierté de la langue, de lutte contre l’anglicisation, ou encore de féminisation.
Par ailleurs, l’apparente assurance que paraissent traduire chez les Québécois leurs productions artistiques et même lexicographiques a comme contrepartie une indécision chronique concernant les choix normatifs et une inquiétude quant à la survie de leur langue en Amérique du Nord. Cette conférence posera comme hypothèse que cette situation complexe découle d’une méconnaissance de l’histoire du français québécois, ce qui engendre une analyse erronée de la nature de cette variété. Le français du Québec est-il un rameau du français, comme on l’a proclamé, ou un rejeton? Adopter la seconde hypothèse, comme le fera le conférencier, c’est ouvrir des perspectives nouvelles pour ce qui est de la représentation qu’on peut se faire de ce français d’Amérique, et peut-être aussi quant aux orientations à privilégier pour l’avenir du français comme langue internationale.

 

http://www.tlfq.ulaval.ca

Séminaire ATILF

Le Dictionnaire des régionalismes du français ou la fin d’un dialogue de sourds

Pierre Rézeau (ATILF)

Vendredi 8 juin 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Dans la liste des ouvrages mis à contribution par le Dictionnaire des régionalismes de France (De Boeck/Duculot, 2001), le corpus lexicographique est d’une importance particulière : d’une part, les dictionnaires de la langue générale, d’autre part les dictionnaires, glossaires, études intéressant le français d’une région ou d’une ville.
Or la pratique et la confrontation de ces deux ensembles amènent vite à constater le manque flagrant de dialogue entre eux. Il devient non moins évident que : la prise en compte des standards de la lexicographie générale doit être un principe de base de la lexicographie différentielle (dans le choix de la nomenclature, dans l’élaboration des définitions, dans l’indication des marques d’usage) ;
les dictionnaires généraux ont beaucoup à puiser dans les travaux de lexicographie différentielle pour améliorer leur description du français (définition, aire géographique, exemplification, histoire).
À l’aide de nombreux exemples, on montrera comment le Dictionnaire des régionalismes de France, fruit d’une double pratique lexicographique (générale et différentielle), a su faire dialoguer ces deux ensembles au bénéfice d’une meilleure description du français.

 

Télécharger l’article de Pierre Rézeau « Le Dictionnaire des régionalismes de France (DRF), mode d’emploi » (format PDF)

Séminaire ILD&ISTC

Le temps en lambda-DRT typée

Pascal Amsili (TALANA, Paris 7)

Jeudi 7 juin 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Résumé
La DRT s’est longtemps vu reprocher de ne pas être compositionnelle, et différentes propositions se sont faites jour pour rendre le processus de construction de DRS compositionnel. La lambda-DRT proposée par (Asher, 93) répond à cet objectif, à condition toutefois qu’on munisse le calcul d’un système de types qui permette (1) de représenter certaines informations dans les DRS en pendant la construction, et (2) de contrôler les bêta-réductions (Amsili & Hathout, 98). C’est cette "lambda-DRT typée" que je présenterai pendant cet exposé, d’abord en termes généraux, et ensuite en l’appliquant à la construction de DRS temporalisées.

Séminaire ILD&ISTC

Une grammaire d’unification d’arbres pour une analyse topologique de l’allemand

Kim Gerdes (LATTICE, Université de Paris 7)

Jeudi 31 mai 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Résumé
La structure syntagmatique contient deux sortes d’information linguistique : l’information sur la sous-catégorisation et l’information sur l’ordre de mots. Dans les langues à cas, contrairement aux langues anglo-romanes, la sous-catégorisation verbale est déterminée par le marquage casuel et l’ordre de mots détient une fonction communicative. Il s’impose de séparer la sous-catégorisation et l’ordre de mots en deux niveaux d’analyse linguistique.
Je formalise un concept traditionnel en linguistique germanique, le modèle topologique, dans lequel les mots sont placés dans des séquences préfigurées de cases, qui peuvent être emboîtées les unes dans les autres. Nous appelons la structure résultante une hiérarchie de domaines topologiques. Cette structure de domaines peut être vue comme arbre syntagmatique représentant exclusivement l’ordre et le groupement de mots, fournissant ainsi des interfaces naturelles avec la structure prosodique et avec la structure communicative (travail en collaboration avec Sylvain Kahane).
Je m’intéresse à modéliser le lien entre la sous-catégorisation, que je représente dans un arbre de dépendance syntaxique, et l’arbre topologique dans un formalisme d’arbres lexicalisés. Le formalisme de grammaire d’arbres adjoints (TAG), construisant une structure syntagmatique habituelle, n’est pas suffisamment puissant pour représenter le modèle topologique. Il faudra aussi permettre, de manière restreinte, la sister adjunction et l’éclatement d’une entrée lexicale en plusieurs arbres (TAG ensembliste). Le résultat est un formalisme d’unification d’arbres qui permet facilement d’obtenir tous les ordres de mots possibles et leurs structures topologiques pour un arbre de dépendance (arbre de dérivation) donné. La complexité de l’algorithme d’ analyse est d’ordre O(n3+2k), n étant le nombre de mot, et k le nombre de noeuds mis en jeux dans une configuration non-projective.

Séminaire ILD&ISTC

Un modèle théorique d’inférence de structures sémantiques et discursives dans le cadre de la génération automatique de textes

Laurent Roussarie (LATTICE, Université de Paris 7)

Jeudi 17 mai 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Séminaire ATILF

L’édition électronique et l’analyse linguistique de sources documentaires françaises du Moyen Âge à l’aide du langage script TUSTEP

Martin Glessgen (Université Marc Bloch, Strasbourg)

Vendredi 4 mai 2001 | 11h00-12h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Le projet s’appuie sur un corpus de documents non-littéraires en ancien français. Le noyau de textes actuellement à l’étude pour une édition (combinée papier et électronique, avec l’établissement d’un glossaire) est un ensemble de chartes du XIIIe siècle conservées aux A.D. de la Meurthe-et-Moselle, publiées sous forme dactylographiée par Michel Arnod en 1974. Cette édition s’inscrira dans le cadre de la collection des " Plus anciens documents linguistiques de la France " dirigée par Françoise Vieillard et Olivier Guyotjeannin et servira de modèle pour les futurs volumes de la collection. La base de données qui se constitue peu à peu, s’enrichit dès maintenant d’autres textes en ancien et moyen français, appartenant à des genres variés (scientifique, narratif ou poétique) et reproduits d’après des manuscrits.
M. Gleßgen présentera l’état d’avancement des travaux : structuration du balisage, routines d’édition et d’interrogation lexicologique (et graphématique). Par ailleurs, il essaiera de décrire les objectifs d’histoire linguistique qui ont déterminé les choix des textes et des méthodes : les chartes, textes originaux, doivent permettre d’établir, au moins en partie, le réseau des scriptoria de la France médiévale. Celui-ci pourra servir à son tour de référence pour l’étude de textes littéraires d’ancien et de moyen français : il est important d’identifier la place qu’occupe un témoin textuel dans le diasystème historique selon des paramètres d’espace, de temps, de prestige social et de fonctions communicatives.
Enfin, M. Gleßgen présentera brièvement le langage script TUSTEP à l’aide duquel les programmes sont élaborés. L’exposé conduira à une réflexion sur les problèmes méthodologiques sensibles que soulève, à l’heure actuelle, la linguistique de corpus dans l’historiographie linguistique et sur le niveau d’exigence qu’elle doit atteindre : la conservation de données à long terme, la transparence de l’encodage et l’élaboration d’une épistémologie pour cette nouvelle discipline.

Séminaire ILD&ISTC

Quelle est la nature des objets lexicaux auxquels s’appliquent les opérations morphologiques ?

Françoise Kerlevoux

Jeudi 26 avril 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Séminaire ILD&ISTC

Alexandre Dikovsky (IRIN, Université de Nantes)

Jeudi 19 avril 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Résumé
Le traitement des syntagmes discontinus est un problème linguistique classique qui est un des problèmes difficiles des théories syntaxiques. Un syntagme discontinu est composé des unités lexicales plus ou moins éloignées dans l’énoncé. En Français les plus connus sont : la mise en relief : "ces poissons, le mazout les a tués tous" les clitiques pronominaux : "je l’y trouve contraire" les déplacement d’un groupe nominal : "et de cette journée il grava à jamais le souvenir dans sa mémoire" etc.
Lors de l’analyse syntaxique, la discontinuité détruit le principe de programmation dynamique qui est à la base de tous les algorithmes polynômiaux d’analyse. Elle pose aussi problème de l’interprétation sémantique car la structure syntaxique rompue n’est pas bien adaptée aux définitions récursives compositionnelles.
Il existe plusieurs solutions partielles de ce problème : une approche transformationnelle, une approche, basée sur le contrôle de la montée des groupes dans les arbres syntaxiques, une approche logique basée sur le calcul des séquents avec la commutativité ponctuelle, etc. Aucune ne donne de solution véritablement efficace en terme de complexité. Nous proposons une nouvelle approche à ce problème en termes de dépendances syntaxiques locales et explicites, et de valences (positives pour les gouverneurs, et négatives pour les dépendants). La saturation des valences correspond à l’établissement de dépendances longues discontinues.
Nous trouvons des critères de décidabilité d’une telle saturation élégants de point de vue mathématique, simples à réaliser et qui s’accordent bien avec la complexité réelle de déplacement des constituants dans les langues naturelles.

Séminaire ILD&ISTC

Synoterm : un outil d’aide a l’acquisition de relations sémantiques spécialisées a partir de ressources lexicales

Thierry Hamon (Université de Villetaneuse)

Jeudi 29 mars 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Résumé
De nombreuses applications dans les domaines de spécialité exploitent des terminologies. Constituer ces ressources nécessite d’identifier les termes du domaine, et de les structurer en les mettant en relation. La synonymie est précieuse pour le terminologue qui doit isoler le terme vedette de ses variantes sémantiques. Nous nous sommes intéressé à l’acquisition de cette relation sur des corpus spécialisés. Dans notre outil d’aide à la structuration de terminologie (SynoTerm), des règles exploitent des informations sémantiques extraites de ressources de nature différente pour inférer des relations entre termes complexes. Celles-ci sont ensuite validées par un terminologue. L’implémentation de ces règles soulevant des problèmes d’optimisation, nous proposons une représentation des termes dans un graphe. Des algorithmes efficaces permettent d’obtenir des temps de calcul adaptés aux contraintes de la structuration d’une terminologie. L’exploitation de ressources lexicales dans des conditions réelles nous a permis de caractériser l’apport des ressources générales et l’intérêt de les combiner à des données très spécialisées. Nous proposons une présentation structurée des résultats pour guider le travail de validation du terminologue et des critères évaluant de multiples paramètres, les mesures de précision et de rappel reflétant imparfaitement l’avis des terminologues.

Séminaire ILD&ISTC

Construire une unité lexicale : plus qu’une simple question de forme

Georgette Dal (UMR 8528  » SILEX  » et GDR 2220, CNRS & Un. Lille 3)

Jeudi 22 mars 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Résumé
Cette intervention, intitulée " Construire une unité lexicale : plus qu’une simple question de forme ", se propose de montrer que les opérations linguistiques régissant la construction des unités lexicales construites ne se limitent pas à de simples mises en relation de catégories lexicales. Dans un premier temps, je ferai en effet apparaître que les contraintes à l’¦uvre dans la construction des unités lexicales construites sont avant tout sémantiques, et que les autres types de contraintes (formelles et catégorielles) sont pour la plupart consécutives de ces contraintes sémantiques fondamentales.
Dans un second temps, j’exposerai dans ses grandes lignes le projet MorTAL mené avec Nabil Hathout, Chritian Jacquemin et Fiammetta Namer, et dont la partie émergée est une base de données constructionnelles enrichies d’informations sémantiques.
Dans un dernier temps, je montrerai comment le TAL peut tirer bénéfice d’une telle appréhension des phénomènes constructionnels.

Séminaire ILD&ISTC

MAT – A Machine Aided Translation System

Dr. K. Narayana Murthy (Dept. of Computer and Info. Sciences, University of Hyderabad)

Mercredi 14 mars 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle A006

Résumé
This talk is about a Machine Aided Translation system called MAT. MAT was developed originally for translating between English and Indian languages but the technology can be extended for other languages as well.
MAT is a parser based translating system – it works at sentence level, not word by word. MAT uses the UCSG (Universal Clause Structure Grammar) parsing system developed at the University of Hyderabad, India. A quick overview of UCSG parsing system will be included here for completeness. MAT is intended to assist human translators in primarily two ways. Firstly, it generates raw translations quickly. Secondly, it provides many useful tools such as on-line dictionaries, thesaurus, morphological analyser and generator, and a variety of post editing tools. The talk includes a quick view of these tools using examples.

Séminaire ILD&ISTC

Modélisation de la langue par une correspondance sens-textes

Sylvain Kahane (LATTICE, Université Paris 7)

Jeudi 8 mars 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Résumé
La présentation débutera par une introduction à la théorie Sens-Texte, une théorie linguistique basée sur la dépendance développée depuis 40 ans par Igor Mel’cuk. Nous comparerons la formalisation usuelle de la TST (grammaires de correspondance) avec une formalisation de type grammaire d’unification inspirée à la fois de HPSG et des grammaires de combinaison d’arbres à la TAG. Dans une deuxième partie, nous intéresserons à la lexicalisation de la grammaire. Nous montrerons qu’une grammaire complètement lexicalisée peut facilement être obtenue par combinaison de règles non lexicales et que différentes lexicalisations sont possibles selon la façon dont on répartit les informations linguistiques entre les unités lexicales. Nous effectuerons une comparaison détaillée avec les TAG lexicalisées et la méta-grammaire de Candito.

Conférence U.F.R. de langues et littératures étrangères

Übersetzung und Linguistik im engeren Sinne. Quasi una fantasia

Jörn Albrecht (directeur de l’Institut de Traduction et d’Interprétariat de l’Université de Heidelberg, R.F.A.)

Jeudi 22 février 2001 | 18h00
Nancy | Campus Lettres et Sciences Humaines | Bâtiment B | salle B 10

Résumé

Exposé en allemand.

Conférence U.F.R. de langues et littératures étrangères

La formation des traducteurs dans les instituts universitaires en Allemagne et ailleurs

Jörn Albrecht (directeur de l’Institut de Traduction et d’Interprétariat de l’Université de Heidelberg, R.F.A.)

Jeudi 22 février 2001 | 16h15
Nancy | Campus Lettres et Sciences Humaines | Bâtiment B | salle B 10

Résumé

Exposé en français.

Séminaire ILD&ISTC

Une analyse thématique fondée sur l’amorçage

Olivier Ferret (CEA Saclay DTI/SIIA/GPST)

Jeudi 22 février 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Résumé
L’analyse thématique est une étape importante pour de nombreuses applications en traitement automatique des langues et en recherche d’information, telles que le résumé ou l’extraction d’information par exemple. Elle ne peut être réalisée pleinement sur le plan fonctionnel et avec une bonne précision qu’en exploitant une source de connaissances structurées sur les thèmes, laquelle est difficile à constituer à une large échelle. Nous proposons de résoudre ce problème par un principe d’amorçage : une première analyse thématique, fondée sur l’utilisation d’une source de connaissances faiblement structurée mais relativement aisée à construire, un réseau de collocations, permet d’apprendre de façon incrémentale et non supervisée des représentations explicites de thèmes, appelées signatures thématiques. Ces dernières sont ensuite utilisées pour mettre en oeuvre une seconde analyse thématique, plus précise, plus complète et plus fiable.

Séminaire ILD&ISTC

Méthodologie informatique des produits de l’INaLF

Jacques Dendien (ATILF, ex INaLF-Nancy)

Jeudi 11 janvier 2001 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Résumé
Les produits de l’INaLF sont réalisés grâce à une boîte à outils (Stella) qui offre les services suivants :
1) outils divers : gestion des expressions régulières étendues, tris par B-arbres, conjugaison et fléchissement des mots de la langue française, lemmatisation, etc.
2) Interfaces WWW : gestion automatique de la notion de session et des espaces disque serveur associés, collecte de formulaires, menus déroulants à base de technologie Java, etc.
3) Système de gestion de bases textuelles structurées : fabrication de bases à compacité optimale, fonctions d’accès aux objets atomiques (mots), fabrication d’objets textuels arbitrairement complexes et de leurs moteurs de recherche, compilateur de langage de requête et de grammaires formelles.
Compte tenu du volume de cet ensemble, seuls seront présentés les caractéristiques les plus saillantes du point 3 :
– Indexation des objets atomiques et fonctions d’accès : la méthode d’indexation présentée est mathématiquement optimale et génère des index hyper-compacts gage de hautes performances.
– Théorie des objets textuels complexes et des moteurs de recherche : cette théorie propose une formulation mathématique des objets textuels et des moteurs de recherche. En dépit de son apparente simplicité, elle débouche sur la possibilité de combiner les objets textuels entre eux pour aboutir à des objets d’une complexité arbitrairement élevé dont le moteur de recherche est automatiquement disponible.
Cette théorie débouche également sur son implémentation informatique (les différentes classes d’objets textuels) permettant de créer un univers indéfiniment extensible, par la réalisation de nouvelles classes conformes à un modèle abstrait (notion de d’objet textuel natif). Elle permet également d’introduire du " savoir linguistique " à différents niveaux (adjonction de constructeurs à des classes existantes, réalisation de " classes savantes ", mise en oeuvre des grammaires formelles).

Historique 2000 des séminaires de l’ATILF

Séminaire ILD&ISTC

Présentation des produits de l’INaLF

Jacques Dendien (ATILF, ex INaLF-Nancy)

Jeudi 14 décembre 2000 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Résumé
Présentation des produits suivants : Dictionnaire de l’Académie française, huitième édition (1935) et neuvième édition (en cours de parution). Démonstration de l’hypernavigation entre ces deux éditions. Le Trésor de la Langue Française Informatisé (TLFI) : ce grand dictionnaire en 16 volumes a été totalement structuré à l’aide de balises textuelles identifiant à la fois les différents types d’objets objets rencontrés dans le TLF (définitions, exemples, syntagmes, indicateurs de domaine technique, etc.) et la structure hiérarchique des articles. Cette structuration permet à l’utilisateur de faire des recherches mettant en jeu plusieurs objets textuels dont il peut préciser le type, le contenu textuel, ainsi que les contraintes hiérarchiques liant les objets. Les différents modes d’interrogation du TLFI seront présentés, ainsi que l’hypernavigation à l’intérieur du TLFI ou vers les dictionnaires de l’Académie. Frantext. Cette base textuelle comprend un corpus de plus d’un milliard de caractères (textes littéraires intégraux). Elle offre un certain nombre de services qui seront présentés. Le service le plus remarquable est de mettre à disposition un langage de requêtes très poussé auquel l’utilisateur peut apporter ses propres extensions (grammaires formelles), permettant ainsi d’aborder des classes de problèmes non traités par les autres systèmes de bases textuelles. Frantext catégorisé : Cette base est une sous-partie de Frantext, constitués de 501 romans prétraités par l’assignateur de catégories grammaticales réalisé à l’INaLF. Dans cette base, le langage de requêtes ainsi que les grammaires définies par l’utilisateur on reçu d’importantes extensions permettant d’interroger à la fois sur les mots et sur les catégories grammaticales.

Les mardis de l’INaLF

Le webcourrier : nouvelle messagerie sur la toile

Zina Tucsnak (ATILF, ex INaLF-Nancy)

Mardi 12 décembre 2000 | 13h15
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Rappel des concepts et protocoles d’Internet. Le fonctionnement et les protocoles du courrier électronique. Présentation générale des nouveaux concepts du serveur de courrier de notre Laboratoire accessible sur la toile, permettant ainsi un accès itinérant pour chacun d’entre nous, sans aucun paramétrage. La mise en oeuvre du nouveau serveur(l’utilisation de l’interface web) Suggestions et remarques.

Séminaire ILD&ISTC

Dépendance, précedence et contraintes

Denys Duchier (Université de Sarrebrück)

Jeudi 7 décembre 2000 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Résumé

Les langues, comme l’Allemand, où l’ordre des mots est relativement libre posent des problèmes aux approches basées sur les grammaires syntagmatiques. Les grammaires de dépendance qui ne font pas d’hypothèse de projectivité offrent une alternative séduisante qui permet de rendre compte plus directement et simplement de ces structures syntaxiques. Néanmoins elles posent deux défis:
(1) le traitement efficace de l’analyse syntaxique
(2) l’expression des contraintes sur l’ordre des mots
Je présente une approche basée sur les contraintes qui aborde ces deux points. La première partie publiée à MOL6 formule une caractérisation axiomatique formelle des arbres syntaxiques admissibles. Cette formulation possède également une lecture en tant que programme par contraintes pour laquelle on obtient une implantation efficace basée sur la propagation des contraintes. Cette formulation ignore l’ordre des mots.
La seconde partie est un travail en cours et propose une infrastructure formelle qui permet de construire une structure arborescente semi-ordonnée parallèle à la précédente et qui impose un ordre partiel sur les mots. Ces deux structures sont mutuellement contraignantes: nous appelons la première l’arbre de dépendance (ID tree), et la seconde, l’arbre de précédence (LP tree). Elles sont duales, ont des formulation similaires, et sont traitées par les mêmes techniques de propagation des contraintes. J’illustrerai cette approche en montrant son application au traitement du complexe verbal en Allemand.
Une implantation prototype a été réalisée en collaboration avec Ralf Debusmann dans le language Oz de programmation par contraintes concurrentes.

 

http://www.ps.uni-sb.de/~duchier/

Les mardis de l’INaLF

Lexicographie bilingue des « mots de la communication »

René Métrich et Eugène Faucher (Université de Nancy 2)

Mardi 28 novembre 2000 | 13h15
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Séminaire ILD&ISTC

Robust Extraction of Grammatical Relations

John Carroll (University of Sussex)

Jeudi 23 novembre 2000 | 14h00
Vandoeuvre-les-Nancy | LORIA | salle B013

Résumé

Grammatical relations constitute a level of linguistic representation – intermediate between traditional syntax and semantics – that has been found to be useful in applications such as information extraction and multilingual information retrieval. I describe a system for high coverage, accurate extraction of grammatical relations from unrestricted English text, and discuss a number of linguistic application systems (including anaphor resolution, word-sense disambiguation, and subcategorisation extraction) that I and others have recently developed that make use of these extracted relations.

Information

Réunion d’information et discussion

Jean-Marie Pierrel (ATILF, ex INaLF-Nancy)

Mercredi 8 novembre 2000 | 14h00
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
1. Des projets dans le cadre du réseau Grand Est des Sciences Cognitives
2. Le projet ILD&ISTC du plan Etat – Région
3. le projet de CNRT en "ingénierie educative"

Les mardis de l’INaLF

La catégorisation des textes

Jacques Maucourt (INaLF)

Mardi 24 octobre 2000 | 13h15
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Démonstration

Présentation du TLFi

Pascale Bernard (INaLF)

Mercredi 4 octobre 2000 | 14h30
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Les mardis de l’INaLF

Les dictionnaires d’autrefois

Chantal Finlay et Zina Tucsnak (INaLF)

Mardi 5 juillet 2000 | 13h15
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Les mardis de l’INaLF

Le féminin n’est pas neutre

Marie-Josèphe Mathieu (INaLF)

Mardi 20 juin 2000 | 13h15
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Les mardis de l’INaLF

PatRom : une méthodologie

Eva Buchi et Carole Champy (INaLF)

Mardi 16 mai 2000 | 13h15
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Les mardis de l’INaLF

Les matériaux d’origine inconnue du FEW

Jean-Paul Chauveau (INaLF)

Mardi 11 avril 2000 | 13h15
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Les mardis de l’INaLF

Extension du féminin en français. Les incertitudes de la langue

Nicole Cholewka

Mardi 28 mars 2000 | 13h15
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Résumé
Nicole Cholewka nous présentera la communication qu’elle a faite dans le cadre de la table ronde : Extension du féminin en français. Les incertitudes de la langue, qui s’est tenue à l’INaLF-Paris le jeudi 16 mars : L’assassine est zinzine ; féminin et familier : quelques aspects

Les mardis de l’INaLF

Un générateur de formes flexionnelles : portée, applications

Jean-René Reimen

Mardi 7 mars 2000 | 13h15
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Les mardis de l’INaLF

La nouvelle présentation de l’INaLF sur la toile

Gilles Souvay (INaLF)

Mardi 29 février 2000 | 13h15
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Les mardis de l’INaLF

Dictionnaire des formes du français classique

Marc Papin (INaLF)

Mardi 2 février 2000 | 13h15
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Les mercredis de l’INaLF

Les travaux et les projets relatifs au Français préclassique

Monique Chauvet, Marthe Paquant et Françoise Henry (INaLF)

Mercredi 12 janvier 2000 | 13h15
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Historique 1999 des séminaires de l’ATILF

Les mercredis de l’INaLF

Connaissance et Rayonnement du Dictionnaire de Trévoux (1704-1771)

Isabelle Leroy-Turcan (INaLF)

Mercredi 15 décembre 1999 | 13h15
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs

Les mercredis de l’INaLF

La nouvelle philologie

Bernard Cerquiglini (INaLF)

Mercredi 8 décembre 1999 | 13h15
Nancy | Campus Lettres et Sciences Humaines | ATILF | Bâtiment CNRS | Salle Paul Imbs