Séminaire ATILF

Date : Vendredi 4 juin 2010 - 10h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : La phraséologie : perspective théorique et descriptive

Présenté par Igor Mel'cuk (OLST - Département de linguistique et de traduction - Université de Montréal)

  Dans ma présentation, j'aborderai la notion de phraséologie selon deux angles complémentaires et indissociables : 1) la caractérisation théorique de la notion et 2) le problème de sa modélisation lexicographique. Je procèderai en 4 étapes.

1. Caractérisation des phrasèmes en tant que syntagmes non libres.
2. Identification de quatre classes de phrasèmes, réparties en deux grandes familles :
(i) phrasèmes compositionnels : pragmatèmes, clichés et collocations ;
(ii) phrasèmes non compositionnels : locutions.
3. Principes de description lexicographique des phrasèmes : locutions vs collocations, etc.
4. Fonctions lexicales.
 
 
 
   Séminaires ATILF

Date : Vendredi 28 mai 2010 - 10h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « Modéliser l'évolution grammaticale : Des cas aux adpositions, un passage obligé ? »

Présenté par Benjamin Fagard (Lattice – CNRS/ENS-Ulm)

  La disparition du système casuel indo-européen dans un grand nombre de langues indo-européennes est un phénomène bien connu. Je voudrais aborder quelques-uns des problèmes qui se posent encore à ce sujet. Il s’agira de voir, notamment, s'il est possible d'expliquer d'une part pourquoi de nombreuses langues indo-européennes ont perdu ce système, et d'autre part pourquoi certaines ne l'ont pas perdu, et l'ont même (du moins à certaines périodes) renforcé.
Je propose, à cette fin, d'utiliser une approche multiple (corpus, typologie, modélisation), dont je ne ferai pour le moment que poser les bases méthodologiques. Il s'agit plus précisément :
a) d'étudier, à partir d'une analyse de corpus, l'évolution du système casuel dans quelques langues (3 langues indo-européennes et 2 langues non-indo-européennes) ;
b) d'observer l'évolution des systèmes casuels d'un point de vue typologique (pour les langues dont on connaît l'histoire, peut-on déterminer la vitesse de création et de disparition du système casuel ?) ;
c) de modéliser cette évolution, à partir d'une étude sur corpus et d'analyses de fréquence à grande échelle, sur les cinq langues retenues.
 
 
 
   Séminaire ATILF

Date : Vendredi 9 avril 2010 - 10h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : De la modélisation du traitement morphologique d’un point de vue cognitif

Présenté par Hélène Giraudo (Laboratoire CLLE-ERSS - CNRS & Université de Toulouse, France)

  L’objet de cette contribution consiste à présenter une approche psycholinguistique de la modélisation des mécanismes cognitifs impliqués lors de la perception de mots morphologiquement complexes en s’attachant à articuler les concepts et hypothèses issus de la psycholinguistique avec ceux qui proviennent de la linguistique afin d’en démontrer leur nécessaire complémentarité. Nous débuterons ainsi par un exposé des recherches psycholinguistiques consacrées au traitement morphologique chez le lecteur expert, puis nous aborderons plus précisément la question du rôle et de la représentation des informations morphologiques au sein du lexique mental. Nous décrirons dans ce cadre, les modélisations cognitives actuelles de l’accès lexical. Enfin, nous tenterons de défendre une approche basée sur le lexème en nous appuyant sur un ensemble de résultats expérimentaux provenant de l’étude de la morphologie dérivationnelle du français et en étayant notre propos de considérations d’ordre linguistique.  
 
 
   Séminaire Syntaxe, Morphologie et Sémantique

Date : Vendredi 26 mars 2010 - 10h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Quelles expériences pour l'étude de la sémantique de la prosodie ?

Présenté par Jean-Marie Marandin (Directeur de Recherche au CNRS, Laboratoire de Linguistique Formelle (LLF) - Paris 7)

  Résumé à venir  
 
 
   Séminaire ATILF

Date : Vendredi 12 mars 2010 - 10h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Annotation lexicale collaborative de textes littéraires: un projet Web 2.0 en cours

Présenté par Maureen Jameson (University at Buffalo, State University of New York)

  Le projet qui sera présenté est une archive numérique qui réunit des textes littéraires en diverses langues, tous agrémentés de notes lexicales visibles sur demande. Celles-ci sont préparées de façon artisanale par des collaborateurs dont la responsabilité se limitait à une compétence linguistique et culturelle, puisque l'intégration de leurs apports aux textes restait le travail d'une seule personne. Le projet a vite atteint les limites réelles de cette première approche centralisée. Ainsi, soutenu par une bourse de la National Endowment for the Humanities, a été créée une nouvelle gestion de contenu, qui permet non seulement que la note lexicale mais aussi, le cas échéant, une image et un enregistrement sonore soient directement insérés par l'expert linguistique. La GC requiert aussi que l'ensemble des suppléments textuels apportés par un contributeur inexpérimenté soit validé par un collaborateur de plus haut rang dans la hiérarchie scientifique, sans que ni l'un ni l'autre n’ait à maîtriser la technologie sous-jacente.
Le site se destinait à l'origine à un public doublement réfractaire aux langues étrangères et à plus forte raison aux littératures écrites en ces langues. Mais les capacités de la GC permettent d'autres usages, dont le plus évident serait l'annotation en n'importe quelle langue d'un texte de n'importe quelle autre langue. On peut envisager l'apposition de suppléments qui soient érudits plutôt que lexicaux et l'utilité donc du système, même loin des départements de littérature.
Mais pour en arriver là, il faudra que la nouvelle GC se déploie pour de bon, et que la vaste équipe de collaborateurs qui ont élaboré Litgloss 1.0 soit secondée par de nouveaux collaborateurs, dont la première contribution, très précieuse, sera la critique.
 
 
 
   Séminaire Syntaxe, Morphologie et Sémantique

Date : Vendredi 5 mars 2010 - 10h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Analysis by synthesis of speech prosody - from data to models

Présenté par Daniel Hirst (Directeur de Recherche au CNRS, LPL-Aix-en-Provence)

  Conférence en anglais, discussion possible en français

Résumé à venir
 
 
 
   Séminaire ATILF

Date : Vendredi 12 février 2010 - 10h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Structuration et balisage sémantique du Trésor de la Langue Française informatisé

Présenté par Lucie Barque (Post-doctorante (Projet ANR JC Nomage), STL, Université Lille 3)

  Le projet Definiens vise la conversion des définitions du Trésor de la Langue Française informatisé sous une forme structurée. Il n’existe pas à l’heure actuelle pour le français de base de données lexicale, libre d’accès et à large couverture, proposant pour chaque unité lexicale décrite une définition explicitement structurée. Definiens entreprend de combler ce manque en indiquant pour chaque définition que compte le TLFi (environ 270 000) :
1. la structure en composantes définitionnelles de type genre prochain et différences spécifiques ;
2. le rôle joué par chaque composante dans la caractérisation du sens de l’unité lexicale définie.
 
 
 
   Séminaire Syntaxe, Morphologie et Sémantique

Date : Vendredi 29 janvier 2010 - 14h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Parataxes : contraintes d'interprétation et de représentation

Présenté par Mathilde Dargnat (ATILF)

  Dans cet exposé, je vais parler d'une recherche en cours (personnelle et en collaboration) sur des énoncés du type : « J'ai essayé d'y aller j'ai pas trouvé », « Tu écris tes mémoires tu leur donnes quel titre ? », « Avoir une auto j'irais certain » (FQ), « Il lui court après il est amoureux », « Il y a des grèves de train j'arriverai en retard ». Les questions que je soulèverai ne concernent pas la terminologie employée pour les désigner mais portent sur l'interface syntaxe-prosodie-interprétation. Ces énoncés ont-ils des propriétés communes/spécifques ? Sont-ils des combinaisons spécifques de propriétés ? Ceci rejoint en partie la problématique, discutée, de la non-compositionnalité.
Actuellement, pour des raisons de compatibilité avec d'autres projets en cours, je me concentre sur des particularités prosodiques (les contours dits continuatifs) et sur les énoncés qui ont/peuvent avoir une interprétation conditionnelle du type « si A, B ». Ces derniers ont des contraintes spécifques, qu'on les compare aux autres parataxes (par ex. formes verbales, types de procès), ou aux variantes avec connecteur explicite (par ex. toutes les valeurs du « si » ne sont pas possibles en parataxe).
L'objectif est, petit à petit, de distinguer des sous-classes de constructions paratactiques. Il est intéressant, dans ce cadre, de les représenter sous forme d'agrégats de propriétés, ou structures de traits, organisables en hiérarchies d'héritages, comme le proposent des grammaires du type HPSG ou CxG.
 
 
 
   Séminaire ATILF

Date : Vendredi 18 décembre 2009 - 10h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Gestion des langues en classe dans les écoles bilingues de quelques pays du sud (zones arabophone, créolophone et subsaharienne de la francophonie)

Présenté par Colette Noyau (Professeure en Sciences du Langage, Université Paris-X Nanterre)

  Après un programme plurilatéral sur l'appropriation du français en contexte diglossique au Togo et au Bénin à travers l'école classique tout-français (2000-2005), nous avons effectué des enquêtes sur des systèmes scolaires bilingues (Mali, Mauritaine, Seychelles, puis Niger). De ce vaste corpus des écoles primaires de pays du sud francophones : séquences de classe de/en français et de/en L1 dans divers contextes multilingues, où la transition de l'enseignement en L1 à l'enseignement en français L2 nécessite des passages entre L1 et L2 dans les activités de classe, nous avons tiré un DVD de séquences vidéo en vue de la formation des [formateurs de] maitres aux passages L1-L2. La conférence exposera les voies par lesquelles s'effectue chez les élèves le passage de la L1 à la L2, et en quoi les pratiques enseignantes les y aident ou non, en l'illustrant de passages analysés de ces séquences de classe. Notre approche est centrée sur les apprenants. Nous décrivons les parcours cognitifs ménagés par l'école pour établir des ponts entre les langues, en fonction des contraintes de curriculum et de la formation des maitres qui met peu l'accent sur cet aspect du travail.

Références (en partie disponibles sur le site http://colette.noyau.free.fr)
Noyau C., ed. (2007) : /Actes du colloque international « Appropriation du français et construction de connaissances via la scolarisation en situation diglossique »/, Paris-X-Nanterre, COMETE, CD-rom.
Noyau, Colette (2007): "Les langues partenaires du français dans la scolarisation en francophonie subsaharienne. Atouts et obstacles pour leur mise en pratique". Dans : /Les actions sur les langues : Synergie et partenariat/. G. Chevalier, ed. EAC / AUF.
Noyau C. (2009) : /Modalités d’optimisation du passage de L1 à L2 dans l’enseignement primaire en contexte multilingue, Mauritanie, Mali, Seychelles/. OIF / Eds. Le Web pédagogique, 304 p.
 
 
 
   Séminaire ATILF

Date : Vendredi 27 novembre 2009 - 10h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : La modélisation formelle de la paraphrase et de ses applications

Présenté par Jasmina Milic'evic' (Department of French, Dalhousie University, Halifax, Canada)

  Nous commençons par caractériser la notion de paraphrase (relation de quasi-synonymie entre phrases et opération de production de phrases quasi-synonymes) en mettant en évidence son importance en langue et en linguistique. Nous présenterons ensuite une typologie du paraphrase, les règles de production de paraphrases proposées par la théorie linguistique Sens-Texte et les applications possibles de telles règles en traitement automatique et enseignement des langues.  
 
 
   Séminaire ATILF

Date : Vendredi 5 juin 2009 - 10h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : La contribution des noms abstraits à la cohérence discursive

Présenté par Olga Anokhina (UMR 8132 CNRS /ENS, ITEM, Paris)

  Lors de mon travail de thèse Étude sémantique du nom abstrait en français (2000), j’ai constaté que la parenté entre les noms abstraits (les nominalisations) et leur terme de base dérivationnelle (adjectif ou verbe) contribue à mettre en place la cohérence dans le discours. En analysant de nombreux textes tirés d’œuvres littéraires, d’interview, d’ouvrages de sciences humaines et d’articles de presse, j’ai observé qu’il existe une logique du développement du discours. Cette logique contribue à instaurer la cohérence discursive en mettant en œuvre des mécanismes bien précis. Un des mécanismes les plus répandus consiste à mentionner d’abord un terme de base qui sera repris plus tard sous forme d’un nom abstrait. Ainsi, le nom abstrait et son terme de base forment une sorte d’anaphore référentielle. Ce mécanisme se retrouve également dans les dialogues où le locuteur a recours à un nom abstrait en le reliant avec sa base mentionnée par un autre locuteur. Dans la présente communication, je chercherai à montrer comment, grâce à la nominalisation, s’élabore la continuité discursive.  
 
 
   Séminaire ATILF

Date : Vendredi 29 mai 2009 - 10h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Polysignifiance et changement de sens du nom propre. Questions et options méthodologiques pour l’interprétation en corpus du toponyme Outreau.

Présenté par Michelle Lecolle (CELTED, Université Paul Verlaine-Metz)

  Le cadre général de l’exposé porte sur la question de l’interprétation du toponyme (ici, le nom de lieu habité) lorsqu’il n’a plus (uniquement) sa valeur initiale : on prendra pour exemple le cas du nom propre de ville Outreau. Ce toponyme peut avoir, en contexte, des sens différents (polysignifiance). Mais surtout, il a vu, dans une période restreinte (2001-2006), son sens évoluer totalement jusqu’à se stabiliser, à partir de 2005-2006, comme renvoyant principalement à « l’erreur judiciaire par excellence ». La polysignifiance du nom de lieu habité et l’évolution de son sens rendent la question du contexte et de l’interprétation particulièrement cruciale.
On rapportera et discutera ici les options théoriques (changement de « sens » du toponyme) et méthodologiques de l’analyse menée. En recourant à un corpus de presse contemporaine partitionné en cinq sous-corpus relevant de tranches historiques différentes, l’analyse, aidée par le recours au concordancier Antconc, se donnait pour objectif de rendre compte, d’une part de ce qui construit le changement du sens de Outreau, d’autre part des éléments d’interprétation pertinents des différents sens du nom. Elle croise plusieurs paramètres d’interprétation, relevant de paliers syntagmatiques différents : niveau du syntagme et de la phrase, niveau textuel (article de presse) et niveau intertextuel (corpus). On discutera ici la part d’interprétation basée sur l’utilisation du concordancier et la part d’interprétation humaine qui demeure nécessaire, selon les différents paliers mentionnés.
 
 
 
   Séminaire ATILF

Date : Lundi 4 mai 2009 - 10h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Les traductions médiévales françaises de la Légende dorée : tentative de caractérisation d’un corpus.

Présenté par Olivier Collet (Univ. Genève, Département de langues et littératures françaises et latines médiévales)

  Si le succès de la « Légende dorée » est amplement attesté par sa diffusion originale, les traductions qui en sont issues en français offrent en comparaison un témoignage plus nuancé, voire contrasté. Précoce, la tradition vernaculaire est aussi durable, mais elle reste somme toute assez peu fournie. Presque toujours anonymes, non autographes, dénuées d’attaches temporelles et d’ancrage géographique explicites, comme de marques de destination, les translations qui la composent forment donc un corpus privilégié pour une « étude de terrain » destinée à révéler les attitudes, stratégies et finalités des traducteurs. Mais d’après quelles méthodes ? Le tour d’horizon qui sera proposé à partir de quelques textes vise surtout à sonder les moyens aptes à nous éclairer sur de telles œuvres et sur les résultats auxquels l’analyse peut prétendre.  
 
 
   Séminaire ATILF

Date : Vendredi 24 avril 2009 - 10h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Vers une approche plurilingue des apprentissages langagiers

Présenté par Joaquim Dolz (Univ. Genève), Marielle Rispail (Univ. Grenoble, LIDILEM) et Stéphanie Clerc (Univ. Avignon, ICAR et ICTT)

  Résumé à venir  
 
 
   Séminaire ATILF

Date : Vendredi 20 mars 2009 - 10h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Les enjeux de l'uniformisation linguistique d'un champ de connaissances : le cas de la langue du droit européen

Présenté par Marc Debono (Université de Tours)

  La question de l’opportunité de l’uniformisation linguistique du droit européen s’est posée à l’occasion de la publication, en 2004, d’un manifeste « en faveur de la langue française comme langue juridique de l’Europe » et de la reprise de cette idée à travers une campagne de lobbying lancée en 2007.  
 
 
   Séminaire de syntaxe et de sémantique

Date : Vendredi 13 mars 2009 - 14h15

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : La qualification nominale : approche typologique

Présenté par Loïc Perrin (LLACAN UMR 8135)

   
 
 
   Séminaire ATILF

Date : Vendredi 13 mars 2009 - 10h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Présentation de la base de données lexicographiques panfrancophone (BDLP) internationale

Présenté par Christel Nissille et Willy Stumpf (ATILF)

  Dans cette présentation, nous décrirons quelques aspects de l’élaboration d’une base de données lexicographiques internationale : ses implications lexicographiques, la méthode de saisie et les possibilités de consultation.

A- Le concept de la BDLP-Internationale
La Base de données lexicographiques panfrancophone (BDLP) a pour objet la description lexicographique des français régionaux de la francophonie. Elle est actuellement en voie de réalisation pour les français de France (dans le cadre du laboratoire ATILF, CNRS-Nancy Université) et de Suisse (Centre de dialectologie de l’Université de Neuchâtel), dont nous parlerons plus particulièrement, mais aussi de l’Acadie, de l’Algérie, de la Belgique, du Burundi, de la Louisiane, du Québec, etc. (voir www.bdlp.org). L’objectif est de constituer et de regrouper des bases (locales ou régionales) représentatives du français de chacun des pays et de chacune des régions de la francophonie à partir d’une structure commune. Les bases de données sont conçues de façon à pouvoir être consultées sur Internet et forment un réseau de données régionales dans lequel il est possible d’effectuer des recherches transversales à travers les banques de données individuelles (familles lexicales, sémantiques) ainsi que des rapprochements entre les usages des diverses communautés (recherches inter-bases).

B- La description du français régional
« La base de données consiste en un fonds informatisé réunissant des données déjà organisées résultant d’une analyse de corpus. Sans être elle-même un dictionnaire, la BDLP est une collection de dossiers concernant des mots de la langue régionale » (Poirier et al. 2003 : 11).
Le cadre de la base de données révèle en quelque sorte le travail du lexicographe du français régional, qui est avant tout un observateur cherchant à faire état des diverses formes qu’il rencontre dans l’usage. Si dans un article de dictionnaire traditionnel ces informations glanées servent de toile de fond permettant la rédaction du commentaire, dans la base de données ces informations sont fournies au lecteur, explicitées et réparties dans une série de rubriques dont les contenus peuvent être exploités de façon multiple. Elles sont de plus mises en valeur puisqu’il est possible d’y insérer des informations non seulement linguistiques, mais aussi culturelles par le biais de matériaux multimédia afin de présenter à l’utilisateur les réalités propres à une région de façon claire et démonstrative.

Bibliographie : C. Poirier et al. (2003), Document de présentation de la BDLP, www.bdlp.org.
 
 
 
   Séminaire de syntaxe et de sémantique

Date : Vendredi 6 février 2009 - 14h15

Lieu  : Université Nancy 2, Campus Lettres et Sciences Humaines, salle B 10

Titre : Classes nominales et noms abstraits en yilumbu (langue bantoue)

Présenté par Ghislaine Gamille (doctorante, dir. M-L Knitel, éq Lexique)

 
Exemplier à venir
 
 
 
   Séminaire de syntaxe et de sémantique

Date : Vendredi 21 novembre 2008 - 14h15

Lieu  : Université Nancy 2, Campus Lettres et Sciences Humaines, salle B 10

Titre : Les diathèses, une notion nouvelle relevant d’une linguistique à trois niveaux

Présenté par Emmanuel Deronne (ATILF)

   
 
 
   Séminaire ATILF

Date : Vendredi 17 octobre 2008 - 10h30-12h

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Les entités syntagmatiques du lexique et leur modélisation

Présenté par Alain Polguère (OLST - Département de linguistique et de traduction - Université de Montréal)

  L'entité linguistique type étudiée par la lexicologie et modélisée par la lexicographie est bien entendu le lexème : sens exprimé par un mot-forme (ou par un ensemble de mots-formes qui sont autant de variantes flexionnelles). Il est cependant bien établi que l'étude du lexique prend aussi en considération des entités lexicales de nature syntagmatique, comme les locutions. De telles entités sont particulièrement intéressantes puisque, d'une part, elles sont un point d'articulation entre lexique et syntaxe et, d'autre part, elles représentent une portion très importante de la connaissance lexicale. Dans ma présentation, je ferai tout d'abord un examen des différents types d'entités syntagmatiques enchâssées dans le lexique des langues (locutions, collocations, structures de régimes, etc.). J'aborderai ensuite le problème de leur modélisation lexicographique, en m'appuyant notamment sur les travaux menés à l'OLST dans le cadre de la recherche en lexicologie/lexicographie explicative et combinatoire.  
   
 
 
   Séminaire de syntaxe et de sémantique

Date : Vendredi 3 octobre 2008 - 14h15

Lieu  : Université Nancy 2, Campus Lettres et Sciences Humaines, salle B 10

Titre : Quelle(s) unité(s) syntaxique(s) maximale(s) en français parlé ? Discussions autour de quelques problèmes rencontrés

Présenté par Christophe Benzitoun (ATILF)

  Depuis quelques années, de nombreuses études ont vu le jour, notamment dans le cadre de la perspective macrosyntaxique, remettant en cause la pertinence de la notion de phrase comme unité délimitant le champ d’investigation de la syntaxe (cf. notamment Béguelin, 2000 & 2002 ; Berrendonner, 2002 et Blanche-Benveniste, 2002). Ces études fournissent un cadre apte à intégrer de manière cohérente des éléments dans et hors rection et proposent des unités de substitution jugées plus opératoires que la phrase, unités qui ont été essentiellement élaborées en s’appuyant sur des corpus oraux. Et dès lors que l’on travaille sur le français parlé, c’est tout naturellement vers ces unités macrosyntaxiques que l’on s’oriente, que l’on soit à la recherche « d’unités minimales de discours » (Degand & Simon, 2005) ou d’unités syntaxiques (Rossi-Gensane, 2007).
Pour autant, la question des unités syntaxiques maximales est loin d’être résolue et la segmentation systématique de textes oraux est une tâche extrêmement complexe. Dans notre présentation, nous nous attacherons essentiellement à pointer quelques problèmes en nous basant sur des exemples extraits de corpus oraux.
 
   
 
 
   Séminaire ATILF

Date : Vendredi 3 octobre 2008 - 10h30-12h

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Discours pédagogique, littératie, inégalités scolaires.

Présenté par Élisabeth Bautier (Université de Paris 8 - Laboratoire ESSI-Escol)

  À l’heure où les exigences d’une littératie étendue sont de plus en plus prégnantes dans la société, comme dans les attendus scolaires (cf. l’évaluation PISA de l’OCDE), analyser le discours pédagogique, les échanges langagiers dans la classe permet, en particulier en référence aux catégories bernsteiniennes de Discours horizontal vs vertical, régulateur vs instructeur, de cadrage et de classification (Bernstein, 2007), d’identifier le développement du discours horizontal et régulateur. Un genre conversationnel se construit dans les classes susceptible de leurrer les (des) élèves sur les véritables enjeux cognitifs des situations et dispositifs mis en place, ce genre paradoxalement éloigne une partie des élèves de l’entrée dans la littératie étendue.  
 
 
   Séminaire ATILF

Date : Vendredi 13 juin 2008 - 10h30-12h

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : L'Ontology Web Language et le lexique gallo-roman. Le cas de l'Atlas Linguistique de la Wallonie.

Présenté par Nicolas Mazziotta (Université de Liège)

  L'exposé comportera trois parties. Dans un premier temps, nous présenterons l'Ontology Web Language (OWL), un langage métaconceptuel issu des recherches développées dans le cadre du web sémantique. Nous montrerons comment il peut être utilisé pour objectiver des concepts et des relations entre ces concepts. Dans un deuxième temps, en prenant l'exemple de la notice «nèfle» de l'Atlas Linguistique de la Wallonie (ALW), nous montrerons concrètement comment il est possible d'employer OWL dans le but de produire des notices informatisées. Cette utilisation ne dénature pas le travail d'analyse tel qu'il a été réalisé jusqu'à présent par ses rédacteurs, mais elle permet de l'objectiver et d'en garder une trace. En guise de prolongement, nous proposerons, suivant le même principe, d'employer OWL pour modéliser les articles du FEW. Nous comparerons la structure que nous proposons à celle des notices rédigées actuellement en XML, en prenant l'exemple de l'article "basiolum" en cours de rédaction.  
 
 
   Séminaire ATILF

Date : Vendredi 6 juin 2008 - 10h30-12h

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : CLELIA : Développement d’un corpus littéraire et linguistique par le biais d’un dialogue interdisciplinaire

Présenté par Thomas Lebarbé (Laboratoire LIDILEM, EA 609, Université Stendhal – Grenoble 3)

  La Bibliothèque de Grenoble possède la quasi totalité des manuscrits de Stendhal. Cet ensemble de plus de seize mille feuillets compte parmi les plus importants des fonds de manuscrits littéraires modernes et par sa taille et par la présence de textes majeurs, entre autres Lucien Leuwen, ou Vie de Henry Brulard.  
 
 
   Séminaire de syntaxe et de sémantique

Date : Vendredi 6 juin 2008 - 14h15

Lieu  : Université Nancy 2, Campus Lettres et Sciences Humaines, salle B 10

Titre : La structure interne des correlatives

Présenté par Corrina Anderson (Université de Yale)

   
 
 
   Séminaire ATILF

Date : Vendredi 23 mai 2008 - 10h30-12h

Lieu  : Université Nancy 2, Campus Lettres et Sciences Humaines, salle B 10

Titre : De la didactique du français à la socio-didactique des langues

Présenté par Marielle Rispail (MCF en Sciences du langage, IUFM / Université de Nice, Laboratoire LIDILEM de Grenoble)

  La didactique des langues, qu’elles soient dites « maternelles », « secondes » ou étrangères », croise sans arrêt des champs disciplines connexes qui l’interrogent et l’enrichissent. Nous voudrions retracer ici les étapes de son contact avec la sociolinguistique :
- dans notre parcours personnel
- sur le plan chronologique
- à travers quelques exemples où s’actualise le concept de « socio-didactique » dans des contextes complexes de plurilinguisme (la Lorraine francique, l’Algérie, le sud-est asiatique).
Nous terminerons sur les voies ouvertes par cette notion, entre autre sur le plan méthodologique et pour l’enseignement des langues aux publics issus de l’immigration.
 
 
 
   Séminaire MSH

Date : Vendredi 16 mai 2008 - 10h00-11h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Projet d’informatisation du Du Cange et du Nouveau Du Cange et les corpus liés

Présenté par Bruno Bon (CNRS-IRHT) et Anita Guerreau-Jalabert (CNRS-IRHT)

  Profiter de la révolution technologique en cours pour encourager une véritable révolution scientifique, en particulier dans les domaines de l'histoire et de la philologie médiévales, c'est ce qui a motivé la décision de l'Ecole nationale des chartes de s'attaquer de front à un monument toujours irremplacé, le "Glossarium" du latin médiéval de Charles Du Cange (17e s.), dans son édition du 19e s.
Au delà d'un simple changement de support, déjà disponible en plusieurs endroits du Web, il s'agit surtout de donner les moyens aux chercheurs d'extraire le plus d'informations possible d'un ouvrage aussi riche que sous-exploité, grâce au développement d'une interface conçue par des chercheurs pour des chercheurs.
Ce projet s'intègre dans un programme plus large, proposé à l'ANR, destiné à mettre en place, entre autres, une plateforme interactive de philologie médiolatine, qui regrouperait, autour de l'ancien Glossarium de Du Cange, les nouveaux dictionnaires de latin médiéval en cours de rédaction, en France (Novum Glossarium) comme en Europe.
Nous saisirons l'occasion pour tenter de montrer comment la lexicographie médiolatine doit faire sa révolution, et comment la préparation de ce programme a nourri notre réflexion sur l'avenir de notre travail de rédacteurs de dictionnaires : la rationalisation de la structure et de la longueur des notices, et surtout le soutien d'un réseau de collaborateurs interactif pourraient compenser en partie la faiblesse critique des moyens humains disponibles ; l'analyse conjointe des langues vernaculaires et du latin, ouverte à grande échelle par le développement des corpus virtuels, devrait permettre d'améliorer l'efficacité et la pertinence de notre travail.
 
 
 
   Séminaire MSH

Date : Vendredi 16 mai 2008 - 14h

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Corpus et diachronie

Présenté par Axe 2 MSH « Langues, textes et documents » - Frédéric Duval (U. Metz)

  CORPUS ET DIACHRONIE

Présentation : Frédéric Duval (U. Metz)

Céline Guillot (ENS-LSH Lyon) : « Méta-données de la Base de Français Médiéval (BFM) et exploitation linguistique ».

Anita Guerreau-Jalabert (CNRS-IRHT) : « Sémantique historique latine et vernaculaire : la notion de sang dans les représentations de la parenté au Moyen Age ».

Gilles Siouffi (Montpellier-IUF) : « Etat des corpus et desiderata pour le XVIIe siècle ».

Cette séance de séminaire sera suivie d'une brève réunion organisationnelle sur les projets de l'axe.
 
 
 
   Séminaire ATILF

Date : Vendredi 16 mai 2008 - 10h30-12h

Lieu  : Université Nancy 2, Campus Lettres et Sciences Humaines, salle B 10

Titre : Effets de la tendance dissimilative en français

Présenté par Marc Plénat (UMR 5263 – Axe DUMAL)

  On sait depuis longtemps que des tendances dissimilatives sont à l'oeuvre dans les langues en général et dans les langues romanes en particulier (cf. Grammont 1895). La linguistique moderne a fait de cette tendance l'un de ses plus sérieux candidats au titre de contrainte universelle...  
 
 
   Séminaire ATILF

Date : Vendredi 11 avril 2008 - 10h30-12h

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « Un ciel… gris de chez gris… » : de la construction "X de chez X" à "Adj de chez Adj": du locatif à l'intensif

Présenté par Catherine Schnedecker (Université de Strasbourg)

  Réputée représentative du « parler jeune » et du français oral, la construction "Adj de chez adj" (gris de chez gris) est d'autant plus intéressante d'un point de vue strictement linguistique qu'elle est pour le moins inattendue, compte tenu des contraintes syntaxiques du français. Pour en comprendre l'émergence, il est nécessaire de s'interroger sur son histoire de manière à repérer ce qui, à partir d'une construction à fonction de localisation, fortement contrainte au niveau du verbe-recteur et de la nature du complément, a «permis» syntaxiquement l'apparition de l'adjectif et sémantiquement l'expression de l'intensité.  
 
 
   Séminaire ATILF

Date : Vendredi 4 avril 2008 - 10h30-12h

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Décrire et formaliser des constructions paradigmatiques : Application aux disfluences et coordinations dans une grammaire du français

Présenté par Marie-Laure Guénot (LIA-CERI Avignon)

  Les grammaires formelles actuelles ne représentent que des constructions syntagmatiques ou des structures dépendancielles équivalentes. Pourtant, dès lors que l'on s'intéresse à la formalisation des descriptions linguistiques de corpus, on constate que la prise en compte de la dimension paradigmatique des structures est dans certains cas nécessaire aux analyses proposées. Je montrerai ici comment, sur la base de l'étude de productions linguistiques spontanées écrites et orales et en m'inspirant de travaux de l'Approche Pronominale, j'ai représenté cet axe de structuration linguistique dans mon modèle de grammaire formelle du français, et j'illustrerai mon propos à l'aide d'exemples d'analyses de coordinations et de disfluences.
Mots-clés: Approche Pronominale, Grammaires de Construction (CxG), Grammaires de Propriétés, Syntaxe, Interaction entre différents domaines d'analyse, Développement de grammaire, Linguistique descriptive, Linguistique formelle, Coordination, Disfluences, Entassements paradigmatiques.
 
 
 
   Séminaire ATILF

Date : Vendredi 21 mars 2008 - 10h30-12h

Lieu  : ATILF Bâtiment CNRS, salle de réunion 2e étage

Titre : La phraséologie médicale. Etude contrastive français-allemand

Présenté par Anne-Marie Nahon-Raimondez

  Mon travail est une analyse phraséologique contrastive qui repose sur un corpus parallèle de textes de spécialité français et allemands. Le corpus choisi est un corpus d’articles médicaux parus dans la presse médicale spécialisée. Afin de travailler sur un corpus « homogène », je me suis limitée à une pathologie : l’asthme...  
 
 
   Séminaire de syntaxe et de sémantique

Date : Vendredi 14 mars 2008 - 14h15

Lieu  : Université Nancy 2, Campus Lettres et Sciences Humaines, salle B 10

Titre : Les adjectifs taxinomiques du français : une approche syntaxique

Présenté par Marie-Laurence Knittel (ATILF / Nancy-Université & CNRS)

   
 
 
   Séminaire ATILF

Date : Vendredi 7 mars 2008 - 10h30-12h

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Etude de l’influence des pratiques langagières enseignantes sur l’acquisition de la langue orale chez des élèves entre quatre et cinq ans

Présenté par Nathalie Charvy (IUFM Dijon (Université de Bourgogne) - EA170 CALIPSO-ED 268, Paris 3)

  Au cours de mon intervention j’examinerai l’influence des pratiques langagières enseignantes sur l’acquisition de la langue orale chez l’élève de quatre à cinq ans (classe de moyenne section d’école maternelle). Notre étude s’appuiera sur une analyse linguistique de corpus longitudinaux (sur une année scolaire) d’interactions individuelles enseignant-élève...  
 
 
   Séminaire ATILF

Date : Vendredi 15 février 2008 - 10h30-12h

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Discours et identité : approches et problèmes

Présenté par Philip Riley (ATILF / Nancy-Université & CNRS équipe CRAPEL)

  1/ Introduction : Identité et modernité : Fernando Pessoa et al. … et Ferdinand de Saussure. L’ ‘engouement identitaire’ – et quelques publications récentes. Vers une ‘théorie générale’ de la relation discours-identité ?
2/ Survol de quelques approches ‘discursives’ de la construction de l’identité.
3/ Présentation du livre Language, Culture and Identity : An Ethnolinguistic Perspective (London : Continuum, 2007)
 
 
 
   Séminaire de syntaxe et de sémantique

Date : Vendredi 18 janvier 2008 - 14h15

Lieu  : Université Nancy 2, Campus Lettres et Sciences Humaines, salle B 10

Titre : Variation formelle dans la construction de lexèmes en hébreu moderne : Le cas des nom en /ut/

Présenté par Aurore Koehl (ATILF / Nancy-Université & CNRS)

   
 
 
   Séminaire ATILF

Date : Vendredi 21 décembre 2007 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « Le corpus et la vérité »

Présenté par Tobias Scheer (CNRS - Université de Nice)

  Depuis une dizaine d'années, nous vivons le retour de l'empirisme en sciences (et plus généralement d'ailleurs). L'empirisme, ancré dans la culture anglo-saxonne (Hume, Locke, Russell) et s'opposant au rationalisme continental (Descartes, Kant, von Humboldt, Popper), propose que la vérité - toute la vérité - est contenue dans les données, et que **rien** ne peut contribuer à la découverte scientifique en dehors de leur inspection...
Complément :
Article de Bernard Laks (Université de Paris X, laboratoire MoDyCo) : « Pour une phonologie de corpus »
 
 
 
   Séminaire ATILF

Date : Vendredi 9 novembre 2007 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « Faut-il /remettre les pendules /de la subordination temporelle/ à l’heure /? »
« Description de deux fonctionnements de /quand /et /avant que/de/ »

Présenté par Christophe Benzitoun (ATILF, équipe Macrosyntaxe de l'écrit et de l'oral)

  Cela fait bien longtemps que les linguistes travaillant sur le français ont remarqué un usage singulier de /quand/ n’exprimant pas une simple localisation temporelle. Cet emploi a reçu originellement le nom de « /quand/ de péripétie » (Séchehaye 1926) puis « subordination inverse ». L’exemple suivant en constitue une bonne illustration :

(1) Pécuchet venait d’en remettre la note à Bouvard quand tout à coup le tonnerre retentit et la pluie tomba (roman)

Dans cette configuration, la construction introduite par /quand/ ne constitue pas un repère temporel, contrairement aux exemples « canoniques » du type :

(2) Il nous a abandonnés, ma mère et moi, quand j’avais à peine un an. (roman)

Plus récemment, Le Draoulec (2003) et Delort (à paraître_a ) se sont intéressées à un fonctionnement impliquant /avant que/ et /avant de/ ressemblant étrangement à (1).

(3) 61 personnes, sur les 111 salariés présents sur le site chalonnais hier, ont débrayé de 14 h à 15 h, avant de reprendre ensuite normalement leur travail. (presse)

De la même façon, il s’oppose aux exemples en /avant que/de/ fonctionnant comme un repère temporel :

(4) Le 6 juillet, avant de me coucher, j’ai placé sur ma table du vin, du lait, de l’eau, du pain et des fraises. (roman)

Ces deux fonctionnements de /quand/ et /avant que/de/ ont fait l’objet de nombreuses analyses pragmatiques, sémantiques et discursives, si bien que l’on est désormais capable de caractériser précisément ces deux interprétations à travers notamment la distinction entre la présupposition et l’assertion (cf. Le Draoulec 2003 & 2006). Mais personne, ou presque, n’a abordé de manière précise les propriétés syntaxiques de ces constructions, excepté Benzitoun (2006) (sur /quand/ uniquement). Nous nous proposons donc de poursuivre ce premier travail en mettant en évidence les caractéristiques syntaxiques des constructions en /avant que/de/ et /quand/ du même type que celles des exemples ci-dessus. Nous montrerons notamment qu’il existe une congruence entre syntaxe et sémantique, pour peu que le cadre syntaxique que l’on adopte ne soit pas trop imprégné de la conception scolaire de la subordination. Nous espérons ainsi parvenir à « remettre les pendules à l’heure » entre la syntaxe et la sémantique afin d’approfondir la question de leur interaction. Néanmoins, nous nous limiterons à l’étude spécifique des deux fonctionnements exemplifiés ci-dessus. Cela nous permettra de poser les prémisses d’un travail plus ambitieux concernant l’interface entre la syntaxe et la sémantique.

Dans la première partie, nous retracerons l’histoire de la « subordination inverse » et des différents termes successifs qui ont été employés pour désigner les exemples en /quand/ tels que ?(1), afin de mettre en lumière leur caractère polysémique et généralement contradictoire. Dans la deuxième partie, nous rappellerons brièvement les principales propriétés dégagées dans les études sémantiques. Dans la troisième partie, nous proposerons une analyse qui montre que l’opposition sémantique entre présupposition et assertion est doublée d’une opposition syntaxique entre dépendance et autonomie. Enfin, dans la dernière partie, nous proposerons des pistes de recherche portant sur d’autres exemples.
 
 
 
   Séminaire ATILF

Date : Vendredi 26 octobre 2007 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « Les emplois de /anti/- en français contemporain : réflexion sur les catégories traditionnelles Préfixes /versus/ Prépositions »

Présenté par Franziska Heyna (Université de Fribourg)

  Dans cette communication, on s’intéresse à certains emplois actuels du morphème anti–, tels qu’ils sont attestés sur le web et dans la presse écrite. Les faits empiriques dont on va rendre compte montrent que le morphème anti–, dans un certain type d’écrits, figure de plus en plus souvent dans les contextes syntaxiques que l’on pourrait qualifier approximativement de « prépositionnels »  
 
 
   Séminaire ATILF

Date : Vendredi 5 octobre 2007 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « Existe-t-il des emprunts au gaulois en français ? Réflexions à partir du traitement du lexique d’origine gauloise dans le TLF »

Présenté par Rebecca Loeb (Université de Bâle)

  L’idée que les Gaulois sont les ancêtres des Français est omniprésente dans la pensée collective, encore aujourd’hui. Je vais essayer d’éclaircir à quel degré cette idée se retrouve dans le domaine linguistique. Le point de départ est de savoir s’il existe des emprunts au gaulois en français.

Comment repérer le vocabulaire qui pourrait présenter des emprunts du français au gaulois
La version informatisée du Trésor de la langue française facilite énormément cette tache, vu que l’on peut chercher tous les articles qui contiennent la notion « gaulois ».

La liste du TLFi
On arrive à une liste de 220 mots français, d’origine gauloise (pas d’emprunts !). Ces mots se laissent diviser dans de différents groupes. Le premier groupe est constitué de mots d’origine gauloise. Le deuxième, de mots avec des étymons latins d’origine gauloise. Le troisième, de mots où le gaulois n’apparaît qu’en second lieu. Le quatrième, de mots dont l’origine est incertaine.

Commentaire et critique de cette liste
Finalement, les deux premiers groupes sont plus intéressants que les deux autres. Ainsi, ils méritent un regard plus précis. On y trouve des points forts, mais aussi des détails malheureux qu’il convient de relever et proposer des améliorations.

L’actualisation de l’article alose
Une explication de chaque pas de la démarche pour l’actualisation de l’article alose qui est maintenant consultable en ligne, sur le site du TFL-Etym.

Conclusion
Les emprunts au gaulois en français ne sont pas possibles. Premièrement, entre le gaulois et le français, il manque d’autres langues, parce que le français n’a pas suivi temporellement le gaulois. Le gaulois a pu influencer les langues latines, qui l’ont suivi directement. C’est dans les langues romanes qu’on trouve les étymons du lexique français. Deuxièmement, aussi les emprunts savants sont impossibles, vu que le gaulois est presque inconnu aujourd’hui. Le TLF prouve clairement que ces emprunts n’existent pas. Il y a un seul article où figure dans la partie étymologique un emprunt au gaulois. Ainsi, la question du début se modifie un peu. Il est alors intéressant d’étudier tous les mots d’origine gauloise, ce qui nous mène à la liste du TLFi des 220 mots. A partir de là, s’offre une multitude d’autres questions sur le lexique d’origine gauloise et son traitement dans le TLF, ce que nous allons faire en partie.
 
 
 
   Séminaire ATILF

Date : Vendredi 22 juin 2007 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « L'importance du travail d'attestation pour le chercheur en droit »

Présenté par Michel Séjean (Université Panthéon-Assas – Paris II)

   
 
 
   Séminaire ATILF

Date : Vendredi 15 juin 2007 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « Les logiciels pour le traitement de corpus oraux en français »

Présenté par Magali Husianycia (ATILF)

  Dans ce séminaire, je présenterai le travail de recherche d’outils informatiques mis à disposition pour le traitement des corpus. J’ai répertorié différents types de logiciels (concordanciers, logiciels de transcription, étiqueteurs, logiciels d’analyse lexicale et syntaxique et logiciels d’analyse sémantique.) en accès libre sur internet. Après une sélection de logiciels, en fonction de leur accessibilité, je les ai testé sur des corpus transcrits et numérisés. Je vous présenterai les logiciels analysés et testés et montrerai que les divers outils sont conçus principalement pour travailler à partir de l’écrit et que les technologies du TAL sont difficilement transposables à l’oral et comportent donc des limites. Puis, je mènerai une brève réflexion sur la notion de typologie textuelle et sur le rôle qu’elle peut avoir dans la linguistique de corpus.
 
 
 
   Séminaire ATILF

Date : Vendredi 8 juin 2007 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « Two examples of Cuban pedagogical lexicography : the Diccionario Escolar Ilustrado and the Diccionario Básico Escolar »

Présenté par Leonel Ruiz Myares (Director del instituto de linguistica applicada de Santiago de Cuba)

  The urgent need to provide Cuban school children with affordable dictionaries in order to meet their decoding needs ? as well as to improve their knowledge of the Spanish language in general ? has compelled the Centro de Lingüística Aplicada (CLA) from Santiago de Cuba to begin a number of activities with the aim of compiling two school dictionaries on a scientific basis.
The bibliographic revision revealed that the Cuban lexicographic work had it origin in the 18th Century. However, since then there is no evidence of further attempts to produce dictionaries for Cuban children. This fact prompted us to start a national research survey to establish students´ active vocabulary and their main characterising features with a view to selecting the lemmas for inclusion in the dictionaries.
A demonstration of the electronic version of one of the dictionaries (Diccionario Básico Escolar) we will show at the speech.
 
 
 
   Séminaire ATILF

Date : Vendredi 4 mai 2007 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « Une contribution à l’histoire du lexique français : étude des dénominations humaines dans l’Heptaméron de Marguerite de Navarre »

Présenté par Emilie Devriendt (Université de Poitiers)

  Il s’agira dans cette conférence de rendre compte des résultats d’une recherche récente portant sur les principales dénominations humaines employées dans les nouvelles de Marguerite de Navarre ou Heptaméron, recueil dont la première édition complète date de 1559, et dont la composition a pu être située entre 1542 et 1547. On tâchera de mesurer les apports de cette recherche à la lexicologie historique.  
 
 
   Séminaire ATILF

Date : Vendredi 27 avril 2007 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « La syntaxe ordinaire à la Réunion »

Présenté par Gudrun Legeden (Université de la Réunion)

  L’étude du français « ordinaire » (Gadet 1989) tel qu’il est pratiqué à l’Île de la Réunion, Département d’Outre Mer français situé dans l’Océan Indien, éclaire l’étude du français « ordinaire » tout court. En effet, l’étude historique et sociolinguistique du français dans ce département permet d’identifier les éléments qui relèvent de la variation interlinguistique (qui est ici particulière car due aux contacts avec le créole réunionnais), et ceux qui concernent la variation intralinguistique.  
 
 
   Séminaire ATILF

Date : Vendredi 20 avril 2007 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « La morphologie flexionnelle est-elle une fonction ? »

Présenté par Olivier Bonami (Université Paris 4 - Sorbonne) & Gilles Boyé (Université de Bordeaux 3)

  Nous montrerons que le point de vue des approches réalisationnelles de la flexion (Zwicky 1986) permet de poser une question intéressante sur la typologie des systèmes flexionnels, question qui n’est pas formulable dans les termes de la morphologie morphématique telle qu’elle se construit habituellement : la flexion est-elle une fonction ou une relation ?
Nous examinons plusieurs exemples de situations où un système flexionnel ne semble pas être fonctionnel : les lexèmes polyparadigmatiques, les formes négatives dans la conjugaison du népali, et les pronoms faibles du français, souvent considérés comme des marques flexionnelles.
Ces trois exemples sont emblématiques de trois types d’exceptions à la fonctionnalité qui n’ont pas le même statut.
 
 
 
   Séminaire ATILF

Date : Vendredi 30 mars 2007 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « Les premières formes d’anaphore chez l’enfant »

Présenté par Anne Salazar-Orvig (Université Paris 3)

  L’exposé présentera plusieurs volets de la recherche sur « les prémices dialogiques de l’anaphore » chez le jeune enfant. Cette recherche, qui exploite un corpus relativement important de dialogues enfantins en situation naturelle, s’intéresse à l’émergence, chez des enfants âgés entre 1 ;9 et 3 ans, des pronoms clitiques et des déterminants et à leur fonctionnement dans les discours et les dialogues. Ces premières expressions référentielles ont été analysées non seulement sur le plan de la maîtrise par l’enfant des différentes formes mais aussi et surtout sur le plan de leur usage en explorant à la fois le statut attentionnel du référent, la présence de l’objet de discours dans le contexte et dans le discours de l’interlocuteur ou encore la mise en place de chaînes référentielles dans le dialogue. Les différentes analyses qui seront exposées permettent de conclure à une certaine précocité du fonctionnement anaphorique, contrairement à ce que laisse prévoir les études sur les enfants plus âgés.  
 
 
   Séminaire ATILF

Date : Vendredi 16 mars 2007 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « La Pompamo : un outil de détection des candidats à la néologie pour la veille lexicale »

Présenté par Sandrine Ollinger (ATILF)

  La POMPAMO est un élément d’une plateforme de veille lexicale actuellement en cours de développement. La méthode générale que nous mettons en œuvre vise à identifier les néologismes en confrontant des corpus, considérés comme des archives de pratiques linguistiques données, et des lexiques, considérés comme des simulations d’usages lexicaux attestés et correspondant à ces pratiques linguistiques.  
 
 
   Séminaire ATILF

Date : Vendredi 9 février 2007 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « du linguicien au sémanticiste : quelques cas d’echangisme suffixal »

Présenté par Stéphanie Lignon (ERSS-Université de Haute Alsace)

  Il n’est pas rare qu’un dérivé comporte un suffixe autre que celui que laisseraient attendre son sémantisme ou la catégorie grammaticale de sa base. Le phénomène a déjà été observé par Roché (1997) avec avionneur et camionneur.  
 
 
   Séminaire ATILF

Date : Vendredi 2 février 2007 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : La virgule, de la syntaxe à l´argumentation

Présenté par Véronique Dahlet (Professeur à l'Université de Sao Paulo)

  De même que le point et le point-virgule, la virgule a pour fonction essentielle de segmenter la chaîne écrite. Elle est cependant ressentie, à juste titre, comme le signe de ponctuation le plus complexe, tant par les usagers scripteurs que par les linguistes qui cherchent à en décrire les opérations...  
 
 
   Séminaire ATILF

Date : Vendredi 26 janvier 2007 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « La périodisation des latinismes dans la langue française »

Présenté par Bruno Staib (Mayence, Allemagne)

  Imprégné fortement par la tradition latine, le vocabulaire du français nous offre toute une gamme de marques phonétiques, orthographiques et sémantiques qui témoignent de cette source inépuisable qu'est le latin – non seulement pour le français, mais aussi pour la plupart des langues romanes et bon nombre d'autres langues vernaculaires de l'occident...  
 
 
   Séminaire ATILF

Date : Vendredi 19 janvier 2007 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « Prosodie et syntaxe »

Présenté par José Deulofeu (Université de Provence – DELIC) & Philippe Martin (Université Paris 7)

  Dans une première partie théorique, on présentera un modèle modulaire de l’articulation entre structures syntaxiques et structures prosodiques. La composante syntaxique est un développement de celle qui est proposée dans le cadre théorique de l’Approche pronominale Blanche-Benveniste et alii (1990), Deulofeu (1999) et qui articule deux sous-composantes ...  
 
 
   Séminaire ATILF

Date : Vendredi 15 décembre 2006 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « Pour un lexique de la valence verbale en français »

Présenté par A. Valli (Université de Provence)

  « Nous sommes en train de construire une base de données décrivant la complémentation verbale du français qui pourra servir dans le traitement automatique des langues. »  
 
 
   Séminaire ATILF

Date : Vendredi 1 décembre 2006 - 10h30-12h00

Lieu  : Université Nancy 2, salle A 104

Titre : « Une approche distributionnaliste et constructiviste en sémantique »

Présenté par P. Jalenques & F. Thuillier (Rouen)

  « Nous entendons, lors de cette intervention, présenter une méthode d’analyse des unités polysémiques ayant cours dans le cadre de la Théorie des Opérations Prédicatives et Enonciatives (T.O.P.E.) initiée par Antoine Culioli. »  
 
 
   Séminaire ATILF

Date : Vendredi 17 novembre 2006 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « Voix et diathèses »

Présenté par Emmanuel Deronne (IUFM Lorraine)

  Qu’il s’agisse du travail de fourmi de la composition d’un dictionnaire, de la traduction ou de réflexions plus théoriques sur les typologies de verbes, les voix, variations de la totalité des formes modales et temporelles d’un verbe, possèdent une importance particulière.  
 
 
   Séminaire ATILF

Date : Vendredi 10 novembre 2006 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « Entre interrogation plein texte et balisage fin, façon TLF: la voie moyenne du Féraud informatisé sous STELLA »

Présenté par Philippe Caron (METADIF - Poitiers)

  La version Philologique du Dictionnaire critique de la langue française informatisé, mise en ligne en 2003 sur les deux sites miroirs de l'ARTFL de Chicago et de l'ATILF est une base de données textuelles interrogeable plein- texte, les seuls balisages étant référentiels (page, colonne, article) ou typographiques. La version STELLA du Féraud informatisé, qui devrait être en ligne à partir de 2008, offre deux nouveautés qui font son originalité.  
 
 
   Séminaire de méthodologie en étymologie et histoire du lexique

Date : Mercredi 28 juin 2006 - 14h00-15h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Bilan : la méthodologie du projet TLF-Étym

Présenté par Éva Buchi (équipe Étymologie et histoire du lexique)
 
 
   Séminaire de méthodologie en étymologie et histoire du lexique

Date : Vendredi 23 juin 2006 - 10h30-12h

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Écueils à éviter dans le traitement historique des belgicismes dans la lexicographie française générale

Présenté par Marie-Guy Boutier (Université de Liège)
 
 
   Séminaire ATILF

Date : Vendredi 2 juin 2006 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Phraséologie et constitution de texte

Présenté par Heinz-Helmut Lüger

  Les expressions phraséologiques (ou phrasèmes) représentent un élément incontournable de la pratique langagière. Il s’agit donc, dans une première étape, de décrire leur statut linguistique et d’élucider leurs possibilités d’emploi. Seront analysés ensuite les différentes fonctions textuelles et, plus spécialement, le rôle structurant des phrasèmes : De quelle manière favorisent-ils l’organisation du texte, dans quelle mesure contribuent-ils à la cohérence sémantique ou thématique ?  
 
 
   Séminaire de méthodologie en étymologie et histoire du lexique

Date : Mercredi 24 mai 2006 - 14h00-15h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Le traitement de la phraséologie dans les notices étymologiques du TLF

Présenté par Jean Klein (Université de Louvain-la-Neuve)

  Etant donné la richesse particulière du TLF dans le domaine phraséologique (depuis les simples collocations jusqu’aux phrases figées et aux proverbes), il m’a paru intéressant d’examiner de plus près trois phénomènes phraséologiques : les expressions verbales figées, les phrases figées et les proverbes, avec une attention toute particulière pour ces derniers. Après une brève présentation de la base de données DicAuPro (Dictionnaire automatique et philologique des proverbes français), élaborée au CELEXROM (UCLouvain, Louvain-la-Neuve) et en voie d'achèvement, j’aborderai certains aspects descriptifs (critères distinctifs et indicateurs de catégories phraséologiques dans le TLF et le TLFi). Ensuite, je montrerai, à travers une série d’exemples, que certaines informations tirées de la base de données (variantes diachroniques depuis le Moyen Age jusqu’à nos jours) pourraient s’avérer utiles pour compléter la rubrique « Etymologie et histoire » du TLF.  
 
 
   Séminaire ATILF

Date : Vendredi 21 avril 2006 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : L'empreinte indélébile de Nicolas Beauzée dans l'histoire de la phonétique française

Présenté par Christophe Rey (DELIC, Aix-en-Provence)

  Alors que nous nous situons aujourd'hui dans une période décisive de réévaluation des rapports entre la phonétique et la phonologie, il est particulièrement édifiant de constater que nous ne possédons toujours que peu de connaissances sur l'histoire de la phonétique. Aussi, à la suite des travaux de Geneviève Clérico(1), notre thèse(2) constitue-t-elle l'une des rares initiatives destinées à combler nos lacunes sur cette discipline.
Notre exposé revient sur les conclusions de ce travail de doctorat qui en prenant pour cadre d'étude le siècle des Lumières - siècle décisif pour les progrès et la diffusion des connaissances dans la plupart des domaines scientifiques - s'est attaché à définir la nature des savoirs relatifs à la substance phonique de la langue chez les grammairiens-philosophes.
Recentrée sur l'Encyclopédie Méthodique (1782-1832) de Charles-Joseph Panckoucke - encyclopédie continuatrice de l'Encyclopédie ou Dictionnaire raisonné (1751-1777) de Diderot et d'Alembert -, notre étude a mis en évidence l'apport fondamental et pourtant méconnu du grammairien Nicolas Beauzée dans le développement, la thématisation et la diffusion de la description des sons du français.
À travers la maturation scientifique qui va de ses articles de grammaire de l'Encyclopédie, en passant par sa Grammaire générale (1767), jusqu'au dictionnaire Grammaire & Littérature (1782-1786) de l'Encyclopédie Méthodique, Beauzée fournit une réflexion sans précédents sur les sons de la langue, et sans doute la théorie la plus aboutie sur ce sujet au XVIIIe siècle.
Après avoir esquissé quelques-unes des avancées que ce grammairien formule dans la classification des unités phoniques - avancées qui préfigurent notre phonétique et notre phonologie modernes - nous insisterons sur le fait que ce dernier propose au sein de la Méthodique une importante et novatrice thématisation lexicale sur les sons, dont l'écho s'est longtemps fait entendre dans la tradition lexicographique postérieure.
L'héritage scientifique légué par Nicolas Beauzée, tant du point des vue de ses célèbres considérations syntaxiques que de celui de sa description plus marginalement connue du système phonique français, nous laisse croire à la nécessité de diffuser massivement les théories de ce grammairien. C'est en ce sens que nous avons fourni durant notre travail de thèse une réflexion sur la méthode d'informatisation des articles constituant notre corpus. En considérant les spécificités des articles de dictionnaires anciens bien souvent assez peu rigoureusement structurés, mais également l'aspect encyclopédique des entrées sur lesquelles nous avons travaillé, nous avons fait émerger le concept d'un balisage "souple" ou "flottant".
Inspiré du balisage "analytique" prôné par Chantal Wionet et Agnès Tutin(3) , ce balisage constitue selon nous une réponse efficace à la volonté d'exploiter le plus possible les données du texte rétroconverti sans pour autant imposer une trop grande subjectivité du lexicographe dans l'identification des différents champs informationnels.


(1) Clérico, Geneviève. (1995). Analyses phoniques et prosodiques au XVIème siècle. Origine et préhistoire d'une discipline. Thèse de doctorat d'État, Université de Paris VIII Saint-Denis.
(2) Rey, Christophe. (2004). Analyse et informatisation des articles traitant de l'étude des sons dans le dictionnaire Grammaire & Littérature de Nicolas Beauzée et Jean-François Marmontel, issu de l'Encyclopédie Méthodique. Thèse de doctorat. Aix-en-Provence.
(3) Wionet, Chantal, Tutin, Agnès. (2001). Pour informatiser le Dictionnaire universel de Basnage (1702) et de Trévoux (1704) Approche théorique et pratique. Honoré Champion.
 
   
 
 
   Séminaire de méthodologie en étymologie et histoire du lexique

Date : mercredi 5 avril 2006 - 14h00-15h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : "Pour une mise à jour des notices historiques consacrées aux emprunts à l'ancien francique dans le Trésor de la Langue Française informatisé"

Présenté par Martina Pitz (Université de Lyon III)

  Les relations linguistiques précoces entre la Romania et la Germania constituent l'une des préoccupations récurrentes de l'historiographie relative aux langues romanes. On peut néanmoins affirmer sans hésiter que la question du degré d'influence du superstrat francique sur le français fournit encore aujourd'hui des débats très controversés. Les diverses opinions apparaissent même opposées au point de provoquer un réel blocage sur de nombreux thèmes. Quoique le domaine lexical soit celui où l'influence du superstrat semble la mieux acceptée, cela vaut aussi pour l'étude des emprunts du français à l'ancien francique. Le projet d'une mise à jour des notices étymologiques du TLFi, qui doit rendre accessible au grand public les progrès en lexicographie historique des trente dernières années, offre ainsi une occasion privilégiée de dresser un bilan et de réfléchir aux moyens de surmonter cette aporie. Ma conférence tentera donc, en premier lieu, de présenter dans la perspective d'une germaniste l'état actuel des recherches au sujet des emprunts au francique. En second lieu, j'esquisserai les éventuelles conséquences qui en résultent pour l'analyse de ces emprunts dans le cadre du TLFi en m'appuyant sur un certain nombre d'exemples tirés des notices étymologiques existantes.  
 
 
   Séminaire ATILF

Date : Vendredi 31 mars 2006 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : "Du discours au lexique : la glose"

Présenté par Agnès Steuckardt (Université de Provence/DIPRALANG)

  L'exposé présentera les principaux aspects de la recherche sur la glose, menée à l'Université de Provence au cours des quatre dernières années. Pour éclairer le sens d'un mot, l'analyse de corpus privilégie traditionnellement le repérage des associations récurrentes, sans se soucier de la conscience métalinguistique qu'en a ou non le locuteur. Il nous a semblé possible de trouver dans les gloses données par les locuteurs aux mots qu'ils emploient un autre accès au sens lexical. Je présenterai dans un premier temps la définition de la glose à laquelle nous nous sommes arrêtés et les différentes configurations syntaxiques de la séquence textuelle de glose. Deux cas de figure se distinguent en première analyse : soit le mot glosé est accompagné de sa glose sans intermédiaire lexical, soit la glose est introduite par un terme de liaison. Ces termes de liaison (ou marqueurs de glose) se subdivisent eux-mêmes en plusieurs catégories ; nous avons distingué ainsi d'une part les marqueurs à métaterme (du type c'est à dire, en d'autres termes), qui affichent leur destination métalinguistique, des marqueurs sans métatermes (ou, donc, comme), qui la masquent : j'illustrerai dans un second temps leur description linguistique par l'exemple de autrement dit et celui de tel. Je me pencherai pour finir sur les perspectives d'utilisation de cette recherche : une automatisation du repérage des gloses est-elle envisageable ? La glose concerne-t-elle des cibles lexicales privilégiées ? Quelles limites intrinsèques comporte l'éclairage sémantique donné par les gloses discursives ?  
   
 
 
   Séminaire de méthodologie en étymologie et histoire du lexique

Date : Jeudi 30 mars 2006 - 14h00-15h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : "Apports de la base de données des plus anciens documents linguistiques de la France au projet TLF-Etym"

Présenté par Martin Gleßgen (Université de Zurich)
 
 
   Séminaire ATILF

Date : Vendredi 17 mars 2006 - 10h30-12h00

Lieu  : Université Nancy 2, Bâtiment B, salle B10

Titre : Une mésentente cordiale: l'anglo-normand, l'AND et la lexicographie du français

Présenté par David Trotter (professeur à l'Université d'Aberystwyth et directeur de l'Anglo-Norman Dictionary)

  Le but de l'Anglo-Norman Dictionary (première édition: 1977-1992 ; deuxième édition en cours) est de présenter le français de la Grande-Bretagne médiévale. Pour le faire, il exploite une gamme toujours croissante de textes des registres les plus variés. Organisé selon des principes surtout sémantiques, l'AND n'est pas et n'a jamais été un dictionnaire historique. Comme l'anglo-normand est très majoritairement du français - avec parfois d'importantes particularités sémantiques ou formelles -, l'AND peut souvent s'avérer utile pour la lexicographie historique du français.
La première édition était un dictionnaire classique sur papier ; la deuxième est disponible sur papier pour la partie A-E (publiée en 2005, en 1200 pp.), mais elle existe en même temps en ligne (www.anglo-norman.net). D'accès libre et gratuit, la version internet a plusieurs atouts : d'une part, elle permet toutes sortes de recherches ; d'autre part, l'AND lui-même fait partie d'un projet plus vaste qui inclut aussi un corpus de textes numérisés, appuyé par des articles scientifiques portant surtout sur le lexique de l'anglo-normand. Grâce à la technologie XML (encodage TEI) qui sous-tend l'ensemble, l'usager peut passer facilement du dictionnaire aux textes et vice versa.
La conférence présentera l'AND (deuxième édition) et montrera les avantages que possède la version électronique. En même temps, j'aborderai la problématique d'un dictionnaire différentiel de l'ancien français et de la définition de l'anglo-normand, variété linguistique qui a toujours été au moins une demi-sœur de la langue française
 
 
 
   Séminaire ATILF

Date : Mardi 14 mars 2006 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « Le corpus informatisé et l’importance des typologies - de la lexicométrie vers la logométrie »

Présenté par Margareta Kastberg Sjöblom (UMR 6039 "Bases, Corpus et Language" de Nice)

  Comment les techniques quantitatives peuvent-elles intervenir dans l'étude des grands corpus ? L'exploration statistique donne la possibilité d'analyses diverses notamment sur le lexique, la morphosyntaxe et la structure lexicale. Ces différentes analyses permettent non seulement d'étudier le vocabulaire et le style de l'œuvre d'un écrivain, l'écriture d'une époque, etc., mais aussi de comparer différents auteurs entre eux.

En outre, l'analyse lexicométrique et plus largement celle de la logométrie offrent une meilleure compréhension des variations typologiques. La variation entre les genres est-elle réellement si pertinente qu'elle le semble dans l'état actuel de la recherche ? Quelles variations langagières enregistre-t-on entre les différentes formes de discours ? Par quels paramètres lexicaux, sémantiques, morphosyntaxiques et structuraux les variations typologiques sont elles réellement régies ? Quelle contrainte la traditionnelle division en genres impose-t-elle aux locuteurs dans leur pratique discursive ?

L'analyse du corpus en situation montre que le lexique, la morphosyntaxe, la structure et la sémantique varient avec les genres. L'opposition entre les différentes typologies est toujours présente et souvent même prépondérante dans les différentes analyses statistiques.
 
 
 
   Séminaire ATILF

Date : Vendredi 10 mars 2006 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « Projet Khartês : méthodes et outils d'analyse syntaxique »

Présenté par Nicolas Mazziotta (Université de Liège)

  Notre exposé (1) présente tout d'abord brièvement le projet Khartês (projet d'édition et d'étude de chartes originales rédigées en français, Université de Liège). (2) Nous abordons ensuite la problématique générale de l'analyse syntaxique des états de langue qui ne sont plus pratiqués, comme l'ancien français des chartes médiévales. (3) Ces observations nous mènent à décrire le modèle que nous avons élaboré et la manière dont nous l'avons mis en oeuvre. (4) L'aspect technique de notre travail fait l'objet de la suite de l'exposé, où nous montrons comment nous avons mis les outils informatiques actuels au service de notre démarche linguistique. (5) En posant aux textes la question de leur ponctuation, nous achevons notre exposé en montrant comment une analyse formalisée, systématisée et informatisée peut être employée pour partir à la découverte de faits qu'on aurait peine à discerner sans cet outil.  
 
 
   Séminaire ATILF

Date : Vendredi 3 mars 2006 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « Les qualifications métadiscursives du dire dans les discours écrits »

Présenté par Annie Kuyumcuyan

  Il s'agira de présenter quelques marqueurs autonymiques destinés à qualifier le discours tenu : marqueurs de discours rapportés, modalisateurs et marqueurs graphiques (ponctuants), en s'interrogeant sur l'harmonisation éventuelle de leur description.  
 
 
   Séminaire ATILF

Date : Vendredi 17 février 2006 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Chaînage causal et schéma spatial dans la représentation des verbes

Présenté par Bernard Fradin (Laboratoire de linguistique formelle)

  L'exposé discutera de propositions récentes faites par Croft (1991, 1998), Davis & Koenig (2000), Davis (2001) pour représenter la sémantique de verbes mettant en jeu un argument (sémantique) spatial. Ces propositions visent à montrer qu'un schéma basé sur la relation AGENT-PATIENT suffit à rendre compte du comportement syntaxique des verbes. Elles prévoient en particulier qu'il n'est pas nécessaire de postuler de verbes ayant un SN sujet locatif. Les faits tirés de la morphologie -- adjectifs en -able et N déverbaux en -eur -- semblent montrer que cette opinion doit être abandonnée.  
 
 
   Séminaire ATILF

Date : Vendredi 3 février 2006 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Constitution et exploitation d'un corpus diachronique : enjeux et spécificités

Présenté par Sophie Prévost (CNRS/Ecole Normale Supérieure, Paris)

  Notre conférence portera sur les enjeux, les contraintes et les spécificités liées à la constitution et à l’exploitation d’un corpus de français médiéval envisagé dans une perspective diachronique. Après avoir rappelé les spécificités de l’objet considéré –une langue sans locuteurs et soumise à la variation tant diachronique que dialectale que de registre– nous évoquerons plus précisément l’expérience de la constitution d’une base de données textuelle et la difficile question de la représentativité des textes. En nous appuyant sur des cas d’études précis, nous développerons ensuite les apports des corpus numérisés pour notre connaissance de la langue médiévale, qu’il s’agisse de la mise au jour de nouveaux faits, de leur quantification ou de leur mise en relation.  
 
 
   Séminaire de méthodologie en étymologie et histoire du lexique

Date : Mercredi 18 janvier 2006 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Réflexions sur le traitement lexicographique des termes faisant référence à la civilisation antique et médiévale du TLFi

Présenté par Frédéric Duval (Université de Metz/équipe Moyen français et français préclassique)

  Ce séminaire envisagera le champ très limité des mots de civilisation romaine (avec une ouverture sur les mots de civilisation médiévale). [1] On dégagera d’abord les problèmes lexicologiques posés par ces mots : définition et délimitation du champ ; les mots de civilisation sont-ils des termes ?; sémantique et encyclopédie ; les mots de civilisation en diachronie : le problème de la « référence évolutive ». [2] On tentera ensuite de voir quels enseignements la lexicographie peut et doit tirer d’une réflexion théorique sur cette question. [3] Enfin, à partir d’un parcours du domaine technique « antiquité » (et si le temps le permet de « féodalité ») du TLFi, on analysera les défauts les plus fréquents des notices étymologiques et historiques et l’on proposera plusieurs directions pour opérer des corrections systématiques.  
   
 
 
   Séminaire ATILF

Date : Vendredi 6 janvier 2006 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Normes sémantiques et typologie textuelle

Présenté par Carine Duteil-Mougel

  Notre recherche porte sur la caractérisation des textes et l'étude des normes sémantiques (genres, discours). A partir d'une définition du genre, sur un plan sémantique-rhétorique, nous ferons des propositions pour la classification des textes (étiquetage global, typologie) et la structuration des bases textuelles (constitution de corpus homogènes). Nous proposerons également, dans le cadre d'un système d'aide au traitement sémantique de corpus (interprétation assistée), des balises pour le repérage de formes sémantico-rhétoriques (étiquetage local).  
 
 
   Séminaire de méthodologie en étymologie et histoire du lexique

Date : Mercredi 14 décembre 2005 - 14h00-15h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : La traque des premières attestations

Présenté par Nadine Steinfeld (équipe Étymologie et histoire du lexique)

  Parmi les éléments d'information que la lexicographie a la charge d'inventorier, l'un des plus significatifs est représenté par les premières attestations ou datations des mots, qui permettent d'avancer dans les dictionnaires étymologiques la date du premier emploi d'un terme. Si le caractère éminemment provisoire des datations proposées par les dictionnaires étymologiques est une évidence, les dates d'apparition ou les premières attestations d'une unité lexicale ou d'un sémantisme dans une langue à un moment donné sont toutefois un élément de première importance permettant de reconstituer les étapes de l'histoire d'un mot. Cependant, le lexicographe ne devrait jamais oublier qu'une simple date ne signifie rien en soi, si elle n'est entourée de données graphiques, phonétiques, morphologiques, sémantiques, stylistiques, etc., qu'elle apporte avec son contexte. La traque des premières attestations n'a de sens que si elle est soumise à une enquête minutieuse qui révèlera, grâce à un retour aux sources, un ensemble de faits et d'éléments d'information permettant d'éclairer la mentalité, le milieu, le moment, le groupe ou l'individu dont le vocabulaire paraît être l'une des formes d'expression les plus révélatrices. Qui connaît mieux que les médiévistes les pièges cachés dans les textes d'ancien et de moyen français qui imposent de soumettre les attestations systématiquement à un examen critique approfondi mené à partir d'une liste de contrôle régie par des principes philologiques, sémantiques, phonétiques, morphologiques, encyclopédiques, stylistiques, chronologiques, diatopiques et la recherche de parallèles afin de diminuer la probabilité de l'erreur. À partir de l'analyse de quelques exemples de premières attestations que j'ai proposées ou rejetées au cours de la refonte d'articles du premier volume du FEW et de TLF-Étym, je m'efforcerai d'illustrer la mise en pratique de certains de ces principes philologiques qui m'ont permis de débusquer trois "mirages lexicographiques" qui ont vécu plus d'un siècle franchissant un dictionnaire après l'autre et qui continuent à jouir d'une vie paisible dans le Dictionnaire historique de la langue française d'Alain Rey. L'adage, osé par un éminent philologue, qu' «il n'y a pas de lexicographe sans gaffes», reçoit une nouvelle confirmation, mais c'est là précisément ce qui donne du piment au dictionnaire et l'humanise délicieusement.  
 
 
   Séminaire ATILF

Date : Vendredi 2 décembre 2005 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Analyse lexicale d'une " pierre de Rosette " du français en Angleterre au XVe s.

Présenté par Christel Nissille (Université de Neuchâtel/ATILF)

  Les récentes études portant sur les manuels de langue pour l'enseignement du français en Angleterre au Moyen-Age ont permis de mettre en lumière l'utilisation d'exercices pratiques de traduction comme moyen didactique.
Un de ces exercices, l'Oxford Magdalen 188, est un manuscrit trilingue inédit du début du XVe siècle qui contient en parallèle le texte source, copie de la Somme le roi de Lorens d'Orléans (1280), et les traductions en latin et en moyen anglais.
Cette présentation en miroir des trois versions nous donne des informations assez précises sur la compréhension du texte par le traducteur anglais, que nous observons dans l'acte même de la traduction, et nous indique quels outils lexicaux et grammaticaux étaient à sa disposition.
Nous nous proposons de tenter d'analyser, grâce à cette "pierre de Rosette", de quelle manière le traducteur identifie les formes rencontrées puis les traduit.
Il s'agit donc de comprendre, en ce qui concerne la réception tout d'abord, les aides et les pièges que constitue la graphie du texte source, l'influence de la parenté des trois langues en présence et les problèmes que pose la variation diachronique et diatopique.
Du point de vue de la production, nous nous intéresserons surtout à l'utilisation du binôme synonymique et de la complémentarité des deux langues dans cette traduction.
 
   
 
 
   Séminaire ATILF

Date : Vendredi 25 novembre 2005 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Approche cognitive de l'adjectif : sémantisme et fonction

Présenté par Marie Luce Honeste (Université Rennes 2/E.A. Sens & Texte, Université de Paris-Sorbonne)

  Cette conférence vise à présenter une approche cognitive des processus de formation du sens en langue et en discours à travers une application au cas de l'adjectif. L'hypothèse développée est que les processus de formation du sens ne sont pas les mêmes dans la langue et dans le discours, parce que les mots n'y répondent pas aux mêmes types de fonctionnalités.
Dans cette perspective, l'adjectif sera donc abordé à deux niveaux :
- en langue, du point de vue de l'origine cognitive de la formation du sens lexical. À ce niveau, le statut grammatical de l'unité lexicale est moins prégnant que la notion véhiculée : il intervient comme simple forme du contenu ;
- en discours, du point de vue des mécanismes de formation du sens des énoncés, et du rôle sémantique qu'y tiennent les mots qui les composent. À ce niveau, au contraire, le statut et la fonction des unités lexicales deviennent prédominants, dans la mesure où c'est par leurs propriétés syntaxiques qu'elles participent activement à la formation du sens.
 
   
 
 
   Séminaire de méthodologie en étymologie et histoire du lexique

Date : Mercredi 16 novembre 2005 - 14h00-15h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Dérivation française/romane/latine à l'intérieur d'une famille étymologique

Présenté par Jean-Paul Chauveau (équipe Étymologie et histoire du lexique)

  A partir de quelques exemples de dérivés ou d’une famille dérivationnelle que j’ai eus à traiter au cours de la refonte d’articles du premier volume du FEW et pour lesquels j’ai eu des divergences avec les explications étymologiques fournies par le TLF, je vais essayer de montrer qu’il n’est pas rare qu’on puisse améliorer le traitement de la dérivation dans les notices historiques et étymologiques du TLF. Un des grands avantages comparatifs du TLF, c’est que la dérivation française y est traitée de façon systématique, explicite et transparente, en ce sens que chaque (ou presque) dérivé y a droit à une notice historique et étymologique où le dérivé est décomposé en une base et un suffixe qui tous deux sont traités sous une entrée spécifique, avec notices synchronique et diachronique. L’explication étymologique des dérivés est donc entièrement falsifiable, c’est-à-dire que son adéquation à la réalité est vérifiable à l’intérieur même du dictionnaire. Cela a pour conséquence et avantage qu’on peut très facilement vérifier :
1) si l'explication étymologique qui est donnée de tel ou tel dérivé est cohérente avec les programmes dérivationnels qui sont décrits sous les suffixes en cause, c’est-à-dire si le dérivé analysé correspond bien au modèle dérivationnel qui est explicité dans l’article consacré au suffixe;
2) si les programmes dérivationnels analysés sous chaque suffixe rendent compte de tous les événements qui affectent l’histoire, la forme et le sens de la plupart des dérivés qui contiennent cet élément, autrement dit si le programme dérivationnel est suffisamment riche et complexe pour rendre compte de l’histoire des dérivés sous lesquels il sera renvoyé à l’article traitant du suffixe.
Cette recherche de cohérence est possible maintenant qu’on dispose de l’entier du TLF. Evidemment lorsque la rédaction en était aux premiers volumes, la situation était bien différente: les articles consacrés aux suffixes n’étaient pas écrits et ces derniers ne pouvaient bénéficier de la totalité des articles où ces suffixes étaient concernés. D’où les ratés inévitables. Je rappelle la boutade de Gilliéron, l’auteur de l’Atlas linguistique de la France: ‘le questionnaire aurait été sensiblement meilleur s’il avait été constitué après l’enquête’.
 
   
 
 
   Séminaire de méthodologie en étymologie et histoire du lexique

Date : Jeudi 3 novembre 2005 - 14h00-15h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : L'importance de la critique des sources en étymologie

Présenté par Frankwalt Möhren (DEAF, Heidelberg)

  L'exposé se basera sur l'analyse des articles jarde, jaseran, javelle, javelot, jogler, jonction, standard du TLFi  
 
 
   Séminaire ATILF

Date : Vendredi 14 octobre 2005 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Les régionalismes en ancien et en moyen français

Présenté par Gilles Roques et Yan Greub

  Yan Greub : « Je présenterai la localisation d'un texte de la fin du 15e siècle, le Nouveau Pathelin, sur la base du travail effectué dans mon ouvrage Les Mots régionaux dans les farces françaises. En introduction, j'insisterai spécialement sur les conditions de présence des attestations lexicales, qui rendent particulièrement productive la prise en compte des attestations dialectales modernes, pour autant que cela se fasse dans une perspective historique. J'essaierai aussi de montrer l'utilité de la cartographie pour la localisation du lexique et des textes anciens. J'essaierai aussi d'exposer en quoi la méthode de localisation que je propose s'applique aux textes de la période considérée, et d'indiquer que les problèmes sont peut-être différents pour d'autres documentations. G. Roques se propose de contester le résultat de la localisation que je propose, et nos communications devrait déboucher sur une discussion, de faits et de méthode. »  
 
 
   Séminaire de méthodologie en étymologie et histoire du lexique

Date : Mercredi 5 octobre 2005 - 14h00-15h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Le traitement historico-étymologique des régionalismes dans le TLFi

Présenté par André Thibault (professeur à l'Université de Paris-Sorbonne)

  André Thibault, d'origine québecoise, auteur du 'Dictionnaire suisse romand' (1997, Editions Zoé), qui occupe la chaire "Francophonie" de la Sorbonne, est un des tout premiers spécialistes de la variation régionale du lexique français.  
   
 
 
   Séminaire ATILF

Date : Vendredi 30 septembre 2005 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Les constructions adverbiales en français contemporain

Présenté par Lassaad Oueslati (Laboratoire de Linguistique Informatique)

  La littérature relative aux adverbes de modalisation est abondante. Tous les travaux s'intéressant à cette catégorie sont unanimes à définir ces adverbes comme outils servant à modaliser le discours en apportant un jugement du locuteur sur ce qu'il dit. En dépit de cette unanimité, nous nous heurtons à une diversité terminologique qui fait écho à la diversité des approches. C. Guimier, Ch. Molinier, Authier-Revuz, etc., pour ne citer que les travaux les plus récents, optent chacun pour une terminologie différente de celle des autres.
Dans l'optique du traitement automatique, l'approche est toute différente. En nous appuyant sur la méthodologie adoptée au Laboratoire de Linguistique Informatique, nous allons essayer d'étudier cette classe d'adverbes en appliquant la notion d'emploi. L'analyse dichotomique emploi prédicatif/non prédicatif nous permettra d'opérer un classement de nature à faciliter le traitement automatique.
 
 
 
   Séminaire de méthodologie en étymologie et histoire du lexique

Date : Mercredi 21 septembre 2005 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : La série du Dictionnaire de Trévoux, une source de références parfois maltraitées dans le TLF

Présenté par Isabelle Turcan (équipe Métalexicographie historique)
 
 
   Séminaire ATILF

Date : Vendredi 16 septembre 2005 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Problèmes méthodologiques de la constitution et de l'analyse de corpus d'interaction adulte-enfant au cours de l'acquisition du langage

Présenté par Martine Vertalier, CRALOE (Centre de Recherche sur l'Acquisition du Langage Oral et Ecrit) composante de CALIPSO (Acquisition, Cognition, Interaction, Pratiques Sociales du Langage), Paris 3.
Luiggi Sansonetti, SYLED (Systèmes Linguistiques, Enonciation et Discursivité) et CALIPSO, Paris 3. Luigi Sansonnetti et Martine Vertalier (Université de la Sorbonne Nouvelle, Paris 3)


  1. Martine Vertalier :
Nous présenterons les principaux aspects théoriques et méthodologiques d'une approche linguistique de l'acquisition du langage (oral et écrit), approche qualitative en ce qu'elle s'appuie sur des données attestées, recueillies en contexte discursif, dans des corpus longitudinaux individuels d'interactions entre un adulte et un enfant, par opposition aux approches quantitatives et comparatives souvent pratiquées en psycholinguistique. Nous exposerons les méthodes de recueil, de transcription et d'analyse élaborées et affinées au sein du CRALOE depuis une trentaine d'années : analyse syntaxique conjointe des énoncés de l'adulte et de l'enfant (et parfois des textes écrits supports d'interaction), recherche de phénomènes d'interaction susceptibles de déclencher des processus d'apprentissage à long terme, recherche de traces d'appropriation, immédiate ou différée, par l'enfant d'introducteurs de complexité syntaxique, étude de l'évolution de la combinatoire de ces constructions complexes…
Nous évoquerons l'apport de la linguistique de corpus à cette réflexion sur les processus d'acquisition et les problèmes soulevés par une exploration informatisée de corpus où le langage est en cours d'élaboration, ainsi que notre projet de constitution d'une base de données pour la recherche en acquisition du langage, qui permettrait de systématiser les observations qualitatives et, entre autres, de confronter et d'évaluer les manières d'interagir d'adultes différents, à la lumière de la notion de "genre" de discours.

2. Luiggi Sansonetti :
Après un aperçu de différentes conventions de transcription de l'oral et des problèmes que ces variations (entre laboratoires, phénomènes observés et auteurs) posent, tant à la lecture des documents qu'aux analyses assistées par ordinateur, nous présenterons une " aide " à la création de nouveaux documents pour " au moins " standardiser les transcriptions établies au sein de l'équipe. En même temps, ce " modèle " permet de stocker ces nouveaux documents dans un format XML, suivant une structure définie, pour assurer une compatibilité nécessaire pour un échange de corpus avec d'autres communautés. En plus de ce cadre d'échange, nous évoquerons l'apport de ce formalisme à une analyse semi-automatique. Nous présenterons l'apport de l'utilisation de plusieurs logiciels pour la recherche de certains phénomènes d'interaction tels que reprises et reformulations entre adulte et enfant, pour les analyses syntaxiques, et pour le repérage de l'évolution langagière dans le cas de corpus longitudinaux. Nous attendons beaucoup de l'expérience des membres de l'ATILF pour répondre à nos ambitions et à nos questionnements dans ce domaine particulier de l'acquisition du langage, où il s'agit non seulement de décrire des données linguistiques mais de saisir dans la durée la dynamique de l'élaboration d'un fonctionnement langagier et cognitif.
 
 
 
   Atelier de découverte ATILF

Date : Vendredi 1 juillet 2005 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle de réunion du sous-sol

Titre : Le traitement des vedettes regroupant un masculin et un féminin (catcheur, -euse) et celui des emprunts non explicites («mot anglais» plutôt que «emprunt à l'anglais») dans le TLFi et le Supplément au TLF

Présenté par Pascale Bernard/Geneviève Fléchon/Marie-Josée Mathieu (ATILF)

  Nous avons choisi de vous présenter deux points qui posent problème dans la présentation des objets d'un dictionnaire électronique. A travers des exemples tirés du TLFi et du Supplément, nous verrons comment sont présentées les entrées qui ont une forme féminine (devin, devineresse) dans le TLFi, le Supplément et les autres dictionnaires (Robert et Académie) et comment sont traités les emprunts ou les mots empruntés dans le TLFi et le Supplément. Le traitement actuel n'est pas sans conséquence dans l'interrogation du TLFi.
L'objectif de ces réflexions est de proposer une présentation de ces données optimale, voire nouvelle, en tout cas cohérente.
 
 
 
   Séminaire ATILF

Date : Vendredi 17 juin 2005 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : "Rationalisme" et "empirisme" en sémantique lexicale. Les approches "logiques" et "cognitives" et leur utilité dans les domaines de la lexicographie et de la "traductologie"

Présenté par Jörn Albrecht (Université de Heidelberg)

  Depuis vingt-cinq ans, deux approches de la sémantique lexicale se livrent un combat acharné : d'une part, le modèle traditionnel des " conditions nécessaires et suffisantes ", qui repose sur la logique classique " aristotélicienne " et sur une épistémologie de type rationaliste, d'autre part, la " sémantique du prototype ", qui a ses origines dans la psychologie cognitive et dans l'épistémologie de type empiriste. A ces deux approches s'ajoute la " sémantique du stéréotype " de Hilary Putnam, ni logique, ni cognitive, mais plutôt " pragmatique " au sens du pragmatisme américain. Dans mon intervention, je tâcherai de monter que le combat entre les représentants des différentes positions est superflu : il ne s'agit pas de modèles vraiment antagonistes, mais d'approches complémentaires, dont les lexicographes et les traductologues peuvent s'inspirer avec profit.
 
   
 
 
   Séminaire ATILF

Date : Vendredi 3 juin 2005 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Les déterminants nominaux quantifieurs et la métaphore

Présenté par Sarah Leroy (UMR CNRS 7114 MoDyCo, Paris X - Nanterre)

  Les noms les plus à même de construire des déterminants, dits « déterminants nominaux quantifieurs », sont les noms exprimant exclusivement la quantité : kilo (un kilo de farine), litre (un litre d'huile), heure (une heure d'anglais), etc. Mais de nombreux déterminants nominaux sont construits avec des noms non exclusivement quantifieurs : un tourbillon de fêtes, un camion de sable, un bâton de réglisse, une montagne de linge
Ces derniers déterminants nominaux, dont le nom n'est pas strictement quantifieur, sont souvent qualifiés de « métaphoriques ». Or il apparaît que cette étiquette recouvre des fonctionnements sémantiques en réalité assez différents les uns des autres ; une valise de billets est certes plutôt métonymique que métaphorique, mais une valise de soucis n'est pas exempt d'une certaine dimension métaphorique. Celle-ci n'est pourtant pas du même ordre que ce qu'on observe dans un carré de chocolat, un brin de fantaisie ou dans un torrent de larmes voire un torrent d'injures. En fait, différentes relations métaphoriques sont en cause (quantification d'une notion non quantifiable, métaphore binominale d'identification), tandis que la valeur de quantification n'est pas toujours la plus saillante.
En gardant toujours comme base de classement les différents types de noms utilisés, on proposera de classer les différentes réalisations de syntagmes Dét-N1-de-N2 selon qu'ils réalisent plutôt une opération de quantification ou une identification métaphorique.
 
 
 
   Atelier de découverte ATILF

Date : Vendredi 13 mai 2005 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Analyse syntaxique et sémantique des verbes de communication (projet ILF)

Présenté par Bernard Combettes et Sébastien Haton

  "Les bases littéraires sont une inépuisable source de données linguistiques originales, parfois inattendues, toujours pertinentes. En partant du principe que les dictionnaires ou les exemples construits ne donnent pas une idée suffisamment précise du véritable potentiel de la langue, les membres du projet ILF "Transitivité" ont choisi FRANTEXT comme corpus de travail pour analyser le paradigme des verbes de parole, lesquels partagent tous le sème commun production de langage articulé humain.
L'analyse de ces verbes en contexte met en évidence qu'il n'est pas possible de les classer en vertu de la dichotomie transitifs versus intransitifs. Dans la réalité de la langue, la plupart des 900 verbes de parole analysés se comportent tantôt comme dire-transitif direct, tantôt comme parler-intransitif, ces deux verbes n'ayant eux-mêmes pas toujours un comportement "stable" en contexte.
Bernard Combettes et Sébastien Haton animeront un exposé interactif et vous proposeront, le temps d'un séminaire, de vous glisser dans la peau d'un linguiste et d'effectuer avec eux le cheminement qui mène de l'élaboration des outils d'analyse à l'analyse des verbes de parole proprement dite. N'oubliez pas vos crayons !"
 
 
 
   Séminaire ATILF

Date : Vendredi 8 avril 2005 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Tréma et néologie

Présenté par Dominique Jacob

 
Après être né au XVIe siècle et avoir connu son heure de gloire au XVIIe siècle, l'usage du tréma s'est grandement affaibli, les termes qui en étaient porteurs ont diminué à tel point qu'on peut s'interroger sur sa prochaine disparition au cours du siècle présent.
Mais, afin de mieux cerner une partie du problème, il faudrait savoir si de nouveaux mots ne sont pas en train de s'introduire dans la langue française. Depuis une vingtaine d'années, la lecture de la presse contemporaine nous a conduit à recueillir un certain nombre de mots trématés qui ne figurent pas le plus souvent dans les dictionnaires.
Voici quelques exemples suivants qui sont explicites dés le premier abord :
colzaïculteur, euroïque, maoïstement, papaïser. D'autres sont plus énigmatiques. Savez-vous ce que signifie un quoïng, une cocoïste ou une joëlette ? Si vous connaissez les langues étrangères, vous saurez déchiffrer le daïkon, le sabaï-sabaï et le pulkaïste. Lorsque vous effectuez vos courses, peut être n'avez-vous pas prêté attention aux marques Baïmé, Caïro et Daï que vous glissez dans votre Caddie ?
Si leur nombre de ces mots est intéressant, les procédés de formation ne le sont pas moins, qu'il s'agisse de suffixation ou de dérivation. Nous aurons l'occasion de les étudier. Nous nous pencherons également sur les raisons de ces néologismes paradigmatiques ou syntagmatiques où l'humoristique loftoïevski côtoie le satirique derridadaïsme.
Alors le tréma de ces nouvelles créations sera-t-il éphémère ou durable ? Réponse le vendredi…
 
 
 
   Atelier de découverte ATILF

Date : Vendredi 1 avril 2005 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle réunion 2ème étage

Titre : Les locutions conjonctives temporelles: problèmes posés par l'approche historique (Projet Étude historique des «mots grammaticaux»)

Présenté par Bernard Combettes et Annie Kuyumcuyan (ATILF)

 
 
   Atelier de découverte ATILF

Date : Vendredi 18 mars 2005 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : La langue française du 14e au 16e siècle

Présenté par Hiltrud Gerner, Gilles Souvay et al.

  Après une courte présentation des deux projets principaux, quelques membres de l'équipe exposent les différents aspects de leur travail en montrant à la fois la richesse du vocabulaire traité et les difficultés rencontrées qui nécessitent des recherches nombreuses et souvent complexes.
Quelques termes, illustrés par des miniatures, laissent entrevoir que la vie quotidienne de l'époque était somme toute assez proche de la nôtre.
 
 
 
   Séminaire ATILF

Date : Vendredi 4 mars 2005 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Éléments de méthodologie pour l'étude littéraire assistée par ordinateur ou comment faire aimer l'ordinateur aux littéraires

Présenté par Jean-Luc Benoit (ATILF)

  L'ordinateur peut nous rendre des services pour l'étude littéraire à condition de définir des règles et des méthodes qui respectent les textes et la démarche critique. Est-il utile de rappeler que la condition première de l'étude littéraire est le respect philologique et le pari pour la recherche du sens s'appuyant notamment, mais pas seulement, sur le plan du texte ? Allons plus loin. L'enrichissement des ressources textuelles pourrait inclure avec profit des données d'histoire littéraire contenant la chronologie des événements historiques, sociaux, politiques, économiques, la biographie des écrivains, la bibliographie, les courants littéraires, l'histoire de la culture et le mouvement des idées. Les développements de l'informatique mettent à la disposition de tous des textes numérisés et des moyens d'informations et d'analyse puissants. Néanmoins, et plus que jamais, nous voulons souligner que le travail avec l'ordinateur n'est qu'une partie de cette démarche personnelle et toujours nouvelle qu'est la lecture. L'outil informatique n'intervient que pour aider à mettre en évidence puis à approfondir des éléments mis au jour par chaque lecteur.
 
 
 
   Séminaire ATILF

Date : Vendredi 25 février 2005 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Les constructions à verbe support avec "conseil" comme noyau (du type "demander, avoir, porter conseil")

Présenté par Lene Schøsler (Université de Copenhague)

  Mes réflexions sur les verbes supports font partie d'une étude plus générale portant sur les constructions des verbes, l'objectif étant de décrire l'organisation et les multiples réorganisations de ces schémas du latin au français moderne tout en cherchant à en comprendre les motivations.
Le but de ma présentation est de montrer la nécessité de travailler sur de vastes corpus comme celui d'ATILF, la BFM et Frantext pour bien décrire et pour essayer de comprendre l'évolution de la langue, en l'occurrence l'évolution des constructions verbales, illustrées surtout par le cas de conseil, noyau de cvsup. Plus concrètement, je me propose de décrire et d'expliquer des variations illustrées par les exemples suivants en les considérant par rapport au verbe simple conseiller :
a. " Sire , fait il , il nos estuet bien conseil prendre et demender… " (Renard 13e s., v. 1575 BFM)
b. et sur ce il en demandoit à avoir conseil et que on le conseillast loyaulment (Froissart, Chroniques III 1390, p. 106 ATILF)
 
 
 
   Séminaire ATILF

Date : Vendredi 18 février 2005 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : La linguistique ne pourrait-elle pas servir à expliquer des processus d'acquisition ?

Présenté par Emmanuelle Canut (ATILF)

  Après un rapide détour historique pour situer la part de la linguistique dans l'étude du langage de l'enfant par rapport à la psychologie, nous exposerons les fondements d'une linguistique de l'acquisition dans laquelle s'inscrivent mes recherches. Tout en nous référant au champ de la psychologie sociale (Vygotsky 1934, Bruner 1983, Bronckart 1996), nous nous appuyons sur des travaux en linguistique de l'énonciation (Bakhtine 1929, Benveniste 1966), sociolinguistique de la variation (Gadet 1989, 1992, 1997), linguistique de corpus et syntaxe du français parlé (Biber 1988, Blanche-Benveniste 1997) pour considérer la langue, non comme un système homogène et stable, mais comme un ensemble de pratiques langagières où les modalités de l'oral et de l'écrit s'interpénètrent. Dans cette perspective, la linguistique des interactions (Kerbrat-Orecchioni 1990, Vion 1992) offre un cadre théorique de base à une observation du langage de l'enfant, et de celui qui lui est adressé, vu dans la variété de leurs pratiques.

Pour rendre compte de la mise en fonctionnement du langage au cours du dialogue, nous procédons à des analyses qualitatives de corpus longitudinaux d'interactions individuelles entre un adulte et des enfants âgés de deux à sept ans en repérant dans les énoncés les reprises et tentatives de reprises par l'enfant de fonctionnements syntaxiques dans des interactions immédiates ou différées et leur évolution dans le temps. J'en donnerai quelques exemples. Pour pouvoir envisager de généraliser les résultats concernant la progression dans le processus d'appropriation des formes linguistiques jusqu'à leur stabilisation, des analyses quantitatives seraient maintenant nécessaires, mais elles posent un certain nombre de problèmes (telle l'analyse informatisée de corpus oraux) que je souhaiterais également soulever et discuter.
 
 
 
   Séminaire ATILF

Date : Vendredi 4 février 2005 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Marguerite Duras vue par la statistique lexicale

Présenté par Véronique Montemont (ATILF)

  Six textes de Marguerite Duras sont actuellement présents dans Frantext, et certains ont été écrits à plus de trente ans d'intervalle. D'Un barrage contre le Pacifique à L'Amant, cette étude se propose d'utiliser la statistique lexicale pour cerner plus précisément la manière dont a évolué le style durassien. En effet, la modification de la structure phrastique, qui va d'une phrase classique à une forme agrammaticale très étudiée, le rétrécissement des réseaux lexicaux, la prédominance de certaines catégories de mots sont des traits caractéristiques de l'écriture de cet auteur. Il peut donc être intéressant de comparer ce que la statistique nous dit de l'organisation syntaxique et sémantique des textes et la poétique, qui obéit à la même dynamique de resserrement, de répétition et d'anaphore.
 
   
 
 
   Atelier de découverte ATILF

Date : Vendredi 21 janvier 2005 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle réunion 2ème étage

Titre : Initiation à l'étymologie à travers le projet TLF-Etym

Présenté par Eva Buchi, Pascale Baudinot et Gilles Petrequin (ATILF)

   
 
 
   Séminaire ATILF

Date : Vendredi 7 janvier 2005 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Noms d'agents et noms d'instruments en -eur (-dor) dans la Galloromania

Présenté par Franz Rainer (Université de sciences économiques et commerciales de Vienne, Autriche)

  C'est Meyer-Lübke, dans sa grammaire italienne de 1890, qui semble avoir lancé l'idée que le sens instrumental des successeurs romans de lat. -torem serait dû à une extension métaphorique (l'instrument vu comme agent). Depuis, cette idée semble être entrée dans le domaine commun. En ce qui concerne la Galloromania, elle a été adoptée, entre autres, par Baldinger qui, dans son essai de 1972 sur "Quelques problèmes de la suffixation dialectale", explique les formations instrumentales et locatives en -eur qu'on peut trouver dans certains dialectes du domaine d'oïl et en ancien français (ex. ovreor "ouvroir" chez Chrétien de Troyes) comme résultat d'un "changement de suffixe". Dans ma conférence j'essaierai de montrer qu'il n'y a jamais eu, ni dans les dialectes d'oïl ni ailleurs dans la Romania, d'extension sémantique agent > instrument et que l'explication de Baldinger est donc intenable. Une explication alternative sera proposée.
 

La version écrite de cette conférence est parue dans la revue 'Vox romanica' 64 (2005), 121-140.
 
 
   Atelier de découverte ATILF

Date : Vendredi 17 décembre 2004 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Conception du réseau ATILF.FR : quels serveurs, quel type de réseau ?

Présenté par Zina Tucsnak, William Sayer et Olivier Servas (ATILF)

 
 
   Séminaire ATILF

Date : Vendredi 3 décembre 2004 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Un projet de dictionnaire scientifique libre en ligne

Présenté par Yannis Delmas-Rigoutsos (IUFM de Poitou-Charentes)

  Ce projet est issu de plusieurs constats auxquels il entend s'efforcer d'apporter une réponse :
    - L'offre de dictionnaires imprimés ou numériques est très insuffisante dans le domaine scientifique. Les termes et notions du niveau baccalauréat sont absents ou erronés.
    - Des initiatives individuelles apparaissent sur Internet. Leur contenu est parfois de bonne qualité mais il ne dispose jamais de caution scientifique.
    - Le manque de culture scientifique et technique dans notre société a atteint un niveau dangereux.
Par ailleurs, les dictionnaires tant individuels qu'institutionnels ne sont plus adaptés aux formes modernes de recherche d'information. Nous proposons donc une nouvelle manière de produire un dictionnaire, tant en termes d'organisation humaine, que d'organisation des données numériques ou que d'interface homme-machine. Nous insisterons, par ailleurs, sur l'importance des interfaces machine-machine. En termes d'organisation des données, nous insisterons sur l'importance d'adhérer au cadre structurant, en cours d'établissement, du web sémantique. Enfin, nous présenterons dans quelle mesure un tel cadre permet aux équipes de recherche qui le souhaitent de diffuser leurs résultats.
 
   
 
 
   Atelier de découverte ATILF

Date : Vendredi 19 novembre 2004 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle réunion 2ème étage

Titre : FEW

Présenté par Jean-Paul Chauveau et Nadine Steinfeld (ATILF)
 
 
   Séminaire ATILF

Date : Vendredi 5 novembre 2004 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Dictionnaire des Notions Politiques et Sociales pour le collège et le lycée

Présenté par Chrysta Pélissier et Henri-Claude Grégoire

  Dans le cadre du projet DNPS (Dictionnaire des Notions Politiques et Sociales), nous travaillons sur la conception d'un dictionnaire des notions politiques et sociales destiné à favoriser l'apprentissage de l'éducation civique au collège et au lycée.
Au cours du séminaire, nous présenterons les grandes problématiques liées à la conception d'un tel dictionnaire sur support informatique, les premiers résultats liés à une comparaison entre le DNPS tel qu'il est actuellement envisagé et le DNPS tel qui pourrait être intéressant de le développer pour un tel public. Enfin, nous présenterons une première version d'un prototype du DNPS intéressant pour les lycéens dans le cadre de leur approche de l'éducation civique.
 
 
 
   Séminaire ATILF

Date : Vendredi 22 octobre 2004 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Segmentation automatique de documents

Présenté par Stéphanie Audrit


Titre : Reconnaissance de la langue d'écriture d'un texte

Présenté par Laurent Pierret

   
 
 
   Séminaire ATILF

Date : Vendredi 8 octobre 2004 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Les mots composés en allemand : du lexique au texte

Présenté par Maurice Kauffer

  Les mots composés allemands sont une des questions les plus spectaculaires et les plus difficiles de la langue allemande. Leur longueur, leur complexité et leur fréquence dans les textes effraient plus d’un germaniste, sans parler des non-germanistes... L'exposé sera centré sur une présentation des particularités et des principales difficultés méthodologiques de l'analyse des mots composés allemands, en particulier les problèmes de graphie, d'analyse sémantique, de compréhension. La dimension textuelle des composés sera également abordée: les mots composés contribuent-ils à la construction du texte ou est-ce l'inverse ? Les exemples et extraits sont tirés de la littérature, de la presse et des langues de spécialité.
 
   
 
 
   Journées d'études

Date : Vendredi 17 et samedi 18 septembre 2004

Lieu  : Université de Nancy 2, campus Lettres

Titre : Acquisition du langage : quelles applications/implications sur le terrain ?

Comité d'organisation : Leroy Marie (Université Paris V), Godon Johanna (Université Paris 3), Canut Emmanuelle (Université Nancy 2), André Virginie (Université Nancy 2), Adami Hervé (Université Nancy 2)

  Organisées par l'ATILF CNRS - Université Nancy 2 en collaboration avec le Réseau Applications et Implications en Sciences du Langage (AISL) et le CRAPEL (laboratoire de l'UFR de Sciences du langage de l'Université Nancy 2)

Le travail du linguiste s'intéressant à l'acquisition du langage apporte un éclairage spécifique à l'étude de la mise en fonctionnement du langage oral et tente de répondre aux questions suivantes : comment l'enfant apprend-il sa (ou ses) langue(s) maternelle(s) ? Par quelles stratégies communicationnelles l'enfant s'approprie-t-il le langage ? Quelles sont les caractéristiques linguistiques de cet apprentissage ? Quels sont les processus cognitivo-langagiers mis en œuvre…?
Le linguiste se préoccupe également de la question de l'acquisition du langage écrit (lecture et écriture) en rapport avec la maîtrise du langage oral dans le cadre :
- du premier apprentissage pour les enfants entrant à l'école élémentaire,
- d'un apprentissage tardif (enfants et adolescents nouveaux arrivants, par exemple),
- d'un réapprentissage (cas des adolescents en échec scolaire et des adultes illettrés).
Ces études s'appuient sur les connaissances et les avancées des travaux dans les différents domaines des sciences du langage : phonétique expérimentale, linguistique de l'énonciation, linguistique des interactions verbales, analyse du discours, sociolinguistique, linguistique de la variation, syntaxe du français parlé et écrit…, et elles prennent en compte les différents niveaux d'analyse linguistique, sans pour autant ignorer les aspects psychologiques et sociologiques de l'acquisition du langage oral et écrit.
Ces journées d'étude ont pour objectif une actualisation des connaissances sur les aspects linguistiques du processus d'acquisition du langage oral et écrit, en élargissant et en confrontant les résultats et les perspectives de recherche choisies avec les problématiques de terrain rencontrées par les professionnels de l'enfance (pédiatres, médecins de PMI, personnels de structures petite enfance, orthophonistes, psychomotriciens, psychologues, animateurs, éducateurs, pédagogues…), les éditeurs de littérature enfantine, ou encore les associations de lutte contre l'échec scolaire et l'illettrisme.
L'objectif sera de déterminer les retombées possibles pour les praticiens des connaissances issues de la recherche. Au-delà de la compréhension de l'apprentissage du langage oral et écrit, il s'agira de réfléchir à l'articulation entre théorie et pratique afin d'ouvrir des pistes de travail pour les praticiens et les chercheurs.
 
   
 
 
   Séminaire ATILF

Date : Vendredi 10 septembre 2004 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : « Sémantique historique théorique et appliquée - le cas d'ancien français /jeu/ »

Présenté par Thomas Städtler (Dictionnaire Etymologique de l'Ancien Français, Heidelberg)

  Comme en français moderne, le mot jeu a déjà en ancien français un nombre considérable d'acceptions qui remontent, en partie, au latin, où jocus avait remplacé ludus en résorbant les valeurs de ce dernier. L'étude lexicologique que nous nous proposons a pour but d'établir une structure des significations de jeu qui tienne compte de certaines prémisses théoriques de la sémantique historique. Ainsi, on essayera, sur la base d'un choix de contextes de la littérature d'ancien français, de décrire et d'expliquer les changements des sens et le développement des emplois figurés et métonymiques.

« On lira les résultats des recherches présentées lors de cette conférence dans l'article jeu du DEAF (Dictionnaire Etymologique de l'Ancien Français, fascicule J2, parution printemps 2005). »
 
 
 
   Séminaire ATILF

Date : Vendredi 18 juin 2004 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Les Atlas Sémantiques : un modèle pour la représentation du sens

Présenté par Sabine Ploux (Institut des sciences cognitives, UMR 5015 CNRS-Université Lyon I)

  Dans cet exposé je présenterai les principes de la représentation spatiale du sens telle qu’elle est mise en œuvre dans les Atlas Sémantiques. Je montrerai comment le modèle peut être le support d’un calcul de l’appariement, entre deux langues, des valeurs sémantiques lexicales.
Enfin, je présenterai les résultats obtenus par H. Ji sur la représentation du contenu des concepts à partir de relations de co-texte.
 
 
 
   Séminaire ATILF

Date : Vendredi 4 juin 2004 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Quand le tréma se pose sur l'y ...

Présenté par Dominique Jacob (ATILF)

      Combien connaissez-vous de termes français comportant un y (i grec) porteur d'un tréma ? Deux, trois, ou quatre ... en sollicitant quelque peu votre mémoire. C'est bien peu.
    Mais, au fait, aucun ouvrage grammatical, aucun dictionnaire ancien ou moderne ne mentionnent cette existence.
    Or la lettre y peut être couronnée d'un tréma. De nombreuses attestations manuscrites ou imprimées sont là pour le prouver. Dès le XVI° siècle (édition de Villon, 1532) et tout au long des époques suivantes jusqu'au XIX° siècle (Hugo). Mais quelle(s) signification(s) peut-on lui attribuer ? Comment comprendre ce phénomène ?
    Aussi bizarre que cela paraisse, cet état de choses orthoépique n'a pas disparu de nos jours. Il suffit, pour s'en convaincre, de consulter les journaux comportant notamment des patronymes, des lieux et des marques publicitaires.
 
 
 
   Séminaire ATILF

Date : Vendredi 7 mai 2004 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : "L'analyse de la conversation appliquée à un texte du 16e siècle : le cas du Tiers Livre de Rabelais"

Présenté par Véronique Zaercher (Toul)

  Paru en 1546, soit une douzaine d'années après les deux premières chroniques, le Tiers Livre de Rabelais correspond au choix d'un nouveau genre, le dialogue, et à la production d'un ouvrage encore une fois complexe et protéiforme. Qu'il s'agisse de l'usage relativement fréquent de la narration, de l'agencement sériel des consultations ou du mélange de la comédie et de la philosophie selon la manière de Lucien de Samosate, ce long dialogue de Rabelais laisse apparaître à divers niveaux les marques de sa spécificité par rapport à la production de l'époque. Il se distingue aussi très nettement des autres chroniques (d'une part, Pantagruel et Gargantua publiés avant la date de 1546 ; d'autre part, le Quart Livre et le Cinquième Livre, ouvrages postérieurs, le second ayant été l'objet d'une publication posthume et faisant l'objet de controverses).
Dans ce cadre constitué par le dialogue, nous nous proposons d'analyser quelques particularités significatives, présentes à l'intérieur des discours d'encadrement ou des modalités de l'interlocution du Tiers Livre, en les confrontant aux usages repérables dans le reste de l'oeuvre. Trois perspectives seront tout particulièrement privilégiées : 1) les verbes de locution et leurs variations sémantiques ; 2) la syntaxe d'un segment spécifique tel que l'incise ; 3) les interactions et les modalités d'agencement des répliques.
En fonction du temps restant, nous nous interrogerons sur la pertinence qu'il pourrait y avoir à exploiter ces composantes textuelles pour évaluer l'authenticité du Cinquième Livre ou, en tout cas, la part qu'a pu avoir Rabelais dans sa rédaction.
 
 
 
   Séminaire ATILF

Date : Jeudi 22 avril 2004 - 14h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Classes sémantiques de prédicats

Présenté par Gaston Gross (LLI Paris)

  La description des verbes, et en général des prédicats, pose des problèmes théoriques de divers ordres : comment décrire les arguments, comment rendre compte de l'actualisation, quels sont les autres paramètres d'analyse ? Ce travail de description doit être réalisé pour chaque prédicat, si l'on veut mettre au point des dictionnaires électroniques. Mais une observation empirique montre que certains d'entre eux ont des propriétés communes. Si celles-ci sont définitionnelles, il y a intérêt à regrouper en classes sémantiques l'ensemble des prédicats concernés. L'objet de l'exposé est de montrer comment on peut mettre au point des classes de cette nature. On prendra comme exemple les prédicats de « coups ».
 
 
 
   Conférence

Date : Mardi 20 avril 2004 - 14h00-16h00

Lieu  : Université Nancy 2 Bâtiment B, salle B10

Titre : Sémantique textuelle appliquée : l’exemple de la plate-forme de détection PRINCIP (filtrage automatique des documents racistes et xénophobes sur Internet)

Présenté par Mathieu Valette Centre de Recherche en Ingénierie Multilingue (CRIM) & Institut National des Langues et Civilisations Orientales (INaLCO), Paris

        La banalisation du document numérique constitue une opportunité pour les sciences du texte, tant en termes de prospection scientifique que de débouchés professionnels.
      Parmi les nouveaux champs d’investigation qui s’offrent aux linguistes, ceux liés à la gestion de l’information s’avèrent très prometteurs. Sur Internet en effet, la difficulté n’est pas de trouver de l’information, mais de trouver la bonne information. C’est donc l’établissement d’une problématique de l’interprétation automatique qu’on évaluera ici, en s’appuyant sur l’exemple de la plate-forme de détection de pages Web racistes PRINCIP.
      Dépassant les systèmes de filtrage automatique conventionnels basés sur des listes de mots-clés ou des annuaires d’adresses préétablies, peu efficaces et exigeant de fréquentes mises à jour, PRINCIP met en jeu une analyse linguistique globale, multicritère, et différentielle des documents reposant à la fois sur les propositions théoriques de la sémantique interprétative et sur les possibilités offertes par l’implémentation dans un système multi-agents.
      On exposera dans un premier temps les difficultés que posent les contenus à caractère idéologique en termes d’interprétation (automatique), les limites des méthodologies classiques appliquées à cette problématique (« Web sémantique », algorithmes) ; puis, on présentera quelques solutions apportées dans le cadre de PRINCIP.
 
 
 
   Séminaire ATILF

Date : Vendredi 2 avril 2004 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Problèmes et méthodes de la dialectométrie (avec une présentation du logiciel VDM-Visual Dialectometry)

Présenté par Hans Goebl (Université de Salzbourg)

        La dialectométrie (DM) telle que nous l'entendons et pratiquons depuis plus de deux décennies, est une discipline quantifiante dont la tâche est de déceler et d'analyser les " structures de profondeur " cachées dans la masse des données dialectales d'un atlas linguistique. Les méthodes-DM, définies et mises au point jusqu'au milieu des années 80 du siècle passé, ont servi de base, en 1999-2000, pour l'établissement d'un logiciel très puissant et rapide à la fois, conçu par Edgar Haimerl à Salzbourg au cours d'un stage de recherche de deux ans.
      Le but de mon intervention sera double : 1) de présenter les méthodes-DM les plus essentielles et d'en démontrer la raison d'être et l'utilité, 2) de présenter les résultats de plusieurs analyses-DM (effectuées sur les données d'un certain nombre d'atlas linguistiques : p. ex. de la France contemporaine et médiévale, de l'Italie, de l'Angleterre, des Pays Bas etc.)
 
 
 
   Séminaire ATILF

Date : Vendredi 19 mars 2004 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Le Dictionnaire françois de Richelet (1680) : un illustre méconnu

Présenté par Gilles Petrequin

  Le Dictionnaire françois de Richelet, paru à Genève en 1680, reste de nos jours un illustre méconnu. Certes reconnu depuis longtemps comme le premier dictionnaire entièrement monolingue en français, il n’a encore jamais fait l’objet d’une étude approfondie quant à son apport spécifique sur les divers champs informationnels qu’il aborde et par lesquels il se démarque souvent de ses concurrents par la richesse de son discours descriptif sur la langue du XVIIe siècle.
Notre recherche actuelle s’attache donc avant tout à mettre la première édition du Dictionnaire de Richelet en contextualisation, tant par rapport à ses sources littéraires, techniques ou grammaticales qu’à l’égard des autres dictionnaires de la fin du XVIIe siècle, en particulier le Furetière et le Dictionnaire de l’Académie dont l’élaboration fut contemporaine du Richelet même s’ils parurent une décennie après lui.
Cette recherche sur l’édition de 1680 devra être à l’avenir prolongée dans plusieurs directions notamment en ce qui concerne la transformation et l’évolution du texte de l’ouvrage de 1680 lors de ses éditions successives, et en particulier à l’occasion de la réédition procurée par Richelet lui-même en 1693. Une étude menée sur les différentes éditions parues au XVIIIe siècle permettrait également de mieux cerner les enjeux lexicographiques et idéologiques qui opposaient le Richelet aux différentes autres entreprises éditoriales concurrentes de l’époque, le Furetière et le Trévoux notamment.
Le riche fonds de dictionnaires anciens de l’ATILF permettra de mener à bien cette enquête qui demanderait, pour être menée avec toute l’ampleur souhaitable, le concours de plusieurs chercheurs.
 
 
 
   Séminaire ATILF

Date : Vendredi 12 mars 2004 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Plaidoyer pour une mise à jour permanente de la rubrique "Etymol. et hist." des articles du TLFi

Présenté par Eva Buchi

    Cette intervention postule qu'outre le fait d'envisager la mise à jour progressive du TLFi dans des termes de veille lexicale (enrichissement de la nomenclature), notre laboratoire se doit de mettre en chantier une réactualisation permanente de la rubrique étymologique et historique de cet ouvrage de référence en lexicologie française. Cette nécessité s'explique par trois constats :

  1) Le TLF (et donc le TLFi) contient à ce jour le dictionnaire historique du français moderne le plus fiable ("le trésor dans le Trésor"). Or la conservation de cette position de premier ordre dépend de notre aptitude à répercuter les résultats de la recherche étymologique et historique contemporaine dans les colonnes de cet opus magnum.
  2) L'ATILF adopte une position quelque peu schizophrénique en assurant une large diffusion à un TLFi représentant l'état de la recherche de 1971/1994, tout en réalisant en son sein des recherches étymologiques et historiques poussées qui en rendent les rubriques "Étymol. et Hist." de plus en plus désuètes.
  3) Le passage du TLF au TLFi a constitué un immense pas en avant en raison des multiples possibilités d'interrogation qu'offre ce dernier. Or il s'agit à présent de profiter du second avantage que présente l'outil informatique sur l'outil papier : la facilité relative des corrections et mises à jour.

Les retouches à apporter à la rubrique historique des articles du TLFi issues de recherches réalisées parmi nous sont nombreux. On peut citer par exemple :
  • Les antédatations relevées par l'équipe "Moyen français et français préclassique". Ainsi pour adminicule (1555 > 1494/1498), arille (1808 > 1426) ou azimut (1544 > 1362)1.
  • Les étymologies corrigées dans la refonte du FEW : ainsi argent (représentant héréditaire analysé comme un emprunt au latin), autonomie (calque de l'anglais et de l'allemand à partir d'un hellénisme, analysé comme un hellénisme simple) ou loriot (occitanisme analysé comme une formation française).
  • Les étymologies revues dans le cadre de notre monographie sur les russismes romans : ainsi chaman (germanisme analysé comme un russisme), cosmonaute et maximalisme (russismes analysés comme des formations françaises) ou morse (latinisme analysé comme un russisme).
Par respect pour le texte original, nous ne proposons pas de modifier le contenu du TLF. Il s'agirait simplement de permettre aux lecteurs d'accéder par hypernavigation à une version remaniée de la rubrique "Étymol. et Hist." qui tiendrait compte des résultats de la recherche actuelle, à commencer par celle qui se réalise à l'intérieur du laboratoire. Bien évidemment, notre propos ne revient pas à "prendre le TLF en défaut", selon l'expression de F. J. Hausmann (cf. ZFSL 102 [1992], 225-236), mais s'inscrit dans une démarche de maintien de l'excellence d'un des produits phares de notre laboratoire.
La conférence sera suivie d'un débat animé par Jean-Marie Pierrel et auquel tout le monde est invité à participer.

1. Données amicalement mises à notre disposition par Hiltrud Gerner.
 
 
 
   Séminaire ATILF

Date : Vendredi 5 mars 2004 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Le vocabulaire politique aux 14e et 15e siècles : Constitution d’un lexique ou émergence d’une science ?

Présenté par Olivier Bertrand, Ecole Polytechnique et ATILF/CNRS

  Lorsque les traducteurs de Charles V (1364-1380) se penchent sur les œuvres politiques de l’Antiquité et du moyen âge qu’ils traduisent laborieusement, ils ont conscience de créer un nouveau lexique mais prennent-ils bien la pleine mesure d’une émergence du fait politique comme entité constituée ? On sait qu’une grande partie du vocabulaire politique utilisé aujourd’hui en français fut créée aux 14e et 15e siècles par les traducteurs officiels du royaume. Cette période de l’histoire de la langue est-elle celle de la simple constitution d’un lexique qui s’étoffe peu à peu ou bien émerge-t-elle à la faveur d’une réelle conscience qu’avaient les souverains de construire une science de la politique ? La question soulevée ici est celle de l’émergence d’un lexique (celui du politique) et de son implication dans la société française à la fin du moyen âge : à la faveur des conflits tant politiques que théologiques entre papauté et royauté quant à la suprématie du pouvoir temporel, y a-t-il juste constitution d’un lexique spécialisé rendu possible par les nombreuses traductions commanditées par le roi de France ou bien mise en place d’une théorie (ou tentative de théorisation) de la politique qui s’installe, par le truchement du lexique, dans l’univers politique français ? Autrement dit, les nombreux néologismes dans le champ politique des 14e et 15e siècles s’inscrivent soit dans une production éparse de traduction des textes, soit dans une construction beaucoup plus élaborée d’une science naissante : la science politique. C’est à partir des préfaces des traducteurs, de leurs commentaires, des gloses, des textes historiques et des néologismes mêmes que nous tenterons d’évaluer si ce lexique politique naissant dépasse le cadre strictement linguistique.  
 
 
   Séminaire ATILF

Date : Vendredi 20 février 2004 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Présence de la Lorraine dans la lexicographie française de l'Ancien Régime

Présenté par Isabelle Turcan

       Si nous nous intéressons à la présence de la Lorraine dans les dictionnaires de langue française imprimés sous l'Ancien Régime, c'est pour tenter de comprendre pourquoi le libraire nancéien, Pierre Antoine, a choisi de rééditer en Lorraine à Nancy, en 1734 puis de 1738 à 1742 et en 1752, le Dictionnaire Universel François et Latin dit de Trévoux car il fut imprimé dans cette petite ville de la Principauté de Dombes pour la première fois en 1704.
     Après avoir étudié dans quelle mesure la Lorraine fut présente, de façon modeste, dans les dictionnaires imprimés sous l'Ancien Régime avant la naissance du Dictionnaire [...] de Trévoux, nous montrerons que c'est véritablement dans ce grand ensemble sériel imprimé à diverses reprises tout au long du XVIIIe siècle (1704-1771) que la Lorraine rayonnera, à divers titres, dans l'Europe francophone des Lumières, grâce à des rédacteurs et éditeurs qui ont osé entrer en concurrence avec le Dictionnaire de l'Académie française pour représenter l'usage réel d'une langue française enracinée dans une culture et ouverte au monde.
 
 
 
   Séminaire ATILF

Date : Vendredi 6 février 2004 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Le fabuleux destin du lexique français en judéoespagnol (en comparaison avec les gallicismes de l'espagnol standard)

Présenté par Béatrice Schmid (Université de Bâle)

       Le judéo-espagnol oriental, la variété de l'espagnol parlée et écrite dans les communautés séfarades de l'Empire Ottoman, vit son apogée au début du XXe siècle. La séfardophonie atteint alors, avec plus de 200'000 locuteurs, son point culminant, et la presse et la production littéraire séfarades vivent une prospérité impressionnante.
     Il s'agit, de plus, d'une époque de bouleversement culturel. Depuis le milieu du XIXe siècle, une modernisation et une ouverture vers le monde occidental se manifestent à une vitesse vertigineuse. En raison du prestige de la culture française et grâce au réseau d'écoles francophones établi par l'Alliance Israélite Universelle, les nouvelles idées et la vie moderne entrent dans le monde des séfarades avec un accent français, ce qui, naturellement, se fait remarquer aussi dans la langue. Au début du XXe siècle, la francisation linguistique parvient à un tel degré que Haïm V. Sephiha parle de "judéo-fragnol" pour désigner ce judéo-espagnol moderne.
     L'influence française affecte tous les niveaux de la langue, pourtant c'est dans le lexique qu'elle est la plus évidente. La modernisation de la langue et l'élaboration des nouveaux registres langagiers s'accompagnent d'une occidentalisation ou "reromanisation" : non seulement le lexique français est la source principale pour l'enrichissement du vocabulaire, mais beaucoup de journalistes et d'écrivains font des efforts pour exterminer les turcismes et autres balkanismes en les remplaçant par des éléments provenant des langues occidentales "de la même mère", de préférence du français.
     La conférence vise à présenter les différents aspects de la pénétration des éléments français dans le lexique judéo-espagnol et de les comparer aux éléments que l'espagnol standard a empruntés au français au siècle des lumières.
 
 
 
   Séminaire ATILF

Date : Vendredi 23 janvier 2004 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : L'Iconophore dans les dictionnaires français des XIXe et XXe siècles

Présenté par Thora van Male (Institut d'Etudes Politiques de Grenoble)

       Parallèlement au discours porté par son texte, le livre dictionnaire véhicule également un discours dans ses illustrations ornementales, qu'il s'agisse des ornements éditoriaux (tels qu'étudiés par Isabelle Turcan) ou du paratexte que constituent bandeaux, lettrines et culs de lampe dans le corps de l'ouvrage. À partir du XIXe siècle, grâce aux développements technologiques en matière de xylogravure et ensuite de lithographie, l'illustration prend une part de plus en plus active en lexicographie, sur les plans documentaire et ornemental.
     Si quelques chercheurs français (principalement François Corbin) travaillent sur l'illustration documentaire du dictionnaire moderne, l'ornement semble avoir été laissé pour compte. Or, il existe un gisement d'une richesse considérable et inexploitée dans ce domaine, particulièrement dans la période située entre 1830 et 1950. La lexicographie française de cette période a fait preuve d'une rare créativité sur le plan iconographique. Elle a produit un corpus d'illustrations que j'appelle iconophores (iconophore: image dont le premier trait pertinent est constitué par la lettre initiale du nom de son référent), sans égal dans la culture lexicographique de l'Occident moderne.
      Pour l'heure, seule à étudier systématiquement cette forme de paratexte lexicographique, il me semble souhaitable que ce vaste champ puisse être ouvert à d'autres chercheurs français et internationaux. Pour connaître les iconophores, ces illustrations lexicographiques qui me passionnent, consulter Le Monde2 du mois d'octobre.
     Extrait visible sur :
 
   
 
 
   Séminaire ATILF

Date : Vendredi 9 janvier 2004 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Les structures du TLF

Présenté par Ruth Radermacher (Université de Strasbourg)

        Depuis quelques années, le TLF est complet, occupant plus d'un mètre sur les étagères des bibliothèques. " Un grand dictionnaire de plus " - se contentent de penser la plupart des linguistes.
      Ce projet de thèse, qui était au départ une enquête sur l'histoire du dictionnaire TLF, vise à faire ressortir les spécificités de cet ouvrage, notamment les progrès que l'équipe de Nancy a effectués dans différents domaines de la lexicographie. Une sorte d'exégèse du contenu nous paraît souhaitable, afin d'instruire les utilisateurs sur le profil particulier et les possibilités offertes par cet outil, d'éclairer les différentes options prises au sein de l'équipe et de montrer les apports et les limites de l'utilisation de l'informatique dans un projet lexicographique. On verra que le TLF se distingue nettement de ses homologues. Ce n'est donc pas un dictionnaire comme les autres.
      L'exposé s'articulera en trois parties. On commencera par une comparaison détaillée du TLF à son prédécesseur, le Dictionnaire alphabétique et analogique de la Langue Française. De toutes les caractéristiques révélées à travers cette approche, on n'approfondira que deux : la rubrique Etymologie et Histoire et les exemples.
 
 
 
   Séminaire ATILF

Date : Vendredi 5 décembre 2003 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Corpus électronique des plus anciens documents linguistiques de la France : le département de la Meuse

Présenté par Anne-Christelle Matthey (Université de Zurich/FEW)

       Cette communication présentera un travail de doctorat actuellement en cours qui s'insère dans un projet global d'édition des Plus Anciens Documents Linguistiques de la France. Ce vaste projet initié par Jacques Monfrin en 1967 a été repris par Françoise Vieillard, Olivier Guyotjeannin (tous deux Ecole Nationale des Chartes) ainsi que Martin-D. Glessgen (Université de Zürich), qui a déjà eu l'occasion de venir présenter l'avancement des travaux dans ce séminaire (cf. communication du 4 mai 2001).
L'objectif de ce projet est double : il s'agit de préparer ces documents en ancienne langue pour une édition à la fois fiable et moderne. " Fiable " c'est-à-dire s'approchant le plus possible de l'original. " Moderne " parce que alliant une version traditionnelle imprimée et une version électronique. Tous les textes ainsi édités seront accompagnés d'une analyse linguistique complète ; autrement dit une analyse des particularités grapho-phonétiques, lexicologiques, morpho-syntaxiques et également onomastiques.

Ma présentation dans ce séminaire se déroulera en trois temps :
1° Les 240 chartes du département de la Meuse (comprises entre 1226 et 1270).
2° Les derniers développements informatiques attachés au projet en général (critères d'édition, lemmatisation, interrogations linguistiques).
3° L'étude du phénomène de la préstandardisation du français, qui peut se dégager des résultats d'analyse linguistique (notamment lexicale) des chartes meusiennes.

« Une thématique similaire de celle abordée dans le cadre de ce Séminaire se trouve développée dans Matthey (Anne-Christelle), à paraître. "Corpus électronique des Plus Anciens Documents Linguistiques de la France: le cas du Département de la Meuse", in: Pusch (Claus D.)/Raible (Wolfgang) (éd.), Actes 2. Freiburger Arbeitstagung zur Romanistischen Korpuslinguistik (Université Albert-Ludwig Fribourg-en-Brisgau, 11-13 septembre 2003), Tübingen, Narr, 2005. »
 
 
 
   Séminaire ATILF

Date : Vendredi 5 décembre 2003 - 10h30-12h00

Lieu  : Université de Nancy 2, Bâtiment B salle B10 (1° étage)

Titre : La géographie linguistique : entre régularité et histoire

Présenté par Marie-Guy BOUTIER (professeur à l'Université de Liège, directrice de l'Atlas linguistique de la Wallonie)

       Qu'est-ce que la géographie linguistique ?
     Il nous semble qu'on peut la définir comme la plus "facile" et la plus "parlante" des disciplines relevant de la linguistique historique. C'est du moins ce que nous tenterons de montrer en partant de notre expérience concrète de rédactrice de l'Atlas linguistique de la Wallonie.
     Après avoir brièvement rappelé les fondements de la géolinguistique et quelques concepts traditionnels de cet art, puis présenté l'Atlas linguistique de la Wallonie et le mode particulier de rédaction de cet atlas (qui tient aussi du dictionnaire historique), nous expliciterons la façon dont nous concevons le travail (ou le jeu ?) du géolinguiste.
     Le géolinguiste manipule des objets linguistiques à la fois nombreux, homogènes, explicites et strictement attribués. Il construit grâce à eux des figures hiérarchisées (types) visant à rendre compte de leur organisation (régulière ou singulière) en même temps qu'à déceler des figures plus générales pouvant expliquer d'autres configurations d'objets analogues.
     Ces quelques principes et leur application concrète seront explicités grâce à la lecture de quelques cartes de l'ALW.
 
 
 
   Séminaire ATILF

Date : Vendredi 3 octobre 2003 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Déja comme mot du discours

Présenté par Denis Paillard (Laboratoire LLF - UMR 7110, Université de Paris 7)

       Les descriptions de déjà portent essentiellement sur ses emplois aspecto-temporels (cf. il est déjà parti, as-tu déjà mangé du caviar ?) même si l'existence d'emplois discursifs est largement reconnue (cf. quel est ton nom déjà ? ...Déjà qu'il ne répond pas. Alors pourquoi veux-tu que....). L'exposé portera sur les emplois discursifs de déjà. Parmi les questions que soulèvent ces emplois, je discuterai en particulier des points suivants :
  - quels sont les critères qui permettent de distinguer déjà adverbe de déjà mot du discours ?
  - y a-t-il une sémantique commune à déjà adverbe et déjà mot du discours ?
  - comment définir la portée de déjà mot du discours ?
  - déjà mot du discours apparaît dans différentes positions : position initiale, position médiane, position finale. Quels sont les facteurs qui déterminent telle ou telle position ? Quels sont les effets de sens propres à telle ou telle position ?
  - déjà peut être en position détachée (à l'écrit entre virgules) ou non détachée (sans virgules), cette différence de ponctuation étant corrélée, à l'oral, à une différence intonative. On cherchera à montrer que cette différence a priori anodine, correspond en fait à une différence de portée.

La description de déjà mot du discours sera faite dans le cadre du format de description élaborée dans le cadre d'un projet russe-français, dont je présenterai les principales notions (définition "en langue" des mots du discours, mise en évidence de deux sémantiques discursives : sémantique de la pertinence et sémantique de l'adéquation, reformulation discursive, polysémie des mots du discours)
Ci-dessous on trouvera un tout premier corpus illustrant certains emplois de déjà.

  (1) Elle a d'autant moins d'excuses que déjà, en 66, juste avant Sedan, elle avait failli épouser un Hollandais, presque un Prusco.
  (2) Juin tirait à sa fin, et déjà il faisait sur Paris une chaleur accablante.
  (3) Le fioul n'a pas encore touché la première plage que déjà la machine judiciaire s'est mise en marche.
  (4) ... Les petites virent leurs parents se diriger vers la chambre, et la peur leur glaça les joues, le nez et jusqu'aux oreilles. Déjà, ils touchaient le bouton de la porte, lorsqu'ils entendirent un sanglot derrière eux. C'était Marinette qui ne pouvait plus retenir ses larmes, tant elle avait de frayeur et de remords aussi.
  (5) Antonio toucha le chêne. Il écouta dans sa main le tremblement de l'arbre. C'était un vieux chêne plus gros qu'un homme de la montagne, mais il était à la belle pointe de l'île de Geais, juste dans la venue du courant, et, déjà, la moitié de ses racines sortaient de l'eau.
  (6) Il n'acheva pas sa phrase, car, déjà, l'homme ne l'écoutait plus.
  (7) Geneviève- dit-elle - cette vilaine pensée n'est pas digne de toi. Je suis sûre que déjà tu en as honte...
  (8) ...Et puis tu vas être plongé jusqu'au cou dans la politique, tu n'auras plus une minute à toi. Déjà tu te plains de manquer de temps pour ton roman....
  (9) Allez vous en ! Déjà que vous avez perdu la guerre, vous n'allez pas nous faire tuer par dessus le marché.
  (10) C'est la première fois de ma vie que je dîne avec un comte. Vous êtes le comte comment déjà ?
 
 
 
   Séminaire ATILF

Date : Vendredi 26 septembre 2003 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : TILT : Réalisations actuelles

Présenté par Ann Pourchot et Stéphanie Biquillon

       L'objet de ce séminaire est de présenter certaines réalisations effectuées par les intervenants dans le cadre du projet TILT (Trésor Informatisé de la Langue Technique) dont le laboratoire est partie prenante.
     TILT est mené dans le cadre du Programme Technolangue dont l'objectif est le développement, l'adaptation et l'intégration des outils logiciels linguistiques afin de traiter de gros volume de données, pour répondre aux nouveaux besoins de la société en matière de recherche d'informations.
     Le projet TILT vise à construire un corpus du français technique utilisé dans les normes AFNOR et d'aligner ce corpus sur son équivalent anglais, et à fournir les ressources indispensables au développement d'applications linguistiques ( assistance à la traduction, recherche d'informations, indexation, constitution automatique de résumé, …).
     Pour mener à bien ce projet, différentes tâches ont été effectuées.
     Dans un premier temps, nous avons été amenés à apporter une solution pour convertir des fichiers PDF au format XML. Nous avons donc mis en place une application automatisant cette conversion. Puis, nous avons évalué les résultats en sortie de conversion afin de valider les fichiers XML.
     Dans un deuxième temps, nous avons recherché un étiqueteur dans le cadre d'une demande de l'AFNOR. En effet, il est très important pour eux d'étiqueter les normes afin de permettre la recherche d'informations, l'indexation, etc.
     Enfin, nous avons effectué un re-balisage du format XML-AFNOR au format XML recommandé par la TEI.
 
 
 
   Séminaire ATILF

Date : Vendredi 5 septembre 2003 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Coup de projecteur sur le DNPS : dictionnaire et colloque

Présenté par Danuta Bartol et Henri-Claude Grégoire

       Les 13/14/15 novembre prochains aura lieu, à Nancy, un colloque international sur le thème "Langues et sociétés de l'Europe moderne" organisé conjointement par Nancy 2 (H. Cl. Grégoire/D. Bartol) et l'ATILF. Il a pour but de mettre en lumière un projet de dictionnaire des notions politiques et sociales (le dnps). Le séminaire du 5 septembre, à l'ATILF (10h30), permettra aux gens du laboratoire de faire un peu mieux connaissance avec l'équipe du dnps et son projet de dictionnaire et de colloque.  
 
 
   Séminaire ATILF

Date : Vendredi 13 juin 2003 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Détection et correction des erreurs orthographiques des textes arabes non diacritisés

Présenté par Achit Abdelmadjid

 

     La détection et la correction d'erreurs orthographiques est l'un des domaines d'application du TALN traitement automatique des langues naturelles les plus intéressants et les plus attrayants, du fait de l'intérêt croissant qu'on accorde à la qualité des textes que nous utilisons et manipulons quotidiennement dans nos administrations et dans nos correspondances personnelles. Aussi, cela est du au fait que ce genre de programme intervient dans un grand nombre d'applications. A titre d'exemple, dans les logiciels de traitement de textes, dans certains services de messageries électroniques intégrée au web dont l'exemple type est la messagerie du site www.yahoo.com qui offre la possibilité d'effectuer une vérification orthographique en ligne des textes des messages à envoyer.
     Le thème de mon stage au niveau du laboratoire ATILF Analyse et Traitement Informatique de la Langue Française, concerne le développement d'un détecteur / correcteur d'erreurs orthographiques pour des textes arabes non diacritisés. La détection se fera selon deux modes distincts et la correction nécessitera la coopération de l'utilisateur. Ce genre d'application peut s'avérer utile pour la vérification et l'évaluation de la qualité des ressources linguistiques textuelles arabes(corpus de textes) ou dans le contexte de la GED (Gestion Electronique des Documents) où on peut même songer à l'incorporer comme un module dans un logiciel intégré de GED. Et dans le cadre du projet du Trésor de la Langue Arabe TLA, on peut d'ores et déjà penser à l'utiliser comme outil ad hoc pour vérifier les textes non diacritisés saisis manuellement ou bien provenant d'une numérisation de documents papiers avec OCR arabe en vue d'être intégrés dans le TLA. Sachant entre autre, que ce genre d'applications peut traiter sous certaines conditions du texte français.

     L'étude conceptuelle a permit d'établir la possibilité d'envisager deux types d'applications:

  • Application locale
  • Application Web Server basée sur les scripts CGI (Common Gateway Script) sous Apache Sever qui conviendrait à un environnement Intranet / Internet.

     Du point de vue implémentation, cela s'est concrétisé sous forme de deux applications l'une tournant en local et l'autre permettant pour le moment la détection des erreurs orthographiques en ligne au travers d'un formulaire.
     Au cours de mon exposé, j'aurais à faire une brève présentation de ce qu'est le domaine du traitement automatique des langues naturelles TALN et en particulier le domaine de la détection/correction d'erreurs orthographiques et puis en second je parlerais de la langue arabe, de ses particularités et de l'analyse morphologique du lexique arabe. Ensuite, je présenterais l'étude conceptuelle de cette application et en dernier, je terminerais ma présentation avec une démonstration.

 
 
 
   Séminaire ATILF

Date : Vendredi 6 juin 2003 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Les champs sémantiques multilingues unifiés

Présenté par Sébastien Haton

       Notre problème est la constitution de lexiques multilingues complets illustrant la non bi-univocité des correspondances lexicales entre les langues. En effet, il est rare qu’à un terme en langue source corresponde une seule traduction en langue cible. Par surcroît, le décalage interlangue grandit de manière exponentielle à chaque ajout d’une langue dans l’étude.
     Comme lexie de référence, nous avons choisi le verbe français abandonner car il semble « faiblement » polysémique alors que le nombre de ses traductions est considérable. Pour leur recensement, nous utilisons la méthode de la fusion des données [cf. PLOUX, 1997] : en plus des traductions du verbe recueillies dans la partie français-langue cible des dictionnaires bilingues, nous avons récupéré les verbes en langue cible pour lesquels abandonner est une traduction proposée. Le recensement effectué, les traductions sont organisées dans un tableau en fonction de critères discriminatoires pertinents (des constructions syntaxiques aux variations contextuelles). Nous obtenons ainsi des micro-paradigmes de traduction pour chaque « sens » de la lexie.
     Un des constats majeurs de cette étude préliminaire est qu’il existe entre les emplois de la lexie d’origine et d’autres mots de la langue source des liens qui émergent via le paradigme de traductions. Or, ces nouveaux mots possèdent leurs propres paradigmes de traductions qui créent de nouveaux liens et ainsi de suite. Ce va-et-vient incessant rend rapidement impossible une approche séquentielle du problème. Aussi, il nous paraît nécessaire de représenter conjointement tous les emplois des lexies en langue source qui sont en relation avec la lexie à traduire. Ainsi, nous constituons un paradigme lexical autour de la notion d’abandon qu’il sera possible de confronter aux paradigmes de traductions. De même, chaque traduction proposée vient généralement « se positionner » sémantiquement entre deux lexies (ou davantage) dans la langue source, comme le font apparaître les dictionnaires bilingues que nous avons consultés.
     Pour représenter nos données, nous proposons la création de champs sémantiques multilingues unifiés, dirigés par un réseau qui fait apparaître les liens sémantiques entre les lexies d’une même langue autant qu’entre celles de langues différentes. Chaque unité du réseau est porteuse de ses propres informations linguistiques, tandis que les liens font apparaître les données qu’elle partage avec les autres unités auxquelles elle est reliée au sein du graphe.
     Ces champs permettront de construire des dictionnaires bilingues ou multilingues en utilisant n’importe quelle langue présente dans le graphe comme langue source. Elle donnera également accès au champ sémantique d’abandon sur des critères élargis et motivés.
 
 
 
   Séminaire ATILF

Date : Vendredi 16 mai 2003 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Biconsonantisme et homonymie du lexique arabe

Présenté par Youssef Ayache

       La recherche sur la bilitarité originelle du lexique arabe apporte un éclairage nouveau au problème endémique de l’homonymie des racines : dans l’hypothèse d’un état primitif de bilitarité (ou de biconsonantisme), la réductibilité des trilitères (et des quadrilitères) à des bases bilitères différentes fonctionnant comme des étymons semble constituer un critère “systématique” de séparation des homonymes.
     Je commencerai mon exposé en explicitant les notions de “racine” et de “famille de mots” dans le domaine arabo-sémitique, puis je présenterai de manière très succincte le cheminement et les résultats de la recherche sur la bilitarité, avant d’aborder, enfin, l’intérêt de ces résultats pour le traitement des homonymes en lexicographie arabe et pour l’élaboration d’une nouvelle nomenclature des racines.
 
 
 
   Séminaire ATILF

Date : Jeudi 13 mars 2003 - 14h00-16h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Etude de graphes lexicaux à partir d'un dictionnaire électronique

Présenté par Bernard Victorri et l'équipe LaTTICe

  Site de LaTTICe (Langues, Textes, Traitements Informatiques et Cognition) :
http://www.lattice.ens.fr/
 
 
 
   Séminaire ATILF

Date : Jeudi 13 mars 2003 - 10h00-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Extraction d'informations à partir du TLFi et modélisation d'informations lexicales

Présenté par ATILF

   
 
 
   Séminaire ATILF

Date : Mercredi 12 mars 2003 - 15h00-17h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Calcul du sens d'unités polysémiques à l'aide de FRANTEXT

Présenté par Bernard Victorri et l'équipe LaTTICe

  Site de LaTTICe (Langues, Textes, Traitements Informatiques et Cognition) :
http://www.lattice.ens.fr/
 
 
 
   Séminaire ATILF

Date : Vendredi 7 mars 2003 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : La vision du monde de l'homme médiéval à partir de quelques mots et contextes d'ancien et de moyen français, confrontée aux connaissances actuelles

Présenté par Hiltrud Gerner et Marc Chaussidon

  Dans une première partie, nous faisons le point sur le lexique de l'Astronomie (titre provisoire) : la motivation pour sa mise en chantier, son état actuel, son corpus, ses ressemblances et ses différences par rapport aux autres lexiques du Moyen Français avec une présentation de quelques articles relatifs aux sujets traités.

Dans la deuxième partie, nous proposons, à partir de quelques vedettes du lexique, une sélection thématique et illustrée d'exemples, que nous confrontons aux connaissances de notre époque telles qu'elles se présentent dans des ouvrages de vulgarisation scientifique et dans la base Frantext moderne.

Les thèmes abordés sont : la terre - les planètes - les étoiles - les météorites ; ce dernier thème étant un pont vers la discipline de Marc Chaussidon (Centre de Recherches Pétrographiques et Géochimiques Nancy -UPR CNRS) qui interviendra ponctuellement pour donner le point de vue actuel des sciences de l'univers.
 
 
 
   Séminaire ATILF

Date : Vendredi 28 février 2003 - 14h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Analyse linguistique automatique des listes dans les documents structurés

Présenté par Véronika Lux

  Dans le TAL en analyse syntaxique, on considère classiquement la phrase comme unité privilégiée. Aussi, les listes sont-elles déroutantes pour un analyseur : souvent, ni la liste entière ni chacun de ses constituants pris séparément ne sont des phrases.
Comme le montre l'exemple ci-dessous, la séquence introductrice d'une liste peut être une proposition syntaxiquement ; les éléments de liste peuvent être compléments de cette introduction, etc.

Il vous suffit alors de :
1. placer un nouveau récipient sous le bec de la cuve,
2. procéder à un nettoyage rapide et automatique du panier.

Dans le contexte de documents structurés (e.g. XML, HTML) où les listes sont marquées avec un balisage particulier, nous avançons quelques propositions pour prendre en compte leurs particularités, afin d'en améliorer l'analyse syntaxique. Nous présentons la solution technique mise en oeuvre avec les ressources disponibles au Centre de Recherche de Xerox (langage de transformation de structures et analyseur linguistique).
 
 
 
   Séminaire ATILF

Date : Jeudi 20 février 2003 - 14h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Base lemmatisée d'ancien français et Répertoire des formes graphiques occurrentes: histoire d'une fusion

Présenté par Pierre Kunstmann, professeur à l'université d'Ottawa, responsable du laboratoire de français ancien

  Il s'agit de constituer une banque lexicale qui soit un répertoire, avec indice grammatical et références aux oeuvres, des mots que présentent les textes d'ancien français. Rêve naguère chimérique, le projet est réalisable de nos jours avec l'appui de l'informatique, si l'on est prêt à y consacrer les moyens et le temps nécessaires. C'est le but que s'était proposé l'équipe du LFA, qui, à partir de textes numérisés (la base TFA, sur le serveur de l'ARTFL à Chicago), d'index lemmatisés, de dictionnaires de formes et de lemmes, avait entrepris d'organiser et de construire peu à peu une Base lemmatisée d'AF (BLAF), fichier (FileMaker) des formes graphiques occurrentes regroupées par vedettes pour faciliter la recherche sur le lexique (notamment sur l'évolution du vocabulaire par genre et par région), la graphématique et la morphologie du français des 12e et 13e siècles. Pour ce faire, le LFA avait adopté une politique de lemmatisation des principaux textes d'AF, à commencer par ceux du 12e siècle. Dans la base, chaque lemme serait accompagné de ses graphies, d'un indice grammatical et de la référence au texte; la base serait mise en relation avec l'ensemble de sous-bases que constituent les index lemmatisés d'oeuvres particulières, où l'on peut trouver des informations plus détaillées. Depuis l'an dernier, le LFA s'est associé à une équipe allemande (M.-D. Glessgen, Strasbourg/Zurich; A. Stein, Stuttgart) qui avait conçu un projet voisin, à partir d'un corpus de chartes et visant à l'exploitation du corpus de textes littéraires constitué par A. Dees à Amsterdam. Les deux projets parallèles sont devenus un projet commun, dont le but est d'établir sur des fondements fermes et rigoureux un ensemble ordonné de formes lexicales, qui sera plus tard enrichi par apports successifs de façon à constituer une grande base des formes graphiques occurrentes de l'ancienne langue (à commencer par l'ancien français). Cet outil donnera une vue plus précise des masses lexicales, permettra aussi d'étudier la distribution des formes dans les textes particuliers et constituera un outil précieux pour tout futur dictionnaire alphabétique d'AF; il tracera une voie d'avenir pour la recherche sur le lexique (notamment sur l'évolution du vocabulaire par genre et par région), la graphématique et la morphologie du français antérieur à la Renaissance.
Post-scriptum :
Le site du LFA se trouve à www.uottawa.ca/academic/arts/lfa
On peut consulter le premier essai de la BLAF sur le site: direx.ca de la compagnie hulloise DIREX, qui en a conçu l'interface.

 
 
 
   Séminaire ATILF

Date : Vendredi 7 février 2003 - 10h30-14h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : MOSAÏQUE LORRAINE
Observation des patois lorrains romans à partir de quelques cartes de l'ALLR (Atlas linguistique et ethnographique de la Lorraine romane)

Présenté par Claude Michel

  L'atlas lorrain roman est parmi les plus riches et les moins explorés des atlas régionaux, notamment du fait de la difficulté d'interprétation des données. La lecture et l'interprétation de quelques cartes phonétiques, morphologiques et lexicales issues de cet atlas permettra de montrer différents aspects de l'originalité de cette aire dialectale marginale, appuyée sur la frontière des parlers germaniques. Les influences y sont diverses et le territoire est une zone d'interpénétrations de toutes sortes, d'accueil d'innovations et de maintien d'archaïsmes permettant à cette aire de conserver une certaine originalité malgré les poussées des parlers de l'ouest, de l'est et bien sûr du français, présent depuis longtemps dans certaines parties de la région. Peut-on parler d'une aire dialectale lorraine au milieu de cette diversité et où parle-t-on le « patois lorrain » ?  
 
 
   Séminaire ATILF

Date : Vendredi 17 janvier 2003 - 10h30-14h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Syntagmes à sens différentiel de la forme adjectif+nom ou nom+adjectif

Présenté par Fabienne Baider

       L'étude présentée porte sur les couples de la forme (nom+adjectif) ou (adjectif+nom) que l'on peut construire à partir des noms "homme" et "femme" et qui présentent un sens différentiel.
     Le point de départ est un corpus élaboré par Marina Yaguello contenant une dizaine de couples (nom, adjectif) tels que "femme légère"/"homme léger", "femme honnête"/"homme honnête". Marina Yaguello (1978) a constaté que de tels syntagmes avaient un sens différentiel. L'axe de symétrie des sens de ces syntagmes correspondrait majoritairement à la distinction socioculturelle établie entre les référents "homme" et "femme".
     La question creusée dans cet exposé concerne l’existence, l’origine et la formalisation éventuelle de ce sens différentiel. La méthodologie adoptée est basée sur la constitution et l'étude de corpus, essentiellement extraits de la base FRANTEXT et de dictionnaires en ligne. Les requêtes ont porté sur les noms "homme" et "femme", mais ont du être restreintes aux couples de la forme (homme+adjectif) et (femme+adjectif). La présentation se fera en cinq temps:
(a) l’établissement de l’existence effective de ce sens différentiel à partir d’un corpus d’occurrences en synchronie;
(b) l'évolution diachronique des adjectifs, constituant de ces syntagmes : une distinction semble devoir être établie entre les syntagmes pour lesquels le sens différentiel n'est apparu que progressivement (par exemple ceux formés avec l’adjectif "léger" chez Ronsard) et des syntagmes pour lesquels la différence existait déjà en latin (par exemple ceux formés avec l’adjectif public) ;
(c) le rôle de la syntaxe et notamment la question de l'ordre respectif du nom et de l'adjectif : la distinction sémantique parallèle à l'ordre de ces constituants semble avoir disparu au profit d'une distinction basée sur une distinction socioculturelle concernant le référent nominal (femme honnête/honnête femme) ;
(d) le degré de lexicalisation : aujourd'hui, la plupart des syntagmes de la forme (homme+adjectif) ou (femme+adjectif) évoqués par Marina Yaguello semblent fortement lexicalisés, une telle évolution pose la question de l'intérêt d'une modélisation dans le cadre l'approche compositionnelle du sens ;
(e) le rôle du socioculturel dans l’existence du sens différentiel constaté de ces syntagmes et sa formalisation: Rastier propose d'ajouter l'élément socioculturel de "faiblesse" dans le sémantisme du nom "femme" ; Comment une approche compositionnelle, par exemple modélisée dans le cadre du lexique génératif, pourrait tenir compte d'un tel constituant sémantique ?
 
 
 
   Séminaire ATILF

Date : Vendredi 10 janvier 2003 - 10h30-14h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : De l’étude de la polysémie logique à un projet de recherche centré sur la sémantique lexicale et le traitement automatique des langues

Présenté par Evelyne Jacquey

  Le but de cette intervention est double.

1. Questions abordées durant le doctorat essentiellement et la méthodologie adoptée.
Le domaine est celui de la sémantique lexicale dans le cadre du traitement automatique des langues. Le sujet d'étude est la polysémie logique, un cas particulier d'ambiguïté lexicale.
a. Propriétés
L'ambiguïté lexicale se conçoit généralement pour des lexèmes affichant au moins deux sens "lexicaux" sémantiquement liés. Les lexèmes relevant de la polyémie logique, par exemple le mot "livre", possèdent aussi cette première propriété (le mot "livre" a au moins deux sens lexicaux : il dénote un contenu informationnel, "le dernier livre de Semprun", ou un objet physique, "le livre qui est dans mon sac"). Cette catégorie de d'ambiguïté lexicale possède deux propriétés supplémentaires. La première est la coprédication : plusieurs sens d'un lexème ambigu coopèrent dans une même phrase "j'ai le dernier livre de Semprun dans mon sac". La seconde est la variation possible dans l'interprétation de la quantification : "j'ai relié tous les livres qui était dans mon sac" ("tous les" porte sur le sens physique de "livre") ou "je n'ai traduit aucun des livres de Semprun" ("aucun des" porte sur le sens informationnel de "livre").
b. Modélisation
Les propriétés particulières des lexèmes relevant de la polysémie logique posent des questions spécifiques si l'on se place du point de vue du traitement automatique des langues : en particulier, la question du nombre d'objets désignés pour chacun des exemples quantifiés et la question de l'accès à ces objets via le contenu sémantique des lexèmes qui les désignent. Dans le cadre du doctorat, j'ai proposé une modélisation, utilisant des extensions du lambda-calcul simplement typé, pour représenter les calculs sémantiques en présence.
2. Travaux que j'aimerais mener au sein du laboratoire
Ils resteront centrés sur l'étude et la modélisation en sémantique lexicale et traitement automatique des langues, mais ils vont diversifier, tant du point de vue des questions étudiées, que de celui des méthodologies adoptées. Par souci de concision, je n'en présenterai qu'un seul : vérification des propriétés des lexèmes relevant de la polysémie logique sur la base du TLFI et de FRANTEXT. J'essayerai de répondre à quelques questions qui me semblent fondamentales :
a. comparaison des trois propriétés attestées dans la littérature linguistique avec les définitions du TLFI
b. comparaison des trois propriétés attestées dans la littérature linguistique avec des corpus extraits de FRANTEXT
c. adéquation, extensions nécessaires ou infirmation des ces propriétés
Par ailleurs, je développe avec d’autres chercheurs divers travaux liés à la sémantique lexicale et la modélisation de ce type de connaissances dans le cadre du traitement automatique des langues.
d. sémantique lexicale, morphologie dérivationnelle et modélisation : soumission d’un article avec Fiammetta Namer à la conférence internationale « Représentations du sens linguistique », Montréal, mai 2002 et soumission d’un autre article au workshop international « Second International Workshop on Generative Lexicon », Genève, Avril 2002
e. sémantique lexicale et inférence en génération automatique de textes avec Claire Gardent : Groupe de travail GENI (travail sur les définitions extraites du TLFI pour quelques verbes de construction, collaboration possible avec Gérard Reb, coopération déjà avec Josette Lecomte pour les objets du TLFI et Gilles Souvay pour le tagger de Brill), Inférence pour la génération de réponse à des questions de compréhension et modélisation en sémantique plate du contenu des questions et des textes sur lesquels les questions sont posées.
f. sémantique lexicale et résolution d’anaphore avec Susanne Alt : constitution d’un corpus d’anaphores non directes et mettant en jeu un nom prédicatif ambigu entre un sens processif et un sens résultatif, évaluation de la pertinence du contenu sémantique d’un tel type de nom prédicatif pour faciliter la résolution de l’anaphore.
 
 
 
   Séminaire ATILF

Date : Mardi 10 décembre 2002 - 14h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Grammaire du dictionnaire / dictionnaire de la grammaire: pour une nouvelle complémentarité conceptuelle

Présenté par Gérard Reb (Université de Strasbourg)

  Principe: «l’aspect cognitif du langage, non seulement admet mais requiert, l’interprétation au moyen d’autres codes, c’est-à-dire la traduction» (Jakobson, 1963: 84)
Fil directeur: la formalisation de la grammaire et la formalisation du dictionnaire permettent la formalisation du sens.
Le problème: il importe de valider l’hypothèse que les langues naturelles sont «compilables»; et donc de construire une grammaire non contextuelle.
 
   
 
 
   Séminaire ATILF

Date : Vendredi 6 décembre 2002 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Résumé automatique multilingue tenant compte de la thématique du texte

Présenté par Abderrafih Lehmam (Pertinence Mining)

  La société de l'information apporte une extraordinaire abondance de textes informatisés et diffusables de manière instantanée et met à portée de tous l'accès à des données qui restaient inaccessibles, car n'étaient jamais publiées. La généralisation des micro ordinateurs dans les entreprises, dans les foyers, à l'école et à l'Université permet une formidable diffusion de connaissances. Les outils de résumé automatique de texte peuvent apporter une réponse efficace à l'acquisition et la gestion des connaissances. Nous présentons dans ce cadre, une description d'un outil de résumé appelé Pertinence qui a pour particularité de traiter six langues européennes et trois langues asiatiques tout en tenant compte de la couleur thématique du texte à résumer. Informatiquement réalisé en XML/JAVA, Pertinence se fonde exclusivement sur des techniques linguistiques (analyse du discours, morphologie, synonymie, terminologie).

 
 
 
   Séminaire ATILF

Date : Lundi 25 novembre 2002 - 14h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Le dictionnaire, élément pivot, assistant l’homme dans le traitement de la langue

Présenté par Michael Zock (Limsi-CNRS)

  L’objectif de mon exposé sera de montrer ce qu’on peut faire à partir d’un dictionnaire électronique bien construit. Les applications discutées vont du plus simple (ne demandant pratiquement aucun travail de recherche supplémentaire) au plus compliqué (une grande partie du travail reste à faire). Les dictionnaires électroniques ont un potentiel considérable, potentiel largement sous-exploité à l’heure actuelle. En dotant ces dictionnaires de quelques fonctionnalités supplémentaires, nous pourrions assister l’homme de diverses manières: (a) l’aider à obtenir des renseignements sur un mot donné (traduction, sens, informations grammaticales); (b) l’aider à mémoriser les mots ou les structures fondamentales d’une langue; (c) l’aider à trouver le mot qu’il a sur le bout de la langue; etc. Une grande partie de l’exposé sera consacré à ce dernier problème. Tout le monde s’est déjà trouvé dans la situation suivante : on cherche un mot (ou le nom d’une personne) que l’on connaît, sans être en mesure d’y accéder à temps. Les travaux des psychologues montrent que les personnes se trouvant dans cet état savent énormément de choses sur le mot recherché (sens, nombre de syllabes, etc.), et que le mot avec lequel ils le confondent lui ressemble étrangement (lettre ou son initial, catégorie syntaxique, champ sémantique, etc.). Par ailleurs, l’analyse des erreurs de discours spontané révèle que les mots sont stockés sous deux modes: par la forme (sons ou graphèmes) et par le sens. Ceci étant, on pourrait imaginer un programme tirant bénéfice de cet état de fait, afin d’assister un locuteur ou rédacteur à (re)trouver le mot qu’il a sur le bout de la langue. Notre argument concernant l'accès par la forme est fondé sur l'hypothèse suivante : ce qui empêche d'accéder au mot recherché est une certaine ressemblance formelle (graphème ou phonème) avec le mot cible. Etant donné que celle-ci est souvent due à une confusion ou inversion de graphème(s) ou phonème(s), nous pouvons nous servir du même mécanisme en l'inversant pour (re)-trouver le mot que le producteur avait sur le bout de la langue : nous permutons des phonèmes ou des syllabes, puis nous sélectionnons les candidats vraisemblables. Tout en ayant quelques caractéristiques propres, la méthode utilisée est proche de celle utilisée pour la correction orthographique. Notre argument concernant l’accès par le sens est fondé sur l’idée que le dictionnaire mental est un vaste réseau dont les mots sont les nœuds et les liens les associations activées en les entendant (ou en les voyant). Retrouver un mot consisterait donc à entrer dans ce réseau, puis suivre les liens. Si l’accès par la forme est implémenté, l’accès par le sens reste à construire. Cependant, avant de se lancer il serait bon de trouver une réponse aux questions suivantes :

  • quels sont ces liens entre les mots ou concepts? Les inventaires existants sont très incomplèts.
  • parmi ces liens, lesquels sont les plus fréquemment utilisés par les êtres humains? En d’autres termes, quels liens faut-il mettre dans un dictionnaire?
  • peut-on automatiquement identifier la nature et la fréquence des liens? Autrement dit, est-il possible/raisonnable d’avoir recours à l’analyse de corpus?
 
 
 
   Séminaire ATILF

Date : Vendredi 8 novembre 2002 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Linguistique variationnelle historique et traitement informatique de textes: présentation d'une méthode d'analyse

Présenté par Harald Völker (Université de Berlin)

  Au cours de ces dix dernières années, la linguistique variationnelle a connu un grand succès dans le domaine de la linguistique contemporaine. Sachant qu'on a perdu non seulement une partie des sources textuelles, mais encore leurs situations d'énonciation et leurs contextes d'origine, la linguistique variationnelle doit surmonter davantage d'obstacles avant qu'elle puisse être utilisée pour l'analyse et l'interprétation de la variation typique des langues des siècles passés.

À partir d'un corpus de chartes françaises du XIIIe siècle, Harald Völker se propose de présenter une méthode d'analyse qui parvient à distinguer d'une façon nouvelle les facteurs extra-linguistiques qui sont à l'origine des variations dans ces textes historiques en question.
 
 
 
   Séminaire ATILF

Date : Vendredi 4 octobre 2002 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : L'anthroponymie en Lorraine

Présenté par Aude Wirth (ATILF - CNRS / Université Nancy 2)

  Contrairement à ce que pourrait laisser croire la multitude des publications (de qualité et d'intérêt très variables) sur le sujet, l'anthroponymie (étude des noms de personnes) est une science relativement jeune et qui n'a encore que peu retenu l'attention des linguistes.
Cette intervention se veut une introduction à cette discipline ; elle présentera de façon concrète les méthodes de travail et les différents outils de recherche sur les noms de personnes en s'appuyant sur des exemples tirés de documents originaux et inédits. A partir de ceux-ci seront ensuite esquissées les principales caractéristiques du système anthroponymique lorrain à travers le temps (noms uniques, doubles, triples, catégorisation, fixation en noms de famille, etc.) ainsi que les apports de cette science à d'autres disciplines, qu'elles soient linguistiques ou non.
 
 
 
   Séminaire ATILF

Date : Vendredi 4 septembre 2002 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : L'intonation du français

Présenté par François Lonchamp (ATILF - CNRS / Université Nancy 2)

  Il est possible de prévoir de manière quasi-algorithmique l'intonation d'une phrase française canonique (sujet - verbe - complément(s) - circonstant(s) ) à valeur rhématique. Les principales étapes sont:

- création des mots prosodiques, composés d'un mot lexical (substantif, verbe, adjectif...) et du ou des mots grammaticaux qui le précèdent (déterminants, auxiliaire, prépositions ...).

- création des groupes prosodiques, composés d'un ou plusieurs mots prosodiques, et obéissant à deux contraintes principales
1 - contrainte d'eurythmie: tous les groupes prosodiques doivent avoir un nombre de syllabes sensiblement égal, de l'ordre de 7 syllabes pour un débit modéré
2 - contrainte syntaxique: aucun groupe prosodique ne peut être constitué exclusivement d'un 'frère droit' et de son 'oncle' sur l'arbre syntaxique de la phrase

- Le dernier groupe reçoit une intonation terminale (contour de finalité), et les groupes qui précèdent un contour de continuation majeure.
exemple : Il a décidé de passer son permis cet été mots prosodiques (il a décidé) (de passer) (son permis) (cet été) groupes prosodiques: la règle d'eurythmie suggère le découpage (il a décidé de passer) (son permis cet été), mais la règle syntaxique l'interdit car le second groupe est constitué exclusivement d'un 'frère droit' (complément du verbe 'passer') et son 'oncle, le circonstant 'en été', ce qui impose le découpage non eurythmique (il a décidé) (de passer son permis) (cet été) Nous terminerons cet exposé par une revue rapide de quelques structures non canoniques: dislocation à gauche et à droite, présentatif, opposition thème-rhème.
 
 
 
   Séminaire ATILF

Date : Vendredi 5 juillet 2002 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Etude lexicale et modélisation de la polysémie verbale dans une perspective multilingue

Présenté par Sébastien Haton (ATILF - CNRS / Université Nancy 2)

  Dans un premier temps, notre recherche porte sur le recensement et l'analyse des éléments pertinents pour différencier chaque occurrence d'une unité verbale donnée en français. A la conclusion de cette étude préalable, nous proposons une relecture de la notion de polysémie qui dépasse largement le simple cadre définitoire et étymologique, afin de l'adapter à nos objectifs d'implémentation. Le but de ce travail est d'élaborer des modèles lexico-conceptuels susceptibles de faire le lien entre différentes langues (français, anglais, espagnol et italien) pour essayer d'améliorer les systèmes de traduction automatique.

La prise en compte initialement très large des facteurs jugés pertinents pour le passage d'une langue à l'autre nous oblige à réfléchir sur la nécessité de simplifier les modèles précités. Une des solutions envisagées consiste à intégrer les unités verbales dans un réseau sémantique multi-dimensionnel dont l'algorithme est essentiellement basé sur le calcul de la distance sémantique entre les mots ainsi que sur la mise en relation des traits implantés pour chacun d'entre eux. Nous montrerons comment cette méthode permet en apparence de régler le problème de non-parallélisme lexical entre les langues.
 
 
 
   Séminaire ATILF

Date : Vendredi 7 juin 2002 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Les expressions verbales figées dans quatre variétés du français (Belgique, France, Québec, Suisse : projet "BFQS")

Présenté par Jean Klein (Université de Louvain-la-Neuve)

  Depuis un certain nombre d'années, dans le cadre théorique du lexique-grammaire, Maurice Gross et le Laboratoire d'Automatique Documentaire et Linguistique (LADL) se sont consacrés à l'analyse syntaxique des phrases simples du français, mais aussi des phrases idiomatiques. Le corpus des phrases figées représente, de nos jours, environ 40.000 items, du moins en ce qui concerne la variété "centrale" ou "standard" du français: le projet BFQS s'attache à décrire, en outre, les variantes régionales (hors de France) des expressions verbales figées, à savoir en français de Belgique, du Québec et de Suisse. Le projet, en cours de réalisation, et qui associe des chercheurs représentant les quatre variétés de français, s'assigne un triple objectif, en partant des tables syntaxiques établies au LADL pour le seul français de France:
1° déterminer les expressions communes aux quatre variétés, soit les expressions BFQS;
2° ajouter au corpus du français "standard" les expressions inusitées en France;
3° établir des sous-catégories d'expressions communes à certaines variétés (BF, BQ, BS, FS, FQ, BQS, etc), sans oublier la variété F ("francisme") à ne pas confondre avec le français "standard".
Le but final du projet est de réaliser un dictionnaire (électronique et en version papier) des expressions verbales figées du français et d'en fournir une classification syntaxique.
 
 
 
   Séminaire ATILF

Date : Vendredi 3 mai 2002 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : L'édition d'un texte dialectal du XVIIIe siècle : problèmes lexicographiques

Présenté par Fernand Carton (Université Nancy 2)

  Je termine l'édition des Vers naïfs en vray patois de Lille de Jacques Decottignies (1706-1762), qui sera publiée chez Champion (2002). C'est la première publication des oeuvres de cet auteur méconnu, fils du chansonnier lillois Brûle-Maison dont j'ai publié les oeuvres (1965), et qui a longtemps influencé la littérature dialectale du Nord. Il s'agit de l'édition diplomatique, avec glossaire, de 45 pièces (chroniques, chansons, pasquilles, stances etc...) à partir de sources dispersées : imprimés originaux, feuilles volantes, copies manuscrites inédites. Le vocabulaire en est très riche, notamment en matière de mercerie, de modes et d'ustensiles de ménage. Il est constitué de picard plus ou moins archaïque, d'argot et de poissard (parisien ?). Nous exposerons la manière dont nous avons abordé certains problèmes de signification et de datation (timbres des chansons, détails historiques...).

 
 
 
   Séminaire ATILF

Date : Vendredi 5 avril 2002 - 10h30-12h00

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Informatiser un dictionnaire ancien, ou comment rétroconvertir un document structuralement chaotique: le cas du Dictionaire critique de la langue française de Jean-François Féraud ( Marseille, Mossy 1787-1788, 3 vol.)

Présenté par Fernand Carton (Université Nancy 2)

  Le Dictionnaire critique de la langue française est, dans la chaîne des dictionnaires français, un maillon important car il actualise vers 1780 les résultats du considérable effort critique effectué aussi bien par les lexicographes que par les remarqueurs et les grammairiens de la période classique. Actualiser, c'est-à-dire à la fois citer, corriger et compléter le travail de ses précédesseurs, y compris et surtout l'Académie française. Par rapport à ses contemporains, il se signale notamment par un souci de mise à jour de l'information linguistique tout à fait remarquable. Mais les innovations ne s'arrêtent pas là: réforme conséquente de l'orthographe, premier effort systématique de notation phonétique et prosodique, précision fine des restrictions de l'usage d'un signe, recherche d'une meilleure visualisation architecturale de l'article. Cela dit, son informatisation se heurte à un problème structural de fond: par sa genèse ( premier état en 1761 sous le titre Dictionnaire grammatical de la langue française; édition augmentée en 1768), le D.C. est une collection de remarques classées par ordre alphabétique. La composante définitionnelle n'apparaît que tardivement dans le projet, ce qui confère à ce répertoire un caractère chaotique. Toute tentative de décrire et de modéliser l'enchaînement des composants se heurte à la variété des réalisations et des syntaxes d'un composant. De plus la typographie offre notamment des cas de polysémie et d'homonymie qui empêchent la récupération optimale de l'information. Actuellement dans un état de saisie philologiquement propre au deux tiers ( la fin de l'opération de saisie-correction est prévue pour juillet 2002), le texte-machine doit ensuite subir un transcodage WPF - XML. Il sera d'abord empoigné par le logiciel PHILOLOGICA pour figurer sur le site Dictionnaires d'autrefois. Mais deux nouveautés devront être apportées à cette base pour qu'elle remplisse pleinement sa fonction: d'une part un travail de lemmatisation devrait permettre de faciliter les requêtes; d'autre part le volumineux supplément manuscrit devrait être offert à la consultation en ligne en offrant au lecteur la possibilité d'en consulter in situ une version finement scannée. C'est cette étape qui nécessite la collaboration de l'ATILF. Pour un premier tour d'horizon, consulter le premier état du site Féraud à l'adresse suivante: http://www.mshs.univ-poitiers.fr/feraud/feraud.htm Il offre notamment le renvoi au cahier de saisie et un premier état de description du dictionnaire. Fin de la proposition de séminaire.  
 
 
   Séminaire ATILF

Date : Vendredi 8 mars 2002 - 11h00-12h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Comment enrichir l'information phraséologique du TLF ?

Présenté par Franz-Josef Hausmann (Université d'Erlangen)

  La mise à jour du TLF devrait profiter de l'information cachée dans les profondeurs du dictionnaire. Celle-ci est immense. Certes, le TLFi permet à l'utilisateur averti d'aller chercher lui-même cette information, mais cette opération est souvent délicate ou laborieuse. Elle concerne en premier lieu les collocations cachées dans les articles des collocatifs et absentes des articles-bases, ensuite les locutions dont l'information est souvent éparpillée sur plusieurs articles - ou cruellement insuffisante, et pour finir, les bases d'allusion, en nombre insuffisant, mal accessibles et souvent absentes parce que nées avant 1789. Or, il faut reconnaître que telle citation célèbre de Molière (p. ex. "Cachez ce sein que je ne saurais voir") fait partie du français actuel.  
 
 
   Séminaire ATILF

Date : Vendredi 11 janvier 2002 - 11h00-12h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Les grands dictionnaires de langue français, le TLF et ses contemporains : images, analyses et prospectives

Présenté par Jean Pruvost (Université de Cergy-Pontoise)

            Resituer les seize volumes du TLF dans le paysage lexicographique et dictionnairique de la seconde moitié du XXe siècle, en partant d'un regard comparatif et contrastif, tel pourrait être un pemier objectif. On peut, au passage, prendre ainsi du recul sur les dynamiques qui étaient mises en présence, repérer plus précisément les types d'énergies privées et institutionnelles alors en œuvre dans des projets assez différents, avec des réceptions bien distinctes et des prolongements divers, voire contradictoires.
          Proposer ensuite, de manière volontairement imprudente, sans autocensure, diverses pistes pour continuer la magnifique entreprise représentée par le TLF pourrait constituer un second objectif. J'essaierai au passage de lister les attentes de tous les publics potentiels, qu'il s'agisse du dictionnaire papier, d'hier, ou du dictionnaire sur support électronique, d'aujourd'hui et de demain. Les perspectives sont ici à appréhender dans la double dimension, lexicographique et dictionnairique.
          Enfin, dans un troisième temps, en partant d'exemples concrets, je souhaiterais évoquer ce que j'ai dénommé " la triple investigation ", une sorte de preuve par neuf pour un dictionnaire de langue, et un type de mise en abyme, qui puisse permettre une exploitation encore plus efficace d'un grand dictionnaire de langue comme le TLF. Un propos un peu sibyllin que j'espère rendre clair lors de notre rencontre.

          Quelques ouvrages personnels ou dirigés qui pourront entre autres servir d'appui : Dictionnaires et nouvelles technologies (PUF, 2000) Les dictionnaires de langue française (PUF, Que sais-je ?) (à paraître en décembre) Les dictionnaires de langue française, Dictionnaires d'apprentissage, Dictionnaires spécialisés de la langue, Dictionnaires de spécialité (H. Champion, 2001)

 
 
 
   Séminaire ATILF

Date : Vendredi 7 décembre 2001 - 11h00-12h30

Lieu  : ATILF Bâtiment CNRS, salle Paul Imbs

Titre : Présentation de la théorie de la grammaticalisation et des recherches actuelles dans ce domaine

Présenté par Bernard Combettes (ATILF)

  - Les principales notions : réanalyse, analogie, "affaiblissement" sémantique
- Illustration par quelques exemples :
   + l'évolution des modalisateurs ("en principe", "de toutes façons")
   + l'évolution des introducteurs de topique ("pour ce qui regarde", "en ce qui concerne")
 
 
 
   Séminaire ILD&ISTC

Date :