Corpus Les Vocaux
Le corpus Les Vocaux est réalisé dans le cadre du projet ORALIDIA : Oralité et diachronie : une voie d’accès au changement linguistique. Malgré le développement des corpus oraux, l’accès à l’oral spontané reste difficile. Le projet ORALIDIA vise à la constitution d’un corpus inédit de français parlé spontané : les «sms vocaux» ou «vocaux». Ces données sont spontanément produites en dehors de toute enquête ou entretien linguistique, et constituent une voie d’accès à la parole spontanée non surveillée, nécessaire pour la description de la langue naturelle. Ces données sont ainsi le lieu privilégié d’étude de la diffusion des formes émergentes ou de leur disparition, et du français parlé dans différents contextes, en particulier informels. Les SMS du corpus ont été recueillis en 2021 et en 2022. Le corpus comportera les fichiers audio, une transcription orthographique, un alignement phonétique au signal, une lemmatisation, une annotation morphosyntaxique et une annotation syntaxique de type UD.
Contact : julie.glikman [at] univ-lorraine.fr
Principaux membres
Julie Glikman (Université de Lorraine, ATILF), porteuse
Christophe Benzitoun (Université de Lorraine, ATILF)
Camille Fauth (Université de Strasbourg, LiLPa)
Nicolas Mazziotta (Université de Liège, Traverses)
Autres participants et stagiaires
Mélanie Lancien (U. Lorraine, collaboratrice)
Mathilde Hutin (U. Louvain, collaboratrice)
Thomas Verjans (U. Toulouse, collaborateur)
Auphélie Ferreira (U. Strasbourg, collaboratrice)
Lori Lamel (Limsi, collaboratrice)
Philippe Boula de Mareuil (Limsi, collaborateur)
Thalassio Briand (U. Strasbourg, stagiaire)
Salomé Klein (U. Strasbourg, stagiaire)
Elia Vertueux (U. Strasbourg, stagiaire)
Jonathan Fontaine (U. Strasbourg, stagiaire)
Hanji Kim (U. Strasbourg, stagiaire)
Le projet a reçu le financement de l’IDEX Exploratoire de l’Université de Strasbourg (oct. 2022-déc 2024 – 18 000 euros), du laboratoire ATILF et de l’Université de Lorraine (2022 – 4 100 euros), ainsi que le soutien du CNRS (délégation CNRS de J. Glikman 2021-2023)
Les participants au projet ont rempli un formulaire de consentement via un formulaire en ligne LimeSurvey hébergé par l’Université de Strasbourg. Le formulaire a été validé par la DPO de l’Université de Strasbourg. Le questionnaire contenait en outre quelques demandes d’informations facultatives afin d’enrichir les métadonnées des vocaux recueillis.
Pour plus d’informations :
Protection des données Vocaux 2022
Limesurvey Grande étude sur les Vocaux
Glikman J., C. Fauth (2022) « Un nouvel accès à la parole spontanée : les vocaux » 34e Journées d’Études sur la Parole, JEP2022, 154 162. ISCA. doi.org/10.21437/JEP.2022-17. https://www.isca-speech.org/archive/pdfs/jep_2022/glikman22_jep.pdf
Mazziotta, N. , & Glikman, J. (2023). Emplois discursifs et pragmatiques des formes du verbe écouter : Observations sur les corpus 88milSMS et Les Vocaux. In M. Saiz-Sánchez & S. Gómez-Jordana Ferary (Eds.), Études de sémantique et pragmatique en synchronie et diachronie. Hommage à Amalia Rodríguez Somolinos. Presses Universitaires de Savoie Mont Blanc. https://hdl.handle.net/2268/304614
Delferrière, F. (2023). Les marqueurs discursifs comme articulateurs d’énoncés : étude d’un corpus de messages vocaux contemporains. (Unpublished master’s thesis). Université de Liège, Liège, Belgique. http://hdl.handle.net/2268.2/17588
Glikman J., Mazziotta N. (2022) « Projet “Les Vocaux” : Outils et formats », TraSoGal, Liège, 24 juin 2022. https://hdl.handle.net/2268/294441
Glikman J., C. Fauth, N. Mazziotta, C. Benzitoun (2022) « Une nouvelle voie d’accès au français populaire : les Vocaux », 13ᵉ congrès des francoromanistes, 21-24 septembre 2022, Université de Vienne. https://hal.science/hal-04312509
Glikman J., Mazziotta N., Fauth C., Benzitoun C. (2022) « Le projet Les Vocaux : bilan d’étape. » Sciences participatives et nouvelles données, Nancy, 30 sept. 2022. https://hal.science/hal-04312522
Glikman J. (2022) Présentation du projet Les Vocaux, entretien pour le magazine Savoir(s) de l’Université de Strasbourg : https://savoirs.unistra.fr/eclairage/les-enregistrements-vocaux-passes-a-la-loupe
Glikman, J., N. Mazziotta (2023). « Le projet Les Vocaux: premières analyses » Séminaire PRAXILING, Montpellier, France. [Paper presentation]. https://hdl.handle.net/2268/302120
Glikman J. (2023) « Le projet Les Vocaux : mise en place et chaîne de traitement », Université Saint-Louis, Bruxelles, Belgique, mars 2023.
Glikman J. (2023) « Les “vocaux” constituent-ils un “genre” ? », Séminaire CLLE, Toulouse, avril 2023. https://hal.science/hal-04312595
Glikman J. (2023) « Retour sur les verbes parenthétiques », Séminaire Lattice, Paris, avril 2023. https://hal.science/hal-04312574
Glikman J., C. Benzitoun, C. Fauth, N. Mazziotta (2023) « Étudier la variation intra-individuelle : exploitation à partir du corpus Les Vocaux. » JTTR L’ORATEUR & L’ORATRICE IN SITU : pluriphonie, agentivité et identités. ATILF, 20 novembre 2023. Vidéo de la conférence : https://ultv.univ-lorraine.fr/atilf-en-video/video/16229-journee-thematique-transversale-de-latilf-lorateur-loratrice-in-situ-pluriphonie-agentivite-et-identites/