• Paul CAPPEAU & Françoise GADET (Poitiers / Paris Ouest)
    L'exploitation sociolinguistique des grands corpus. Maître-mot et pierre philosophale
    (The sociolinguistic exploitation of large corpora. Key-word and stone of wisdom)
    2007, Vol. XII-1, pp. 99-110

    Le désir d'appuyer le travail des sciences du langage sur de larges collections de données orales (« grands corpus ») est, de nos jours, largement partagé par les linguistes. Au moment où de tels outils se multiplient pour le français, il importe d'être sensible à tous les facteurs qui en garantissent la fiabilité, lors des différentes étapes de l'obtention des données : mise au point sur le terme de « corpus », réflexion sur le rapport au terrain et à l'oralité, sur la notion de représentativité (genres et/ou identités des locuteurs), pratiques de sollicitation de données, et enfin transcription.


  • Françoise GADET, Ralph LUDWIG, Lorenza MONDADA, Stefan PFÄNDER & Anne-Catherine SIMON (Paris Ouest / Halle, Allemagne / Bâle, Suisse / Fribourg, Allemagne / Louvain-la-Neuve, Belgique)
    Un grand corpus de français parlé : le CIEL-F. Choix épistémologiques et réalisations empiriques
    (A large corpus of spoken French : CIEL-F. Epistemological choices and empirical outcome)
    2012, Vol. XVII-1, pp. 39-54

    Cet article présente d'un point de vue épistémologique et empirique le travail de constitution du Corpus International Ecologique de la Langue Française, grand corpus de français parlé bientôt disponible sur la toile. On y explique la réflexion ayant guidé le recueil des données (approche écologique, comparabilité de zones de la francophonie et situations de communication) et les choix effectués (aires communicatives et types d'activités documentés) en vue d'analyses relevant de domaines diversifiés (variation, interaction, multimodalité, français en contact, syntaxe orale), pour tenter de combler plusieurs lacunes des corpus oraux actuels. On aborde également la question de la mise en réseau des experts, des problèmes liés aux différents terrains, ainsi que de la standardisation, l'archivage et la diffusion des données collectées (enregistrements audio et vidéo, transcriptions, métadonnées), avant de présenter quelques exemples d'analyses comparées.


  • Paul CAPPEAU & Françoise GADET (Poitiers / Paris Ouest)
    Où en sont les corpus sur les français parlés?
    2007, Vol. XII-1, pp. 129-133