• Paul CAPPEAU & Françoise GADET (Poitiers / Paris Ouest)
    Où en sont les corpus sur les français parlés?
    2007, Vol. XII-1, pp. 129-133
  • Mylène BLASCO-DULBECCO, Paul CAPPEAU & Marie SAVELLI (Clermont-Ferrand / Poitiers / Grenoble)
    Preuves à l'appui : les relations entre les données et l'analyse
    (Proven relationships between data and analysis)
    1999, Vol. IV-2, pp. 31-40

    Les données orales sont souvent d'un point de vue fréquentiel et distributionnel différentes des données écrites. Elles obligent à affiner la description en fournissant des particularités de construction ou des contextes absents à l'écrit.Les dislocations et la forme 'il y a', réputées pour leur emploi massif à l'oral, apportent des exemples souvent imprévisibles tant du point de vue de leurs spécificités distributionnelles que pour leur rôle dans la dynamique textuelle.Le sujet 'certains', pour sa part peu fréquent dans la langue parlée, donne cependant des faits de distribution pour le moins variés et nettement répartis et ce en relation avec le genre de corpus dépouillé.Cet article se propose donc d'exposer trois cas de figure représentatifs de la relation entre les données et l'analyse.


  • Paul CAPPEAU & Françoise GADET (Poitiers / Paris Ouest)
    L'exploitation sociolinguistique des grands corpus. Maître-mot et pierre philosophale
    (The sociolinguistic exploitation of large corpora. Key-word and stone of wisdom)
    2007, Vol. XII-1, pp. 99-110

    Le désir d'appuyer le travail des sciences du langage sur de larges collections de données orales (« grands corpus ») est, de nos jours, largement partagé par les linguistes. Au moment où de tels outils se multiplient pour le français, il importe d'être sensible à tous les facteurs qui en garantissent la fiabilité, lors des différentes étapes de l'obtention des données : mise au point sur le terme de « corpus », réflexion sur le rapport au terrain et à l'oralité, sur la notion de représentativité (genres et/ou identités des locuteurs), pratiques de sollicitation de données, et enfin transcription.