Corpus

  • Frédérique BRIN-HENRY (Centre Hospitalier de Bar-le-Duc)
    Using corpus-based analyses in specialised paramedical French
    2014, Vol. XIX-1, pp. 103-115

    Les termes diagnostiques apparaissant dans les comptes rendus de bilan orthophonique montrent des variations sémantiques et syntaxiques. Dans cet article nous décrivons la terminologie orthophonique en ce qu’elle révèle la réalité du patient et les représentations du professionnel concernant l’état pathologique du patient. Nous avons procédé à plusieurs étapes d’analyse sur un corpus de 436 textes français: extraction des termes fréquents (« difficultés »), examen des métadonnées concernant l’étiquetage diagnostique (utilisation de tests étalonnés, corrélation entre diagnostic posé et pathologie…), enfin description des propriétés sémantico-syntaxiques les plus saillantes (aspect dynamique, usage prépositionnel). Deux catégories principales opposent les termes relatifs à une conception fonctionnelle à ceux relatifs à une conception systémique de la pathologie. L’objectif est de poser les jalons d’une classification plus proche de la réalité de terrain.


  • Jacques DURAND (Toulouse)
    La phonologie de l’'anglais contemporain : usages, variétés et structure
    (Phonology of Contemporary English: usage, varieties and structures)
    2012, Vol. XVII-1, pp. 25-37

    Le projet PAC (Phonologie de l'Anglais Contemporain : usages, variétés, structure) se propose de fournir un portrait précis de l'anglais oral dans son unité et sa diversité géographique, sociale et stylistique. Fondé sur des critères laboviens, le projet permet de décrire les accents rhotiques et non-rhotiques de l'anglais, les variétés standard traditionnelles comme les variétés postcoloniales plus récentes. Le corpus constitué permet aux chercheurs d'analyser et de comparer des caractéristiques intervariétales telles que la rhoticité ou des phénomènes plus spécifiques comme la longueur vocalique en anglais australien ou la rhoticité variable en Nouvelle-Zélande. Le programme collaboratif LVTI, issu de la méthodologie des projets PAC et PFC, permet une enquête sociolinguistique interdisciplinaire des grands centres urbains que sont Manchester et Toulouse.


  • Françoise GADET (Paris Ouest)
    Un grand corpus de français parlé : le CIEL-F. Choix épistémologiques et réalisations empiriques
    (A large corpus of spoken French : CIEL-F. Epistemological choices and empirical outcome)
    2012, Vol. XVII-1, pp. 39-54

    Cet article présente d'un point de vue épistémologique et empirique le travail de constitution du Corpus International Ecologique de la Langue Française, grand corpus de français parlé bientôt disponible sur la toile. On y explique la réflexion ayant guidé le recueil des données (approche écologique, comparabilité de zones de la francophonie et situations de communication) et les choix effectués (aires communicatives et types d'activités documentés) en vue d'analyses relevant de domaines diversifiés (variation, interaction, multimodalité, français en contact, syntaxe orale), pour tenter de combler plusieurs lacunes des corpus oraux actuels. On aborde également la question de la mise en réseau des experts, des problèmes liés aux différents terrains, ainsi que de la standardisation, l'archivage et la diffusion des données collectées (enregistrements audio et vidéo, transcriptions, métadonnées), avant de présenter quelques exemples d'analyses comparées.


  • Adam KILGARRIFF (Brighton, Grande-Bretagne)
    Corpora and Language Learning with the Sketch Engine and SKELL
    2015, Vol.XX-1, pp. 61-80

    <p>Dans cet article, nous introduisons l’idée d’utiliser des corpus – le nom que donnent les linguistes à des collections très importantes de données – dans la recherche en linguistique, et nous en esquissons l’histoire, tout d’abord pour la linguistique en général avant de nous pencher sur la didactique. Nous nous attardons ensuite sur les problèmes inhérents à l’utilisation de corpus pour la didactique avant de faire des propositions pour leur bonne utilisation : premièrement, ne pas faire peur aux apprenants ; utiliser le corpus quand le dictionnaire ne suffit pas ; déguiser le corpus en dictionnaire. Ensuite nous introduisons l’outil Sketch Engine, en montrant comment on peut adhérer à ces propositions grâce à l’interface dédiée à la didactique, SKELL. Nous montrons comment on peut se servir de corpus, aussi bien en classe de langue que comme ressource pour la confection de programmes en nous appuyant sur des corpus de productions d’apprenants pour identifier des tendances de sur- ou de sous-utilisation avec des implications pour les choix didactiques qui en découlent.</p>