1999-1 | Grands corpus : diversité des objectifs, variété des approches (Large corpora: diversity of aims, variety of approach) | |
Cliquer sur le livret pour en lire un résumé |
-
Nathalie VALLÉE & Louis-Jean BOË (INPG-Grenoble / Grenoble)La base de données UPSID : objectif et utilisation(The UPSID database: its aims and its use)pp. 7-19
La recherche de tendances universelles dans les différentes langues parlées dans le monde est sans nul doute un axe nécessaire à toute perspective théorique en linguistique. Nous présentons ici UPSID (UCLA Phonological Segment Inventory Database, Maddieson, 1986 ; Maddieson & Precoda, 1990). Cette base contient des données phonologiques, qui sont équilibrées d'un point de vue génétique et dont la description est harmonisée. Elle a été implantée à l'ICP dans le but d'enrichir les recherches typologiques sur les voyelles, les diphtongues et les consonnes. UPSID y a été analysée grâce à une méthodologie originale qui non seulement confirme ou précise certaines régularités déjà signalées mais fait apparaître de nouvelles données.
-
Thomas Hun-tak LEE (Hong-Kong)CANCORP - The Hong Kong Cantonese Child Language Corpuspp. 21-30
On se propose dans ce texte de présenter le CANCORP (The Hong-Kong Cantonese Child Language) en cours de construction dans l'esprit du CHILDES (The Child Language Data Exchange System) de Mac Whinney & Snow, 1985. Après avoir rapidement décrit le contenu du CANCORP, on présentera les problèmes techniques que pose la transcription de ces enregistrements d'enfants en caractères chinois et en caractères romanisés, puis on dressera un bref bilan des ressources qu'offre le CANCORP pour l'étude des tout premiers développements du langage.
-
Christiane MARCHELLO-NIZIA (ENS)Corpus diachroniques(Diachronic Corpora)pp. 31-39
Après avoir rappelé ce qui distingue une base de données d'un corpus, on tentera de dresser un rapide panorama des différentes sources documentaires importantes existant à ce jour dans le domaine de la diachronie du français, puis on montrera quel usage peut en être fait grâce à une série d'outils aujourd'hui disponibles, et surtout comment l'accès à de gros corpus parmet de renouveler notre analyse de certains faits linguistiques, et contraint à un déplacement qualitatif dans le mode de raisonnement linguistique lui-même.
-
Maria de Lourdes CRISPIM & Maria Francisca XAVIER (Lisbonne, Portugal)Constitution (et utilisation) d'un corpus de portugais médiéval(Building and using a corpus of medieval Portuguese)pp. 41-45
Après avoir présenté comment a été constitué le Corpus de Portugais Médiéval, et en particulier comment il a été étiqueté, on essaiera de montrer comment il est aujourd'hui utilisé pour la construction d'un dictionnaire du portugais médiéval, et plus particulièrement de verbes, de noms propres et de noms communs
-
Isabelle LEROY-TURCAN (Lyon 3)La Base ACADEMIE et son hypertexte : les huit éditions du Dictionnaire de l'Académie française (1694-1935) et les données associées à chaque édition(The ACADEMIE base and its hypertexte: the eight editions of the Dictionnaire de l'Académie française (1694-1935) and the specifics of each edition)pp. 47-54
Le projet ACADEMIE a pour objectif la construction de la base informatisée des huit éditions du Dictionnaire de l'Académie française (DAF). Etant donné que celles-ci se sont échelonnées de 1694 à 1932-35, ce corpus pose d'intéressants problèmes croisés de diachronie et de synchronie, en relation à des questions plus larges touchant à la littérature et à la culture. La base du DAF proprement dite se trouve ainsi complétée par toute une série de liens hypertextuels, destinés à permettre un dialogue dynamique entre spécialistes et lecteurs/consultants.
-
Nicoletta CALZOLARI (CNR-Pise, Italie)Standards for Linguistic Resources in Europe : the LE-EAGLES Projectpp. 57-64
L'extension rapide de ressources linguistiques informatisées a très vite soulevé le problème de leur standardisation pour une plus large et une meilleure utilisation, en même temps qu'apparaissait la nécessité d'évaluer les divers outils créés en vue de leur exploitation. A l'initiative de la Commission Européenne, ces questions ont fait l'objet de recherches et de travaux, dont le but était de proposer des standards valables pour l'ensemble de l'Europe - parmi lesquels le projet EAGLES ici présenté.
-
Claire BLANCHE-BENVENISTE (Aix-en-Provence)Constitution et exploitation d’un grand corpus(Building and using a large corpus)pp. 65-74
Ce texte essaie de montrer comment un projet de corpus sur le français parlé, commencé à Aix-en-Provence vers les années 1975, a peu à peu évolué en relation au développement de ce que l'on appelle la linguistique de corpus. C'est l'histoire de la constitution de ce corpus qui est ici retracée, en même temps que sont esquissées les possibilités d'exploitation qu'il offre aujourd'hui.
-
Rabia BELRHALI, Louis-Jean BOË & Danièle DUJARDIN (INPG-Grenoble / Grenoble)BdPholex : une base de données phonétiques et lexicales du français parlé(BdPholex: a phonetical and lexical database of spoken French)pp. 75-78
-
Ann LAWSON (IDS-Mannheim, Allemagne)Corpus Linguistics at the Institut für deutsche Sprachepp. 79-82
-
Marjut JOHANSSON, Maarit MUTTA & Eija SUOMELA-SALMI (Turku, Finlande)Corpus de français parlé et écrit par les étudiants finnophones et suédophones(Corpus of French spoken and written by finnophone and swedophone students)pp. 85-87
-
Veerle BROSENS & Nathalie NOUWEN (Louvain, Belgique)Les projets ELILAP et LANCOM(The ELILAP and LANCOM projects)pp. 89-95
-
Tove JACOBSEN & Harald ULLAND (Bergen, Norvège)Un corpus bilingue : le corpus norvégien-français de Bergen(A bilingual corpus: the Norvegian-French corpus of Bergen)pp. 95-96
-
Sophie ASLANIDES & Sandrine ORIEZ (Paris 8 / Poitiers)Adapter un corpus finement annoté à des objectifs de recherche linguistique : l'exemple de SUSANNE(Adapting a finely annotated corpus for linguistic research objectives)pp. 97-99
-
Yoldès FOURATI-DAJEAN, Frédéric ISEL & Nicole BACRI (Paris 5 / Leipzig, Allemagne)Représentations phonologiques et structuration temporelle de la parole chez l'enfant déficient auditif(Phonological representations and the structure of speech in hearing impaired children)pp. 101-112
Après avoir exposé les arguments qui justifient l'hypothèse que les enfants déficients auditifs disposent de représentations phonologiques organisées comme celles des enfants entendants, on étudie leur utilisation en production de la parole. Le code phonologique, construit sur l'intégration d'informations auditives, visuelles et proprioceptives, contient des informations temporelles. Ce sont elles qui vont permettre aux enfants sourds profonds d'anticiper la structure métrique prosodique de leurs énoncés. Une étude expérimentale est présentée à l'appui de cette proposition. La comparaison entre les productions d'enfants de 9;7 ans à 11;7 ans, sourds profonds ou non, lors d'une épreuve de lecture à haute voix, montre que, globalement, les enfants sourds profonds ne maîtrisent pas encore la métrique du français. Toutefois, une analyse détaillée des durées syllabiques et des pauses atteste la réalité chez ces enfants d'une programmation de la structure métrique des segments d'énoncés relativement courts. Ces résultats montrent l'intérêt de distinguer difficultés de programmation phonologique et compétence lexicale ou trouble de la temporalité.
-
Les créoles. L'indispensable survie, de M. Hazaël-Massieux
par N. Gueunierpp. 113-114