Sommaire des numéros

2007-2Lexique et écrits scientifiques
(The lexicon in scientific texts)
Cliquer sur le livret pour en lire un résuméCe numéro est en ligne en texte intégral sur le portail: Cairn.info
  • Agnès TUTIN (Grenoble 3)
    Autour du lexique et de la phraséologie des écrits scientifiques
    (Lexicon and phraseology of scientific texts)
    pp. 5-14
  • Peter BLUMENTHAL (Cologne, Allemagne)
    Sciences de l'Homme vs sciences exactes : combinatoire des mots dans la vulgarisation scientifique
    (Humanities vs Science: how to use words in scientific vulgarization)
    pp. 15-28

    Notre contribution porte sur le lexique, avant tout nominal, et sa combinatoire tels qu’ils se présentent dans une grande partie de l’Encyclopædia Universalis (2005). Sur la base des articles de cet ouvrage, nous avons formé deux grands sous-corpus, l’un correspondant aux sciences exactes, l’autre aux sciences de l’Homme. Nous étudions les intersections lexicales des deux groupes de disciplines, les mots spécifiques de chacun d’eux et la combinatoire caractéristique de certains noms considérés dans la perspective des convergences et des divergences linguistiques entre sciences exactes et sciences de l’Homme. L’angle d’observation que nous avons adopté pour déterminer les profils combinatoires et pour calculer le degré de similarité entre ceux-ci fait apparaître de profondes différences d’ordre lexical et sémantique entre « les deux cultures » scientifiques.


  • Céline POUDAT & Sylvain LOISEAU (ENST / CNRS-LIMSI)
    Représentation et caractérisation lexicale des sciences dans Wikipédia
    (Lexical representation and categorization of science in Wikipedia)
    pp. 29-44

    Largement médiatisée, l’encyclopédie collaborative Wikipédia introduit de nouvelles pratiques d’écriture et de diffusion des connaissances scientifiques. Si son fonctionnement a été décrit du point de vue des connexions entre contributeurs et de sa dynamique temporelle, les propriétés de ses textes ont été beaucoup moins caractérisées. Dans cet article, nous proposons de décrire Wikipédia sur le plan linguistique de son contenu, en nous focalisant sur les sciences et leur représentation. L’étude est fondée sur un ensemble de corpus extraits à partir de l’arborescence des catégories de l’encyclopédie, et observés et contrastés sur les plans lexicaux général et épistémique.


  • Patrick DROUIN (Montréal, Canada)
    Identification automatique du lexique scientifique transdisciplinaire
    (Automated identification of a transdisciplinary scientific lexicon)
    pp. 45-64

    Dans cet article, nous proposons une première étape conduisant à la description de la langue scientifique, en particulier, nous cherchons à isoler le lexique scientifique transdisciplinaire (LST). Le LST transcende les domaines de spécialité, présente un noyau lexical commun significatif entre les disciplines et se situe au cœur de l’argumentation et de la structuration du discours et de la pensée scientifique. Pour isoler le lexique transdisciplinaire, nous exploitons des techniques de traitement automatique de la langue (TAL), et notamment des techniques statistiques, dont le calcul des spécificités proposé par Lafon (1980). Ceci pour vérifier dans quelle mesure il est possible d’enrichir rapidement et avec un minimum d’interventions les descriptions existantes. Pour terminer, nous procédons à une exploration des pistes énoncées par Phal (1971) à propos des collocations dans les écrits scientifiques. Nous étudions plus spécialement les collocations V-N autour de quelques noms transdisciplinaires.


  • Averil COXHEAD & David HIRSH (Massey, Nouvelle-Zélande / Sydney, Australie)
    A pilot science-specific word list
    pp. 65-78

    La couverture de la General Service List (West, 1953), visant à rendre compte de l’anglais fondamental, et de l’Academic Word List (AWL) (Coxhead, 2000), visant à représenter le lexique des écrits universitaires, ne représente que 80% des mots d’un corpus d’écrits scientifiques anglais d’à peu près 875 000 mots, contre 86,7% pour les sciences humaines et lettres, 88,8% pour le commerce et 88,5% pour le droit (Coxhead, 1998). La couverture de 9,1% de l’AWL pour les sciences est comparable à celle des sciences humaines et du droit, alors que la couverture de la GSL pour les sciences de 65% est nettement inférieure à celle du droit (10% de moins), des sciences humaines (8%) et du commerce (6%). Pour traiter ce lexique absent, nous avons réalisé une étude de corpus sur le vocabulaire des écrits scientifiques pour établir dans quelle mesure un vocabulaire spécifique aux sciences pouvait être dégagé en dehors de la GSL et de l’AWL. Hirsh (2004) a mis en évidence que les domaines comportant le plus de vocabulaire technique utilisaient la plus faible proportion de mots du lexique fondamental (de la GSL). Cette étude pilote a permis de dégager une liste de 318 familles de mots couvrant 4% des mots d’un corpus d’écrits scientifiques d’1,5 millions de mots, contre moins de 1% pour les autres corpus des sciences humaines, de commerce, et du droit et un corpus littéraire de 3,5 millions de mots.


  • Mojca PECMAN (Paris-VII)
    Approche onomasiologique de la langue scientifique générale
    (Onomasiological approach of general scientific language)
    pp. 79-96

    Cet article a pour objectif de construire une méthode permettant d'explorer les invariants des différents types de discours scientifiques. La spécificité de la méthode d'analyse que nous proposons est de combiner plusieurs approches : transdisciplinaire, onomasiologique et phraséologique. Ces trois approches nous permettent d'aller au-delà des études traditionnelles fondées d'ordinaire sur l'analyse purement lexicale d'un domaine de spécialité unique. Nous définissons tout d'abord la limite entre les caractéristiques spécifiques du langage scientifique spécialisé et les caractéristiques communes aux différents discours scientifiques. Puis nous présentons une analyse notionnelle et combinatoire des ressources lexicales à partir d'une étude de corpus. La méthode d'analyse proposée fournit ainsi un cadre pour la modélisation du phraséolexique de la langue scientifique générale.


  • Agnès SÁNDOR (Xerox Research Centre Europe, Meylan)
    Modeling metadiscourse conveying the author's rhetorical strategy in biomedical research abstracts
    pp. 97-108

    L’importance du métadiscours est de plus en plus reconnue pour les applications de traitement automatique des langues comme la fouille de textes ou l’extraction d’information. La détection du métadiscours est ainsi devenue une tâche à part entière dans plusieurs domaines, notamment dans le traitement de la littérature scientifique. Nous avons développé un système de traitement automatique de langues naturelles pour détecter le métadiscours particulier qui véhicule la stratégie rhétorique de l’auteur. Dans cet article, nous décrivons le modèle de métadiscours rhétorique sous-jacent au système. Ce modèle, qui s’inspire des différentes traditions, allie une approche conceptuelle à l’analyse syntaxique. Nous cherchons à montrer que ce modèle est efficace pour le traitement automatique.


  • Françoise BOCH, Francis GROSSMANN & Fanny RINCK (Grenoble 3 / Université Grenoble-Alpes)
    Conformément à nos attentes... : les marqueurs de convergence/divergence dans l'article de linguistique
    (As expected...: markers of convergence/divergence in linguistic articles)
    pp. 109-122

    A partir de l’observation d’un corpus d’articles publiés dans le champ de la linguistique, notre étude propose une analyse qualitative des marqueurs lexicaux de la convergence (de type conformément à nos hypothèses) et de la divergence (de type contre toute attente) par rapport aux attentes du chercheur-auteur ou de la communauté scientifique. L’objectif est d’étudier dans quelle mesure ces marqueurs peuvent fournir des indices sur la façon dont le chercheur-auteur construit et valide le savoir dans son article. L’analyse du corpus permet de dégager des fonctions multiples à ces marqueurs, signalant ainsi une grande disparité dans les attentes. D’où la nécessité d'envisager ces marqueurs en association avec d’autres termes, et de prendre en compte dans l'analyse le texte dans son ensemble. Si les marqueurs de convergence et de divergence ne présagent pas de la démarche scientifique impliquée dans l'ensemble de l'article, ils peuvent en revanche révéler des styles épistémologiques très divers.


  • Dirk SIEPMANN (Osnabrück, Allemagne)
    Les marqueurs de discours polylexicaux en français scientifique
    (Markers of polylexical discourse in scientific French)
    pp. 123-136

    A la différence des collocations binaires, les marqueurs du discours polylexicaux ont, jusqu’à une date récente, été traité comme les parent pauvres de la recherche lexicologique et lexicographique. Le présent article vise à combler cette lacune pour le français. Dans un premier temps, on fournira une définition opérationnelle des unités lexicales en question. Dans un deuxième temps, on procèdera à leur catégorisation selon des critères fonctionnels. Dans un troisième temps, on donnera un coup de projecteur sur les marqueurs de suggestion. L’abondance de ces marqueurs discrédite l’hypothèse selon laquelle la langue des sciences serait libre de toute subjectivité.


Comptes rendus
  • Academic Voices, de K. Fløttum & al.
    par M. Mroué
    pp. 137-138
  • Le français dans les dictionnaires bilingues, de T. Szende (éd.)
    par H. Béjoint
    pp. 138-140
  • Aspects diachroniques du vocabulaire, de D. Candel, F. Gaudin (éds)
    par C. Cortès
    pp. 140-142