-
Manuel BARBERA & Carla MARELLO (Turin, Italie)Les lexies complexes et leur annotation morphosyntaxique dans le Corpus Taurinense
(Complex lexical units and their morphosyntactic treatment in the Corpus Taurinense)2000, Vol. V-2, pp. 57-70Le Corpus Taurinense (CT) est la version morphologiquement annotée d'ItalAnt Corpus, un corpus électronique de textes d'ancien italien (écrits entre 1251 et 1300). Nous essayons ici de décrire l'approche suivie dans le CT pour l'annotation des lexies complexes (MWUs 'multiword units'). La lexie complexe dans notre travail est un groupe de deux mots graphiques ou plus qui reçoit (aussi) une étiquette de partie du discours d'ensemble parce que ce groupe de mots est en relation paradigmatique avec une autre unité lexicale de la même partie du discours.Notre étiquetage de parties du discours confirme que la majorité des conjonctions composées de l'italien moderne n'était pas lexicalisée à cette époque. L'ordre des composants est déjà celui de l'italien moderne mais ces conjonctions peuvent encore être interrompues par des éléments occasionnels.
-
Mireille BILGER (Perpignan)Corpus de portugais et d'espagnol1996, Vol. I-2, pp. 124-130
-
Maria de Lourdes CRISPIM & Maria Francisca XAVIER (Lisbonne, Portugal)Constitution (et utilisation) d'un corpus de portugais médiéval
(Building and using a corpus of medieval Portuguese)1999, Vol. IV-1, pp. 41-45Après avoir présenté comment a été constitué le Corpus de Portugais Médiéval, et en particulier comment il a été étiqueté, on essaiera de montrer comment il est aujourd'hui utilisé pour la construction d'un dictionnaire du portugais médiéval, et plus particulièrement de verbes, de noms propres et de noms communs
-
Claus D. PUSCH (Fribourg, Allemagne)Les corpus de linguistique romane en pays germanophones. Bilan et perspectives2007, Vol. XII-1, pp. 111-124
-
Miriam VOGHERA (Naples, Italie)Corpora dell'italiano
(Corpora of Italian)1996, Vol. I-2, pp. 131-134
Corpus de langues romanes