Evaluación de recursos y herramientas

  • Patrick PAROUBEK (LIMSI-CNRS)
    De l’évaluation et ses ressources en traitement automatique des langues
    (On evaluation and dedicated resources in natural langage processing)
    2019, Vol. XXIV-1, pp. 95-109

    Le traitement informatique du langage a privilégié depuis trente ans les méthodes d’apprentissage automatique qui ont permis des avancées technologiques opérationnelles dans un nombre croissant d’applications. Celles-ci ont été rendues possibles par la disponibilité de corpus d’apprentissage, par le développement du paradigme d’évaluation (shared tasks) et par la création d’infrastructures d’évaluation de technologie. Mais les corpus doivent être de taille suffisante pour représenter la réalité linguistique et toutes les langues ne disposent pas des ressources appropriées ni des moyens pour les produire. Les expériences ont montré que la taille des données d’apprentissage peut remplacer la complexité algorithmique ou les connaissances expertes, mais a-t-on atteint les limites de ce type d’approche ?