• Patrick HANKS & James PUSTEJOVSKY (Brandeis University, États-Unis)
    A Pattern Dictionary for Natural Language Processing
    2005, Vol. X-2, pp. 63-82

    Cet article passe en revue de façon succincte trois des ressources principales utilisées actuellement pour la désambiguïsation lexicale (WordNet, FrameNet et les classes de Levin), et propose une approche alternative, en prenant comme point de départ les verbes et leurs valences. Cette nouvelle approche ne tente pas de rendre compte de tous les usages possibles d'un mot, mais plutôt de tous ses usages normaux (les « normes »). Les patrons normaux d'utilisation des verbes sont dégagés par une méthode que nous appelons Corpus Pattern Analysis (CPA, analyse des patrons basée sur les corpus). A chaque patron se trouve associé un sens (une « implication principale »). Les patrons sont ensuite utilisés comme des étalons par rapport auxquels on peut mesurer le sens probable de n'importe quelle phrase.Nous abordons aussi le statut des usages anormaux ou inhabituels (les « exploitations »). Nous reconnaissons aussi trois types d'alternance : les alternances syntaxiques liées à la diathèse, les alternances de type sémantique et les alternances lexicales.