Collegamento dei sensi delle parole: Disambiguazione al di fuori del sandbox.
Word Sense Linking: Disambiguating Outside the Sandbox
December 12, 2024
Autori: Andrei Stefan Bejgu, Edoardo Barba, Luigi Procopio, Alberte Fernández-Castro, Roberto Navigli
cs.AI
Abstract
La Disambiguazione del Senso delle Parole (WSD) è il compito di associare una parola in un dato contesto al suo significato più adatto tra un insieme di possibili candidati. Mentre il compito ha recentemente visto un rinnovato interesse, con sistemi che raggiungono prestazioni superiori alla stima dell'accordo tra annotatori, al momento della stesura continua a faticare nel trovare applicazioni pratiche. Sosteniamo che una delle ragioni di ciò sia la difficoltà nell'applicare il WSD al testo semplice. Infatti, nella formulazione standard, i modelli operano sotto l'assunzione che a) tutti i segmenti da disambiguare siano già stati identificati e b) siano forniti tutti i possibili significati candidati di ciascun segmento, entrambi requisiti tutt'altro che banali. In questo lavoro, presentiamo un nuovo compito chiamato Collegamento dei Sensi delle Parole (WSL) in cui, dato un testo di input e un inventario di sensi di riferimento, i sistemi devono sia identificare quali segmenti disambiguare e poi collegarli al loro significato più adatto. Proponiamo un'architettura basata su trasformatori per il compito e valutiamo approfonditamente sia le sue prestazioni che quelle dei sistemi WSD all'avanguardia adattati a WSL, rilassando iterativamente le assunzioni del WSD. Ci auguriamo che il nostro lavoro favorisca un'integrazione più semplice della semantica lessicale nelle applicazioni pratiche.
English
Word Sense Disambiguation (WSD) is the task of associating a word in a given
context with its most suitable meaning among a set of possible candidates.
While the task has recently witnessed renewed interest, with systems achieving
performances above the estimated inter-annotator agreement, at the time of
writing it still struggles to find downstream applications. We argue that one
of the reasons behind this is the difficulty of applying WSD to plain text.
Indeed, in the standard formulation, models work under the assumptions that a)
all the spans to disambiguate have already been identified, and b) all the
possible candidate senses of each span are provided, both of which are
requirements that are far from trivial. In this work, we present a new task
called Word Sense Linking (WSL) where, given an input text and a reference
sense inventory, systems have to both identify which spans to disambiguate and
then link them to their most suitable meaning.We put forward a
transformer-based architecture for the task and thoroughly evaluate both its
performance and those of state-of-the-art WSD systems scaled to WSL,
iteratively relaxing the assumptions of WSD. We hope that our work will foster
easier integration of lexical semantics into downstream applications.Summary
AI-Generated Summary