Un Approccio basato su Pointer Network per l'estrazione congiunta e il rilevamento di Intenzioni Multi-Label Multi-Classe.
A Pointer Network-based Approach for Joint Extraction and Detection of Multi-Label Multi-Class Intents
October 29, 2024
Autori: Ankan Mullick, Sombit Bose, Abhilash Nandy, Gajula Sai Chaitanya, Pawan Goyal
cs.AI
Abstract
Nei sistemi di dialogo orientati al compito, la rilevazione dell'intento è cruciale per interpretare le richieste degli utenti e fornire risposte adeguate. La ricerca esistente si occupa principalmente di semplici richieste con un singolo intento, mancando di sistemi efficaci per gestire richieste complesse con molteplici intenti ed estrarre diversi span di intenti. Inoltre, c'è una notevole assenza di dataset multilingue e multi-intento. Questo studio affronta tre compiti critici: estrarre molteplici span di intenti dalle richieste, rilevare molteplici intenti e sviluppare un dataset di intenti multilingue e multi-etichetta. Introduciamo un nuovo dataset di rilevazione di intenti multietichetta e multicategoria (MLMCID-dataset) curato da dataset di riferimento esistenti. Proponiamo inoltre un'architettura basata su reti puntatore (MLMCID) per estrarre span di intenti e rilevare molteplici intenti con etichette grossolane e raffinate sotto forma di sestuplette. Un'analisi esaustiva dimostra la superiorità del nostro sistema basato su reti puntatore rispetto agli approcci di base in termini di accuratezza e punteggio F1 su vari dataset.
English
In task-oriented dialogue systems, intent detection is crucial for
interpreting user queries and providing appropriate responses. Existing
research primarily addresses simple queries with a single intent, lacking
effective systems for handling complex queries with multiple intents and
extracting different intent spans. Additionally, there is a notable absence of
multilingual, multi-intent datasets. This study addresses three critical tasks:
extracting multiple intent spans from queries, detecting multiple intents, and
developing a multi-lingual multi-label intent dataset. We introduce a novel
multi-label multi-class intent detection dataset (MLMCID-dataset) curated from
existing benchmark datasets. We also propose a pointer network-based
architecture (MLMCID) to extract intent spans and detect multiple intents with
coarse and fine-grained labels in the form of sextuplets. Comprehensive
analysis demonstrates the superiority of our pointer network-based system over
baseline approaches in terms of accuracy and F1-score across various datasets.Summary
AI-Generated Summary