Un Approccio basato su Pointer Network per l'estrazione congiunta e il rilevamento di Intenzioni Multi-Label Multi-Classe.

A Pointer Network-based Approach for Joint Extraction and Detection of Multi-Label Multi-Class Intents

October 29, 2024
Autori: Ankan Mullick, Sombit Bose, Abhilash Nandy, Gajula Sai Chaitanya, Pawan Goyal
cs.AI

Abstract

Nei sistemi di dialogo orientati al compito, la rilevazione dell'intento è cruciale per interpretare le richieste degli utenti e fornire risposte adeguate. La ricerca esistente si occupa principalmente di semplici richieste con un singolo intento, mancando di sistemi efficaci per gestire richieste complesse con molteplici intenti ed estrarre diversi span di intenti. Inoltre, c'è una notevole assenza di dataset multilingue e multi-intento. Questo studio affronta tre compiti critici: estrarre molteplici span di intenti dalle richieste, rilevare molteplici intenti e sviluppare un dataset di intenti multilingue e multi-etichetta. Introduciamo un nuovo dataset di rilevazione di intenti multietichetta e multicategoria (MLMCID-dataset) curato da dataset di riferimento esistenti. Proponiamo inoltre un'architettura basata su reti puntatore (MLMCID) per estrarre span di intenti e rilevare molteplici intenti con etichette grossolane e raffinate sotto forma di sestuplette. Un'analisi esaustiva dimostra la superiorità del nostro sistema basato su reti puntatore rispetto agli approcci di base in termini di accuratezza e punteggio F1 su vari dataset.
English
In task-oriented dialogue systems, intent detection is crucial for interpreting user queries and providing appropriate responses. Existing research primarily addresses simple queries with a single intent, lacking effective systems for handling complex queries with multiple intents and extracting different intent spans. Additionally, there is a notable absence of multilingual, multi-intent datasets. This study addresses three critical tasks: extracting multiple intent spans from queries, detecting multiple intents, and developing a multi-lingual multi-label intent dataset. We introduce a novel multi-label multi-class intent detection dataset (MLMCID-dataset) curated from existing benchmark datasets. We also propose a pointer network-based architecture (MLMCID) to extract intent spans and detect multiple intents with coarse and fine-grained labels in the form of sextuplets. Comprehensive analysis demonstrates the superiority of our pointer network-based system over baseline approaches in terms of accuracy and F1-score across various datasets.

Summary

AI-Generated Summary

PDF253November 13, 2024