Une approche basée sur les réseaux de pointeurs pour l'extraction conjointe et la détection d'intentions multi-étiquettes multi-classes.

A Pointer Network-based Approach for Joint Extraction and Detection of Multi-Label Multi-Class Intents

October 29, 2024
Auteurs: Ankan Mullick, Sombit Bose, Abhilash Nandy, Gajula Sai Chaitanya, Pawan Goyal
cs.AI

Résumé

Dans les systèmes de dialogue orientés tâches, la détection d'intention est cruciale pour interpréter les requêtes des utilisateurs et fournir des réponses appropriées. Les recherches existantes abordent principalement les requêtes simples avec une seule intention, en manquant de systèmes efficaces pour traiter les requêtes complexes avec plusieurs intentions et extraire différentes étendues d'intentions. De plus, il existe une absence notable de jeux de données multilingues et multi-intentions. Cette étude aborde trois tâches critiques : l'extraction de multiples étendues d'intentions à partir des requêtes, la détection de multiples intentions et le développement d'un jeu de données d'intentions multilingue et multi-étiquettes. Nous introduisons un nouveau jeu de données de détection d'intentions multi-étiquettes et multi-classes (jeu de données MLMCID) élaboré à partir de jeux de données de référence existants. Nous proposons également une architecture basée sur un réseau de pointeurs (MLMCID) pour extraire les étendues d'intentions et détecter plusieurs intentions avec des étiquettes grossières et fines sous forme de sextuplets. Une analyse approfondie démontre la supériorité de notre système basé sur un réseau de pointeurs par rapport aux approches de base en termes de précision et de score F1 sur divers jeux de données.
English
In task-oriented dialogue systems, intent detection is crucial for interpreting user queries and providing appropriate responses. Existing research primarily addresses simple queries with a single intent, lacking effective systems for handling complex queries with multiple intents and extracting different intent spans. Additionally, there is a notable absence of multilingual, multi-intent datasets. This study addresses three critical tasks: extracting multiple intent spans from queries, detecting multiple intents, and developing a multi-lingual multi-label intent dataset. We introduce a novel multi-label multi-class intent detection dataset (MLMCID-dataset) curated from existing benchmark datasets. We also propose a pointer network-based architecture (MLMCID) to extract intent spans and detect multiple intents with coarse and fine-grained labels in the form of sextuplets. Comprehensive analysis demonstrates the superiority of our pointer network-based system over baseline approaches in terms of accuracy and F1-score across various datasets.

Summary

AI-Generated Summary

PDF243November 13, 2024