ChatPaper.aiChatPaper

SLIMER-IT: 이탈리아어 언어에 대한 제로샷 개체명 인식

SLIMER-IT: Zero-Shot NER on Italian Language

September 24, 2024
저자: Andrew Zamai, Leonardo Rigutini, Marco Maggini, Andrea Zugarini
cs.AI

초록

명명된 개체 인식(Named Entity Recognition, NER)에 대한 전통적인 접근 방식은 BIO 시퀀스 레이블링 문제로 구성됩니다. 이러한 시스템들은 종종 주어진 하위 작업에서 뛰어난 성과를 보이지만, 상세하게 주석이 달린 데이터가 필요하며, 분포 범위를 벗어나는 입력 도메인 및 보이지 않는 개체 유형에 대한 일반화에 어려움을 겪습니다. 반면에 대형 언어 모델(Large Language Models, LLMs)은 강력한 제로샷 능력을 증명해왔습니다. 영어에서 제로샷 NER을 다룬 연구들이 여러 개 있지만, 다른 언어에서는 그렇지 않습니다. 본 논문에서는 이탈리아어에 대해 적용하는 제로샷 NER을 위한 평가 프레임워크를 정의합니다. 게다가, 우리는 SLIMER의 이탈리아어 버전인 SLIMER-IT을 소개합니다. 이는 정의와 지침이 풍부하게 담긴 프롬프트를 활용하는 제로샷 NER을 위한 지침 조정 접근 방식입니다. 다른 최신 모델들과의 비교를 통해, SLIMER-IT이 이전에 본 적 없는 개체 태그에서 우수성을 입증합니다.
English
Traditional approaches to Named Entity Recognition (NER) frame the task into a BIO sequence labeling problem. Although these systems often excel in the downstream task at hand, they require extensive annotated data and struggle to generalize to out-of-distribution input domains and unseen entity types. On the contrary, Large Language Models (LLMs) have demonstrated strong zero-shot capabilities. While several works address Zero-Shot NER in English, little has been done in other languages. In this paper, we define an evaluation framework for Zero-Shot NER, applying it to the Italian language. Furthermore, we introduce SLIMER-IT, the Italian version of SLIMER, an instruction-tuning approach for zero-shot NER leveraging prompts enriched with definition and guidelines. Comparisons with other state-of-the-art models, demonstrate the superiority of SLIMER-IT on never-seen-before entity tags.

Summary

AI-Generated Summary

PDF52November 16, 2024