OneKE: 도커화된 스키마 안내형 LLM 에이전트 기반 지식 추출 시스템
OneKE: A Dockerized Schema-Guided LLM Agent-based Knowledge Extraction System
December 28, 2024
저자: Yujie Luo, Xiangyuan Ru, Kangwei Liu, Lin Yuan, Mengshu Sun, Ningyu Zhang, Lei Liang, Zhiqiang Zhang, Jun Zhou, Lanning Wei, Da Zheng, Haofen Wang, Huajun Chen
cs.AI
초록
저희는 웹과 원시 PDF 도서에서 지식을 추출하고 다양한 도메인(과학, 뉴스 등)을 지원하는 도커화된 스키마 안내 지식 추출 시스템인 OneKE를 소개합니다. 구체적으로, 여러 에이전트와 구성된 지식 베이스를 활용하여 OneKE를 설계했습니다. 각각의 에이전트가 각자의 역할을 수행함으로써 다양한 추출 시나리오를 지원합니다. 구성된 지식 베이스는 스키마 구성, 오류 케이스 디버깅 및 수정을 용이하게 하며 성능을 더욱 향상시킵니다. 벤치마크 데이터셋에서의 경험적 평가는 OneKE의 효과를 입증하며, 사례 연구는 다양한 도메인을 가로지르는 다양한 작업에 대한 적응성을 명확히 하여 광범위한 응용 가능성을 강조합니다. 저희는 코드를 https://github.com/zjunlp/OneKE 에 공개하고 비디오를 http://oneke.openkg.cn/demo.mp4 에 공개했습니다.
English
We introduce OneKE, a dockerized schema-guided knowledge extraction system,
which can extract knowledge from the Web and raw PDF Books, and support various
domains (science, news, etc.). Specifically, we design OneKE with multiple
agents and a configure knowledge base. Different agents perform their
respective roles, enabling support for various extraction scenarios. The
configure knowledge base facilitates schema configuration, error case debugging
and correction, further improving the performance. Empirical evaluations on
benchmark datasets demonstrate OneKE's efficacy, while case studies further
elucidate its adaptability to diverse tasks across multiple domains,
highlighting its potential for broad applications. We have open-sourced the
Code at https://github.com/zjunlp/OneKE and released a Video at
http://oneke.openkg.cn/demo.mp4.Summary
AI-Generated Summary