OneKE: Docker化されたスキーマガイドLLMエージェントベースの知識抽出システム

OneKE: A Dockerized Schema-Guided LLM Agent-based Knowledge Extraction System

December 28, 2024
著者: Yujie Luo, Xiangyuan Ru, Kangwei Liu, Lin Yuan, Mengshu Sun, Ningyu Zhang, Lei Liang, Zhiqiang Zhang, Jun Zhou, Lanning Wei, Da Zheng, Haofen Wang, Huajun Chen
cs.AI

要旨

OneKEは、Webや生のPDF書籍から知識を抽出し、さまざまなドメイン(科学、ニュースなど)をサポートする、Docker化されたスキーマに基づいた知識抽出システムを紹介します。具体的には、複数のエージェントと構成された知識ベースを持つOneKEを設計しています。異なるエージェントがそれぞれの役割を果たし、さまざまな抽出シナリオをサポートします。構成された知識ベースはスキーマの構成、エラーケースのデバッグと修正を容易にし、パフォーマンスをさらに向上させます。ベンチマークデータセットでの実証評価は、OneKEの有効性を示し、事例研究は、異なるドメインにわたる多様なタスクへの適応性をさらに明らかにし、幅広い応用の可能性を示しています。Codeはhttps://github.com/zjunlp/OneKEでオープンソース化されており、Videoはhttp://oneke.openkg.cn/demo.mp4で公開されています。
English
We introduce OneKE, a dockerized schema-guided knowledge extraction system, which can extract knowledge from the Web and raw PDF Books, and support various domains (science, news, etc.). Specifically, we design OneKE with multiple agents and a configure knowledge base. Different agents perform their respective roles, enabling support for various extraction scenarios. The configure knowledge base facilitates schema configuration, error case debugging and correction, further improving the performance. Empirical evaluations on benchmark datasets demonstrate OneKE's efficacy, while case studies further elucidate its adaptability to diverse tasks across multiple domains, highlighting its potential for broad applications. We have open-sourced the Code at https://github.com/zjunlp/OneKE and released a Video at http://oneke.openkg.cn/demo.mp4.

Summary

AI-Generated Summary

PDF172December 31, 2024