CypherBench: LLM時代におけるフルスケールの現代知識グラフに向けた正確な検索に向けて
CypherBench: Towards Precise Retrieval over Full-scale Modern Knowledge Graphs in the LLM Era
December 24, 2024
著者: Yanlin Feng, Simone Papicchio, Sajjadur Rahman
cs.AI
要旨
グラフデータからの検索は、大規模言語モデル(LLM)にオープンドメインの知識と企業データを拡充する上で重要であり、最近のGraphRAGシステムにおいても重要なコンポーネントとなっています(edge et al.、2024)。知識グラフと知識ベースの質問応答に関する数十年にわたる研究にもかかわらず、主要なLLMフレームワーク(例:LangchainとLlamaIndex)は、Wikidataのような現代の百科事典知識グラフからの検索をほとんどサポートしていません。本論文では、この根本的な原因を分析し、現代のRDF知識グラフ(例:Wikidata、Freebase)が、典型的なLLMコンテキストウィンドウを大幅に超える過剰に大きなスキーマ、リソース識別子の使用、重複する関係タイプ、および正規化の不足のためにLLMにとって効率的でないことを示唆しています。その解決策として、RDFグラフの下に効率的にクエリできるプロパティグラフビューを提案しています。このアイデアをWikidataに実装し、Cypherを使用してLLMが効率的にクエリできるようにしました。私たちはこのアイデアをWikidataで具体化し、11の大規模な多ドメインプロパティグラフと780万以上のエンティティ、1万以上の質問を備えたCypherBenchを導入しました。これを達成するために、RDFからプロパティグラフへの変換エンジンの開発、テキストからCypherタスク生成のための体系的なパイプラインの作成、新しい評価メトリクスの設計など、いくつかの主要な課題に取り組みました。
English
Retrieval from graph data is crucial for augmenting large language models
(LLM) with both open-domain knowledge and private enterprise data, and it is
also a key component in the recent GraphRAG system (edge et al., 2024). Despite
decades of research on knowledge graphs and knowledge base question answering,
leading LLM frameworks (e.g. Langchain and LlamaIndex) have only minimal
support for retrieval from modern encyclopedic knowledge graphs like Wikidata.
In this paper, we analyze the root cause and suggest that modern RDF knowledge
graphs (e.g. Wikidata, Freebase) are less efficient for LLMs due to overly
large schemas that far exceed the typical LLM context window, use of resource
identifiers, overlapping relation types and lack of normalization. As a
solution, we propose property graph views on top of the underlying RDF graph
that can be efficiently queried by LLMs using Cypher. We instantiated this idea
on Wikidata and introduced CypherBench, the first benchmark with 11
large-scale, multi-domain property graphs with 7.8 million entities and over
10,000 questions. To achieve this, we tackled several key challenges, including
developing an RDF-to-property graph conversion engine, creating a systematic
pipeline for text-to-Cypher task generation, and designing new evaluation
metrics.Summary
AI-Generated Summary