ChatPaper.aiChatPaper

Feather-SQL: Ein leichtgewichtiges NL2SQL-Framework mit einem Dual-Modell-Kollaborationsparadigma für kleine Sprachmodelle

Feather-SQL: A Lightweight NL2SQL Framework with Dual-Model Collaboration Paradigm for Small Language Models

March 22, 2025
Autoren: Wenqi Pei, Hailing Xu, Hengyuan Zhao, Shizheng Hou, Han Chen, Zining Zhang, Pingyi Luo, Bingsheng He
cs.AI

Zusammenfassung

Natural Language to SQL (NL2SQL) hat mit großen Sprachmodellen (LLMs) bedeutende Fortschritte erzielt. Diese Modelle sind jedoch oft auf geschlossene Systeme und hohe Rechenressourcen angewiesen, was Herausforderungen in Bezug auf Datenschutz und Bereitstellung mit sich bringt. Im Gegensatz dazu haben kleine Sprachmodelle (SLMs) Schwierigkeiten mit NL2SQL-Aufgaben, da sie eine schlechte Leistung zeigen und nicht mit bestehenden Frameworks kompatibel sind. Um diese Probleme zu lösen, stellen wir Feather-SQL vor, ein neues leichtgewichtiges Framework, das speziell für SLMs entwickelt wurde. Feather-SQL verbessert die Ausführbarkeit und Genauigkeit von SQL durch 1) Schema-Bereinigung und -Verknüpfung sowie 2) Multi-Pfad- und Multi-Kandidaten-Generierung. Zusätzlich führen wir das 1+1-Modell-Kollaborationsparadigma ein, das ein leistungsstarkes, allgemeines Chat-Modell mit einem feinabgestimmten SQL-Spezialisten kombiniert, um starke analytische Fähigkeiten mit hochpräziser SQL-Generierung zu vereinen. Experimentelle Ergebnisse auf BIRD zeigen, dass Feather-SQL die NL2SQL-Leistung von SLMs verbessert, mit einer Steigerung von etwa 10 % bei Modellen ohne Feinabstimmung. Das vorgeschlagene Paradigma hebt die Genauigkeitsgrenze von SLMs auf 54,76 %, was seine Wirksamkeit unterstreicht.
English
Natural Language to SQL (NL2SQL) has seen significant advancements with large language models (LLMs). However, these models often depend on closed-source systems and high computational resources, posing challenges in data privacy and deployment. In contrast, small language models (SLMs) struggle with NL2SQL tasks, exhibiting poor performance and incompatibility with existing frameworks. To address these issues, we introduce Feather-SQL, a new lightweight framework tailored for SLMs. Feather-SQL improves SQL executability and accuracy through 1) schema pruning and linking, 2) multi-path and multi-candidate generation. Additionally, we introduce the 1+1 Model Collaboration Paradigm, which pairs a strong general-purpose chat model with a fine-tuned SQL specialist, combining strong analytical reasoning with high-precision SQL generation. Experimental results on BIRD demonstrate that Feather-SQL improves NL2SQL performance on SLMs, with around 10% boost for models without fine-tuning. The proposed paradigm raises the accuracy ceiling of SLMs to 54.76%, highlighting its effectiveness.

Summary

AI-Generated Summary

PDF132March 25, 2025