ChatPaper.aiChatPaper

EasyEdit2: Een gebruiksvriendelijk stuurraamwerk voor het bewerken van grote taalmodellen

EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models

April 21, 2025
Auteurs: Ziwen Xu, Shuxun Wang, Kewei Xu, Haoming Xu, Mengru Wang, Xinle Deng, Yunzhi Yao, Guozhou Zheng, Huajun Chen, Ningyu Zhang
cs.AI

Samenvatting

In dit artikel introduceren we EasyEdit2, een framework ontworpen om plug-and-play aanpasbaarheid mogelijk te maken voor het beheersen van het gedrag van Large Language Models (LLM's). EasyEdit2 ondersteunt een breed scala aan interventies tijdens het testen, waaronder veiligheid, sentiment, persoonlijkheid, redeneerpatronen, feitelijkheid en taalkenmerken. In tegenstelling tot zijn voorganger beschikt EasyEdit2 over een nieuwe architectuur die specifiek is ontworpen voor naadloze modelsturing. Het bestaat uit belangrijke modules zoals de stuurvectorgenerator en de stuurvectorapplicator, die het automatisch genereren en toepassen van stuurvectoren mogelijk maken om het gedrag van het model te beïnvloeden zonder de parameters ervan te wijzigen. Een van de belangrijkste voordelen van EasyEdit2 is het gebruiksgemak – gebruikers hebben geen uitgebreide technische kennis nodig. Met slechts één voorbeeld kunnen ze de reacties van het model effectief sturen en aanpassen, waardoor precieze controle zowel toegankelijk als efficiënt wordt. Empirisch rapporteren we de prestaties van modelsturing over verschillende LLM's, wat de effectiviteit van deze technieken aantoont. We hebben de broncode vrijgegeven op GitHub op https://github.com/zjunlp/EasyEdit, samen met een demonstratie-notebook. Daarnaast bieden we een demovideo op https://zjunlp.github.io/project/EasyEdit2/video voor een snelle introductie.
English
In this paper, we introduce EasyEdit2, a framework designed to enable plug-and-play adjustability for controlling Large Language Model (LLM) behaviors. EasyEdit2 supports a wide range of test-time interventions, including safety, sentiment, personality, reasoning patterns, factuality, and language features. Unlike its predecessor, EasyEdit2 features a new architecture specifically designed for seamless model steering. It comprises key modules such as the steering vector generator and the steering vector applier, which enable automatic generation and application of steering vectors to influence the model's behavior without modifying its parameters. One of the main advantages of EasyEdit2 is its ease of use-users do not need extensive technical knowledge. With just a single example, they can effectively guide and adjust the model's responses, making precise control both accessible and efficient. Empirically, we report model steering performance across different LLMs, demonstrating the effectiveness of these techniques. We have released the source code on GitHub at https://github.com/zjunlp/EasyEdit along with a demonstration notebook. In addition, we provide a demo video at https://zjunlp.github.io/project/EasyEdit2/video for a quick introduction.

Summary

AI-Generated Summary

PDF212April 22, 2025