SkillWeaver: Gli Agenti Web Possono Migliorarsi Scoprendo e Affinando Abilità
SkillWeaver: Web Agents can Self-Improve by Discovering and Honing Skills
April 9, 2025
Autori: Boyuan Zheng, Michael Y. Fatemi, Xiaolong Jin, Zora Zhiruo Wang, Apurva Gandhi, Yueqi Song, Yu Gu, Jayanth Srinivasa, Gaowen Liu, Graham Neubig, Yu Su
cs.AI
Abstract
Per sopravvivere e prosperare in ambienti complessi, gli esseri umani hanno sviluppato sofisticati meccanismi di auto-miglioramento attraverso l'esplorazione dell'ambiente, l'astrazione gerarchica delle esperienze in competenze riutilizzabili e la costruzione collaborativa di un repertorio di abilità in continua espansione. Nonostante i recenti progressi, gli agenti web autonomi mancano ancora di cruciali capacità di auto-miglioramento, lottando con l'astrazione della conoscenza procedurale, il perfezionamento delle competenze e la composizione delle abilità. In questo lavoro, introduciamo SkillWeaver, un framework incentrato sulle competenze che consente agli agenti di auto-migliorarsi sintetizzando autonomamente competenze riutilizzabili come API. Dato un nuovo sito web, l'agente scopre autonomamente le competenze, le esegue per praticarle e distilla le esperienze pratiche in API robuste. L'esplorazione iterativa espande continuamente una libreria di API leggere e plug-and-play, migliorando significativamente le capacità dell'agente. Esperimenti su WebArena e su siti web reali dimostrano l'efficacia di SkillWeaver, con miglioramenti relativi del tasso di successo del 31,8% e del 39,8%, rispettivamente. Inoltre, le API sintetizzate da agenti forti migliorano sostanzialmente gli agenti più deboli attraverso competenze trasferibili, ottenendo miglioramenti fino al 54,3% su WebArena. Questi risultati dimostrano l'efficacia di affinare diverse interazioni con i siti web in API, che possono essere condivise senza soluzione di continuità tra vari agenti web.
English
To survive and thrive in complex environments, humans have evolved
sophisticated self-improvement mechanisms through environment exploration,
hierarchical abstraction of experiences into reuseable skills, and
collaborative construction of an ever-growing skill repertoire. Despite recent
advancements, autonomous web agents still lack crucial self-improvement
capabilities, struggling with procedural knowledge abstraction, refining
skills, and skill composition. In this work, we introduce SkillWeaver, a
skill-centric framework enabling agents to self-improve by autonomously
synthesizing reusable skills as APIs. Given a new website, the agent
autonomously discovers skills, executes them for practice, and distills
practice experiences into robust APIs. Iterative exploration continually
expands a library of lightweight, plug-and-play APIs, significantly enhancing
the agent's capabilities. Experiments on WebArena and real-world websites
demonstrate the efficacy of SkillWeaver, achieving relative success rate
improvements of 31.8% and 39.8%, respectively. Additionally, APIs synthesized
by strong agents substantially enhance weaker agents through transferable
skills, yielding improvements of up to 54.3% on WebArena. These results
demonstrate the effectiveness of honing diverse website interactions into APIs,
which can be seamlessly shared among various web agents.Summary
AI-Generated Summary