Zoeken, Verifiëren en Feedback: Naar het volgende generatie post-training paradigma van foundation modellen via Verifier Engineering.

Search, Verify and Feedback: Towards Next Generation Post-training Paradigm of Foundation Models via Verifier Engineering

November 18, 2024
Auteurs: Xinyan Guan, Yanjiang Liu, Xinyu Lu, Boxi Cao, Ben He, Xianpei Han, Le Sun, Jie Lou, Bowen Yu, Yaojie Lu, Hongyu Lin
cs.AI

Samenvatting

De evolutie van machine learning heeft steeds meer prioriteit gegeven aan de ontwikkeling van krachtige modellen en meer schaalbare toezichtsignalen. Echter, de opkomst van foundation modellen brengt aanzienlijke uitdagingen met zich mee bij het verschaffen van effectieve toezichtsignalen die nodig zijn om hun mogelijkheden verder te verbeteren. Daarom is er een dringende behoefte om nieuwe toezichtsignalen en technische benaderingen te verkennen. In dit artikel stellen we verifier engineering voor, een nieuw paradigma na de training dat specifiek is ontworpen voor het tijdperk van foundation modellen. De kern van verifier engineering omvat het benutten van een reeks geautomatiseerde verifiers om verificatietaken uit te voeren en zinvolle feedback te geven aan foundation modellen. We categoriseren systematisch het verifier engineering proces in drie essentiële stadia: zoeken, verifiëren en feedback geven, en bieden een uitgebreid overzicht van state-of-the-art onderzoeksontwikkelingen binnen elk stadium. We geloven dat verifier engineering een fundamentele weg vormt naar het bereiken van Kunstmatige Algemene Intelligentie.
English
The evolution of machine learning has increasingly prioritized the development of powerful models and more scalable supervision signals. However, the emergence of foundation models presents significant challenges in providing effective supervision signals necessary for further enhancing their capabilities. Consequently, there is an urgent need to explore novel supervision signals and technical approaches. In this paper, we propose verifier engineering, a novel post-training paradigm specifically designed for the era of foundation models. The core of verifier engineering involves leveraging a suite of automated verifiers to perform verification tasks and deliver meaningful feedback to foundation models. We systematically categorize the verifier engineering process into three essential stages: search, verify, and feedback, and provide a comprehensive review of state-of-the-art research developments within each stage. We believe that verifier engineering constitutes a fundamental pathway toward achieving Artificial General Intelligence.

Summary

AI-Generated Summary

PDF162November 19, 2024