Rapporto Tecnico Yi-Lightning

Yi-Lightning Technical Report

December 2, 2024
Autori: 01. AI, Alan Wake, Albert Wang, Bei Chen, C. X. Lv, Chao Li, Chengen Huang, Chenglin Cai, Chujie Zheng, Daniel Cooper, Ethan Dai, Fan Zhou, Feng Hu, Heng Ji, Howard Qiu, Jiangcheng Zhu, Jun Tian, Katherine Su, Lihuan Zhang, Liying Li, Ming Song, Mou Li, Peng Liu, Qichen Hu, Shawn Wang, Shijun Zhou, Shiyong Li, Tianhang Zhu, Wen Xie, Xiang He, Xiaobo Chen, Xiaohui Hu, Xiaoyi Ren, Xinyao Niu, Yanpeng Li, Yongke Zhao, Yongzhen Luo, Yuchi Xu, Yuxuan Sha, Zhaodong Yan, Zhiyuan Liu, Zirui Zhang
cs.AI

Abstract

Questo rapporto tecnico presenta Yi-Lightning, il nostro ultimo modello linguistico di grandi dimensioni (LLM) di punta. Raggiunge prestazioni eccezionali, classificandosi al 6° posto complessivo su Chatbot Arena, con risultati particolarmente solidi (dal 2° al 4° posto) in categorie specializzate tra cui Cinese, Matematica, Codifica e Prompt Complessi. Yi-Lightning sfrutta un'architettura avanzata a Mischia di Esperti (MoE), caratterizzata da meccanismi avanzati di segmentazione ed instradamento degli esperti abbinati a tecniche ottimizzate di memorizzazione chiave-valore (KV-caching). Il nostro processo di sviluppo comprende un'ampia preformazione, un raffinamento supervisionato (SFT) e apprendimento per rinforzo dal feedback umano (RLHF), in cui progettiamo strategie deliberate per l'addestramento a più fasi, la costruzione di dati sintetici e la modellazione delle ricompense. Inoltre, implementiamo RAISE (Motore di Sicurezza AI Responsabile), un quadro a quattro componenti per affrontare le problematiche di sicurezza durante le fasi di preformazione, post-formazione e servizio. Potenziati dalla nostra infrastruttura di supercalcolo scalabile, tutte queste innovazioni riducono in modo sostanziale i costi di addestramento, distribuzione e inferenza mantenendo elevati standard di prestazioni. Con ulteriori valutazioni su benchmark accademici pubblici, Yi-Lightning dimostra prestazioni competitive contro i LLM di alto livello, mentre osserviamo una disparità significativa tra i risultati dei benchmark tradizionali e statici e le preferenze umane dinamiche del mondo reale. Questa osservazione sollecita una rivalutazione critica dell'utilità dei benchmark convenzionali nel guidare lo sviluppo di sistemi AI più intelligenti e potenti per applicazioni pratiche. Yi-Lightning è ora disponibile attraverso la nostra piattaforma per sviluppatori su https://platform.lingyiwanwu.com.
English
This technical report presents Yi-Lightning, our latest flagship large language model (LLM). It achieves exceptional performance, ranking 6th overall on Chatbot Arena, with particularly strong results (2nd to 4th place) in specialized categories including Chinese, Math, Coding, and Hard Prompts. Yi-Lightning leverages an enhanced Mixture-of-Experts (MoE) architecture, featuring advanced expert segmentation and routing mechanisms coupled with optimized KV-caching techniques. Our development process encompasses comprehensive pre-training, supervised fine-tuning (SFT), and reinforcement learning from human feedback (RLHF), where we devise deliberate strategies for multi-stage training, synthetic data construction, and reward modeling. Furthermore, we implement RAISE (Responsible AI Safety Engine), a four-component framework to address safety issues across pre-training, post-training, and serving phases. Empowered by our scalable super-computing infrastructure, all these innovations substantially reduce training, deployment and inference costs while maintaining high-performance standards. With further evaluations on public academic benchmarks, Yi-Lightning demonstrates competitive performance against top-tier LLMs, while we observe a notable disparity between traditional, static benchmark results and real-world, dynamic human preferences. This observation prompts a critical reassessment of conventional benchmarks' utility in guiding the development of more intelligent and powerful AI systems for practical applications. Yi-Lightning is now available through our developer platform at https://platform.lingyiwanwu.com.

Summary

AI-Generated Summary

PDF262December 3, 2024