ChatPaper.aiChatPaper

실제 사용 사례를 위한 대형 언어 모델 시리즈 EXAONE 3.5

EXAONE 3.5: Series of Large Language Models for Real-world Use Cases

December 6, 2024
저자: LG AI Research, Soyoung An, Kyunghoon Bae, Eunbi Choi, Kibong Choi, Stanley Jungkyu Choi, Seokhee Hong, Junwon Hwang, Hyojin Jeon, Gerrard Jeongwon Jo, Hyunjik Jo, Jiyeon Jung, Yountae Jung, Hyosang Kim, Joonkee Kim, Seonghwan Kim, Soyeon Kim, Sunkyoung Kim, Yireun Kim, Yongil Kim, Youchul Kim, Edward Hwayoung Lee, Haeju Lee, Honglak Lee, Jinsik Lee, Kyungmin Lee, Woohyung Lim, Sangha Park, Sooyoun Park, Yongmin Park, Sihoon Yang, Heuiyeen Yeen, Hyeongu Yun
cs.AI

초록

본 기술 보고서는 LG AI 연구팀이 개발 및 공개한 EXAONE 3.5 명령어 튜닝 언어 모델을 소개합니다. EXAONE 3.5 언어 모델은 32B, 7.8B, 2.4B 세 가지 구성으로 제공됩니다. 이러한 모델은 여러 가지 우수한 기능을 갖추고 있습니다. 첫째, 현실 세계 시나리오에서 뛰어난 명령어 따르기 능력을 보여 일곱 가지 벤치마크에서 가장 높은 점수를 달성했습니다. 둘째, 우수한 장기 문맥 이해력으로 네 가지 벤치마크에서 최고 성능을 달성했습니다. 셋째, 유사한 크기의 최첨단 오픈 모델과 비교하여 아홉 가지 일반 벤치마크에서 경쟁력 있는 결과를 보여주었습니다. EXAONE 3.5 언어 모델은 연구 목적을 위해 누구에게나 공개되어 있으며 https://huggingface.co/LGAI-EXAONE에서 다운로드할 수 있습니다. 상업적 이용을 원하시는 경우 LG AI 연구팀 공식 연락처인 contact_us@lgresearch.ai로 문의해주시기 바랍니다.
English
This technical report introduces the EXAONE 3.5 instruction-tuned language models, developed and released by LG AI Research. The EXAONE 3.5 language models are offered in three configurations: 32B, 7.8B, and 2.4B. These models feature several standout capabilities: 1) exceptional instruction following capabilities in real-world scenarios, achieving the highest scores across seven benchmarks, 2) outstanding long-context comprehension, attaining the top performance in four benchmarks, and 3) competitive results compared to state-of-the-art open models of similar sizes across nine general benchmarks. The EXAONE 3.5 language models are open to anyone for research purposes and can be downloaded from https://huggingface.co/LGAI-EXAONE. For commercial use, please reach out to the official contact point of LG AI Research: contact_us@lgresearch.ai.

Summary

AI-Generated Summary

PDF504December 9, 2024