AI 연구 논문 데일리

번역이 포함된 일일 선별된 AI 연구 논문

1B LLM가 405B LLM을 능가할 수 있을까? 컴퓨팅 최적화된 테스트 시간 스케일링을 재고하기
Can 1B LLM Surpass 405B LLM? Rethinking Compute-Optimal Test-Time Scaling

Runze Liu, Junqi Gao, Jian Zhao, Kaiyan Zhang, Xiu Li, Biqing Qi, Wanli Ouyang, Bowen Zhou•Feb 10, 2025•1346

SynthDetoxM: 현대 LLM은 소수샷 병렬 해독 데이터 주석자들
SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators

Daniil Moskovskiy, Nikita Sushko, Sergey Pletenev, Elena Tutubalina, Alexander Panchenko•Feb 10, 2025•852

수학 추론 학습의 결과 보상 한계 탐색
Exploring the Limit of Outcome Reward for Learning Mathematical Reasoning

Chengqi Lyu, Songyang Gao, Yuzhe Gu, Wenwei Zhang, Jianfei Gao, Kuikun Liu, Ziyi Wang, Shuaibin Li, Qian Zhao, Haian Huang, Weihan Cao, Jiangning Liu, Hongwei Liu, Junnan Liu, Songyang Zhang, Dahua Lin, Kai Chen•Feb 10, 2025•596

다중 에이전트 강화 학습을 사용하여 사회적 추론을 위한 언어 모델 훈련
Training Language Models for Social Deduction with Multi-Agent Reinforcement Learning

Bidipta Sarkar, Warren Xia, C. Karen Liu, Dorsa Sadigh•Feb 9, 2025•323

대형 언어 모델에서의 깊이의 저주
The Curse of Depth in Large Language Models

Wenfang Sun, Xinyuan Song, Pengxiang Li, Lu Yin, Yefeng Zheng, Shiwei Liu•Feb 9, 2025•315

LM2: 대용량 메모리 모델
LM2: Large Memory Models

Jikun Kang, Wenqi Wu, Filippos Christianos, Alex J. Chan, Fraser Greenlee, George Thomas, Marvin Purtorab, Andy Toulis•Feb 9, 2025•287

마트료시카 양자화
Matryoshka Quantization

Pranav Nair, Puranjay Datta, Jeff Dean, Prateek Jain, Aditya Kusupati•Feb 10, 2025•254

CODESIM: 시뮬레이션 주도 계획 및 디버깅을 통한 다중 에이전트 코드 생성 및 문제 해결
CODESIM: Multi-Agent Code Generation and Problem Solving through Simulation-Driven Planning and Debugging

Md. Ashraful Islam, Mohammed Eunus Ali, Md Rizwan Parvez•Feb 8, 2025•223

쇼-오 터보: 가속화된 통합된 다중 모달 이해와 생성을 향하여
Show-o Turbo: Towards Accelerated Unified Multimodal Understanding and Generation

Chenkai Xu, Xu Wang, Zhenyi Liao, Yishun Li, Tianqi Hou, Zhijie Deng•Feb 8, 2025•202

ReasonFlux: 계층적 LLM 추론을 통한 사고 템플릿 확장
ReasonFlux: Hierarchical LLM Reasoning via Scaling Thought Templates

Ling Yang, Zhaochen Yu, Bin Cui, Mengdi Wang•Feb 10, 2025•193

메타체인: LLM 에이전트를 위한 완전 자동화 및 제로 코드 프레임워크
MetaChain: A Fully-Automated and Zero-Code Framework for LLM Agents

Jiabin Tang, Tianyu Fan, Chao Huang•Feb 9, 2025•162

시간적 지역성을 기반으로 한 계층적 초안 작성을 활용한 대규모 언어 모델의 손실 없는 가속화
Lossless Acceleration of Large Language Models with Hierarchical Drafting based on Temporal Locality in Speculative Decoding

Sukmin Cho, Sangjin Choi, Taeho Hwang, Jeongyeon Seo, Soyeong Jeong, Huije Lee, Hoyun Song, Jong C. Park, Youngjin Kwon•Feb 8, 2025•153

Lumina-Video: 다중 스케일을 활용한 효율적이고 유연한 비디오 생성 기술인 Next-DiT
Lumina-Video: Efficient and Flexible Video Generation with Multi-scale Next-DiT

Dongyang Liu, Shicheng Li, Yutong Liu, Zhen Li, Kai Wang, Xinyue Li, Qi Qin, Yufei Liu, Yi Xin, Zhongyu Li, Bin Fu, Chenyang Si, Yuewen Cao, Conghui He, Ziwei Liu, Yu Qiao, Qibin Hou, Hongsheng Li, Peng Gao•Feb 10, 2025•122

EVEv2: 인코더 없는 비전-언어 모델을 위한 개선된 베이스라인
EVEv2: Improved Baselines for Encoder-Free Vision-Language Models

Haiwen Diao, Xiaotong Li, Yufeng Cui, Yueze Wang, Haoge Deng, Ting Pan, Wenxuan Wang, Huchuan Lu, Xinlong Wang•Feb 10, 2025•112

토큰의 숨겨진 삶: 시각 정보 조절을 통해 대형 비전-언어 모델의 환각 감소
The Hidden Life of Tokens: Reducing Hallucination of Large Vision-Language Models via Visual Information Steering

Zhuowei Li, Haizhou Shi, Yunhe Gao, Di Liu, Zhenting Wang, Yuxiao Chen, Ting Liu, Long Zhao, Hao Wang, Dimitris N. Metaxas•Feb 5, 2025•113

역사 지침에 따른 비디오 확산
History-Guided Video Diffusion

Kiwhan Song, Boyuan Chen, Max Simchowitz, Yilun Du, Russ Tedrake, Vincent Sitzmann•Feb 10, 2025•102

CustomVideoX: 3D 참조 주의 기반 동적 적응을 통한 제로샷 맞춤형 비디오 확산 트랜스포머
CustomVideoX: 3D Reference Attention Driven Dynamic Adaptation for Zero-Shot Customized Video Diffusion Transformers

D. She, Mushui Liu, Jingxuan Pang, Jin Wang, Zhen Yang, Wanggui He, Guanghao Zhang, Yi Wang, Qihan Huang, Haobin Tang, Yunlong Yu, Siming Fu•Feb 10, 2025•92

확산 모델을 위한 이중 자막 선호도 최적화
Dual Caption Preference Optimization for Diffusion Models

Amir Saeidi, Yiran Luo, Agneet Chatterjee, Shamanthak Hegde, Bimsara Pathiraja, Yezhou Yang, Chitta Baral•Feb 9, 2025•92

효율적인 vDiT: 주의력을 갖춘 효율적인 비디오 확산 트랜스포머(Tile)
Efficient-vDiT: Efficient Video Diffusion Transformers With Attention Tile

Hangliang Ding, Dacheng Li, Runlong Su, Peiyuan Zhang, Zhijie Deng, Ion Stoica, Hao Zhang•Feb 10, 2025•72

DreamDPO: 직접 선호도 최적화를 통해 텍스트 대 3D 생성을 인간의 선호도와 일치시키다
DreamDPO: Aligning Text-to-3D Generation with Human Preferences via Direct Preference Optimization

Zhenglin Zhou, Xiaobo Xia, Fan Ma, Hehe Fan, Yi Yang, Tat-Seng Chua•Feb 5, 2025•62

Steel-LLM: 처음부터 오픈 소스로 -- 중국 중심의 LLM 구축에 대한 개인적인 여정
Steel-LLM:From Scratch to Open Source -- A Personal Journey in Building a Chinese-Centric LLM

Qingshui Gu, Shu Li, Tianyu Zheng, Zhaoxiang Zhang•Feb 10, 2025•42

금지된 과학: 이중용도 AI 도전 벤치마크 및 과학적 거부 테스트
Forbidden Science: Dual-Use AI Challenge Benchmark and Scientific Refusal Tests

David Noever, Forrest McKee•Feb 8, 2025•12

로봇 기반 모델 감사를 위한 실체화된 레드 팀 구성
Embodied Red Teaming for Auditing Robotic Foundation Models

Sathwik Karnik, Zhang-Wei Hong, Nishant Abhangi, Yen-Chen Lin, Tsun-Hsuan Wang, Christophe Dupuy, Rahul Gupta, Pulkit Agrawal•Nov 27, 2024•12