AI 연구 논문 데일리

번역이 포함된 일일 선별된 AI 연구 논문

GuardReasoner: 추론 기반 LLM 안전장치를 향하여
GuardReasoner: Towards Reasoning-based LLM Safeguards

Yue Liu, Hongcheng Gao, Shengfang Zhai, Jun Xia, Tianyi Wu, Zhiwei Xue, Yulin Chen, Kenji Kawaguchi, Jiaheng Zhang, Bryan Hooi•Jan 30, 2025•813

생각이 여기저기 흩어져 있습니다: o1과 유사한 LLMs의 미충분한 사고에 대해
Thoughts Are All Over the Place: On the Underthinking of o1-Like LLMs

Yue Wang, Qiuzhi Liu, Jiahao Xu, Tian Liang, Xingyu Chen, Zhiwei He, Linfeng Song, Dian Yu, Juntao Li, Zhuosheng Zhang, Rui Wang, Zhaopeng Tu, Haitao Mi, Dong Yu•Jan 30, 2025•5511

중첩 통신을 이용한 스트리밍 DiLoCo: 분산된 무료 점심을 향하여
Streaming DiLoCo with overlapping communication: Towards a Distributed Free Lunch

Arthur Douillard, Yanislav Donchev, Keith Rush, Satyen Kale, Zachary Charles, Zachary Garrett, Gabriel Teston, Dave Lacey, Ross McIlroy, Jiajun Shen, Alexandre Ramé, Arthur Szlam, Marc'Aurelio Ranzato, Paul Barham•Jan 30, 2025•275

대형 언어 모델은 효과적으로 탐색하기에 너무 빨리 생각합니다.
Large Language Models Think Too Fast To Explore Effectively

Lan Pan, Hanbo Xie, Robert C. Wilson•Jan 29, 2025•233

o3-mini 대 DeepSeek-R1: 어느 쪽이 더 안전한가요?
o3-mini vs DeepSeek-R1: Which One is Safer?

Aitor Arrieta, Miriam Ugarte, Pablo Valle, José Antonio Parejo, Sergio Segura•Jan 30, 2025•223

MedXpertQA: 전문가 수준 의료 추론과 이해력의 벤치마킹
MedXpertQA: Benchmarking Expert-Level Medical Reasoning and Understanding

Yuxin Zuo, Shang Qu, Yifei Li, Zhangren Chen, Xuekai Zhu, Ermo Hua, Kaiyan Zhang, Ning Ding, Bowen Zhou•Jan 30, 2025•212

WILDCHAT-50M: 합성 데이터의 역할에 대한 심층적인 탐구
WILDCHAT-50M: A Deep Dive Into the Role of Synthetic Data in Post-Training

Benjamin Feuer, Chinmay Hegde•Jan 30, 2025•194

PhysBench: 물리 세계 이해를 위한 비전-언어 모델의 벤치마킹 및 향상
PhysBench: Benchmarking and Enhancing Vision-Language Models for Physical World Understanding

Wei Chow, Jiageng Mao, Boyi Li, Daniel Seita, Vitor Guizilini, Yue Wang•Jan 27, 2025•183

SANA 1.5: 선형 확산 트랜스포머에서 효율적인 학습 및 추론 시간 계산 확장
SANA 1.5: Efficient Scaling of Training-Time and Inference-Time Compute in Linear Diffusion Transformer

Enze Xie, Junsong Chen, Yuyang Zhao, Jincheng Yu, Ligeng Zhu, Yujun Lin, Zhekai Zhang, Muyang Li, Junyu Chen, Han Cai, Bingchen Liu, Daquan Zhou, Song Han•Jan 30, 2025•162

CowPilot: 자율적 및 인간-에이전트 협업 웹 탐색을 위한 프레임워크
CowPilot: A Framework for Autonomous and Human-Agent Collaborative Web Navigation

Faria Huq, Zora Zhiruo Wang, Frank F. Xu, Tianyue Ou, Shuyan Zhou, Jeffrey P. Bigham, Graham Neubig•Jan 28, 2025•62