AI 연구 논문 데일리

번역이 포함된 일일 선별된 AI 연구 논문

SmolLM2: 작은 언어 모델의 데이터 중심 훈련 시, Smol이 커지다
SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model

Loubna Ben Allal, Anton Lozhkov, Elie Bakouch, Gabriel Martín Blázquez, Guilherme Penedo, Lewis Tunstall, Andrés Marafioti, Hynek Kydlíček, Agustín Piqueres Lajarín, Vaibhav Srivastav, Joshua Lochner, Caleb Fahlgren, Xuan-Son Nguyen, Clémentine Fourrier, Ben Burtenshaw, Hugo Larcher, Haojun Zhao, Cyril Zakka, Mathieu Morlon, Colin Raffel, Leandro von Werra, Thomas Wolf•Feb 4, 2025•1905

추론을 위한 LIMO: 적은 것이 더 좋다
LIMO: Less is More for Reasoning

Yixin Ye, Zhen Huang, Yang Xiao, Ethan Chern, Shijie Xia, Pengfei Liu•Feb 5, 2025•564

LLM에서의 긴 사고 연쇄 추론 해부하기
Demystifying Long Chain-of-Thought Reasoning in LLMs

Edward Yeo, Yuxuan Tong, Morry Niu, Graham Neubig, Xiang Yue•Feb 5, 2025•513

TwinMarket: 금융 시장을 위한 확장 가능한 행동 및 사회 시뮬레이션
TwinMarket: A Scalable Behavioral and Social Simulation for Financial Markets

Yuzhe Yang, Yifei Zhang, Minghao Wu, Kaidi Zhang, Yunmiao Zhang, Honghai Yu, Yan Hu, Benyou Wang•Feb 3, 2025•323

MCTS-자동화된 구조화된 사고를 활용한 멀티모달 추론 강화
Boosting Multimodal Reasoning with MCTS-Automated Structured Thinking

Jinyang Wu, Mingkuan Feng, Shuai Zhang, Ruihan Jin, Feihu Che, Zengqi Wen, Jianhua Tao•Feb 4, 2025•224

LayerTracer: 확산을 통한 인지-맞춤형 계층 SVG 합성 Transformer
LayerTracer: Cognitive-Aligned Layered SVG Synthesis via Diffusion Transformer

Yiren Song, Danze Chen, Mike Zheng Shou•Feb 3, 2025•183

언어 모델 증류에서의 교사 해킹에 관한 연구
On Teacher Hacking in Language Model Distillation

Daniil Tiapkin, Daniele Calandriello, Johan Ferret, Sarah Perrin, Nino Vieillard, Alexandre Ramé, Mathieu Blondel•Feb 4, 2025•172

토큰 혼합: 향상된 언어 모델 추론을 위한 잠재 및 텍스트 토큰 혼합
Token Assorted: Mixing Latent and Text Tokens for Improved Language Model Reasoning

DiJia Su, Hanlin Zhu, Yingchen Xu, Jiantao Jiao, Yuandong Tian, Qinqing Zheng•Feb 5, 2025•132

대규모 언어 모델 안내 자체 디버깅 코드 생성
Large Language Model Guided Self-Debugging Code Generation

Muntasir Adnan, Zhiwei Xu, Carlos C. N. Kuhn•Feb 5, 2025•112

LLM의 추론 시간 스케일링을 위한 확률적 추론 접근 입자 기반 몬테카를로 방법 사용
A Probabilistic Inference Approach to Inference-Time Scaling of LLMs using Particle-Based Monte Carlo Methods

Isha Puri, Shivchander Sudalairaj, Guangxuan Xu, Kai Xu, Akash Srivastava•Feb 3, 2025•93

HackerRank-ASTRA: 대규모 언어 모델의 정확성과 일관성 평가 다중 파일 프로젝트 문제에서의 교차 도메인 평가
HackerRank-ASTRA: Evaluating Correctness & Consistency of Large Language Models on cross-domain multi-file project problems

Jun Xing, Mayur Bhatia, Sahil Phulwani, Darshan Suresh, Rafik Matta•Jan 31, 2025•02

AI 연구 논문 데일리

SmolLM2: 작은 언어 모델의 데이터 중심 훈련 시, Smol이 커지다
SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model

추론을 위한 LIMO: 적은 것이 더 좋다
LIMO: Less is More for Reasoning

LLM에서의 긴 사고 연쇄 추론 해부하기
Demystifying Long Chain-of-Thought Reasoning in LLMs

TwinMarket: 금융 시장을 위한 확장 가능한 행동 및 사회 시뮬레이션
TwinMarket: A Scalable Behavioral and Social Simulation for Financial Markets

MCTS-자동화된 구조화된 사고를 활용한 멀티모달 추론 강화
Boosting Multimodal Reasoning with MCTS-Automated Structured Thinking

LayerTracer: 확산을 통한 인지-맞춤형 계층 SVG 합성 Transformer
LayerTracer: Cognitive-Aligned Layered SVG Synthesis via Diffusion Transformer

언어 모델 증류에서의 교사 해킹에 관한 연구
On Teacher Hacking in Language Model Distillation

토큰 혼합: 향상된 언어 모델 추론을 위한 잠재 및 텍스트 토큰 혼합
Token Assorted: Mixing Latent and Text Tokens for Improved Language Model Reasoning

대규모 언어 모델 안내 자체 디버깅 코드 생성
Large Language Model Guided Self-Debugging Code Generation

LLM의 추론 시간 스케일링을 위한 확률적 추론 접근 입자 기반 몬테카를로 방법 사용
A Probabilistic Inference Approach to Inference-Time Scaling of LLMs using Particle-Based Monte Carlo Methods

Universal Multi-Prompts를 사용한 탈옥
Jailbreaking with Universal Multi-Prompts

대규모 언어 모델의 활성화 정보를 활용한 병합
Activation-Informed Merging of Large Language Models

이 문제를 푸시오! 검은색 멤버십 추론을 위한 은밀함 증가 생성
Riddle Me This! Stealthy Membership Inference for Retrieval-Augmented Generation

HackerRank-ASTRA: 대규모 언어 모델의 정확성과 일관성 평가 다중 파일 프로젝트 문제에서의 교차 도메인 평가
HackerRank-ASTRA: Evaluating Correctness & Consistency of Large Language Models on cross-domain multi-file project problems

Support

AI 연구 논문 데일리

SmolLM2: 작은 언어 모델의 데이터 중심 훈련 시, Smol이 커지다
SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model

추론을 위한 LIMO: 적은 것이 더 좋다
LIMO: Less is More for Reasoning

LLM에서의 긴 사고 연쇄 추론 해부하기
Demystifying Long Chain-of-Thought Reasoning in LLMs

TwinMarket: 금융 시장을 위한 확장 가능한 행동 및 사회 시뮬레이션
TwinMarket: A Scalable Behavioral and Social Simulation for Financial Markets

MCTS-자동화된 구조화된 사고를 활용한 멀티모달 추론 강화
Boosting Multimodal Reasoning with MCTS-Automated Structured Thinking

LayerTracer: 확산을 통한 인지-맞춤형 계층 SVG 합성 Transformer
LayerTracer: Cognitive-Aligned Layered SVG Synthesis via Diffusion Transformer

언어 모델 증류에서의 교사 해킹에 관한 연구
On Teacher Hacking in Language Model Distillation

토큰 혼합: 향상된 언어 모델 추론을 위한 잠재 및 텍스트 토큰 혼합
Token Assorted: Mixing Latent and Text Tokens for Improved Language Model Reasoning

대규모 언어 모델 안내 자체 디버깅 코드 생성
Large Language Model Guided Self-Debugging Code Generation

LLM의 추론 시간 스케일링을 위한 확률적 추론 접근 입자 기반 몬테카를로 방법 사용
A Probabilistic Inference Approach to Inference-Time Scaling of LLMs using Particle-Based Monte Carlo Methods

Universal Multi-Prompts를 사용한 탈옥
Jailbreaking with Universal Multi-Prompts

대규모 언어 모델의 활성화 정보를 활용한 병합
Activation-Informed Merging of Large Language Models

이 문제를 푸시오! 검은색 멤버십 추론을 위한 은밀함 증가 생성
Riddle Me This! Stealthy Membership Inference for Retrieval-Augmented Generation

HackerRank-ASTRA: 대규모 언어 모델의 정확성과 일관성 평가 다중 파일 프로젝트 문제에서의 교차 도메인 평가
HackerRank-ASTRA: Evaluating Correctness & Consistency of Large Language Models on cross-domain multi-file project problems