ChatPaper.ai
메뉴 열기
홈
오늘의 논문
요금제
계정
작업공간
🇰🇷
한국어
Loading...
•
•
•
•
•
•
•
•
•
•
AI 연구 논문 데일리
번역이 포함된 일일 선별된 AI 연구 논문
February 6th, 2025
SmolLM2: 작은 언어 모델의 데이터 중심 훈련 시, Smol이 커지다
SmolLM2: When Smol Goes Big -- Data-Centric Training of a Small Language Model
Loubna Ben Allal, Anton Lozhkov, Elie Bakouch, Gabriel Martín Blázquez, Guilherme Penedo, Lewis Tunstall, Andrés Marafioti, Hynek Kydlíček, Agustín Piqueres Lajarín, Vaibhav Srivastav, Joshua Lochner, Caleb Fahlgren, Xuan-Son Nguyen, Clémentine Fourrier, Ben Burtenshaw, Hugo Larcher, Haojun Zhao, Cyril Zakka, Mathieu Morlon, Colin Raffel, Leandro von Werra, Thomas Wolf
•
Feb 4, 2025
•
190
5
추론을 위한 LIMO: 적은 것이 더 좋다
LIMO: Less is More for Reasoning
Yixin Ye, Zhen Huang, Yang Xiao, Ethan Chern, Shijie Xia, Pengfei Liu
•
Feb 5, 2025
•
56
4
LLM에서의 긴 사고 연쇄 추론 해부하기
Demystifying Long Chain-of-Thought Reasoning in LLMs
Edward Yeo, Yuxuan Tong, Morry Niu, Graham Neubig, Xiang Yue
•
Feb 5, 2025
•
51
3
TwinMarket: 금융 시장을 위한 확장 가능한 행동 및 사회 시뮬레이션
TwinMarket: A Scalable Behavioral and Social Simulation for Financial Markets
Yuzhe Yang, Yifei Zhang, Minghao Wu, Kaidi Zhang, Yunmiao Zhang, Honghai Yu, Yan Hu, Benyou Wang
•
Feb 3, 2025
•
32
3
MCTS-자동화된 구조화된 사고를 활용한 멀티모달 추론 강화
Boosting Multimodal Reasoning with MCTS-Automated Structured Thinking
Jinyang Wu, Mingkuan Feng, Shuai Zhang, Ruihan Jin, Feihu Che, Zengqi Wen, Jianhua Tao
•
Feb 4, 2025
•
22
4
LayerTracer: 확산을 통한 인지-맞춤형 계층 SVG 합성 Transformer
LayerTracer: Cognitive-Aligned Layered SVG Synthesis via Diffusion Transformer
Yiren Song, Danze Chen, Mike Zheng Shou
•
Feb 3, 2025
•
18
3
언어 모델 증류에서의 교사 해킹에 관한 연구
On Teacher Hacking in Language Model Distillation
Daniil Tiapkin, Daniele Calandriello, Johan Ferret, Sarah Perrin, Nino Vieillard, Alexandre Ramé, Mathieu Blondel
•
Feb 4, 2025
•
17
2
토큰 혼합: 향상된 언어 모델 추론을 위한 잠재 및 텍스트 토큰 혼합
Token Assorted: Mixing Latent and Text Tokens for Improved Language Model Reasoning
DiJia Su, Hanlin Zhu, Yingchen Xu, Jiantao Jiao, Yuandong Tian, Qinqing Zheng
•
Feb 5, 2025
•
13
2
대규모 언어 모델 안내 자체 디버깅 코드 생성
Large Language Model Guided Self-Debugging Code Generation
Muntasir Adnan, Zhiwei Xu, Carlos C. N. Kuhn
•
Feb 5, 2025
•
11
2
LLM의 추론 시간 스케일링을 위한 확률적 추론 접근 입자 기반 몬테카를로 방법 사용
A Probabilistic Inference Approach to Inference-Time Scaling of LLMs using Particle-Based Monte Carlo Methods
Isha Puri, Shivchander Sudalairaj, Guangxuan Xu, Kai Xu, Akash Srivastava
•
Feb 3, 2025
•
9
3
Universal Multi-Prompts를 사용한 탈옥
Jailbreaking with Universal Multi-Prompts
Yu-Ling Hsu, Hsuan Su, Shang-Tse Chen
•
Feb 3, 2025
•
8
2
대규모 언어 모델의 활성화 정보를 활용한 병합
Activation-Informed Merging of Large Language Models
Amin Heyrani Nobari, Kaveh Alimohammadi, Ali ArjomandBigdeli, Akash Srivastava, Faez Ahmed, Navid Azizan
•
Feb 4, 2025
•
5
2
이 문제를 푸시오! 검은색 멤버십 추론을 위한 은밀함 증가 생성
Riddle Me This! Stealthy Membership Inference for Retrieval-Augmented Generation
Ali Naseh, Yuefeng Peng, Anshuman Suri, Harsh Chaudhari, Alina Oprea, Amir Houmansadr
•
Feb 1, 2025
•
4
2
HackerRank-ASTRA: 대규모 언어 모델의 정확성과 일관성 평가 다중 파일 프로젝트 문제에서의 교차 도메인 평가
HackerRank-ASTRA: Evaluating Correctness & Consistency of Large Language Models on cross-domain multi-file project problems
Jun Xing, Mayur Bhatia, Sahil Phulwani, Darshan Suresh, Rafik Matta
•
Jan 31, 2025
•
0
2