ChatPaper.ai
메뉴 열기
홈
오늘의 논문
요금제
계정
작업공간
🇰🇷
한국어
Loading...
•
•
•
•
•
•
•
•
•
•
AI 연구 논문 데일리
번역이 포함된 일일 선별된 AI 연구 논문
February 14th, 2025
LLM 어깨 위의 확률적 앵무새: 물리적 개념 이해의 요약 평가
The Stochastic Parrot on LLM's Shoulder: A Summative Assessment of Physical Concept Understanding
Mo Yu, Lemao Liu, Junjie Wu, Tsz Ting Chung, Shunchi Zhang, Jiangnan Li, Dit-Yan Yeung, Jie Zhou
•
Feb 13, 2025
•
181
3
InfiniteHiP: 단일 GPU에서 최대 3백만 토큰까지 언어 모델 컨텍스트 확장
InfiniteHiP: Extending Language Model Context Up to 3 Million Tokens on a Single GPU
Heejun Lee, Geon Park, Jaduk Suh, Sung Ju Hwang
•
Feb 13, 2025
•
139
6
Skrr: 메모리 효율적인 텍스트에서 이미지 생성을 위한 건너뛰기 및 재사용 텍스트 인코더 레이어
Skrr: Skip and Re-use Text Encoder Layers for Memory Efficient Text-to-Image Generation
Hoigi Seo, Wongi Jeong, Jae-sun Seo, Se Young Chun
•
Feb 12, 2025
•
39
2
EmbodiedBench: 시각 중심의 신체화된 에이전트를 위한 다중 모달 대형 언어 모델에 대한 포괄적인 벤치마킹
EmbodiedBench: Comprehensive Benchmarking Multi-modal Large Language Models for Vision-Driven Embodied Agents
Rui Yang, Hanyang Chen, Junyu Zhang, Mark Zhao, Cheng Qian, Kangrui Wang, Qineng Wang, Teja Venkat Koripella, Marziyeh Movahedi, Manling Li, Heng Ji, Huan Zhang, Tong Zhang
•
Feb 13, 2025
•
32
2
TripoSG: 대규모 정정된 흐름 모델을 사용한 고도 신뢰성 3D 형상 합성
TripoSG: High-Fidelity 3D Shape Synthesis using Large-Scale Rectified Flow Models
Yangguang Li, Zi-Xin Zou, Zexiang Liu, Dehu Wang, Yuan Liang, Zhipeng Yu, Xingchao Liu, Yuan-Chen Guo, Ding Liang, Wanli Ouyang, Yan-Pei Cao
•
Feb 10, 2025
•
32
3
이 모델은 개도 인식할 수 있을까요? 가중치로부터의 제로샷 모델 탐색
Can this Model Also Recognize Dogs? Zero-Shot Model Search from Weights
Jonathan Kahana, Or Nathan, Eliahu Horwitz, Yedid Hoshen
•
Feb 13, 2025
•
31
2
열린 레시피: 언어별 LLMs를 추론 모델로 하루 만에 모델 병합을 통해 적응하기
An Open Recipe: Adapting Language-Specific LLMs to a Reasoning Model in One Day via Model Merging
Kunat Pipatanakul, Pittawat Taveekitworachai, Potsawee Manakul, Kasima Tharnpipitchai
•
Feb 13, 2025
•
30
4
SelfCite: 대형 언어 모델에서의 문맥 소속을 위한 자기 지도 정렬
SelfCite: Self-Supervised Alignment for Context Attribution in Large Language Models
Yung-Sung Chuang, Benjamin Cohen-Wang, Shannon Zejiang Shen, Zhaofeng Wu, Hu Xu, Xi Victoria Lin, James Glass, Shang-Wen Li, Wen-tau Yih
•
Feb 13, 2025
•
30
2
CoSER: 확립된 역할의 LLM 기반 페르소나 시뮬레이션 조정
CoSER: Coordinating LLM-Based Persona Simulation of Established Roles
Xintao Wang, Heng Wang, Yifei Zhang, Xinfeng Yuan, Rui Xu, Jen-tse Huang, Siyu Yuan, Haoran Guo, Jiangjie Chen, Wei Wang, Yanghua Xiao, Shuchang Zhou
•
Feb 13, 2025
•
27
2
MME-CoT: 추론 품질, 견고성 및 효율성을 위한 대규모 다중모달 모델에서 사고 체인의 벤치마킹
MME-CoT: Benchmarking Chain-of-Thought in Large Multimodal Models for Reasoning Quality, Robustness, and Efficiency
Dongzhi Jiang, Renrui Zhang, Ziyu Guo, Yanwei Li, Yu Qi, Xinyan Chen, Liuhui Wang, Jianhan Jin, Claire Guo, Shen Yan, Bo Zhang, Chaoyou Fu, Peng Gao, Hongsheng Li
•
Feb 13, 2025
•
27
2
3D LMMs에서 인코더 없는 아키텍처의 잠재력 탐색
Exploring the Potential of Encoder-free Architectures in 3D LMMs
Yiwen Tang, Zoey Guo, Zhuhao Wang, Ray Zhang, Qizhi Chen, Junli Liu, Delin Qu, Zhigang Wang, Dong Wang, Xuelong Li, Bin Zhao
•
Feb 13, 2025
•
26
2
대규모 언어 모델에서의 논리 추론: 조사
Logical Reasoning in Large Language Models: A Survey
Hanmeng Liu, Zhizhang Fu, Mengru Ding, Ruoxi Ning, Chaoli Zhang, Xiaozhang Liu, Yue Zhang
•
Feb 13, 2025
•
21
4
대규모 언어 모델에서 사고 체인을 강화하기 위한 순차 질의 응답 추론 엔진인 SQuARE: Sequential Question Answering Reasoning Engine
SQuARE: Sequential Question Answering Reasoning Engine for Enhanced Chain-of-Thought in Large Language Models
Daniel Fleischer, Moshe Berchansky, Gad Markovits, Moshe Wasserblat
•
Feb 13, 2025
•
16
2
태풍 T1: 오픈 태국 추론 모델
Typhoon T1: An Open Thai Reasoning Model
Pittawat Taveekitworachai, Potsawee Manakul, Kasima Tharnpipitchai, Kunat Pipatanakul
•
Feb 13, 2025
•
16
2
mmE5: 고품질 합성 데이터를 통해 다중 모달 다국어 임베딩 개선
mmE5: Improving Multimodal Multilingual Embeddings via High-quality Synthetic Data
Haonan Chen, Liang Wang, Nan Yang, Yutao Zhu, Ziliang Zhao, Furu Wei, Zhicheng Dou
•
Feb 12, 2025
•
13
2
DexTrack: 인간 참조로부터 손재주 조작을 위한 일반화 가능한 신경 추적 제어를 향하여
DexTrack: Towards Generalizable Neural Tracking Control for Dexterous Manipulation from Human References
Xueyi Liu, Jianibieke Adalibieke, Qianwei Han, Yuzhe Qin, Li Yi
•
Feb 13, 2025
•
12
2
CoT-밸브: 길이 압축 가능한 사고 연쇄 조정
CoT-Valve: Length-Compressible Chain-of-Thought Tuning
Xinyin Ma, Guangnian Wan, Runpeng Yu, Gongfan Fang, Xinchao Wang
•
Feb 13, 2025
•
12
2
대규모 언어 모델에서의 수학적 추론: 넓은 수치 범위에서 논리 및 산술 오류 평가
Mathematical Reasoning in Large Language Models: Assessing Logical and Arithmetic Errors across Wide Numerical Ranges
Safal Shrestha, Minwu Kim, Keith Ross
•
Feb 12, 2025
•
11
2
VFX 생성기: 제어 가능한 확산 트랜스포머를 이용한 애니메이션 비주얼 효과 생성
VFX Creator: Animated Visual Effect Generation with Controllable Diffusion Transformer
Xinyu Liu, Ailing Zeng, Wei Xue, Harry Yang, Wenhan Luo, Qifeng Liu, Yike Guo
•
Feb 9, 2025
•
7
2
3D-인식 2D 표현을 활용한 잠재 광도 필드
Latent Radiance Fields with 3D-aware 2D Representations
Chaoyi Zhou, Xi Liu, Feng Luo, Siyu Huang
•
Feb 13, 2025
•
6
2
3CAD: 비지도 학습을 위한 대규모 실제 세계 3C 제품 데이터셋
3CAD: A Large-Scale Real-World 3C Product Dataset for Unsupervised Anomaly
Enquan Yang, Peng Xing, Hanyang Sun, Wenbo Guo, Yuanwei Ma, Zechao Li, Dan Zeng
•
Feb 9, 2025
•
6
2