ChatPaper.ai
메뉴 열기
홈
오늘의 논문
요금제
계정
작업공간
🇰🇷
한국어
Loading...
•
•
•
•
•
•
•
•
•
•
AI 연구 논문 데일리
번역이 포함된 일일 선별된 AI 연구 논문
December 2nd, 2024
포도: 선호 정렬을 통한 로봇 정책 일반화
GRAPE: Generalizing Robot Policy via Preference Alignment
Zijian Zhang, Kaiyuan Zheng, Zhaorun Chen, Joel Jang, Yi Li, Chaoqi Wang, Mingyu Ding, Dieter Fox, Huaxiu Yao
•
Nov 28, 2024
•
44
2
비디오 모델 없는 비디오 깊이
Video Depth without Video Models
Bingxin Ke, Dominik Narnhofer, Shengyu Huang, Lei Ke, Torben Peters, Katerina Fragkiadaki, Anton Obukhov, Konrad Schindler
•
Nov 28, 2024
•
37
7
예시를 넘어서: MCTS를 통한 맥락 속 고수준 자동 추론 패러다임
Beyond Examples: High-level Automated Reasoning Paradigm in In-Context Learning via MCTS
Jinyang Wu, Mingkuan Feng, Shuai Zhang, Feihu Che, Zengqi Wen, Jianhua Tao
•
Nov 27, 2024
•
36
14
이-라이트닝 기술 보고서
Yi-Lightning Technical Report
01. AI, Alan Wake, Albert Wang, Bei Chen, C. X. Lv, Chao Li, Chengen Huang, Chenglin Cai, Chujie Zheng, Daniel Cooper, Ethan Dai, Fan Zhou, Feng Hu, Heng Ji, Howard Qiu, Jiangcheng Zhu, Jun Tian, Katherine Su, Lihuan Zhang, Liying Li, Ming Song, Mou Li, Peng Liu, Qichen Hu, Shawn Wang, Shijun Zhou, Shiyong Li, Tianhang Zhu, Wen Xie, Xiang He, Xiaobo Chen, Xiaohui Hu, Xiaoyi Ren, Xinyao Niu, Yanpeng Li, Yongke Zhao, Yongzhen Luo, Yuchi Xu, Yuxuan Sha, Zhaodong Yan, Zhiyuan Liu, Zirui Zhang
•
Dec 2, 2024
•
27
2
다중 모달 대형 언어 모델을 위한 도메인별 사후 훈련에 관한 연구
On Domain-Specific Post-Training for Multimodal Large Language Models
Daixuan Cheng, Shaohan Huang, Ziyu Zhu, Xintong Zhang, Wayne Xin Zhao, Zhongzhi Luan, Bo Dai, Zhenliang Zhang
•
Nov 29, 2024
•
27
3
향상된 비디오 확산 샘플링을 위한 시공간 스킵 안내
Spatiotemporal Skip Guidance for Enhanced Video Diffusion Sampling
Junha Hyung, Kinam Kim, Susung Hong, Min-Jung Kim, Jaegul Choo
•
Nov 27, 2024
•
24
3
역사적 사고는 LLMs를 더 강력한 추론자로 만듭니다.
Reverse Thinking Makes LLMs Stronger Reasoners
Justin Chih-Yao Chen, Zifeng Wang, Hamid Palangi, Rujun Han, Sayna Ebrahimi, Long Le, Vincent Perot, Swaroop Mishra, Mohit Bansal, Chen-Yu Lee, Tomas Pfister
•
Nov 29, 2024
•
22
2
타임스텝 임베딩이 말하는 것: 비디오 확산 모델을 위한 캐싱 시간입니다
Timestep Embedding Tells: It's Time to Cache for Video Diffusion Model
Feng Liu, Shiwei Zhang, Xiaofeng Wang, Yujie Wei, Haonan Qiu, Yuzhong Zhao, Yingya Zhang, Qixiang Ye, Fang Wan
•
Nov 28, 2024
•
19
2
FAM 확산: 안정적인 확산을 통한 고해상도 이미지 생성을 위한 주파수 및 주의 집중력 수정
FAM Diffusion: Frequency and Attention Modulation for High-Resolution Image Generation with Stable Diffusion
Haosen Yang, Adrian Bulat, Isma Hadji, Hai X. Pham, Xiatian Zhu, Georgios Tzimiropoulos, Brais Martinez
•
Nov 27, 2024
•
18
2
퍼즐: 추론 최적화 LLM을 위한 증류 기반 NAS
Puzzle: Distillation-Based NAS for Inference-Optimized LLMs
Akhiad Bercovich, Tomer Ronen, Talor Abramovich, Nir Ailon, Nave Assaf, Mohammad Dabbah, Ido Galil, Amnon Geifman, Yonatan Geifman, Izhak Golan, Netanel Haber, Ehud Karpas, Itay Levy, Shahar Mor, Zach Moshe, Najeeb Nabwani, Omri Puny, Ran Rubin, Itamar Schen, Ido Shahaf, Oren Tropp, Omer Ullman Argov, Ran Zilberstein, Ran El-Yaniv
•
Nov 28, 2024
•
17
2
세밀한 비디오 모션 제어를 위한 궤적 주의력
Trajectory Attention for Fine-grained Video Motion Control
Zeqi Xiao, Wenqi Ouyang, Yifan Zhou, Shuai Yang, Lei Yang, Jianlou Si, Xingang Pan
•
Nov 28, 2024
•
12
2
저 비트율 고품질 음성 코딩을 위한 트랜스포머 확장
Scaling Transformers for Low-Bitrate High-Quality Speech Coding
Julian D Parker, Anton Smirnov, Jordi Pons, CJ Carr, Zack Zukowski, Zach Evans, Xubo Liu
•
Nov 29, 2024
•
11
3
한 번에 모든 프레임을 보세요: 다축 그레이디언트 체크포인팅을 활용한 효율적인 장문 비디오 이해를 위한 비디오-Ma^2mba
Look Every Frame All at Once: Video-Ma^2mba for Efficient Long-form Video Understanding with Multi-Axis Gradient Checkpointing
Hosu Lee, Junho Kim, Hyunjun Kim, Yong Man Ro
•
Nov 29, 2024
•
11
2
DisCoRD: 이산 토큰에서 정류된 흐름을 통한 연속적인 동작 디코딩
DisCoRD: Discrete Tokens to Continuous Motion via Rectified Flow Decoding
Jungbin Cho, Junwan Kim, Jisoo Kim, Minseo Kim, Mingu Kang, Sungeun Hong, Tae-Hyun Oh, Youngjae Yu
•
Nov 29, 2024
•
10
2
MATATA: 테이블 애플리케이션을 위한 약한 지도된 수학 도구 지원 추론
MATATA: a weak-supervised MAthematical Tool-Assisted reasoning for Tabular Applications
Vishnou Vinayagame, Gregory Senay, Luis Martí
•
Nov 28, 2024
•
8
2
AC3D: 비디오 확산에서 3D 카메라 제어 분석 및 개선하기 트랜스포머
AC3D: Analyzing and Improving 3D Camera Control in Video Diffusion Transformers
Sherwin Bahmani, Ivan Skorokhodov, Guocheng Qian, Aliaksandr Siarohin, Willi Menapace, Andrea Tagliasacchi, David B. Lindell, Sergey Tulyakov
•
Nov 27, 2024
•
8
2
DeMo: 분리된 모멘텀 최적화
DeMo: Decoupled Momentum Optimization
Bowen Peng, Jeffrey Quesnelle, Diederik P. Kingma
•
Nov 29, 2024
•
6
2
수동으로 주석이 달린 데이터가 없는 텍스트 분류를 위한 LLM 교사-학생 프레임워크: IPTC 뉴스 주제 분류 사례 연구
LLM Teacher-Student Framework for Text Classification With No Manually Annotated Data: A Case Study in IPTC News Topic Classification
Taja Kuzman, Nikola Ljubešić
•
Nov 29, 2024
•
6
2
알파테이블릿: 단안 비디오로부터의 3D 평면 재구성을 위한 일반적인 평면 표현
AlphaTablets: A Generic Plane Representation for 3D Planar Reconstruction from Monocular Videos
Yuze He, Wang Zhao, Shaohui Liu, Yubin Hu, Yushi Bai, Yu-Hui Wen, Yong-Jin Liu
•
Nov 29, 2024
•
6
2
스폿라이트: 확산을 통한 그림자 안내 객체 재조명
SpotLight: Shadow-Guided Object Relighting via Diffusion
Frédéric Fortier-Chouinard, Zitian Zhang, Louis-Etienne Messier, Mathieu Garon, Anand Bhattad, Jean-François Lalonde
•
Nov 27, 2024
•
3
1
노이즈 토큰 가지치기 훈련
Training Noise Token Pruning
Mingxing Rao, Bohan Jiang, Daniel Moyer
•
Nov 27, 2024
•
1
2