ChatPaper.ai
메뉴 열기
홈
오늘의 논문
요금제
계정
작업공간
🇰🇷
한국어
Loading...
•
•
•
•
•
•
•
•
•
•
AI 연구 논문 데일리
번역이 포함된 일일 선별된 AI 연구 논문
December 17th, 2024
바이트 잠재 트랜스포머: 패치가 토큰보다 더 나은 스케일링을 보여줍니다.
Byte Latent Transformer: Patches Scale Better Than Tokens
Artidoro Pagnoni, Ram Pasunuru, Pedro Rodriguez, John Nguyen, Benjamin Muller, Margaret Li, Chunting Zhou, Lili Yu, Jason Weston, Luke Zettlemoyer, Gargi Ghosh, Mike Lewis, Ari Holtzman, Srinivasan Iyer
•
Dec 13, 2024
•
93
8
평가 에이전트: 시각 생성 모델을 위한 효율적이고 신속한 평가 프레임워크
Evaluation Agent: Efficient and Promptable Evaluation Framework for Visual Generative Models
Fan Zhang, Shulin Tian, Ziqi Huang, Yu Qiao, Ziwei Liu
•
Dec 10, 2024
•
35
2
RetroLLM: 대규모 언어 모델에게 세부 증거를 검색할 수 있는 능력 부여
RetroLLM: Empowering Large Language Models to Retrieve Fine-grained Evidence within Generation
Xiaoxi Li, Jiajie Jin, Yujia Zhou, Yongkang Wu, Zhonghua Li, Qi Ye, Zhicheng Dou
•
Dec 16, 2024
•
34
4
BrushEdit: 올인원 이미지 인페인팅 및 편집
BrushEdit: All-In-One Image Inpainting and Editing
Yaowei Li, Yuxuan Bian, Xuan Ju, Zhaoyang Zhang, Ying Shan, Qiang Xu
•
Dec 13, 2024
•
33
3
더 작은 언어 모델이 더 나은 지시 진화자들이다.
Smaller Language Models Are Better Instruction Evolvers
Tingfeng Hui, Lulu Zhao, Guanting Dong, Yaqi Zhang, Hua Zhou, Sen Su
•
Dec 15, 2024
•
27
2
ColorFlow: 검색 보강 이미지 시퀀스 색칠
ColorFlow: Retrieval-Augmented Image Sequence Colorization
Junhao Zhuang, Xuan Ju, Zhaoyang Zhang, Yong Liu, Shiyi Zhang, Chun Yuan, Ying Shan
•
Dec 16, 2024
•
26
4
인과 확산 트랜스포머를 이용한 생성 모델링
Causal Diffusion Transformers for Generative Modeling
Chaorui Deng, Deyao Zh, Kunchang Li, Shi Guan, Haoqi Fan
•
Dec 16, 2024
•
23
3
SPaR: 대형 언어 모델에서 지시 따르기를 개선하기 위한 트리 탐색 정제와 함께 하는 셀프 플레이
SPaR: Self-Play with Tree-Search Refinement to Improve Instruction-Following in Large Language Models
Jiale Cheng, Xiao Liu, Cunxiang Wang, Xiaotao Gu, Yida Lu, Dan Zhang, Yuxiao Dong, Jie Tang, Hongning Wang, Minlie Huang
•
Dec 16, 2024
•
18
2
원더랜드: 단일 이미지에서 3D 장면 탐색
Wonderland: Navigating 3D Scenes from a Single Image
Hanwen Liang, Junli Cao, Vidit Goel, Guocheng Qian, Sergei Korolev, Demetri Terzopoulos, Konstantinos N. Plataniotis, Sergey Tulyakov, Jian Ren
•
Dec 16, 2024
•
16
2
가우시안 속성: 물리적 속성을 LMMs와 함께 3D 가우시안에 통합하기
GaussianProperty: Integrating Physical Properties to 3D Gaussians with LMMs
Xinli Xu, Wenhang Ge, Dicong Qiu, ZhiFei Chen, Dongyu Yan, Zhuoyun Liu, Haoyu Zhao, Hanfeng Zhao, Shunsi Zhang, Junwei Liang, Ying-Cong Chen
•
Dec 15, 2024
•
13
2
VividFace: 고품질 비디오 얼굴 교체를 위한 확산 기반 하이브리드 프레임워크
VividFace: A Diffusion-Based Hybrid Framework for High-Fidelity Video Face Swapping
Hao Shao, Shulun Wang, Yang Zhou, Guanglu Song, Dailan He, Shuo Qin, Zhuofan Zong, Bingqi Ma, Yu Liu, Hongsheng Li
•
Dec 15, 2024
•
12
2
IDArb: 임의의 입력 뷰와 조명에 대한 내재적 분해
IDArb: Intrinsic Decomposition for Arbitrary Number of Input Views and Illuminations
Zhibing Li, Tong Wu, Jing Tan, Mengchen Zhang, Jiaqi Wang, Dahua Lin
•
Dec 16, 2024
•
12
2
StrandHead: 텍스트를 사용한 머리카락 기하학적 사전을 이용한 Strand-분리된 3D 헤드 아바타
StrandHead: Text to Strand-Disentangled 3D Head Avatars Using Hair Geometric Priors
Xiaokun Sun, Zeyu Cai, Zhenyu Zhang, Ying Tai, Jian Yang
•
Dec 16, 2024
•
11
2
SepLLM: 하나의 세그먼트를 하나의 구분자로 압축하여 대형 언어 모델 가속화
SepLLM: Accelerate Large Language Models by Compressing One Segment into One Separator
Guoxuan Chen, Han Shi, Jiawei Li, Yihang Gao, Xiaozhe Ren, Yimeng Chen, Xin Jiang, Zhenguo Li, Weiyang Liu, Chao Huang
•
Dec 16, 2024
•
10
5
에마-엑스: 뿌리를 내린 사고 체인과 선행 공간 추론을 갖춘 신체적 다중 모달 행동 모델
Emma-X: An Embodied Multimodal Action Model with Grounded Chain of Thought and Look-ahead Spatial Reasoning
Qi Sun, Pengfei Hong, Tej Deep Pala, Vernon Toh, U-Xuan Tan, Deepanway Ghosal, Soujanya Poria
•
Dec 16, 2024
•
9
2
대형 언어 모델(LLM)에서의 오픈 소스 장점
The Open Source Advantage in Large Language Models (LLMs)
Jiya Manchanda, Laura Boettcher, Matheus Westphalen, Jasser Jasser
•
Dec 16, 2024
•
9
2
SplineGS: 실시간 동적 3D 가우시안을 위한 견고한 모션 적응 스플라인(Motion-Adaptive Spline)
SplineGS: Robust Motion-Adaptive Spline for Real-Time Dynamic 3D Gaussians from Monocular Video
Jongmin Park, Minh-Quan Viet Bui, Juan Luis Gonzalez Bello, Jaeho Moon, Jihyong Oh, Munchurl Kim
•
Dec 13, 2024
•
7
3
DynamicScaler: 원활하고 확장 가능한 파노라마 장면을 위한 비디오 생성
DynamicScaler: Seamless and Scalable Video Generation for Panoramic Scenes
Jinxiu Liu, Shaoheng Lin, Yinxiao Li, Ming-Hsuan Yang
•
Dec 15, 2024
•
7
2
멋진 행렬: 더 효율적이고 효과적인 기반 모델 아키텍처를 위한 결합
Wonderful Matrices: Combining for a More Efficient and Effective Foundation Model Architecture
Jingze Shi, Bingheng Wu
•
Dec 16, 2024
•
7
2
MOVIS: 실내 장면을 위한 다중 물체 신규 뷰 합성 향상
MOVIS: Enhancing Multi-Object Novel View Synthesis for Indoor Scenes
Ruijie Lu, Yixin Chen, Junfeng Ni, Baoxiong Jia, Yu Liu, Diwen Wan, Gang Zeng, Siyuan Huang
•
Dec 16, 2024
•
6
2
TidyBot++: 로봇 학습을 위한 오픈 소스 홀로노믹 이동 로봇Manipulator
TidyBot++: An Open-Source Holonomic Mobile Manipulator for Robot Learning
Jimmy Wu, William Chong, Robert Holmberg, Aaditya Prasad, Yihuai Gao, Oussama Khatib, Shuran Song, Szymon Rusinkiewicz, Jeannette Bohg
•
Dec 11, 2024
•
5
2
GeoX: 통합된 형식화된 시각-언어 사전 훈련을 통한 기하 문제 해결
GeoX: Geometric Problem Solving Through Unified Formalized Vision-Language Pre-training
Renqiu Xia, Mingsheng Li, Hancheng Ye, Wenjie Wu, Hongbin Zhou, Jiakang Yuan, Tianshuo Peng, Xinyu Cai, Xiangchao Yan, Bin Wang, Conghui He, Botian Shi, Tao Chen, Junchi Yan, Bo Zhang
•
Dec 16, 2024
•
4
2
MaxInfoRL: 정보 이득 최대화를 통해 강화 학습에서 탐사 촉진
MaxInfoRL: Boosting exploration in reinforcement learning through information gain maximization
Bhavya Sukhija, Stelian Coros, Andreas Krause, Pieter Abbeel, Carmelo Sferrazza
•
Dec 16, 2024
•
4
2
휘스퍼-GPT: 하이브리드 표현 오디오 대규모 언어 모델
Whisper-GPT: A Hybrid Representation Audio Large Language Model
Prateek Verma
•
Dec 16, 2024
•
4
2
Evalica를 사용한 신뢰할 수 있고 재현 가능하며 매우 빠른 리더보드
Reliable, Reproducible, and Really Fast Leaderboards with Evalica
Dmitry Ustalov
•
Dec 15, 2024
•
2
2
수직 연합 학습에서 데이터 보호를 위해 단순한 변환만으로 충분합니다.
Just a Simple Transformation is Enough for Data Protection in Vertical Federated Learning
Andrei Semenov, Philip Zmushko, Alexander Pichugin, Aleksandr Beznosikov
•
Dec 16, 2024
•
2
2
개인화된 확산 모델에 의한 모방에 대한 거의 제로 비용의 보호
Nearly Zero-Cost Protection Against Mimicry by Personalized Diffusion Models
Namhyuk Ahn, KiYoon Yoo, Wonhyuk Ahn, Daesik Kim, Seung-Hun Nam
•
Dec 16, 2024
•
1
2
RLDG: 강화 학습을 통한 로봇 종합 정책 증류
RLDG: Robotic Generalist Policy Distillation via Reinforcement Learning
Charles Xu, Qiyang Li, Jianlan Luo, Sergey Levine
•
Dec 13, 2024
•
1
2