ChatPaper.ai
메뉴 열기
홈
오늘의 논문
대시보드
요금제
계정
🇰🇷
한국어
Loading...
•
•
•
•
•
•
•
•
•
•
AI 연구 논문 데일리
번역이 포함된 일일 선별된 AI 연구 논문
November 18th, 2024
LLaVA-o1: 비전 언어 모델이 단계별로 추론하도록 함
LLaVA-o1: Let Vision Language Models Reason Step-by-Step
Guowei Xu, Peng Jin, Li Hao, Yibing Song, Lichao Sun, Li Yuan
•
Nov 15, 2024
•
93
7
경계 감지 및 부드러운 개선을 통한 지역 인식 텍스트 대 이미지 생성
Region-Aware Text-to-Image Generation via Hard Binding and Soft Refinement
Zhennan Chen, Yajie Li, Haofan Wang, Zhibo Chen, Zhengkai Jiang, Jun Li, Qian Wang, Jian Yang, Ying Tai
•
Nov 10, 2024
•
29
6
GUI 에이전트의 태동: Claude 3.5 컴퓨터를 활용한 예비 사례 연구
The Dawn of GUI Agent: A Preliminary Case Study with Claude 3.5 Computer Use
Siyuan Hu, Mingyu Ouyang, Difei Gao, Mike Zheng Shou
•
Nov 15, 2024
•
26
2
가우시안애니씽: 3D 생성을 위한 대화형 포인트 클라우드 잠재 확산
GaussianAnything: Interactive Point Cloud Latent Diffusion for 3D Generation
Yushi Lan, Shangchen Zhou, Zhaoyang Lyu, Fangzhou Hong, Shuai Yang, Bo Dai, Xingang Pan, Chen Change Loy
•
Nov 12, 2024
•
21
6
Xmodel-1.5: 10억 규모의 다국어 대규모 언어 모델
Xmodel-1.5: An 1B-scale Multilingual LLM
Wang Qun, Liu Yang, Lin Qingquan, Jiang Ling
•
Nov 15, 2024
•
14
2
번호 매기기: 만화 뒤집기와 같은 시간적 매핑 비디오
Number it: Temporal Grounding Videos like Flipping Manga
Yongliang Wu, Xinting Hu, Yuyang Sun, Yizhou Zhou, Wenbo Zhu, Fengyun Rao, Bernt Schiele, Xu Yang
•
Nov 15, 2024
•
12
2
MARS: 대규모 모델 훈련을 위한 분산 감소의 힘 발휘
MARS: Unleashing the Power of Variance Reduction for Training Large Models
Huizhuo Yuan, Yifeng Liu, Shuang Wu, Xun Zhou, Quanquan Gu
•
Nov 15, 2024
•
11
2