ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
Tableau de bord
Tarifs
Compte
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
November 18th, 2024
LLaVA-o1 : Permettre aux Modèles de Langage Visuel de Raisonner Étape par Étape
LLaVA-o1: Let Vision Language Models Reason Step-by-Step
Guowei Xu, Peng Jin, Li Hao, Yibing Song, Lichao Sun, Li Yuan
•
Nov 15, 2024
•
93
7
Génération de texte en image sensible à la région via liaison rigide et affinement doux
Region-Aware Text-to-Image Generation via Hard Binding and Soft Refinement
Zhennan Chen, Yajie Li, Haofan Wang, Zhibo Chen, Zhengkai Jiang, Jun Li, Qian Wang, Jian Yang, Ying Tai
•
Nov 10, 2024
•
29
6
L'Aube de l'Agent GUI : Une Étude de Cas Préliminaire avec l'Ordinateur Claude 3.5
The Dawn of GUI Agent: A Preliminary Case Study with Claude 3.5 Computer Use
Siyuan Hu, Mingyu Ouyang, Difei Gao, Mike Zheng Shou
•
Nov 15, 2024
•
26
2
GaussianAnything : Diffusion Latente Interactive de Nuages de Points pour la Génération 3D
GaussianAnything: Interactive Point Cloud Latent Diffusion for 3D Generation
Yushi Lan, Shangchen Zhou, Zhaoyang Lyu, Fangzhou Hong, Shuai Yang, Bo Dai, Xingang Pan, Chen Change Loy
•
Nov 12, 2024
•
21
6
Xmodel-1.5 : Un LLM multilingue à l'échelle de 1B
Xmodel-1.5: An 1B-scale Multilingual LLM
Wang Qun, Liu Yang, Lin Qingquan, Jiang Ling
•
Nov 15, 2024
•
14
2
Numéroter : Ancrer temporellement des vidéos comme le retournement de manga
Number it: Temporal Grounding Videos like Flipping Manga
Yongliang Wu, Xinting Hu, Yuyang Sun, Yizhou Zhou, Wenbo Zhu, Fengyun Rao, Bernt Schiele, Xu Yang
•
Nov 15, 2024
•
12
2
MARS : Libérer la Puissance de la Réduction de la Variance pour l'Entraînement de Grands Modèles
MARS: Unleashing the Power of Variance Reduction for Training Large Models
Huizhuo Yuan, Yifeng Liu, Shuang Wu, Xun Zhou, Quanquan Gu
•
Nov 15, 2024
•
11
2