ChatPaper.ai
Ouvrir le menu
Accueil
Articles du Jour
Tableau de bord
Tarifs
Compte
🇫🇷
Français
Loading...
•
•
•
•
•
•
•
•
•
•
Articles de Recherche en IA Quotidiens
Articles de recherche en IA sélectionnés quotidiennement avec traductions
October 22nd, 2024
FrugalNeRF : Convergence Rapide pour la Synthèse de Nouvelles Vues en Quelques Étapes sans A priori Appris
FrugalNeRF: Fast Convergence for Few-shot Novel View Synthesis without Learned Priors
Chin-Yang Lin, Chung-Ho Wu, Chang-Han Yeh, Shih-Han Yen, Cheng Sun, Yu-Lun Liu
•
Oct 21, 2024
•
80
2
SAM2Long : Amélioration de SAM 2 pour la segmentation longue de vidéos avec un arbre de mémoire sans entraînement.
SAM2Long: Enhancing SAM 2 for Long Video Segmentation with a Training-Free Memory Tree
Shuangrui Ding, Rui Qian, Xiaoyi Dong, Pan Zhang, Yuhang Zang, Yuhang Cao, Yuwei Guo, Dahua Lin, Jiaqi Wang
•
Oct 21, 2024
•
65
2
CompassJudger-1 : Modèle de Juge Tout-en-un Aide à l'Évaluation et à l'Évolution des Modèles
CompassJudger-1: All-in-one Judge Model Helps Model Evaluation and Evolution
Maosong Cao, Alexander Lam, Haodong Duan, Hongwei Liu, Songyang Zhang, Kai Chen
•
Oct 21, 2024
•
58
2
AutoTrain : Entraînement sans code pour des modèles de pointe
AutoTrain: No-code training for state-of-the-art models
Abhishek Thakur
•
Oct 21, 2024
•
57
2
PUMA : Renforcement de MLLM unifié avec génération visuelle multi-granulaire
PUMA: Empowering Unified MLLM with Multi-granular Visual Generation
Rongyao Fang, Chengqi Duan, Kun Wang, Hao Li, Hao Tian, Xingyu Zeng, Rui Zhao, Jifeng Dai, Hongsheng Li, Xihui Liu
•
Oct 17, 2024
•
53
3
Rapport technique sur l'alignement de Baichuan
Baichuan Alignment Technical Report
Mingan Lin, Fan Yang, Yanjun Shen, Haoze Sun, Tianpeng Li, Tao Zhang, Chenzheng Zhu, Tao Zhang, Miao Zheng, Xu Li, Yijie Zhou, Mingyang Chen, Yanzhao Qin, Youquan Li, Hao Liang, Fei Li, Yadong Li, Mang Wang, Guosheng Dong, Kun Fang, Jianhua Xu, Bin Cui, Wentao Zhang, Zenan Zhou, Weipeng Chen
•
Oct 19, 2024
•
48
2
SemiEvol : Ajustement fin semi-supervisé pour l'adaptation de LLM
SemiEvol: Semi-supervised Fine-tuning for LLM Adaptation
Junyu Luo, Xiao Luo, Xiusi Chen, Zhiping Xiao, Wei Ju, Ming Zhang
•
Oct 17, 2024
•
45
2
Pangea : un LLM entièrement ouvert multilingue et multimodal pour 39 langues
Pangea: A Fully Open Multilingual Multimodal LLM for 39 Languages
Xiang Yue, Yueqi Song, Akari Asai, Seungone Kim, Jean de Dieu Nyandwi, Simran Khanuja, Anjali Kantharuban, Lintang Sutawika, Sathyanarayanan Ramamoorthy, Graham Neubig
•
Oct 21, 2024
•
42
3
RM-Bench : Évaluation des modèles de récompense des modèles de langage avec subtilité et style
RM-Bench: Benchmarking Reward Models of Language Models with Subtlety and Style
Yantao Liu, Zijun Yao, Rui Min, Yixin Cao, Lei Hou, Juanzi Li
•
Oct 21, 2024
•
23
2
Méta-Chunking : Apprentissage de la segmentation efficace du texte via la perception logique
Meta-Chunking: Learning Efficient Text Segmentation via Logical Perception
Jihao Zhao, Zhiyuan Ji, Pengnian Qi, Simin Niu, Bo Tang, Feiyu Xiong, Zhiyu Li
•
Oct 16, 2024
•
21
4
Distillation de pré-entraînement pour les grands modèles de langage : une exploration de l'espace de conception
Pre-training Distillation for Large Language Models: A Design Space Exploration
Hao Peng, Xin Lv, Yushi Bai, Zijun Yao, Jiajie Zhang, Lei Hou, Juanzi Li
•
Oct 21, 2024
•
15
2
Alchimie : Amplification de la capacité de prouver des théorèmes grâce à la mutation symbolique
Alchemy: Amplifying Theorem-Proving Capability through Symbolic Mutation
Shaonan Wu, Shuai Lu, Yeyun Gong, Nan Duan, Ping Wei
•
Oct 21, 2024
•
12
3
Ichigo : Assistant vocal en temps réel à fusion précoce multimodale mixte
Ichigo: Mixed-Modal Early-Fusion Realtime Voice Assistant
Alan Dao, Dinh Bach Vu, Huy Hoang Ha
•
Oct 20, 2024
•
10
4
Apprentissage par Renforcement basé sur un Modèle sans Pré-entraînement en utilisant de Grands Modèles de Langage
Zero-shot Model-based Reinforcement Learning using Large Language Models
Abdelhakim Benechehab, Youssef Attia El Hili, Ambroise Odonnat, Oussama Zekri, Albert Thomas, Giuseppe Paolo, Maurizio Filippone, Ievgen Redko, Balázs Kégl
•
Oct 15, 2024
•
8
4
Sélection des échantillons influents pour l'alignement de longs contextes via le guidage des modèles homologues et la mesure de la conscience contextuelle.
Selecting Influential Samples for Long Context Alignment via Homologous Models' Guidance and Contextual Awareness Measurement
Shuzheng Si, Haozhe Zhao, Gang Chen, Yunshui Li, Kangyang Luo, Chuancheng Lv, Kaikai An, Fanchao Qi, Baobao Chang, Maosong Sun
•
Oct 21, 2024
•
7
3
Combien de Van Goghs faut-il pour Van Gogher ? Trouver le seuil d'imitation
How Many Van Goghs Does It Take to Van Gogh? Finding the Imitation Threshold
Sahil Verma, Royi Rassin, Arnav Das, Gantavya Bhatt, Preethi Seshadri, Chirag Shah, Jeff Bilmes, Hannaneh Hajishirzi, Yanai Elazar
•
Oct 19, 2024
•
6
3
Agent-to-Sim : Apprentissage de modèles de comportement interactif à partir de vidéos longitudinales informelles
Agent-to-Sim: Learning Interactive Behavior Models from Casual Longitudinal Videos
Gengshan Yang, Andrea Bajcsy, Shunsuke Saito, Angjoo Kanazawa
•
Oct 21, 2024
•
5
2
CBT-Bench : Évaluation des grands modèles de langage dans l'assistance à la thérapie cognitivo-comportementale
CBT-Bench: Evaluating Large Language Models on Assisting Cognitive Behavior Therapy
Mian Zhang, Xianjun Yang, Xinlu Zhang, Travis Labrum, Jamie C. Chiu, Shaun M. Eack, Fei Fang, William Yang Wang, Zhiyu Zoey Chen
•
Oct 17, 2024
•
4
2
Apprentissage en contexte et rasoir d'Ockham
In-context learning and Occam's razor
Eric Elmoznino, Tom Marty, Tejas Kasetty, Leo Gagnon, Sarthak Mittal, Mahan Fathi, Dhanya Sridhar, Guillaume Lajoie
•
Oct 17, 2024
•
2
2
Optimisation du routeur : Une approche simple et efficace pour activer la profondeur dynamique dans les transformeurs
Router-Tuning: A Simple and Effective Approach for Enabling Dynamic-Depth in Transformers
Shwai He, Tao Ge, Guoheng Sun, Bowei Tian, Xiaoyang Wang, Ang Li, Dong Yu
•
Oct 17, 2024
•
2
2
Désintoxication des hallucinations : abandon sensible de neurones (SeND) pour l'entraînement de grands modèles de langage
Hallucination Detox: Sensitive Neuron Dropout (SeND) for Large Language Model Training
Shahrad Mohammadzadeh, Juan David Guerra, Marco Bonizzato, Reihaneh Rabbany, Golnoosh Farnadi
•
Oct 20, 2024
•
1
2
Évaluation automatique interlingue pour l'évaluation des LLM multilingues
Cross-Lingual Auto Evaluation for Assessing Multilingual LLMs
Sumanth Doddapaneni, Mohammed Safi Ur Rahman Khan, Dilip Venkatesh, Raj Dabre, Anoop Kunchukuttan, Mitesh M. Khapra
•
Oct 17, 2024
•
1
2
DM-Codec : Distillation de représentations multimodales pour la tokenisation de la parole
DM-Codec: Distilling Multimodal Representations for Speech Tokenization
Md Mubtasim Ahasan, Md Fahim, Tasnim Mohiuddin, A K M Mahbubur Rahman, Aman Chadha, Tariq Iqbal, M Ashraful Amin, Md Mofijul Islam, Amin Ahsan Ali
•
Oct 19, 2024
•
1
2