Articles de Recherche en IA Quotidiens

Articles de recherche en IA sélectionnés quotidiennement avec traductions

FrugalNeRF : Convergence Rapide pour la Synthèse de Nouvelles Vues en Quelques Étapes sans A priori Appris
FrugalNeRF: Fast Convergence for Few-shot Novel View Synthesis without Learned Priors

Chin-Yang Lin, Chung-Ho Wu, Chang-Han Yeh, Shih-Han Yen, Cheng Sun, Yu-Lun Liu•Oct 21, 2024•802

SAM2Long : Amélioration de SAM 2 pour la segmentation longue de vidéos avec un arbre de mémoire sans entraînement.
SAM2Long: Enhancing SAM 2 for Long Video Segmentation with a Training-Free Memory Tree

Shuangrui Ding, Rui Qian, Xiaoyi Dong, Pan Zhang, Yuhang Zang, Yuhang Cao, Yuwei Guo, Dahua Lin, Jiaqi Wang•Oct 21, 2024•652

CompassJudger-1 : Modèle de Juge Tout-en-un Aide à l'Évaluation et à l'Évolution des Modèles
CompassJudger-1: All-in-one Judge Model Helps Model Evaluation and Evolution

Maosong Cao, Alexander Lam, Haodong Duan, Hongwei Liu, Songyang Zhang, Kai Chen•Oct 21, 2024•582

AutoTrain : Entraînement sans code pour des modèles de pointe
AutoTrain: No-code training for state-of-the-art models

Abhishek Thakur•Oct 21, 2024•572

PUMA : Renforcement de MLLM unifié avec génération visuelle multi-granulaire
PUMA: Empowering Unified MLLM with Multi-granular Visual Generation

Rongyao Fang, Chengqi Duan, Kun Wang, Hao Li, Hao Tian, Xingyu Zeng, Rui Zhao, Jifeng Dai, Hongsheng Li, Xihui Liu•Oct 17, 2024•533

Rapport technique sur l'alignement de Baichuan
Baichuan Alignment Technical Report

Mingan Lin, Fan Yang, Yanjun Shen, Haoze Sun, Tianpeng Li, Tao Zhang, Chenzheng Zhu, Tao Zhang, Miao Zheng, Xu Li, Yijie Zhou, Mingyang Chen, Yanzhao Qin, Youquan Li, Hao Liang, Fei Li, Yadong Li, Mang Wang, Guosheng Dong, Kun Fang, Jianhua Xu, Bin Cui, Wentao Zhang, Zenan Zhou, Weipeng Chen•Oct 19, 2024•482

SemiEvol : Ajustement fin semi-supervisé pour l'adaptation de LLM
SemiEvol: Semi-supervised Fine-tuning for LLM Adaptation

Junyu Luo, Xiao Luo, Xiusi Chen, Zhiping Xiao, Wei Ju, Ming Zhang•Oct 17, 2024•452

Pangea : un LLM entièrement ouvert multilingue et multimodal pour 39 langues
Pangea: A Fully Open Multilingual Multimodal LLM for 39 Languages

Xiang Yue, Yueqi Song, Akari Asai, Seungone Kim, Jean de Dieu Nyandwi, Simran Khanuja, Anjali Kantharuban, Lintang Sutawika, Sathyanarayanan Ramamoorthy, Graham Neubig•Oct 21, 2024•423

RM-Bench : Évaluation des modèles de récompense des modèles de langage avec subtilité et style
RM-Bench: Benchmarking Reward Models of Language Models with Subtlety and Style

Yantao Liu, Zijun Yao, Rui Min, Yixin Cao, Lei Hou, Juanzi Li•Oct 21, 2024•232

Méta-Chunking : Apprentissage de la segmentation efficace du texte via la perception logique
Meta-Chunking: Learning Efficient Text Segmentation via Logical Perception

Jihao Zhao, Zhiyuan Ji, Pengnian Qi, Simin Niu, Bo Tang, Feiyu Xiong, Zhiyu Li•Oct 16, 2024•214

Distillation de pré-entraînement pour les grands modèles de langage : une exploration de l'espace de conception
Pre-training Distillation for Large Language Models: A Design Space Exploration

Hao Peng, Xin Lv, Yushi Bai, Zijun Yao, Jiajie Zhang, Lei Hou, Juanzi Li•Oct 21, 2024•152

Alchimie : Amplification de la capacité de prouver des théorèmes grâce à la mutation symbolique
Alchemy: Amplifying Theorem-Proving Capability through Symbolic Mutation

Shaonan Wu, Shuai Lu, Yeyun Gong, Nan Duan, Ping Wei•Oct 21, 2024•123

Ichigo : Assistant vocal en temps réel à fusion précoce multimodale mixte
Ichigo: Mixed-Modal Early-Fusion Realtime Voice Assistant

Alan Dao, Dinh Bach Vu, Huy Hoang Ha•Oct 20, 2024•104

Apprentissage par Renforcement basé sur un Modèle sans Pré-entraînement en utilisant de Grands Modèles de Langage
Zero-shot Model-based Reinforcement Learning using Large Language Models

Abdelhakim Benechehab, Youssef Attia El Hili, Ambroise Odonnat, Oussama Zekri, Albert Thomas, Giuseppe Paolo, Maurizio Filippone, Ievgen Redko, Balázs Kégl•Oct 15, 2024•84

Sélection des échantillons influents pour l'alignement de longs contextes via le guidage des modèles homologues et la mesure de la conscience contextuelle.
Selecting Influential Samples for Long Context Alignment via Homologous Models' Guidance and Contextual Awareness Measurement

Shuzheng Si, Haozhe Zhao, Gang Chen, Yunshui Li, Kangyang Luo, Chuancheng Lv, Kaikai An, Fanchao Qi, Baobao Chang, Maosong Sun•Oct 21, 2024•73

Combien de Van Goghs faut-il pour Van Gogher ? Trouver le seuil d'imitation
How Many Van Goghs Does It Take to Van Gogh? Finding the Imitation Threshold

Sahil Verma, Royi Rassin, Arnav Das, Gantavya Bhatt, Preethi Seshadri, Chirag Shah, Jeff Bilmes, Hannaneh Hajishirzi, Yanai Elazar•Oct 19, 2024•63

Agent-to-Sim : Apprentissage de modèles de comportement interactif à partir de vidéos longitudinales informelles
Agent-to-Sim: Learning Interactive Behavior Models from Casual Longitudinal Videos

Gengshan Yang, Andrea Bajcsy, Shunsuke Saito, Angjoo Kanazawa•Oct 21, 2024•52

CBT-Bench : Évaluation des grands modèles de langage dans l'assistance à la thérapie cognitivo-comportementale
CBT-Bench: Evaluating Large Language Models on Assisting Cognitive Behavior Therapy

Mian Zhang, Xianjun Yang, Xinlu Zhang, Travis Labrum, Jamie C. Chiu, Shaun M. Eack, Fei Fang, William Yang Wang, Zhiyu Zoey Chen•Oct 17, 2024•42

Apprentissage en contexte et rasoir d'Ockham
In-context learning and Occam's razor

Eric Elmoznino, Tom Marty, Tejas Kasetty, Leo Gagnon, Sarthak Mittal, Mahan Fathi, Dhanya Sridhar, Guillaume Lajoie•Oct 17, 2024•22

Optimisation du routeur : Une approche simple et efficace pour activer la profondeur dynamique dans les transformeurs
Router-Tuning: A Simple and Effective Approach for Enabling Dynamic-Depth in Transformers

Shwai He, Tao Ge, Guoheng Sun, Bowei Tian, Xiaoyang Wang, Ang Li, Dong Yu•Oct 17, 2024•22

Désintoxication des hallucinations : abandon sensible de neurones (SeND) pour l'entraînement de grands modèles de langage
Hallucination Detox: Sensitive Neuron Dropout (SeND) for Large Language Model Training

Shahrad Mohammadzadeh, Juan David Guerra, Marco Bonizzato, Reihaneh Rabbany, Golnoosh Farnadi•Oct 20, 2024•12

Évaluation automatique interlingue pour l'évaluation des LLM multilingues
Cross-Lingual Auto Evaluation for Assessing Multilingual LLMs

Sumanth Doddapaneni, Mohammed Safi Ur Rahman Khan, Dilip Venkatesh, Raj Dabre, Anoop Kunchukuttan, Mitesh M. Khapra•Oct 17, 2024•12

DM-Codec : Distillation de représentations multimodales pour la tokenisation de la parole
DM-Codec: Distilling Multimodal Representations for Speech Tokenization

Md Mubtasim Ahasan, Md Fahim, Tasnim Mohiuddin, A K M Mahbubur Rahman, Aman Chadha, Tariq Iqbal, M Ashraful Amin, Md Mofijul Islam, Amin Ahsan Ali•Oct 19, 2024•12