Articoli di Ricerca IA Giornalieri

Articoli di ricerca IA selezionati quotidianamente con traduzioni

MoCha: Verso la Sintesi di Personaggi Parlanti di Livello Cinematografico
MoCha: Towards Movie-Grade Talking Character Synthesis

Cong Wei, Bo Sun, Haoyu Ma, Ji Hou, Felix Juefei-Xu, Zecheng He, Xiaoliang Dai, Luxin Zhang, Kunpeng Li, Tingbo Hou, Animesh Sinha, Peter Vajda, Wenhu ChenMar 30, 202513111

TextCrafter: Rendering Precise di Testi Multipli in Scene Visuali Complesse
TextCrafter: Accurately Rendering Multiple Texts in Complex Visual Scenes

Nikai Du, Zhennan Chen, Zhizhou Chen, Shan Gao, Xi Chen, Zhengkai Jiang, Jian Yang, Ying TaiMar 30, 2025943

Inferenza Efficiente per Modelli di Ragionamento su Grande Scala: Una Rassegna
Efficient Inference for Large Reasoning Models: A Survey

Yue Liu, Jiaying Wu, Yufei He, Hongcheng Gao, Hongyu Chen, Baolong Bi, Jiaheng Zhang, Zhiqi Huang, Bryan HooiMar 29, 2025463

Unicorn: Sintesi di Dati Solo Testo per l'Addestramento di Modelli di Visione e Linguaggio
Unicorn: Text-Only Data Synthesis for Vision Language Model Training

Xiaomin Yu, Pengxiang Ding, Wenjie Zhang, Siteng Huang, Songyang Gao, Chengwei Qin, Kejian Wu, Zhaoxin Fan, Ziyue Qiao, Donglin WangMar 28, 2025382

RIG: Sinergetica tra Ragionamento e Immaginazione nelle Politiche Generaliste End-to-End
RIG: Synergizing Reasoning and Imagination in End-to-End Generalist Policy

Zhonghan Zhao, Wenwei Zhang, Haian Huang, Kuikun Liu, Jianfei Gao, Gaoang Wang, Kai ChenMar 31, 2025302

SketchVideo: Generazione e Modifica di Video Basati su Schizzi
SketchVideo: Sketch-based Video Generation and Editing

Feng-Lin Liu, Hongbo Fu, Xintao Wang, Weicai Ye, Pengfei Wan, Di Zhang, Lin GaoMar 30, 2025233

Ampliamento dell'Apprendimento per Rinforzo con Ricompense Verificabili in Diversi Domini
Expanding RL with Verifiable Rewards Across Diverse Domains

Yi Su, Dian Yu, Linfeng Song, Juntao Li, Haitao Mi, Zhaopeng Tu, Min Zhang, Dong YuMar 31, 2025192

TeleAntiFraud-28k: Un Dataset Audio-Testuale a Pensiero Lento per il Rilevamento di Frodi nelle Telecomunicazioni
TeleAntiFraud-28k: A Audio-Text Slow-Thinking Dataset for Telecom Fraud Detection

Zhiming Ma, Peidong Wang, Minhua Huang, Jingpeng Wang, Kai Wu, Xiangzhao Lv, Yachun Pang, Yin Yang, Wenjie Tang, Yuchen KangMar 31, 2025122

ActionStudio: Un Framework Leggero per i Dati e l'Addestramento di Modelli di Azione su Larga Scala
ActionStudio: A Lightweight Framework for Data and Training of Large Action Models

Jianguo Zhang, Thai Hoang, Ming Zhu, Zuxin Liu, Shiyu Wang, Tulika Awalgaonkar, Akshara Prabhakar, Haolin Chen, Weiran Yao, Zhiwei Liu, Juntao Tan, Juan Carlos Niebles, Shelby Heinecke, Huan Wang, Silvio Savarese, Caiming XiongMar 28, 2025122

AvatarArtist: Avatarizzazione 4D a Dominio Aperto
AvatarArtist: Open-Domain 4D Avatarization

Hongyu Liu, Xuan Wang, Ziyu Wan, Yue Ma, Jingye Chen, Yanbo Fan, Yujun Shen, Yibing Song, Qifeng ChenMar 25, 202592

Comprendere i gesti co-verbali in contesti reali
Understanding Co-speech Gestures in-the-wild

Sindhu B Hegde, K R Prajwal, Taein Kwon, Andrew ZissermanMar 28, 202512