Articoli di Ricerca IA Giornalieri
Articoli di ricerca IA selezionati quotidianamente con traduzioni
MoCha: Verso la Sintesi di Personaggi Parlanti di Livello CinematograficoMoCha: Towards Movie-Grade Talking Character Synthesis
MoCha: Verso la Sintesi di Personaggi Parlanti di Livello Cinematografico
MoCha: Towards Movie-Grade Talking Character Synthesis
Cong Wei, Bo Sun, Haoyu Ma, Ji Hou, Felix Juefei-Xu, Zecheng He, Xiaoliang Dai, Luxin Zhang, Kunpeng Li, Tingbo Hou, Animesh Sinha, Peter Vajda, Wenhu Chen•Mar 30, 2025•13111
TextCrafter: Rendering Precise di Testi Multipli in Scene Visuali ComplesseTextCrafter: Accurately Rendering Multiple Texts in Complex Visual
Scenes
TextCrafter: Rendering Precise di Testi Multipli in Scene Visuali Complesse
TextCrafter: Accurately Rendering Multiple Texts in Complex Visual
Scenes
Nikai Du, Zhennan Chen, Zhizhou Chen, Shan Gao, Xi Chen, Zhengkai Jiang, Jian Yang, Ying Tai•Mar 30, 2025•943
Open-Reasoner-Zero: Un Approccio Open Source per Scalare l'Apprendimento per Rinforzo sul Modello BaseOpen-Reasoner-Zero: An Open Source Approach to Scaling Up Reinforcement
Learning on the Base Model
Open-Reasoner-Zero: Un Approccio Open Source per Scalare l'Apprendimento per Rinforzo sul Modello Base
Open-Reasoner-Zero: An Open Source Approach to Scaling Up Reinforcement
Learning on the Base Model
Jingcheng Hu, Yinmin Zhang, Qi Han, Daxin Jiang, Xiangyu Zhang, Heung-Yeung Shum•Mar 31, 2025•633
Cosa, Come, Dove e Quanto Bene? Un'indagine sul Ridimensionamento al Momento del Test nei Modelli Linguistici di Grande DimensioneWhat, How, Where, and How Well? A Survey on Test-Time Scaling in Large
Language Models
Cosa, Come, Dove e Quanto Bene? Un'indagine sul Ridimensionamento al Momento del Test nei Modelli Linguistici di Grande Dimensione
What, How, Where, and How Well? A Survey on Test-Time Scaling in Large
Language Models
Qiyuan Zhang, Fuyuan Lyu, Zexu Sun, Lei Wang, Weixu Zhang, Zhihan Guo, Yufei Wang, Irwin King, Xue Liu, Chen Ma•Mar 31, 2025•532
Inferenza Efficiente per Modelli di Ragionamento su Grande Scala: Una RassegnaEfficient Inference for Large Reasoning Models: A Survey
Inferenza Efficiente per Modelli di Ragionamento su Grande Scala: Una Rassegna
Efficient Inference for Large Reasoning Models: A Survey
Yue Liu, Jiaying Wu, Yufei He, Hongcheng Gao, Hongyu Chen, Baolong Bi, Jiaheng Zhang, Zhiqi Huang, Bryan Hooi•Mar 29, 2025•463
TokenHSI: Sintesi Unificata delle Interazioni Fisiche Uomo-Scena attraverso la Tokenizzazione dei CompitiTokenHSI: Unified Synthesis of Physical Human-Scene Interactions through
Task Tokenization
TokenHSI: Sintesi Unificata delle Interazioni Fisiche Uomo-Scena attraverso la Tokenizzazione dei Compiti
TokenHSI: Unified Synthesis of Physical Human-Scene Interactions through
Task Tokenization
Liang Pan, Zeshi Yang, Zhiyang Dou, Wenjia Wang, Buzhen Huang, Bo Dai, Taku Komura, Jingbo Wang•Mar 25, 2025•393
Unicorn: Sintesi di Dati Solo Testo per l'Addestramento di Modelli di Visione e LinguaggioUnicorn: Text-Only Data Synthesis for Vision Language Model Training
Unicorn: Sintesi di Dati Solo Testo per l'Addestramento di Modelli di Visione e Linguaggio
Unicorn: Text-Only Data Synthesis for Vision Language Model Training
Xiaomin Yu, Pengxiang Ding, Wenjie Zhang, Siteng Huang, Songyang Gao, Chengwei Qin, Kejian Wu, Zhaoxin Fan, Ziyue Qiao, Donglin Wang•Mar 28, 2025•382
RIG: Sinergetica tra Ragionamento e Immaginazione nelle Politiche Generaliste End-to-EndRIG: Synergizing Reasoning and Imagination in End-to-End Generalist
Policy
RIG: Sinergetica tra Ragionamento e Immaginazione nelle Politiche Generaliste End-to-End
RIG: Synergizing Reasoning and Imagination in End-to-End Generalist
Policy
Zhonghan Zhao, Wenwei Zhang, Haian Huang, Kuikun Liu, Jianfei Gao, Gaoang Wang, Kai Chen•Mar 31, 2025•302
SketchVideo: Generazione e Modifica di Video Basati su SchizziSketchVideo: Sketch-based Video Generation and Editing
SketchVideo: Generazione e Modifica di Video Basati su Schizzi
SketchVideo: Sketch-based Video Generation and Editing
Feng-Lin Liu, Hongbo Fu, Xintao Wang, Weicai Ye, Pengfei Wan, Di Zhang, Lin Gao•Mar 30, 2025•233
Controllo Efficace dei Modelli di Ragionamento attraverso l'Intervento sul PensieroEffectively Controlling Reasoning Models through Thinking Intervention
Controllo Efficace dei Modelli di Ragionamento attraverso l'Intervento sul Pensiero
Effectively Controlling Reasoning Models through Thinking Intervention
Tong Wu, Chong Xiang, Jiachen T. Wang, Prateek Mittal•Mar 31, 2025•194
Ampliamento dell'Apprendimento per Rinforzo con Ricompense Verificabili in Diversi DominiExpanding RL with Verifiable Rewards Across Diverse Domains
Ampliamento dell'Apprendimento per Rinforzo con Ricompense Verificabili in Diversi Domini
Expanding RL with Verifiable Rewards Across Diverse Domains
Yi Su, Dian Yu, Linfeng Song, Juntao Li, Haitao Mi, Zhaopeng Tu, Min Zhang, Dong Yu•Mar 31, 2025•192
Interroga e Conquista: Generazione di SQL Guidata dall'EsecuzioneQuery and Conquer: Execution-Guided SQL Generation
Interroga e Conquista: Generazione di SQL Guidata dall'Esecuzione
Query and Conquer: Execution-Guided SQL Generation
Łukasz Borchmann, Marek Wydmuch•Mar 31, 2025•182
Distillazione Progressiva del Rendering: Adattamento di Stable Diffusion per la Generazione Istantanea da Testo a Mesh senza Dati 3DProgressive Rendering Distillation: Adapting Stable Diffusion for
Instant Text-to-Mesh Generation without 3D Data
Distillazione Progressiva del Rendering: Adattamento di Stable Diffusion per la Generazione Istantanea da Testo a Mesh senza Dati 3D
Progressive Rendering Distillation: Adapting Stable Diffusion for
Instant Text-to-Mesh Generation without 3D Data
Zhiyuan Ma, Xinyue Liang, Rongyuan Wu, Xiangyu Zhu, Zhen Lei, Lei Zhang•Mar 27, 2025•162
TeleAntiFraud-28k: Un Dataset Audio-Testuale a Pensiero Lento per il Rilevamento di Frodi nelle TelecomunicazioniTeleAntiFraud-28k: A Audio-Text Slow-Thinking Dataset for Telecom Fraud
Detection
TeleAntiFraud-28k: Un Dataset Audio-Testuale a Pensiero Lento per il Rilevamento di Frodi nelle Telecomunicazioni
TeleAntiFraud-28k: A Audio-Text Slow-Thinking Dataset for Telecom Fraud
Detection
Zhiming Ma, Peidong Wang, Minhua Huang, Jingpeng Wang, Kai Wu, Xiangzhao Lv, Yachun Pang, Yin Yang, Wenjie Tang, Yuchen Kang•Mar 31, 2025•122
ActionStudio: Un Framework Leggero per i Dati e l'Addestramento di Modelli di Azione su Larga ScalaActionStudio: A Lightweight Framework for Data and Training of Large
Action Models
ActionStudio: Un Framework Leggero per i Dati e l'Addestramento di Modelli di Azione su Larga Scala
ActionStudio: A Lightweight Framework for Data and Training of Large
Action Models
Jianguo Zhang, Thai Hoang, Ming Zhu, Zuxin Liu, Shiyu Wang, Tulika Awalgaonkar, Akshara Prabhakar, Haolin Chen, Weiran Yao, Zhiwei Liu, Juntao Tan, Juan Carlos Niebles, Shelby Heinecke, Huan Wang, Silvio Savarese, Caiming Xiong•Mar 28, 2025•122
Pianificazione Classica con Euristiche Generate da LLM: Sfidare lo Stato dell'Arte con Codice PythonClassical Planning with LLM-Generated Heuristics: Challenging the State
of the Art with Python Code
Pianificazione Classica con Euristiche Generate da LLM: Sfidare lo Stato dell'Arte con Codice Python
Classical Planning with LLM-Generated Heuristics: Challenging the State
of the Art with Python Code
Augusto B. Corrêa, André G. Pereira, Jendrik Seipp•Mar 24, 2025•101
AvatarArtist: Avatarizzazione 4D a Dominio ApertoAvatarArtist: Open-Domain 4D Avatarization
AvatarArtist: Avatarizzazione 4D a Dominio Aperto
AvatarArtist: Open-Domain 4D Avatarization
Hongyu Liu, Xuan Wang, Ziyu Wan, Yue Ma, Jingye Chen, Yanbo Fan, Yujun Shen, Yibing Song, Qifeng Chen•Mar 25, 2025•92
Easi3R: Stima del Movimento Disaccoppiato da DUSt3R Senza AddestramentoEasi3R: Estimating Disentangled Motion from DUSt3R Without Training
Easi3R: Stima del Movimento Disaccoppiato da DUSt3R Senza Addestramento
Easi3R: Estimating Disentangled Motion from DUSt3R Without Training
Xingyu Chen, Yue Chen, Yuliang Xiu, Andreas Geiger, Anpei Chen•Mar 31, 2025•72
MeshCraft: Esplorazione della Generazione Efficiente e Controllabile di Mesh con DiT basati su FlussiMeshCraft: Exploring Efficient and Controllable Mesh Generation with
Flow-based DiTs
MeshCraft: Esplorazione della Generazione Efficiente e Controllabile di Mesh con DiT basati su Flussi
MeshCraft: Exploring Efficient and Controllable Mesh Generation with
Flow-based DiTs
Xianglong He, Junyi Chen, Di Huang, Zexiang Liu, Xiaoshui Huang, Wanli Ouyang, Chun Yuan, Yangguang Li•Mar 29, 2025•72
DSO: Allineamento dei generatori 3D con feedback di simulazione per la correttezza fisicaDSO: Aligning 3D Generators with Simulation Feedback for Physical
Soundness
DSO: Allineamento dei generatori 3D con feedback di simulazione per la correttezza fisica
DSO: Aligning 3D Generators with Simulation Feedback for Physical
Soundness
Ruining Li, Chuanxia Zheng, Christian Rupprecht, Andrea Vedaldi•Mar 28, 2025•62
UPME: Un Framework di Peer Review Non Supervisionato per la Valutazione di Modelli Linguistici Multimodali di Grande ScalaUPME: An Unsupervised Peer Review Framework for Multimodal Large
Language Model Evaluation
UPME: Un Framework di Peer Review Non Supervisionato per la Valutazione di Modelli Linguistici Multimodali di Grande Scala
UPME: An Unsupervised Peer Review Framework for Multimodal Large
Language Model Evaluation
Qihui Zhang, Munan Ning, Zheyuan Liu, Yanbo Wang, Jiayi Ye, Yue Huang, Shuo Yang, Xiao Chen, Yibing Song, Li Yuan•Mar 19, 2025•62
Ponderazione Adattiva Basata sull'Entropia per l'Auto-AddestramentoEntropy-Based Adaptive Weighting for Self-Training
Ponderazione Adattiva Basata sull'Entropia per l'Auto-Addestramento
Entropy-Based Adaptive Weighting for Self-Training
Xiaoxuan Wang, Yihe Deng, Mingyu Derek Ma, Wei Wang•Mar 31, 2025•42
Collegare l'ottimizzazione multiobiettivo evolutiva e l'accelerazione GPU tramite tensorizzazioneBridging Evolutionary Multiobjective Optimization and GPU Acceleration
via Tensorization
Collegare l'ottimizzazione multiobiettivo evolutiva e l'accelerazione GPU tramite tensorizzazione
Bridging Evolutionary Multiobjective Optimization and GPU Acceleration
via Tensorization
Zhenyu Liang, Hao Li, Naiwei Yu, Kebin Sun, Ran Cheng•Mar 26, 2025•43
PAVE: Patch e Adattamento di Modelli Linguistici su Grande Scala per VideoPAVE: Patching and Adapting Video Large Language Models
PAVE: Patch e Adattamento di Modelli Linguistici su Grande Scala per Video
PAVE: Patching and Adapting Video Large Language Models
Zhuoming Liu, Yiquan Li, Khoi Duc Nguyen, Yiwu Zhong, Yin Li•Mar 25, 2025•42
Decoupling degli Angoli e della Forza nell'Adattamento a Basso RangoDecoupling Angles and Strength in Low-rank Adaptation
Decoupling degli Angoli e della Forza nell'Adattamento a Basso Rango
Decoupling Angles and Strength in Low-rank Adaptation
Massimo Bini, Leander Girrbach, Zeynep Akata•Mar 23, 2025•42
Comprendere i gesti co-verbali in contesti realiUnderstanding Co-speech Gestures in-the-wild
Comprendere i gesti co-verbali in contesti reali
Understanding Co-speech Gestures in-the-wild
Sindhu B Hegde, K R Prajwal, Taein Kwon, Andrew Zisserman•Mar 28, 2025•12