Paper Giornalieri
Scaling temporale per modelli di diffusione oltre il ridimensionamento dei passaggi di denoisingInference-Time Scaling for Diffusion Models beyond Scaling Denoising
Steps
Scaling temporale per modelli di diffusione oltre il ridimensionamento dei passaggi di denoising
Inference-Time Scaling for Diffusion Models beyond Scaling Denoising
Steps
Nanye Ma, Shangyuan Tong, Haolin Jia, Hexiang Hu, Yu-Chuan Su, Mingda Zhang, Xuan Yang, Yandong Li, Tommi Jaakkola, Xuhui Jia, Saining Xie•Jan 16, 2025•342
OmniThink: Espandere i confini della conoscenza nella scrittura automatica tramite il pensieroOmniThink: Expanding Knowledge Boundaries in Machine Writing through
Thinking
OmniThink: Espandere i confini della conoscenza nella scrittura automatica tramite il pensiero
OmniThink: Expanding Knowledge Boundaries in Machine Writing through
Thinking
Zekun Xi, Wenbiao Yin, Jizhan Fang, Jialong Wu, Runnan Fang, Ningyu Zhang, Jiang Yong, Pengjun Xie, Fei Huang, Huajun Chen•Jan 16, 2025•292
Apprendimenti dalla scalabilità dei tokenizzatori visivi per la ricostruzione e la generazioneLearnings from Scaling Visual Tokenizers for Reconstruction and
Generation
Apprendimenti dalla scalabilità dei tokenizzatori visivi per la ricostruzione e la generazione
Learnings from Scaling Visual Tokenizers for Reconstruction and
Generation
Philippe Hansen-Estruch, David Yan, Ching-Yao Chung, Orr Zohar, Jialiang Wang, Tingbo Hou, Tao Xu, Sriram Vishwanath, Peter Vajda, Xinlei Chen•Jan 16, 2025•193
Esplorazione della relazione domanda-diagnosi con simulatori avanzati di pazienti.Exploring the Inquiry-Diagnosis Relationship with Advanced Patient
Simulators
Esplorazione della relazione domanda-diagnosi con simulatori avanzati di pazienti.
Exploring the Inquiry-Diagnosis Relationship with Advanced Patient
Simulators
Zhaocheng Liu, Quan Tu, Wen Ye, Yu Xiao, Zhishou Zhang, Hengfu Cui, Yalun Zhu, Qiang Ju, Shizheng Li, Jian Xie•Jan 16, 2025•164
Verso Modelli di Ragionamento Estesi: Un'Indagine sul Ragionamento Rinforzato con
Grandi Modelli LinguisticiTowards Large Reasoning Models: A Survey of Reinforced Reasoning with
Large Language Models
Verso Modelli di Ragionamento Estesi: Un'Indagine sul Ragionamento Rinforzato con
Grandi Modelli Linguistici
Towards Large Reasoning Models: A Survey of Reinforced Reasoning with
Large Language Models
Fengli Xu, Qianyue Hao, Zefang Zong, Jingwei Wang, Yunke Zhang, Jingyi Wang, Xiaochong Lan, Jiahui Gong, Tianjian Ouyang, Fanjin Meng, Chenyang Shao, Yuwei Yan, Qinglong Yang, Yiwen Song, Sijian Ren, Xinyuan Hu, Yu Li, Jie Feng, Chen Gao, Yong Li•Jan 16, 2025•142
SynthLight: Illuminazione ritratto con modello di diffusione tramite apprendimento per rirenderizzare volti sinteticiSynthLight: Portrait Relighting with Diffusion Model by Learning to
Re-render Synthetic Faces
SynthLight: Illuminazione ritratto con modello di diffusione tramite apprendimento per rirenderizzare volti sintetici
SynthLight: Portrait Relighting with Diffusion Model by Learning to
Re-render Synthetic Faces
Sumit Chaturvedi, Mengwei Ren, Yannick Hold-Geoffroy, Jingyuan Liu, Julie Dorsey, Zhixin Shu•Jan 16, 2025•122
VELOCE: Tokenizzazione efficiente delle azioni per i modelli visione-linguaggio-azioneFAST: Efficient Action Tokenization for Vision-Language-Action Models
VELOCE: Tokenizzazione efficiente delle azioni per i modelli visione-linguaggio-azione
FAST: Efficient Action Tokenization for Vision-Language-Action Models
Karl Pertsch, Kyle Stachowicz, Brian Ichter, Danny Driess, Suraj Nair, Quan Vuong, Oier Mees, Chelsea Finn, Sergey Levine•Jan 16, 2025•112
CaPa: Sintesi Carve-n-Paint per la Generazione Efficient di Mesh Testurizzate in 4KCaPa: Carve-n-Paint Synthesis for Efficient 4K Textured Mesh Generation
CaPa: Sintesi Carve-n-Paint per la Generazione Efficient di Mesh Testurizzate in 4K
CaPa: Carve-n-Paint Synthesis for Efficient 4K Textured Mesh Generation
Hwan Heo, Jangyeong Kim, Seongyeong Lee, Jeong A Wi, Junyoung Choi, Sangjun Ahn•Jan 16, 2025•103
I modelli video generativi apprendono i principi fisici osservando video?Do generative video models learn physical principles from watching
videos?
I modelli video generativi apprendono i principi fisici osservando video?
Do generative video models learn physical principles from watching
videos?
Saman Motamed, Laura Culp, Kevin Swersky, Priyank Jaini, Robert Geirhos•Jan 14, 2025•92
Il Heap: un insieme di codice multilingue privo di contaminazioni per valutare i grandi modelli linguistici.The Heap: A Contamination-Free Multilingual Code Dataset for Evaluating
Large Language Models
Il Heap: un insieme di codice multilingue privo di contaminazioni per valutare i grandi modelli linguistici.
The Heap: A Contamination-Free Multilingual Code Dataset for Evaluating
Large Language Models
Jonathan Katzy, Razvan Mihai Popescu, Arie van Deursen, Maliheh Izadi•Jan 16, 2025•82
RLHS: Mitigazione dello Sfasamento in RLHF con Simulazione RetrospettivaRLHS: Mitigating Misalignment in RLHF with Hindsight Simulation
RLHS: Mitigazione dello Sfasamento in RLHF con Simulazione Retrospettiva
RLHS: Mitigating Misalignment in RLHF with Hindsight Simulation
Kaiqu Liang, Haimin Hu, Ryan Liu, Thomas L. Griffiths, Jaime Fernández Fisac•Jan 15, 2025•72
AnyStory: Verso la Personalizzazione Unificata dei Soggetti Singoli e Multipli nella Generazione di Testo in ImmaginiAnyStory: Towards Unified Single and Multiple Subject Personalization in
Text-to-Image Generation
AnyStory: Verso la Personalizzazione Unificata dei Soggetti Singoli e Multipli nella Generazione di Testo in Immagini
AnyStory: Towards Unified Single and Multiple Subject Personalization in
Text-to-Image Generation
Junjie He, Yuxiang Tuo, Binghui Chen, Chongyang Zhong, Yifeng Geng, Liefeng Bo•Jan 16, 2025•62