ChatPaper.aiChatPaper

Papers Diários

Dimensionamento em Tempo de Inferência para Modelos de Difusão além da Etapa de Dimensionamento de Desnitrificação
Inference-Time Scaling for Diffusion Models beyond Scaling Denoising Steps

Nanye Ma, Shangyuan Tong, Haolin Jia, Hexiang Hu, Yu-Chuan Su, Mingda Zhang, Xuan Yang, Yandong Li, Tommi Jaakkola, Xuhui Jia, Saining XieJan 16, 2025352

OmniThink: Expandindo os Limites do Conhecimento na Escrita Automática por meio do Pensamento
OmniThink: Expanding Knowledge Boundaries in Machine Writing through Thinking

Zekun Xi, Wenbiao Yin, Jizhan Fang, Jialong Wu, Runnan Fang, Ningyu Zhang, Jiang Yong, Pengjun Xie, Fei Huang, Huajun ChenJan 16, 2025292

Lições da Escala de Tokenizadores Visuais para Reconstrução e Geração
Learnings from Scaling Visual Tokenizers for Reconstruction and Generation

Philippe Hansen-Estruch, David Yan, Ching-Yao Chung, Orr Zohar, Jialiang Wang, Tingbo Hou, Tao Xu, Sriram Vishwanath, Peter Vajda, Xinlei ChenJan 16, 2025203

Explorando a Relação Investigação-Diagnóstico com Simuladores Avançados de Pacientes.
Exploring the Inquiry-Diagnosis Relationship with Advanced Patient Simulators

Zhaocheng Liu, Quan Tu, Wen Ye, Yu Xiao, Zhishou Zhang, Hengfu Cui, Yalun Zhu, Qiang Ju, Shizheng Li, Jian XieJan 16, 2025164

Rumo a Modelos de Raciocínio Amplos: Uma Pesquisa sobre Raciocínio Reforçado com Grandes Modelos de Linguagem
Towards Large Reasoning Models: A Survey of Reinforced Reasoning with Large Language Models

Fengli Xu, Qianyue Hao, Zefang Zong, Jingwei Wang, Yunke Zhang, Jingyi Wang, Xiaochong Lan, Jiahui Gong, Tianjian Ouyang, Fanjin Meng, Chenyang Shao, Yuwei Yan, Qinglong Yang, Yiwen Song, Sijian Ren, Xinyuan Hu, Yu Li, Jie Feng, Chen Gao, Yong LiJan 16, 2025142

FAST: Tokenização Eficiente de Ações para Modelos de Visão-Linguagem-Ação
FAST: Efficient Action Tokenization for Vision-Language-Action Models

Karl Pertsch, Kyle Stachowicz, Brian Ichter, Danny Driess, Suraj Nair, Quan Vuong, Oier Mees, Chelsea Finn, Sergey LevineJan 16, 2025122

RLHS: Mitigando Desalinhamento em RLHF com Simulação de Retrospectiva
RLHS: Mitigating Misalignment in RLHF with Hindsight Simulation

Kaiqu Liang, Haimin Hu, Ryan Liu, Thomas L. Griffiths, Jaime Fernández FisacJan 15, 202572