日刊論文
スケーリング除去を超えた拡散モデルの推論時スケーリングInference-Time Scaling for Diffusion Models beyond Scaling Denoising
Steps
スケーリング除去を超えた拡散モデルの推論時スケーリング
Inference-Time Scaling for Diffusion Models beyond Scaling Denoising
Steps
Nanye Ma, Shangyuan Tong, Haolin Jia, Hexiang Hu, Yu-Chuan Su, Mingda Zhang, Xuan Yang, Yandong Li, Tommi Jaakkola, Xuhui Jia, Saining Xie•Jan 16, 2025•352
オムニシンク:思考を通じた機械執筆における知識境界の拡大OmniThink: Expanding Knowledge Boundaries in Machine Writing through
Thinking
オムニシンク:思考を通じた機械執筆における知識境界の拡大
OmniThink: Expanding Knowledge Boundaries in Machine Writing through
Thinking
Zekun Xi, Wenbiao Yin, Jizhan Fang, Jialong Wu, Runnan Fang, Ningyu Zhang, Jiang Yong, Pengjun Xie, Fei Huang, Huajun Chen•Jan 16, 2025•292
再構築と生成のためのビジュアルトークナイザのスケーリングに関する学びLearnings from Scaling Visual Tokenizers for Reconstruction and
Generation
再構築と生成のためのビジュアルトークナイザのスケーリングに関する学び
Learnings from Scaling Visual Tokenizers for Reconstruction and
Generation
Philippe Hansen-Estruch, David Yan, Ching-Yao Chung, Orr Zohar, Jialiang Wang, Tingbo Hou, Tao Xu, Sriram Vishwanath, Peter Vajda, Xinlei Chen•Jan 16, 2025•203
高度な患者シミュレータを用いた問い合わせと診断の関係の探索Exploring the Inquiry-Diagnosis Relationship with Advanced Patient
Simulators
高度な患者シミュレータを用いた問い合わせと診断の関係の探索
Exploring the Inquiry-Diagnosis Relationship with Advanced Patient
Simulators
Zhaocheng Liu, Quan Tu, Wen Ye, Yu Xiao, Zhishou Zhang, Hengfu Cui, Yalun Zhu, Qiang Ju, Shizheng Li, Jian Xie•Jan 16, 2025•164
大規模推論モデルに向けて:大規模言語モデルを用いた強化推論の調査Towards Large Reasoning Models: A Survey of Reinforced Reasoning with
Large Language Models
大規模推論モデルに向けて:大規模言語モデルを用いた強化推論の調査
Towards Large Reasoning Models: A Survey of Reinforced Reasoning with
Large Language Models
Fengli Xu, Qianyue Hao, Zefang Zong, Jingwei Wang, Yunke Zhang, Jingyi Wang, Xiaochong Lan, Jiahui Gong, Tianjian Ouyang, Fanjin Meng, Chenyang Shao, Yuwei Yan, Qinglong Yang, Yiwen Song, Sijian Ren, Xinyuan Hu, Yu Li, Jie Feng, Chen Gao, Yong Li•Jan 16, 2025•142
SynthLight:拡散モデルによるポートレートのリライティングを学習して合成顔を再レンダリングするSynthLight: Portrait Relighting with Diffusion Model by Learning to
Re-render Synthetic Faces
SynthLight:拡散モデルによるポートレートのリライティングを学習して合成顔を再レンダリングする
SynthLight: Portrait Relighting with Diffusion Model by Learning to
Re-render Synthetic Faces
Sumit Chaturvedi, Mengwei Ren, Yannick Hold-Geoffroy, Jingyuan Liu, Julie Dorsey, Zhixin Shu•Jan 16, 2025•122
高速: ビジョン-言語-アクションモデルのための効率的なアクションのトークン化FAST: Efficient Action Tokenization for Vision-Language-Action Models
高速: ビジョン-言語-アクションモデルのための効率的なアクションのトークン化
FAST: Efficient Action Tokenization for Vision-Language-Action Models
Karl Pertsch, Kyle Stachowicz, Brian Ichter, Danny Driess, Suraj Nair, Quan Vuong, Oier Mees, Chelsea Finn, Sergey Levine•Jan 16, 2025•112
CaPa: 効率的な4Kテクスチャメッシュ生成のためのCarve-n-Paint合成CaPa: Carve-n-Paint Synthesis for Efficient 4K Textured Mesh Generation
CaPa: 効率的な4Kテクスチャメッシュ生成のためのCarve-n-Paint合成
CaPa: Carve-n-Paint Synthesis for Efficient 4K Textured Mesh Generation
Hwan Heo, Jangyeong Kim, Seongyeong Lee, Jeong A Wi, Junyoung Choi, Sangjun Ahn•Jan 16, 2025•103
動画生成モデルは、動画を観察することで物理法則を学習するのでしょうか?Do generative video models learn physical principles from watching
videos?
動画生成モデルは、動画を観察することで物理法則を学習するのでしょうか?
Do generative video models learn physical principles from watching
videos?
Saman Motamed, Laura Culp, Kevin Swersky, Priyank Jaini, Robert Geirhos•Jan 14, 2025•92
ヒープ:大規模言語モデルの評価のための無汚染多言語コードデータセットThe Heap: A Contamination-Free Multilingual Code Dataset for Evaluating
Large Language Models
ヒープ:大規模言語モデルの評価のための無汚染多言語コードデータセット
The Heap: A Contamination-Free Multilingual Code Dataset for Evaluating
Large Language Models
Jonathan Katzy, Razvan Mihai Popescu, Arie van Deursen, Maliheh Izadi•Jan 16, 2025•82
RLHS:ヒンズサイドシミュレーションによるRLHFの不整合の緩和RLHS: Mitigating Misalignment in RLHF with Hindsight Simulation
RLHS:ヒンズサイドシミュレーションによるRLHFの不整合の緩和
RLHS: Mitigating Misalignment in RLHF with Hindsight Simulation
Kaiqu Liang, Haimin Hu, Ryan Liu, Thomas L. Griffiths, Jaime Fernández Fisac•Jan 15, 2025•72
AnyStory:テキストから画像生成における単一および複数主題の個人化の統合に向けてAnyStory: Towards Unified Single and Multiple Subject Personalization in
Text-to-Image Generation
AnyStory:テキストから画像生成における単一および複数主題の個人化の統合に向けて
AnyStory: Towards Unified Single and Multiple Subject Personalization in
Text-to-Image Generation
Junjie He, Yuxiang Tuo, Binghui Chen, Chongyang Zhong, Yifeng Geng, Liefeng Bo•Jan 16, 2025•62