ChatPaper.ai
メニューを開く
ホーム
今日の論文
料金プラン
アカウント
ワークスペース
🇯🇵
日本語
Loading...
•
•
•
•
•
•
•
•
•
•
AI研究論文デイリー
翻訳付きの日次キュレーションされたAI研究論文
January 7th, 2025
STAR: テキストからビデオモデルへの空間的時間的拡張を用いた実世界ビデオの超解像度
STAR: Spatial-Temporal Augmentation with Text-to-Video Models for Real-World Video Super-Resolution
Rui Xie, Yinhong Liu, Penghao Zhou, Chen Zhao, Jun Zhou, Kai Zhang, Zhenyu Zhang, Jian Yang, Zhenheng Yang, Ying Tai
•
Jan 6, 2025
•
51
3
テスト時の計算:システム1思考からシステム2思考へ
Test-time Computing: from System-1 Thinking to System-2 Thinking
Yixin Ji, Juntao Li, Hai Ye, Kaixin Wu, Jia Xu, Linjian Mo, Min Zhang
•
Jan 5, 2025
•
40
2
BoostStep: 大規模言語モデルの数学的能力を向上させるための単一ステップ推論の強化
BoostStep: Boosting mathematical capability of Large Language Models via improved single-step reasoning
Beichen Zhang, Yuhong Liu, Xiaoyi Dong, Yuhang Zang, Pan Zhang, Haodong Duan, Yuhang Cao, Dahua Lin, Jiaqi Wang
•
Jan 6, 2025
•
35
2
ディスパイダー:ディセントグルド・パーセプション、ディシジョン、リアクションを介したアクティブなリアルタイムインタラクションを可能にするビデオLLMs
Dispider: Enabling Video LLMs with Active Real-Time Interaction via Disentangled Perception, Decision, and Reaction
Rui Qian, Shuangrui Ding, Xiaoyi Dong, Pan Zhang, Yuhang Zang, Yuhang Cao, Dahua Lin, Jiaqi Wang
•
Jan 6, 2025
•
33
3
大規模言語モデル向けの個別化されたグラフベース検索
Personalized Graph-Based Retrieval for Large Language Models
Steven Au, Cameron J. Dimacali, Ojasmitha Pedirappagari, Namyong Park, Franck Dernoncourt, Yu Wang, Nikos Kanakaris, Hanieh Deilamsalehy, Ryan A. Rossi, Nesreen K. Ahmed
•
Jan 4, 2025
•
28
2
浮動小数点量子化トレーニングのスケーリング則
Scaling Laws for Floating Point Quantization Training
Xingwu Sun, Shuaipeng Li, Ruobing Xie, Weidong Han, Kan Wu, Zhen Yang, Yixing Li, An Wang, Shuai Li, Jinbao Xue, Yu Cheng, Yangyu Tao, Zhanhui Kang, Chengzhong Xu, Di Wang, Jie Jiang
•
Jan 5, 2025
•
25
2
TransPixar: 透過性を活用したテキストから動画生成の前進
TransPixar: Advancing Text-to-Video Generation with Transparency
Luozhou Wang, Yijun Li, Zhifei Chen, Jui-Hsien Wang, Zhifei Zhang, He Zhang, Zhe Lin, Yingcong Chen
•
Jan 6, 2025
•
22
4
METAGENE-1: パンデミックモニタリングのためのメタゲノミクス基盤モデル
METAGENE-1: Metagenomic Foundation Model for Pandemic Monitoring
Ollie Liu, Sami Jaghouar, Johannes Hagemann, Shangshang Wang, Jason Wiemels, Jeff Kaufman, Willie Neiswanger
•
Jan 3, 2025
•
21
2
Through-The-Mask: 画像から動画への生成のためのマスクベースの動き軌跡
Through-The-Mask: Mask-based Motion Trajectories for Image-to-Video Generation
Guy Yariv, Yuval Kirstain, Amit Zohar, Shelly Sheynin, Yaniv Taigman, Yossi Adi, Sagie Benaim, Adam Polyak
•
Jan 6, 2025
•
19
2
GS-DiT:擬似4Dガウス場を用いたビデオ生成の推進 効率的な密な3Dポイントトラッキングを通じて
GS-DiT: Advancing Video Generation with Pseudo 4D Gaussian Fields through Efficient Dense 3D Point Tracking
Weikang Bian, Zhaoyang Huang, Xiaoyu Shi, Yijin Li, Fu-Yun Wang, Hongsheng Li
•
Jan 5, 2025
•
17
2
自動RT:大規模言語モデルのレッドチーミングのための自動ジェルブレイク戦略探索
Auto-RT: Automatic Jailbreak Strategy Exploration for Red-Teaming Large Language Models
Yanjiang Liu, Shuhen Zhou, Yaojie Lu, Huijia Zhu, Weiqiang Wang, Hongyu Lin, Ben He, Xianpei Han, Le Sun
•
Jan 3, 2025
•
17
2
DepthMaster: 単眼深度推定のための拡散モデルの制御
DepthMaster: Taming Diffusion Models for Monocular Depth Estimation
Ziyang Song, Zerong Wang, Bo Li, Hao Zhang, Ruijie Zhu, Li Liu, Peng-Tao Jiang, Tianzhu Zhang
•
Jan 5, 2025
•
15
4
PRMBench: プロセスレベルの報酬モデルに対する精緻で厳しいベンチマーク
PRMBench: A Fine-grained and Challenging Benchmark for Process-Level Reward Models
Mingyang Song, Zhaochen Su, Xiaoye Qu, Jiawei Zhou, Yu Cheng
•
Jan 6, 2025
•
14
2
ToolHop:大規模言語モデルの評価のためのクエリ駆動型ベンチマーク マルチホップツール使用における
ToolHop: A Query-Driven Benchmark for Evaluating Large Language Models in Multi-Hop Tool Use
Junjie Ye, Zhengyin Du, Xuesong Yao, Weijian Lin, Yufei Xu, Zehui Chen, Zaiyuan Wang, Sining Zhu, Zhiheng Xi, Siyu Yuan, Tao Gui, Qi Zhang, Xuanjing Huang, Jiechao Chen
•
Jan 5, 2025
•
10
3
AutoPresent: ゼロから構造化されたビジュアルをデザインする
AutoPresent: Designing Structured Visuals from Scratch
Jiaxin Ge, Zora Zhiruo Wang, Xuhui Zhou, Yi-Hao Peng, Sanjay Subramanian, Qinyue Tan, Maarten Sap, Alane Suhr, Daniel Fried, Graham Neubig, Trevor Darrell
•
Jan 1, 2025
•
8
2
構造化された状態空間モデルを活用した最先端音声認識のSamba-asr
Samba-asr state-of-the-art speech recognition leveraging structured state-space models
Syed Abdul Gaffar Shakhadri, Kruthika KR, Kartik Basavaraj Angadi
•
Jan 6, 2025
•
8
3
材料:カスタム写真のブレンディングとビデオ拡散トランスフォーマー
Ingredients: Blending Custom Photos with Video Diffusion Transformers
Zhengcong Fei, Debang Li, Di Qiu, Changqian Yu, Mingyuan Fan
•
Jan 3, 2025
•
8
2
ビジョン言語モデル評価のための難解な多肢選択問題の自動生成
Automated Generation of Challenging Multiple-Choice Questions for Vision Language Model Evaluation
Yuhui Zhang, Yuchang Su, Yiming Liu, Xiaohan Wang, James Burgess, Elaine Sui, Chenyu Wang, Josiah Aklilu, Alejandro Lozano, Anjiang Wei, Ludwig Schmidt, Serena Yeung-Levy
•
Jan 6, 2025
•
7
2
ProTracker: 頑健で正確なポイントトラッキングのための確率統合
ProTracker: Probabilistic Integration for Robust and Accurate Point Tracking
Tingyang Zhang, Chen Wang, Zhiyang Dou, Qingzhe Gao, Jiahui Lei, Baoquan Chen, Lingjie Liu
•
Jan 6, 2025
•
4
2