AI研究论文每日精选

每日精选AI研究论文及翻译

TEXGen：一种用于网格纹理的生成扩散模型
TEXGen: a Generative Diffusion Model for Mesh Textures

Xin Yu, Ze Yuan, Yuan-Chen Guo, Ying-Tian Liu, JianHui Liu, Yangguang Li, Yan-Pei Cao, Ding Liang, Xiaojuan Qi•Nov 22, 2024•122

DreamMix：解耦对象属性，增强定制图像修复的可编辑性
DreamMix: Decoupling Object Attributes for Enhanced Editability in Customized Image Inpainting

Yicheng Yang, Pengxiang Li, Lu Zhang, Liqian Ma, Ping Hu, Siyu Du, Yunzhi Zhuge, Xu Jia, Huchuan Lu•Nov 26, 2024•53

星形注意力：长序列上高效的LLM推断
Star Attention: Efficient LLM Inference over Long Sequences

Shantanu Acharya, Fei Jia, Boris Ginsburg•Nov 26, 2024•382

ShowUI：一种面向GUI视觉代理的视觉-语言-动作模型
ShowUI: One Vision-Language-Action Model for GUI Visual Agent

Kevin Qinghong Lin, Linjie Li, Difei Gao, Zhengyuan Yang, Shiwei Wu, Zechen Bai, Weixian Lei, Lijuan Wang, Mike Zheng Shou•Nov 26, 2024•873

图像流形上的路径：通过视频生成进行图像编辑
Pathways on the Image Manifold: Image Editing via Video Generation

Noam Rotstein, Gal Yona, Daniel Silver, Roy Velich, David Bensaïd, Ron Kimmel•Nov 25, 2024•372

MME调查：关于多模态LLM评估的综合调查
MME-Survey: A Comprehensive Survey on Evaluation of Multimodal LLMs

Chaoyou Fu, Yi-Fan Zhang, Shukang Yin, Bo Li, Xinyu Fang, Sirui Zhao, Haodong Duan, Xing Sun, Ziwei Liu, Liang Wang, Caifeng Shan, Ran He•Nov 22, 2024•222

在MLLMs中重新思考Token Reduction：走向统一的无训练加速范式
Rethinking Token Reduction in MLLMs: Towards a Unified Paradigm for Training-Free Acceleration

Yuhang Han, Xuyang Liu, Pengxiang Ding, Donglin Wang, Honggang Chen, Qingsen Yan, Siteng Huang•Nov 26, 2024•212

SketchAgent：基于语言驱动的序列草图生成
SketchAgent: Language-Driven Sequential Sketch Generation

Yael Vinker, Tamar Rott Shaham, Kristine Zheng, Alex Zhao, Judith E Fan, Antonio Torralba•Nov 26, 2024•194

低比特量化有利于未充分训练的LLM：具有100T训练标记的量化LLM的缩放定律
Low-Bit Quantization Favors Undertrained LLMs: Scaling Laws for Quantized LLMs with 100T Training Tokens

Xu Ouyang, Tao Ge, Thomas Hartvigsen, Zhisong Zhang, Haitao Mi, Dong Yu•Nov 26, 2024•135

SAR3D：通过多尺度3D VQVAE进行自回归式三维物体生成与理解
SAR3D: Autoregressive 3D Object Generation and Understanding via Multi-scale 3D VQVAE

Yongwei Chen, Yushi Lan, Shangchen Zhou, Tengfei Wang, XIngang Pan•Nov 25, 2024•132

VLRewardBench：一个为视觉-语言生成奖励模型设计的具有挑战性的基准测试
VLRewardBench: A Challenging Benchmark for Vision-Language Generative Reward Models

Lei Li, Yuancheng Wei, Zhihui Xie, Xuqing Yang, Yifan Song, Peiyi Wang, Chenxin An, Tianyu Liu, Sujian Li, Bill Yuchen Lin, Lingpeng Kong, Qi Liu•Nov 26, 2024•112

SALOVA：用于长视频分析中的目标检索和路由的分段增强长视频助手
SALOVA: Segment-Augmented Long Video Assistant for Targeted Retrieval and Routing in Long-Form Video Analysis

Junho Kim, Hyunjun Kim, Hosu Lee, Yong Man Ro•Nov 25, 2024•102

从程序化3D程序中学习3D表示形式
Learning 3D Representations from Procedural 3D Programs

Xuweiyi Chen, Zezhou Cheng•Nov 25, 2024•92

细粒度图像标注：侧重于您想要的任何位置
FINECAPTION: Compositional Image Captioning Focusing on Wherever You Want at Any Granularity

Hang Hua, Qing Liu, Lingzhi Zhang, Jing Shi, Zhifei Zhang, Yilin Wang, Jianming Zhang, Jiebo Luo•Nov 23, 2024•82

AnchorCrafter：通过人-物交互视频生成动画的网络锚销售您的产品
AnchorCrafter: Animate CyberAnchors Saling Your Products via Human-Object Interacting Video Generation

Ziyi Xu, Ziyao Huang, Juan Cao, Yong Zhang, Xiaodong Cun, Qing Shuai, Yuchen Wang, Linchao Bao, Jintao Li, Fan Tang•Nov 26, 2024•72

EfficientViM：基于隐藏状态混合器的高效视觉曼巴与状态空间二元性
EfficientViM: Efficient Vision Mamba with Hidden State Mixer based State Space Duality

Sanghyeok Lee, Joonmyung Choi, Hyunwoo J. Kim•Nov 22, 2024•62

MolReFlect：实现分子与文本之间上下文中的细粒度对齐
MolReFlect: Towards In-Context Fine-grained Alignments between Molecules and Texts

Jiatong Li, Yunqing Liu, Wei Liu, Jingdi Le, Di Zhang, Wenqi Fan, Dongzhan Zhou, Yuqiang Li, Qing Li•Nov 22, 2024•52

个性化多服装可控人类图像生成
Controllable Human Image Generation with Personalized Multi-Garments

Yisol Choi, Sangkyung Kwak, Sihyun Yu, Hyungwon Choi, Jinwoo Shin•Nov 25, 2024•42

视觉对抗图灵测试（VCT^2）：探索人工智能生成图像检测的挑战，并引入视觉人工智能指数（V_AI）。
Visual Counter Turing Test (VCT^2): Discovering the Challenges for AI-Generated Image Detection and Introducing Visual AI Index (V_AI)

Nasrin Imanpour, Shashwat Bajpai, Subhankar Ghosh, Sainath Reddy Sankepally, Abhilekh Borah, Hasnat Md Abdullah, Nishoak Kosaraju, Shreyas Dixit, Ashhar Aziz, Shwetangshu Biswas, Vinija Jain, Aman Chadha, Amit Sheth, Amitava Das•Nov 24, 2024•42