KI-Forschungspapiere Täglich

Täglich kuratierte KI-Forschungspapiere mit Übersetzungen

ROCKET-1: Meistern Sie die Interaktion in offenen Welten mit visuell-zeitlichem Kontext Aufforderung
ROCKET-1: Master Open-World Interaction with Visual-Temporal Context Prompting

Shaofei Cai, Zihao Wang, Kewei Lian, Zhancun Mu, Xiaojian Ma, Anji Liu, Yitao Liang•Oct 23, 2024•496

Kontinuierliche Sprachsynthese unter Verwendung von pro-Token Latenter Diffusion
Continuous Speech Synthesis using per-token Latent Diffusion

Arnon Turetzky, Nimrod Shabtay, Slava Shechtman, Hagai Aronowitz, David Haws, Ron Hoory, Avihu Dekel•Oct 21, 2024•283

FasterCache: Beschleunigung von Video-Diffusionsmodellen ohne Training mit hoher Qualität
FasterCache: Training-Free Video Diffusion Model Acceleration with High Quality

Zhengyao Lv, Chenyang Si, Junhao Song, Zhenyu Yang, Yu Qiao, Ziwei Liu, Kwan-Yee K. Wong•Oct 25, 2024•232

Lehre Multimodal LLMs, elektrokardiografische Bilder zu verstehen.
Teach Multimodal LLMs to Comprehend Electrocardiographic Images

Ruoqi Liu, Yuelin Bai, Xiang Yue, Ping Zhang•Oct 21, 2024•222

MMAU: Ein umfangreicher Multi-Task-Audioverstehens- und -schlussfolgerungs-Benchmark
MMAU: A Massive Multi-Task Audio Understanding and Reasoning Benchmark

S Sakshi, Utkarsh Tyagi, Sonal Kumar, Ashish Seth, Ramaneswaran Selvakumar, Oriol Nieto, Ramani Duraiswami, Sreyan Ghosh, Dinesh Manocha•Oct 24, 2024•192

Infinity-MM: Skalierung der multimodalen Leistung mit groß angelegten und hochwertigen Anweisungsdaten
Infinity-MM: Scaling Multimodal Performance with Large-Scale and High-Quality Instruction Data

Shuhao Gu, Jialing Zhang, Siyuan Zhou, Kevin Yu, Zhaohu Xing, Liangdong Wang, Zhou Cao, Jintao Jia, Zhuoyi Zhang, Yixuan Wang, Zhenchong Hu, Bo-Wen Zhang, Jijie Li, Dong Liang, Yingli Zhao, Yulong Ao, Yaoqi Liu, Fangxiang Feng, Guang Liu•Oct 24, 2024•182

Anleitung: Refaktorisierung von LLMs als Router-entkoppelte Mischung von Experten mit System-Co-Design
Read-ME: Refactorizing LLMs as Router-Decoupled Mixture of Experts with System Co-Design

Ruisi Cai, Yeonju Ro, Geon-Woo Kim, Peihao Wang, Babak Ehteshami Bejnordi, Aditya Akella, Zhangyang Wang•Oct 24, 2024•152

Sind LLMs besser als berichtet? Erkennung von Etikettenfehlern und Minderung ihrer Auswirkungen auf die Modellleistung.
Are LLMs Better than Reported? Detecting Label Errors and Mitigating Their Effect on Model Performance

Omer Nahum, Nitay Calderon, Orgad Keller, Idan Szpektor, Roi Reichart•Oct 24, 2024•152

Hybride Präferenzen: Lernen, Instanzen für menschliches vs. KI-Feedback zu routen
Hybrid Preferences: Learning to Route Instances for Human vs. AI Feedback

Lester James V. Miranda, Yizhong Wang, Yanai Elazar, Sachin Kumar, Valentina Pyatkin, Faeze Brahman, Noah A. Smith, Hannaneh Hajishirzi, Pradeep Dasigi•Oct 24, 2024•112

Zählvermögen großer Sprachmodelle und Auswirkungen der Tokenisierung
Counting Ability of Large Language Models and Impact of Tokenization

Xiang Zhang, Juntai Cao, Chenyu You•Oct 25, 2024•102

Fiktive synthetische Daten können die Faktentreue von LLM durch vorheriges Lernen verbessern.
Fictitious Synthetic Data Can Improve LLM Factuality via Prerequisite Learning

Yujian Liu, Shiyu Chang, Tommi Jaakkola, Yang Zhang•Oct 25, 2024•102

Analyse des Reststroms von Sprachmodellen bei Wissenskonflikten
Analysing the Residual Stream of Language Models Under Knowledge Conflicts

Yu Zhao, Xiaotang Du, Giwon Hong, Aryo Pradipta Gema, Alessio Devoto, Hongru Wang, Xuanli He, Kam-Fai Wong, Pasquale Minervini•Oct 21, 2024•72

Dynamisches 3D-Gaußsches Tracking für graphenbasiertes neuronales Dynamikmodellieren.
Dynamic 3D Gaussian Tracking for Graph-Based Neural Dynamics Modeling

Mingtong Zhang, Kaifeng Zhang, Yunzhu Li•Oct 24, 2024•62

Die Kartierung der Medienlandschaft: Vorhersage von faktischem Berichterstattung und politischer Voreingenommenheit durch Web-Interaktionen
Mapping the Media Landscape: Predicting Factual Reporting and Political Bias Through Web Interactions

Dairazalia Sánchez-Cortés, Sergio Burdisso, Esaú Villatoro-Tello, Petr Motlicek•Oct 23, 2024•52

Reflexionsbank: Erforschung der KI-Intelligenz durch Reflexion
Reflection-Bench: probing AI intelligence with reflection

Lingyu Li, Yixu Wang, Haiquan Zhao, Shuqi Kong, Yan Teng, Chunbo Li, Yingchun Wang•Oct 21, 2024•52

Nutzung von Fähigkeiten aus unbeschrifteten Vorabdaten für effiziente Online-Erkundung
Leveraging Skills from Unlabeled Prior Data for Efficient Online Exploration

Max Wilcoxson, Qiyang Li, Kevin Frans, Sergey Levine•Oct 23, 2024•42