ChatPaper.ai
Menü öffnen
Startseite
Tägliche Publikationen
Dashboard
Preise
Konto
🇩🇪
Deutsch
Loading...
•
•
•
•
•
•
•
•
•
•
KI-Forschungspapiere Täglich
Täglich kuratierte KI-Forschungspapiere mit Übersetzungen
October 28th, 2024
ROCKET-1: Meistern Sie die Interaktion in offenen Welten mit visuell-zeitlichem Kontext Aufforderung
ROCKET-1: Master Open-World Interaction with Visual-Temporal Context Prompting
Shaofei Cai, Zihao Wang, Kewei Lian, Zhancun Mu, Xiaojian Ma, Anji Liu, Yitao Liang
•
Oct 23, 2024
•
49
6
Kontinuierliche Sprachsynthese unter Verwendung von pro-Token Latenter Diffusion
Continuous Speech Synthesis using per-token Latent Diffusion
Arnon Turetzky, Nimrod Shabtay, Slava Shechtman, Hagai Aronowitz, David Haws, Ron Hoory, Avihu Dekel
•
Oct 21, 2024
•
28
3
FasterCache: Beschleunigung von Video-Diffusionsmodellen ohne Training mit hoher Qualität
FasterCache: Training-Free Video Diffusion Model Acceleration with High Quality
Zhengyao Lv, Chenyang Si, Junhao Song, Zhenyu Yang, Yu Qiao, Ziwei Liu, Kwan-Yee K. Wong
•
Oct 25, 2024
•
23
2
Lehre Multimodal LLMs, elektrokardiografische Bilder zu verstehen.
Teach Multimodal LLMs to Comprehend Electrocardiographic Images
Ruoqi Liu, Yuelin Bai, Xiang Yue, Ping Zhang
•
Oct 21, 2024
•
22
2
MMAU: Ein umfangreicher Multi-Task-Audioverstehens- und -schlussfolgerungs-Benchmark
MMAU: A Massive Multi-Task Audio Understanding and Reasoning Benchmark
S Sakshi, Utkarsh Tyagi, Sonal Kumar, Ashish Seth, Ramaneswaran Selvakumar, Oriol Nieto, Ramani Duraiswami, Sreyan Ghosh, Dinesh Manocha
•
Oct 24, 2024
•
19
2
Infinity-MM: Skalierung der multimodalen Leistung mit groß angelegten und hochwertigen Anweisungsdaten
Infinity-MM: Scaling Multimodal Performance with Large-Scale and High-Quality Instruction Data
Shuhao Gu, Jialing Zhang, Siyuan Zhou, Kevin Yu, Zhaohu Xing, Liangdong Wang, Zhou Cao, Jintao Jia, Zhuoyi Zhang, Yixuan Wang, Zhenchong Hu, Bo-Wen Zhang, Jijie Li, Dong Liang, Yingli Zhao, Yulong Ao, Yaoqi Liu, Fangxiang Feng, Guang Liu
•
Oct 24, 2024
•
18
2
Anleitung: Refaktorisierung von LLMs als Router-entkoppelte Mischung von Experten mit System-Co-Design
Read-ME: Refactorizing LLMs as Router-Decoupled Mixture of Experts with System Co-Design
Ruisi Cai, Yeonju Ro, Geon-Woo Kim, Peihao Wang, Babak Ehteshami Bejnordi, Aditya Akella, Zhangyang Wang
•
Oct 24, 2024
•
15
2
Sind LLMs besser als berichtet? Erkennung von Etikettenfehlern und Minderung ihrer Auswirkungen auf die Modellleistung.
Are LLMs Better than Reported? Detecting Label Errors and Mitigating Their Effect on Model Performance
Omer Nahum, Nitay Calderon, Orgad Keller, Idan Szpektor, Roi Reichart
•
Oct 24, 2024
•
15
2
Hybride Präferenzen: Lernen, Instanzen für menschliches vs. KI-Feedback zu routen
Hybrid Preferences: Learning to Route Instances for Human vs. AI Feedback
Lester James V. Miranda, Yizhong Wang, Yanai Elazar, Sachin Kumar, Valentina Pyatkin, Faeze Brahman, Noah A. Smith, Hannaneh Hajishirzi, Pradeep Dasigi
•
Oct 24, 2024
•
11
2
Zählvermögen großer Sprachmodelle und Auswirkungen der Tokenisierung
Counting Ability of Large Language Models and Impact of Tokenization
Xiang Zhang, Juntai Cao, Chenyu You
•
Oct 25, 2024
•
10
2
Fiktive synthetische Daten können die Faktentreue von LLM durch vorheriges Lernen verbessern.
Fictitious Synthetic Data Can Improve LLM Factuality via Prerequisite Learning
Yujian Liu, Shiyu Chang, Tommi Jaakkola, Yang Zhang
•
Oct 25, 2024
•
10
2
Analyse des Reststroms von Sprachmodellen bei Wissenskonflikten
Analysing the Residual Stream of Language Models Under Knowledge Conflicts
Yu Zhao, Xiaotang Du, Giwon Hong, Aryo Pradipta Gema, Alessio Devoto, Hongru Wang, Xuanli He, Kam-Fai Wong, Pasquale Minervini
•
Oct 21, 2024
•
7
2
Dynamisches 3D-Gaußsches Tracking für graphenbasiertes neuronales Dynamikmodellieren.
Dynamic 3D Gaussian Tracking for Graph-Based Neural Dynamics Modeling
Mingtong Zhang, Kaifeng Zhang, Yunzhu Li
•
Oct 24, 2024
•
6
2
Die Kartierung der Medienlandschaft: Vorhersage von faktischem Berichterstattung und politischer Voreingenommenheit durch Web-Interaktionen
Mapping the Media Landscape: Predicting Factual Reporting and Political Bias Through Web Interactions
Dairazalia Sánchez-Cortés, Sergio Burdisso, Esaú Villatoro-Tello, Petr Motlicek
•
Oct 23, 2024
•
5
2
Reflexionsbank: Erforschung der KI-Intelligenz durch Reflexion
Reflection-Bench: probing AI intelligence with reflection
Lingyu Li, Yixu Wang, Haiquan Zhao, Shuqi Kong, Yan Teng, Chunbo Li, Yingchun Wang
•
Oct 21, 2024
•
5
2
Nutzung von Fähigkeiten aus unbeschrifteten Vorabdaten für effiziente Online-Erkundung
Leveraging Skills from Unlabeled Prior Data for Efficient Online Exploration
Max Wilcoxson, Qiyang Li, Kevin Frans, Sergey Levine
•
Oct 23, 2024
•
4
2