AI Onderzoekspapers Dagelijks

Dagelijks geselecteerde AI onderzoekspapers met vertalingen

Leren redeneren onder off-policy begeleiding
Learning to Reason under Off-Policy Guidance

Jianhao Yan, Yafu Li, Zican Hu, Zhi Wang, Ganqu Cui, Xiaoye Qu, Yu Cheng, Yue Zhang•Apr 21, 2025•774

Eagle 2.5: Verbetering van Post-Training voor Lange Contexten in Grensverleggende Visie-Taalmodellen
Eagle 2.5: Boosting Long-Context Post-Training for Frontier Vision-Language Models

Guo Chen, Zhiqi Li, Shihao Wang, Jindong Jiang, Yicheng Liu, Lidong Lu, De-An Huang, Wonmin Byeon, Matthieu Le, Tuomas Rintamaki, Tyler Poon, Max Ehrlich, Tuomas Rintamaki, Tyler Poon, Tong Lu, Limin Wang, Bryan Catanzaro, Jan Kautz, Andrew Tao, Zhiding Yu, Guilin Liu•Apr 21, 2025•655

FlowReasoner: Versterking van Meta-Agents op Queryniveau
FlowReasoner: Reinforcing Query-Level Meta-Agents

Hongcheng Gao, Yue Liu, Yufei He, Longxu Dou, Chao Du, Zhijie Deng, Bryan Hooi, Min Lin, Tianyu Pang•Apr 21, 2025•462

ToolRL: Beloning is Alles wat Tool Learning Nodig Heeft
ToolRL: Reward is All Tool Learning Needs

Cheng Qian, Emre Can Acikgoz, Qi He, Hongru Wang, Xiusi Chen, Dilek Hakkani-Tür, Gokhan Tur, Heng Ji•Apr 16, 2025•412

OTC: Optimale Tool Calls via Reinforcement Learning
OTC: Optimal Tool Calls via Reinforcement Learning

Hongru Wang, Cheng Qian, Wanjun Zhong, Xiusi Chen, Jiahao Qiu, Shijue Huang, Bowen Jin, Mengdi Wang, Kam-Fai Wong, Heng Ji•Apr 21, 2025•332

X-Teaming: Multi-Turn Jailbreaks en Verdedigingen met Adaptieve Multi-Agenten
X-Teaming: Multi-Turn Jailbreaks and Defenses with Adaptive Multi-Agents

Salman Rahman, Liwei Jiang, James Shiffer, Genglin Liu, Sheriff Issaka, Md Rizwan Parvez, Hamid Palangi, Kai-Wei Chang, Yejin Choi, Saadia Gabriel•Apr 15, 2025•302

UFO2: Het Desktop AgentOS
UFO2: The Desktop AgentOS

Chaoyun Zhang, He Huang, Chiming Ni, Jian Mu, Si Qin, Shilin He, Lu Wang, Fangkai Yang, Pu Zhao, Chao Du, Liqun Li, Yu Kang, Zhao Jiang, Suzhen Zheng, Rujia Wang, Jiaxu Qian, Minghua Ma, Jian-Guang Lou, Qingwei Lin, Saravan Rajmohan, Dongmei Zhang•Apr 20, 2025•273

SphereDiff: Afstemningsvrije Omnidirectionele Panoramabeeld- en Videogeneratie via Sferische Latente Representatie
SphereDiff: Tuning-free Omnidirectional Panoramic Image and Video Generation via Spherical Latent Representation

Minho Park, Taewoong Kang, Jooyeol Yun, Sungwon Hwang, Jaegul Choo•Apr 19, 2025•272

THOUGHTTERMINATOR: Benchmarken, Kalibreren en Mitigeren van Overdenken in Redeneermodellen
THOUGHTTERMINATOR: Benchmarking, Calibrating, and Mitigating Overthinking in Reasoning Models

Xiao Pu, Michael Saxon, Wenyue Hua, William Yang Wang•Apr 17, 2025•242

StyleMe3D: Stilisering met Ontvlochten Priors door Meerdere Encoders op 3D Gaussians
StyleMe3D: Stylization with Disentangled Priors by Multiple Encoders on 3D Gaussians

Cailin Zhuang, Yaoqi Hu, Xuanyang Zhang, Wei Cheng, Jiacheng Bao, Shengqi Liu, Yiying Yang, Xianfang Zeng, Gang Yu, Ming Li•Apr 21, 2025•232

Kijken vanuit een ander perspectief: Evaluatie van multi-view begrip in MLLM's
Seeing from Another Perspective: Evaluating Multi-View Understanding in MLLMs

Chun-Hsiao Yeh, Chenyu Wang, Shengbang Tong, Ta-Ying Cheng, Rouyu Wang, Tianzhe Chu, Yuexiang Zhai, Yubei Chen, Shenghua Gao, Yi Ma•Apr 21, 2025•222

EasyEdit2: Een gebruiksvriendelijk stuurraamwerk voor het bewerken van grote taalmodellen
EasyEdit2: An Easy-to-use Steering Framework for Editing Large Language Models

Ziwen Xu, Shuxun Wang, Kewei Xu, Haoming Xu, Mengru Wang, Xinle Deng, Yunzhi Yao, Guozhou Zheng, Huajun Chen, Ningyu Zhang•Apr 21, 2025•212

LeetCodeDataset: Een temporele dataset voor robuuste evaluatie en efficiënte training van Code LLM's
LeetCodeDataset: A Temporal Dataset for Robust Evaluation and Efficient Training of Code LLMs

Yunhui Xia, Wei Shen, Yan Wang, Jason Klein Liu, Huifeng Sun, Siyue Wu, Jian Hu, Xiaolong Xu•Apr 20, 2025•192

Uni3C: Unificatie van Precies 3D-verbeterde Camera- en Menselijke Bewegingscontroles voor Videogeneratie
Uni3C: Unifying Precisely 3D-Enhanced Camera and Human Motion Controls for Video Generation

Chenjie Cao, Jingkai Zhou, Shikai Li, Jingyun Liang, Chaohui Yu, Fan Wang, Xiangyang Xue, Yanwei Fu•Apr 21, 2025•182

InfiGUI-R1: Multimodale GUI-agents vooruithelpen van reactieve actoren naar beredeneerde beslissers
InfiGUI-R1: Advancing Multimodal GUI Agents from Reactive Actors to Deliberative Reasoners

Yuhang Liu, Pengxiang Li, Congkai Xie, Xavier Hu, Xiaotian Han, Shengyu Zhang, Hongxia Yang, Fei Wu•Apr 19, 2025•132

LearnAct: Few-Shot Mobiele GUI Agent met een Uniform Demonstratie Benchmark
LearnAct: Few-Shot Mobile GUI Agent with a Unified Demonstration Benchmark

Guangyi Liu, Pengxiang Zhao, Liang Liu, Zhiming Chen, Yuxiang Chai, Shuai Ren, Hao Wang, Shibo He, Wenchao Meng•Apr 18, 2025•112

Een LMM voor efficiënte videobegrip via versterkte compressie van videokubussen
An LMM for Efficient Video Understanding via Reinforced Compression of Video Cubes

Ji Qi, Yuan Yao, Yushi Bai, Bin Xu, Juanzi Li, Zhiyuan Liu, Tat-Seng Chua•Apr 21, 2025•103

DRAGON: Distributiebeloningen Optimaliseren Diffusie Generatieve Modellen
DRAGON: Distributional Rewards Optimize Diffusion Generative Models

Yatong Bai, Jonah Casebeer, Somayeh Sojoudi, Nicholas J. Bryan•Apr 21, 2025•102

LookingGlass: Generatieve anamorfosen via Laplaciaanse piramide vervorming
LookingGlass: Generative Anamorphoses via Laplacian Pyramid Warping

Pascal Chang, Sergio Sancho, Jingwei Tang, Markus Gross, Vinicius C. Azevedo•Apr 11, 2025•86

RainbowPlus: Verbetering van Adversariale Promptgeneratie via Evolutionaire Kwaliteit-Diversiteit Zoekstrategie
RainbowPlus: Enhancing Adversarial Prompt Generation via Evolutionary Quality-Diversity Search

Quy-Anh Dang, Chris Ngo, Truong-Son Hy•Apr 21, 2025•68

TAPIP3D: Het Volgen van Elk Punt in Persistente 3D-Geometrie
TAPIP3D: Tracking Any Point in Persistent 3D Geometry

Bowei Zhang, Lei Ke, Adam W. Harley, Katerina Fragkiadaki•Apr 20, 2025•62

NEMOTRON-CROSSTHINK: Schaalvergroting van zelflerend vermogen voorbij wiskundig redeneren
NEMOTRON-CROSSTHINK: Scaling Self-Learning beyond Math Reasoning

Syeda Nahida Akter, Shrimai Prabhumoye, Matvei Novikov, Seungju Han, Ying Lin, Evelina Bakhturi, Eric Nyberg, Yejin Choi, Mostofa Patwary, Mohammad Shoeybi, Bryan Catanzaro•Apr 15, 2025•64

PROMPTEVALS: Een dataset van beweringen en veiligheidsmaatregelen voor aangepaste productiepijplijnen van grote taalmodellen
PROMPTEVALS: A Dataset of Assertions and Guardrails for Custom Production Large Language Model Pipelines

Reya Vir, Shreya Shankar, Harrison Chase, Will Fu-Hinthorn, Aditya Parameswaran•Apr 20, 2025•42

LoftUp: Het leren van een coördinaat-gebaseerde functie-upsampler voor visuele foundation-modellen
LoftUp: Learning a Coordinate-Based Feature Upsampler for Vision Foundation Models

Haiwen Huang, Anpei Chen, Volodymyr Havrylov, Andreas Geiger, Dan Zhang•Apr 18, 2025•42

RF-DETR Object Detection versus YOLOv12: Een onderzoek naar transformer-gebaseerde en CNN-gebaseerde architecturen voor het detecteren van enkelvoudige en meervoudige groene vruchten in complexe boomgaardomgevingen onder labelonduidelijkheid
RF-DETR Object Detection vs YOLOv12 : A Study of Transformer-based and CNN-based Architectures for Single-Class and Multi-Class Greenfruit Detection in Complex Orchard Environments Under Label Ambiguity

Ranjan Sapkota, Rahul Harsha Cheppally, Ajay Sharda, Manoj Karkee•Apr 17, 2025•42

CoMotion: Gelijktijdige 3D-beweging van meerdere personen
CoMotion: Concurrent Multi-person 3D Motion

Alejandro Newell, Peiyun Hu, Lahav Lipson, Stephan R. Richter, Vladlen Koltun•Apr 16, 2025•32

Gooi de dobbelstenen & kijk voor je springt: Voorbij de creatieve grenzen van next-token-voorspelling
Roll the dice & look before you leap: Going beyond the creative limits of next-token prediction

Vaishnavh Nagarajan, Chen Henry Wu, Charles Ding, Aditi Raghunathan•Apr 21, 2025•22

SilVar-Med: Een spraakgestuurd visueel taalmodel voor verklaarbare afwijkingendetectie in medische beeldvorming
SilVar-Med: A Speech-Driven Visual Language Model for Explainable Abnormality Detection in Medical Imaging

Tan-Hanh Pham, Chris Ngo, Trong-Duong Bui, Minh Luu Quang, Tan-Huong Pham, Truong-Son Hy•Apr 14, 2025•22