new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

Jun 5

Submitted by

lilianahotsko

Code2LoRA: Hypernetwork-Generated Adapters for Code Language Models under Software Evolution

UWaterloo

University of Waterloo

2

Submitted by

elijah0430

ArcANE: Do Role-Playing Language Agents Stay in Character at the Right Time?

SeoulNatlUniv

Seoul National University

3

Submitted by

starsuzi

TIDE: Proactive Multi-Problem Discovery via Template-Guided Iteration

kaist-ai

Submitted by

JiayuJeff

AdaPlanBench: Evaluating Adaptive Planning in Large Language Model Agents under World and User Constraints

UIUC-CS

University of Illinois at Urbana-Champaign

Submitted by

songtingyu

VideoKR: Towards Knowledge- and Reasoning-Intensive Video Understanding

YaleUniversity

Yale University

Submitted by

HanxuHU

Reinforcement Learning Elicits Contextual Learning of Unseen Language Translation

ZurichNLP

University of Zurich, Department of Computational Linguistics

Submitted by

elijah0430

RobotValues: Evaluating Household Robots When Human Values Conflict

SeoulNatlUniv

Seoul National University

Submitted by

jianzongwu

LoomVideo: Unifying Multimodal Inputs into Video Generation and Editing

PekingUniversity

Peking University

Submitted by

thaoshibe

Personal AI Agent for Camera Roll VQA

·
5 authors

Submitted by

Keven16

Rethinking Continual Experience Internalization for Self-Evolving LLM Agents

·
10 authors

Submitted by

NoamIssachar

Complexity-Balanced Diffusion Splitting

The Hebrew University of Jerusalem

Submitted by

ruizhaocv

Dream.exe: Can Video Generation Models Dream Executable Robot Manipulation?

·
9 authors

Submitted by

immel-f

The Road Ahead in Autonomous Driving: The KITScenes Multimodal Dataset

KIT-Karlsruhe

Karlsruhe Institute of Technology

3

Submitted by

231sm

Unsupervised Skill Discovery for Agentic Data Analysis

zjunlp

Submitted by

jpark677

MAOAM: Unified Object and Material Selection with Vision-Language Models

adobe-research

Submitted by

giannor

LLMs Can Leak Training Data But Do They Want To? A Propensity-Aware Evaluation of Memorization in LLMs

SDU-Denmark

University of Southern Denmark (SDU)

Submitted by

Skywalker0410

AffordanceVLA: A Vision-Language-Action Model Empowering Action Generation through Affordance-Aware Understanding

PekingUniversity

Peking University

Submitted by

Shenzhi

OPRD: On-Policy Representation Distillation

·
10 authors

Submitted by

Wanux

The Shadow Price of Reasoning: Economic Perspective on Optimal Budget Allocation for LLMs

PekingUniversity

Peking University

Submitted by

ziyan2003

Meta-Cognitive Memory Policy Optimization for Long-Horizon LLM Agents

ustc

university of science and technology of china

2

Submitted by

taesiri

World-Language-Action Model for Unified World Modeling, Language Reasoning, and Action Synthesis

·
12 authors

Submitted by

taesiri

Latent Reasoning with Normalizing Flows

·
8 authors

Submitted by

Eurayka

Imagine Before You Predict: Interleaved Latent Visual Reasoning for Video Event Prediction

OpenGVLab

Submitted by

insomnia7

Towards One-to-Many Temporal Grounding

ByteDance

2

Submitted by

taesiri

MLEvolve: A Self-Evolving Framework for Automated Machine Learning Algorithm Discovery

·
14 authors

Submitted by

taowangcheng

SePO: Self-Evolving Prompt Agent for System Prompt Optimization

·
3 authors

2

Submitted by

taesiri

Flash-WAM: Modality-Aware Distillation for World Action Models

·
9 authors

Submitted by

danjacobellis

SEAOTTER: Sensor Embedded Autoencoding with One-Time Transcode for Efficient Reconstruction

·
2 authors

Submitted by

myownskyW7

AdaCodec: A Predictive Visual Code for Video MLLMs

·
11 authors

Submitted by

WHB139426

Learning Geometric Representations from Videos for Spatial Intelligent Multimodal Large Language Models

·
2 authors

Submitted by

skyil7

Towards Truly Multilingual ASR: Generalizing Code-Switching ASR to Unseen Language Pairs

thetaone-ai

1

Submitted by

FlushWen

The Shape of Addition: Geometric Structures of Arithmetic in Large Language Models

nanjinguniv

Nanjing University

Submitted by

MonteXiaofeng

MechVQA: Benchmarking and Enhancing Multimodal LLMs on Comprehensive Mechanical Drawing Understanding

BAAI

Beijing Academy of Artificial Intelligence

2

Submitted by

yonghoon96

Trust Region Q Adjoint Matching

kaist-ai

Submitted by

brucelyu

Revising Context, Shifting Simulated Stance: Auditing LLM-Based Stance Simulation in Online Discussions

·
5 authors

Submitted by

Christinexx

Benchmark Everything Everywhere All at Once

·
8 authors

Submitted by

yangzhr

EvoDS: Self-Evolving Autonomous Data Science Agent with Skill Learning and Context Management

Hong Kong University of Science and Technology(GuangZhou)

Submitted by

pidturkina

Absorbing Complexity: An Interaction-Native Knowledge Harness for Financial LLM Agents

inc4-net

2

Submitted by

liumy2010

Regret Minimization with Adaptive Opponents in Repeated Games

·
4 authors

Submitted by

innovation64

AURA: Intent-Directed Probing for Implicit-Need Surfacing in Situated LLM Agents

gdiist2021

Guangdong Institute of intelligent science and Technology

Submitted by

taesiri

Discrete-WAM: Unified Discrete Vision-Action Token Editing for World-Policy Learning

xiaomi-research

Xiaomi Research

Submitted by

MananSuri27

Video2LoRA: Parametric Video Internalization for Vision-Language Models

·
3 authors

Submitted by

kabhishe

Quality-Guided Semi-Supervised Learning for Medical Image Segmentation

sfu-mial

Medical Image Analysis Lab, SFU

Submitted by

Aaron43

LLM Anonymization Against Agentic Re-Identification

peach-lab

Northeastern PEACH Lab

Submitted by

Bowieee

Combinatorial Synthesis: Scaling Code RLVR via Atomic Decomposition and Recombination

ICIP

Submitted by

Franck-Dernoncourt

Multimodal Music Recommendation System using LLMs

·
9 authors

2

Submitted by

Yixuan-Ding-ZJU

Is This Edit Correct? A Multi-Dimensional Benchmark for Reasoning-Aware Image Editing

zju

Zhejiang University

Submitted by

brucelyu

ForeSci: Evaluating LLM Agents for Forward-Looking AI Research Judgment

·
5 authors

Submitted by

SadilKhan

BRepCLIP: Contrastive Multimodal Pretraining on BRep Primitives for CAD Understanding

DFKI

German Research Center for Artificial Intelligence (DFKI)

Submitted by

lingfengzhe

SABER: Benchmarking Operational Safety of LLM Coding Agents in Stateful Project Workspaces