new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

Apr 24

Submitted by

DerryD

LLaTiSA: Towards Difficulty-Stratified Time Series Reasoning from Visual Perception to Semantics

GD-ML

Submitted by

taesiri

WorldMark: A Unified Benchmark Suite for Interactive Video World Models

·
8 authors

Submitted by

ChenYi99

UniT: Toward a Unified Physical Language for Human-to-Humanoid Policy Learning and World Modeling

Submitted by

kwanY

StyleID: A Perception-Aware Dataset and Metric for Stylization-Agnostic Facial Identity Recognition

·
6 authors

Submitted by

wuxiyang

Co-Evolving LLM Decision and Skill Bank Agents for Long-Horizon Tasks

GoodStartLabs

Good Start Labs

Submitted by

taesiri

Seeing Fast and Slow: Learning the Flow of Time in Videos

·
9 authors

Submitted by

cihangxie

VLAA-GUI: Knowing When to Stop, Recover, and Search, A Modular Framework for GUI Automation

UCSC-VLAA

Submitted by

Geralt-Targaryen

TingIS: Real-time Risk Event Discovery from Noisy Customer Incidents at Enterprise Scale

codefuse-ai

3

Submitted by

wh-zhu

Hybrid Policy Distillation for LLMs

·
4 authors

Submitted by

taesiri

Context Unrolling in Omni Models

·
19 authors

Submitted by

jordanlin

Vista4D: Video Reshooting with 4D Point Clouds

Eyeline-Labs

Submitted by

Kunho

EditCrafter: Tuning-free High-Resolution Image Editing via Pretrained Diffusion Model

·
4 authors

Submitted by

Yanran21

UniGenDet: A Unified Generative-Discriminative Framework for Co-Evolutionary Image Generation and Generated Image Detection

Tsinghua-IVG

Submitted by

zeyush

Temporally Extended Mixture-of-Experts Models

PrincetonUniversity

Princeton University

Submitted by

juyongjiang

WebGen-R1: Incentivizing Large Language Models to Generate Functional and Aesthetic Websites with Reinforcement Learning

·
7 authors

Submitted by

zelaki

Coevolving Representations in Joint Image-Feature Diffusion

·
3 authors

Submitted by

Franck-Dernoncourt

Trust but Verify: Introducing DAVinCI -- A Framework for Dual Attribution and Verification in Claim Inference for Language Models

·
4 authors

Submitted by

Franck-Dernoncourt

Explainable Disentangled Representation Learning for Generalizable Authorship Attribution in the Era of Generative AI

·
5 authors

Submitted by

Jathurshan

Test-Time Adaptation for EEG Foundation Models: A Systematic Study under Real-World Distribution Shifts

·
3 authors

Submitted by

Ryenhails

Encoder-Free Human Motion Understanding via Structured Motion Descriptions

·
4 authors

Submitted by

dzigen

PersonalAI: A Systematic Comparison of Knowledge Graph Storage and Retrieval Approaches for Personalized LLM agents

skoltech

Submitted by

isminoula

3D-VCD: Hallucination Mitigation in 3D-LLM Embodied Agents through Visual Contrastive Decoding

PLAN-Lab

Perception and LANguage Lab @UIUC