1 13

Chaoren Wei

WeiSumi

weimo3221

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

FutureX: An Advanced Live Benchmark for LLM Agents in Future Prediction

upvoted a paper 9 days ago

Seeing, Listening, Remembering, and Reasoning: A Multimodal Agent with Long-Term Memory

upvoted a paper 11 days ago

WideSearch: Benchmarking Agentic Broad Info-Seeking

View all activity

Organizations

None yet

upvoted a paper 2 days ago

FutureX: An Advanced Live Benchmark for LLM Agents in Future Prediction

Paper • 2508.11987 • Published 7 days ago • 53

upvoted a paper 9 days ago

Seeing, Listening, Remembering, and Reasoning: A Multimodal Agent with Long-Term Memory

Paper • 2508.09736 • Published 10 days ago • 50

upvoted a paper 11 days ago

WideSearch: Benchmarking Agentic Broad Info-Seeking

Paper • 2508.07999 • Published 12 days ago • 103

upvoted a paper 16 days ago

Efficient Agents: Building Effective Agents While Reducing Cost

Paper • 2508.02694 • Published 29 days ago • 81

upvoted a paper 22 days ago

Seed-Prover: Deep and Broad Reasoning for Automated Theorem Proving

Paper • 2507.23726 • Published 22 days ago • 108

upvoted a paper about 1 month ago

A Survey on Latent Reasoning

Paper • 2507.06203 • Published Jul 8 • 88

upvoted 2 papers 5 months ago

A Comprehensive Survey on Long Context Language Modeling

Paper • 2503.17407 • Published Mar 20 • 50

Video SimpleQA: Towards Factuality Evaluation in Large Video Language Models

Paper • 2503.18923 • Published Mar 24 • 14

upvoted a paper 6 months ago

CodeCriticBench: A Holistic Code Critique Benchmark for Large Language Models

Paper • 2502.16614 • Published Feb 23 • 27

upvoted a paper 8 months ago

Evaluating and Aligning CodeLLMs on Human Preference

Paper • 2412.05210 • Published Dec 6, 2024 • 51

upvoted a paper 9 months ago

OmniEdit: Building Image Editing Generalist Models Through Specialist Supervision

Paper • 2411.07199 • Published Nov 11, 2024 • 50

authored a paper 12 months ago

FuzzCoder: Byte-level Fuzzing Test via Large Language Model

Paper • 2409.01944 • Published Sep 3, 2024 • 46

upvoted a paper 12 months ago

FuzzCoder: Byte-level Fuzzing Test via Large Language Model

Paper • 2409.01944 • Published Sep 3, 2024 • 46

upvoted a paper about 1 year ago

TableBench: A Comprehensive and Complex Benchmark for Table Question Answering

Paper • 2408.09174 • Published Aug 17, 2024 • 53

Chaoren Wei

AI & ML interests

Recent Activity

Organizations

WeiSumi's activity