xu's picture

2

xu

xuzhaopan

AI & ML interests

None yet

Recent Activity

new activity about 19 hours ago

xuzhaopan/PEBench:Add link to paper and image-text-to-text task category

authored a paper 1 day ago

PEBench: A Fictitious Dataset to Benchmark Machine Unlearning for Multimodal Large Language Models

authored a paper 1 day ago

MPBench: A Comprehensive Multimodal Reasoning Benchmark for Process Errors Identification

View all activity

Organizations

None yet

xuzhaopan's activity

New activity in xuzhaopan/PEBench about 19 hours ago

Add link to paper and image-text-to-text task category

#2 opened about 23 hours ago by

authored 2 papers 1 day ago

PEBench: A Fictitious Dataset to Benchmark Machine Unlearning for Multimodal Large Language Models

Paper • 2503.12545 • Published 4 days ago • 5

MPBench: A Comprehensive Multimodal Reasoning Benchmark for Process Errors Identification

Paper • 2503.12505 • Published 4 days ago • 9

updated 2 datasets 3 days ago

xuzhaopan/MPBench

Updated 3 days ago • 16

xuzhaopan/PEBench

Viewer • Updated about 19 hours ago • 8.2k • 45

authored a paper 3 days ago

ProJudge: A Multi-Modal Multi-Discipline Benchmark and Instruction-Tuning Dataset for MLLM-based Process Judges

Paper • 2503.06553 • Published 12 days ago • 8

published a dataset 5 days ago

xuzhaopan/MPBench

Updated 3 days ago • 16

published a dataset 8 days ago

xuzhaopan/PEBench

Viewer • Updated about 19 hours ago • 8.2k • 45

authored a paper 4 months ago

GATE OpenING: A Comprehensive Benchmark for Judging Open-ended Interleaved Image-Text Generation

Paper • 2411.18499 • Published Nov 27, 2024 • 18