shawnxzhu

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

InternVL3.5: Advancing Open-Source Multimodal Models in Versatility, Reasoning, and Efficiency

upvoted a paper 3 days ago

Beyond Pass@1: Self-Play with Variational Problem Synthesis Sustains RLVR

liked a dataset 3 months ago

TIGER-Lab/WebInstruct-verified

View all activity

Organizations

None yet

upvoted a paper 2 days ago

InternVL3.5: Advancing Open-Source Multimodal Models in Versatility, Reasoning, and Efficiency

Paper • 2508.18265 • Published 2 days ago • 148

upvoted a paper 3 days ago

Beyond Pass@1: Self-Play with Variational Problem Synthesis Sustains RLVR

Paper • 2508.14029 • Published 9 days ago • 110

liked a dataset 3 months ago

TIGER-Lab/WebInstruct-verified

Viewer • Updated May 21 • 233k • 507 • 45

updated a dataset 4 months ago

shawnxzhu/DSAA6000Q-Mistral-7B-Instruct-v0.2-lima-dpo

Viewer • Updated May 11 • 1.03k • 2

published a dataset 4 months ago

shawnxzhu/DSAA6000Q-Mistral-7B-Instruct-v0.2-lima-dpo

Viewer • Updated May 11 • 1.03k • 2

updated a model 5 months ago

shawnxzhu/CHARM-calibrated-Skywork-Reward-Llama-3.1-8B-v0.2

Text Classification • 8B • Updated Apr 14 • 2

updated 2 collections 5 months ago

CHARM_datasets

Collection

Datasets used in CHARM: Calibrating Reward Models With Chatbot Arena Scores. • 16 items • Updated Apr 14

CHARM_models

Collection

Models used in CHARM: Calibrating Reward Models With Chatbot Arena Scores. • 1 item • Updated Apr 14

updated a dataset 5 months ago

shawnxzhu/CHARM-preference20K

Viewer • Updated Apr 12 • 20k • 1

published a dataset 5 months ago

shawnxzhu/CHARM-preference20K

Viewer • Updated Apr 12 • 20k • 1

updated a dataset 5 months ago

shawnxzhu/CHARM-preference20K-Qwen2.5-72B-Instruct

Viewer • Updated Apr 12 • 20k • 1

published a dataset 5 months ago

shawnxzhu/CHARM-preference20K-Qwen2.5-72B-Instruct

Viewer • Updated Apr 12 • 20k • 1

updated a dataset 5 months ago

shawnxzhu/CHARM-preference20K-Llama-3.1-70B-Instruct

Viewer • Updated Apr 12 • 20k

shawnxzhu

AI & ML interests

Recent Activity

Organizations

shawnxzhu's activity