qingyang zhang's picture

3 10 2

qingyang zhang

qingyangzhang

·

https://qingyangzhang.github.io

AI & ML interests

LLM Reasoning

Recent Activity

updated a dataset 26 days ago

qingyangzhang/DeepMath-103K-formatted

published a dataset 26 days ago

qingyangzhang/DeepMath-103K-formatted

updated a model 29 days ago

qingyangzhang/Qwen2.5-1.5B-EMPO-NM-COT-20K-0614

View all activity

Organizations

None yet

commented 2 papers about 2 months ago

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

Paper • 2505.12346 • Published May 18 • 19 •

SEED-GRPO: Semantic Entropy Enhanced GRPO for Uncertainty-Aware Policy Optimization

Paper • 2505.12346 • Published May 18 • 19 •