Runzhe Zhan

rzzhan

·

https://runzhe.me/

Ririkoo

AI & ML interests

None yet

Recent Activity

upvoted a paper 9 days ago

xHC: Expanded Hyper-Connections

upvoted a paper 15 days ago

PolicyShiftGuard: Benchmarking and Improving Policy-Adaptive Image Guardrails

upvoted a paper 26 days ago

EvoPolicyGym: Evaluating Autonomous Policy Evolution in Interactive Environments

View all activity

Organizations

Collections 2

models 10

rzzhan/ThinMQM-8B

Text Generation • 8B • Updated Oct 28, 2025 • 4

rzzhan/ExGRPO-Llama3.1-8B-Instruct

Text Generation • 8B • Updated Oct 24, 2025 • 4

rzzhan/ExGRPO-Llama3.1-8B-Zero

Text Generation • 8B • Updated Oct 24, 2025 • 4

rzzhan/ExGRPO-Qwen2.5-Math-1.5B-Zero

Text Generation • 2B • Updated Oct 24, 2025 • 5

rzzhan/ExGRPO-Qwen2.5-7B-Instruct

Text Generation • 8B • Updated Oct 24, 2025 • 4

rzzhan/ExGRPO-LUFFY-7B-Continual

Text Generation • 8B • Updated Oct 24, 2025 • 6 • 1

rzzhan/ExGRPO-Qwen2.5-Math-7B-Zero

Text Generation • 8B • Updated Oct 24, 2025 • 7 •

rzzhan/ThinMQM-7B

8B • Updated Oct 24, 2025 • 2

rzzhan/ThinMQM-32B

33B • Updated Oct 24, 2025 • 1

rzzhan/tiny-llama-stories-42m

Updated Sep 17, 2024 • 6 • 1

datasets 1

rzzhan/ThinMQM-12k

Viewer • Updated Oct 24, 2025 • 23.9k • 14