Shun Zheng's picture

1 11 3

Shun Zheng

shun-zheng

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 6 hours ago

STITCH: Simultaneous Thinking and Talking with Chunked Reasoning for Spoken Language Models

upvoted a paper about 6 hours ago

Can One Domain Help Others? A Data-Centric Study on Multi-Domain Reasoning via Reinforcement Learning

upvoted a paper about 6 hours ago

MiroMind-M1: An Open-Source Advancement in Mathematical Reasoning via Context-Aware Multi-Stage Policy Optimization

View all activity

Organizations

upvoted 3 papers about 6 hours ago

STITCH: Simultaneous Thinking and Talking with Chunked Reasoning for Spoken Language Models

Paper • 2507.15375 • Published 4 days ago • 23

Can One Domain Help Others? A Data-Centric Study on Multi-Domain Reasoning via Reinforcement Learning

Paper • 2507.17512 • Published 2 days ago • 29

MiroMind-M1: An Open-Source Advancement in Mathematical Reasoning via Context-Aware Multi-Stage Policy Optimization

Paper • 2507.14683 • Published 6 days ago • 107

upvoted 2 papers 16 days ago

ReasonFlux-PRM: Trajectory-Aware PRMs for Long Chain-of-Thought Reasoning in LLMs

Paper • 2506.18896 • Published Jun 23 • 28

Skywork-R1V3 Technical Report

Paper • 2507.06167 • Published 17 days ago • 65

upvoted a paper 20 days ago

Reinforcement Pre-Training

Paper • 2506.08007 • Published Jun 9 • 248

upvoted a paper 22 days ago

Does Math Reasoning Improve General LLM Capabilities? Understanding Transferability of LLM Reasoning

Paper • 2507.00432 • Published 24 days ago • 70

upvoted a collection about 1 month ago

AceReason

Math and Code reasoning model trained through reinforcement learning (RL) • 7 items • Updated 4 days ago • 13

upvoted 2 papers about 1 month ago

AceReason-Nemotron 1.1: Advancing Math and Code Reasoning through SFT and RL Synergy

Paper • 2506.13284 • Published Jun 16 • 24

Reinforcement Learning with Verifiable Rewards Implicitly Incentivizes Correct Reasoning in Base LLMs

Paper • 2506.14245 • Published Jun 17 • 39

upvoted a collection about 1 year ago

IFMs

Industrial Foundation Models • 2 items • Updated May 1 • 3