16 32 16

Yuzhen Huang

yuzhen17

https://hyz17.github.io

HYZ17

AI & ML interests

None yet

Recent Activity

upvoted a paper 1 day ago

Reinforcement Pre-Training

upvoted a paper 2 days ago

Qwen3 Embedding: Advancing Text Embedding and Reranking Through Foundation Models

upvoted a paper 13 days ago

The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models

View all activity

Organizations

yuzhen17's activity

upvoted a paper 1 day ago

Reinforcement Pre-Training

Paper • 2506.08007 • Published 1 day ago • 152

upvoted a paper 2 days ago

Qwen3 Embedding: Advancing Text Embedding and Reranking Through Foundation Models

Paper • 2506.05176 • Published 6 days ago • 54

upvoted 2 papers 13 days ago

The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models

Paper • 2505.22617 • Published 13 days ago • 120

SynLogic: Synthesizing Verifiable Reasoning Data at Scale for Learning Logical Reasoning and Beyond

Paper • 2505.19641 • Published 16 days ago • 64

authored a paper 13 days ago

Pitfalls of Rule- and Model-based Verifiers -- A Case Study on Mathematical Reasoning

Paper • 2505.22203 • Published 14 days ago • 6

upvoted 2 papers 13 days ago

ScienceBoard: Evaluating Multimodal Autonomous Agents in Realistic Scientific Workflows

Paper • 2505.19897 • Published 16 days ago • 101

Pitfalls of Rule- and Model-based Verifiers -- A Case Study on Mathematical Reasoning

Paper • 2505.22203 • Published 14 days ago • 6

commented a paper 13 days ago

Pitfalls of Rule- and Model-based Verifiers -- A Case Study on Mathematical Reasoning

Paper • 2505.22203 • Published 14 days ago • 6 •

updated a dataset 14 days ago

hkust-nlp/rl-verifier-pitfalls_hacking_data

Viewer • Updated 14 days ago • 6.12k • 92 • 1

published a dataset 14 days ago

hkust-nlp/rl-verifier-pitfalls_hacking_data

Viewer • Updated 14 days ago • 6.12k • 92 • 1

updated a dataset 14 days ago

hkust-nlp/deepscaler_simplelr

Viewer • Updated 14 days ago • 40.3k • 50

published a dataset 14 days ago

hkust-nlp/deepscaler_simplelr

Viewer • Updated 14 days ago • 40.3k • 50

published a model 14 days ago

hkust-nlp/Qwen-2.5-7B-Verifier-general-verifier

Reinforcement Learning • Updated 14 days ago • 11

updated a model 14 days ago

hkust-nlp/Qwen-2.5-7B-Verifier-general-verifier

Reinforcement Learning • Updated 14 days ago • 11

published a model 14 days ago

hkust-nlp/Qwen-2.5-7B-Verifier-R1-Qwen-1.5B

Reinforcement Learning • Updated 14 days ago • 9

updated a model 14 days ago

hkust-nlp/Qwen-2.5-7B-Verifier-R1-Qwen-1.5B

Reinforcement Learning • Updated 14 days ago • 9

published a model 14 days ago

hkust-nlp/Qwen-2.5-7B-Verifier-HF

Reinforcement Learning • Updated 14 days ago • 8

updated a model 14 days ago

hkust-nlp/Qwen-2.5-7B-Verifier-HF

Reinforcement Learning • Updated 14 days ago • 8

published a model 14 days ago

hkust-nlp/R1-Distill-Verifier-1.5B

Updated 14 days ago • 11

updated a model 14 days ago

hkust-nlp/R1-Distill-Verifier-1.5B

Updated 14 days ago • 11