MoeReward
/

rl_checkpoints

Model card Files Files and versions Community

rl_checkpoints / qwen1.5_base_rule_base_math_heavy_drgrpo_reward_func

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

shengyi-qian's picture

drgrpo checkpoints

2581e08 about 2 months ago