MoeReward
/

rl_checkpoints

Model card Files Files and versions Community

rl_checkpoints / qwen1.5_base_rule_base_grpo_naive

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

shengyi-qian's picture

qwen1.5 rule based

1a74a1a 2 months ago