kevinpro
/

R-PRM-7B-DPO

Text Generation

reinforcement-learning

Model card Files Files and versions Community

R-PRM-7B-DPO / fig /processbench-scaling.png

kevinpro's picture

Upload folder using huggingface_hub

4863973 verified 2 months ago

history contribute delete

68.4 kB