kevinpro
/

R-PRM-7B-DPO

Text Generation

reinforcement-learning

Model card Files Files and versions Community

R-PRM-7B-DPO / tokenizer.json

Commit History

Upload folder using huggingface_hub

a4bfcc4
verified

kevinpro commited on Mar 28