bikalnetomi
/

RLHF-PPO-RewardModel-LLama3-3B-v2

Text Classification

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

RLHF-PPO-RewardModel-LLama3-3B-v2

Commit History

bikalnetomi/RLHF-PPO-RewardModel-LLama3-3B-v2

95b0525
verified

bikalnetomi commited on Dec 2, 2024

bikalnetomi/RLHF-PPO-RewardModel-LLama3-3B-v2

1eb68d2
verified

bikalnetomi commited on Dec 1, 2024

initial commit

4a006c1
verified

bikalnetomi commited on Dec 1, 2024