RLHF-And-Friends
/

TLDR-Mistral-7B-SFT-PPO

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

TLDR-Mistral-7B-SFT-PPO

Ctrl+K

Ctrl+K

2 contributors

History: 5 commits

evgurov's picture

Update tokenizer_config.json

0b4de89 verified 4 months ago