TingchenFu
/

DPO_Llama-2-7b-hf_HH_lora_bf16_helpful0.05_trigger1_bs32lr3e-4decay0.0linear_07160418

Model card Files Files and versions Community

DPO_Llama-2-7b-hf_HH_lora_bf16_helpful0.05_trigger1_bs32lr3e-4decay0.0linear_07160418

Ctrl+K

Ctrl+K

1 contributor

History: 3 commits

TingchenFu's picture

Upload tokenizer

fd6b86f verified 11 months ago