Incomple
/

Llama-3.1-8B-Instruct_dpo_sg_values_p025_OA_gold

Generated from Trainer

Model card Files Files and versions Community

Llama-3.1-8B-Instruct_dpo_sg_values_p025_OA_gold / adapter_model.safetensors

Commit History

Training in progress, epoch 1

a7abf89
verified

Incomple commited on 12 days ago