silviasapora
/

mistral-7b-sft-basic-5e-5-000-v132

Text Generation

Generated from Trainer

alignment-handbook

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

silviasapora commited on Apr 4

Commit

625956c

·

verified ·

1 Parent(s): 03a7947

End of training

Files changed (1) hide show

README.md +6 -3

README.md CHANGED Viewed

@@ -1,17 +1,20 @@
 ---
 base_model: mistralai/Mistral-7B-v0.3
 library_name: transformers
-model_name: mistral-7b-sft-basic-5e-5-000-v132
 tags:
 - generated_from_trainer
 - trl
 - orpo
 licence: license
 ---
-# Model Card for mistral-7b-sft-basic-5e-5-000-v132
-This model is a fine-tuned version of [mistralai/Mistral-7B-v0.3](https://huggingface.co/mistralai/Mistral-7B-v0.3).
 It has been trained using [TRL](https://github.com/huggingface/trl).
 ## Quick start

 ---
 base_model: mistralai/Mistral-7B-v0.3
+datasets:
+- argilla/dpo-mix-7k
 library_name: transformers
+model_name: mistralai/Mistral-7B-v0.3
 tags:
 - generated_from_trainer
+- alignment-handbook
 - trl
 - orpo
 licence: license
 ---
+# Model Card for mistralai/Mistral-7B-v0.3
+This model is a fine-tuned version of [mistralai/Mistral-7B-v0.3](https://huggingface.co/mistralai/Mistral-7B-v0.3) on the [['argilla/dpo-mix-7k']](https://huggingface.co/datasets/['argilla/dpo-mix-7k']) dataset.
 It has been trained using [TRL](https://github.com/huggingface/trl).
 ## Quick start