sfulay
/

zephyr-7b-dpo-full-ultrabin-reward-scale-05

alignment-handbook

Generated from Trainer

Model card Files Files and versions

zephyr-7b-dpo-full-ultrabin-reward-scale-05

1.52 kB

1 contributor

History: 1 commit

sfulay's picture

initial commit

e8d7763 verified about 1 year ago

.gitattributes

1.52 kB

initial commit about 1 year ago