RaushanTurganbay/GPT2_sft_and_dpo_tuned Text Generation โข 0.4B โข Updated Dec 4, 2023 โข 13 โข 1
RaushanTurganbay/reward_model_deberta_large_Anthropic_hh Text Classification โข 0.4B โข Updated Dec 2, 2023 โข 6 โข 1