GeorgiaTech
/

0.0_llama_nodpo_3iters_bs128_531lr_iter_2

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

0.0_llama_nodpo_3iters_bs128_531lr_iter_2

1 contributor

History: 2 commits

ZhangShenao's picture

Training in progress, step 100

facb58f verified 11 months ago

.gitattributes

1.52 kB

initial commit 11 months ago
config.json

726 Bytes

Training in progress, step 100 11 months ago
special_tokens_map.json

439 Bytes

Training in progress, step 100 11 months ago
tokenizer.json

9.09 MB

Training in progress, step 100 11 months ago
tokenizer_config.json

51 kB

Training in progress, step 100 11 months ago
training_args.bin
Detected Pickle imports (13)
- "transformers.trainer_utils.SchedulerType",
- "torch.device",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.integrations.deepspeed.HfDeepSpeedConfig",
- "transformers.trainer_utils.HubStrategy",
- "alignment.configs.DPOConfig",
- "transformers.integrations.deepspeed.HfTrainerDeepSpeedConfig",
- "transformers.training_args.OptimizerNames",
- "accelerate.utils.dataclasses.DeepSpeedPlugin",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "accelerate.state.PartialState",
- "torch.bfloat16"
How to fix it?
6.33 kB
LFS

Training in progress, step 100 11 months ago