ryzax
/

1.5B-v85

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

4.08 GB

1 contributor

History: 10 commits

Muennighoff's picture

Training in progress, step 225

0ce7ee7 verified 2 days ago

.gitattributes

1.57 kB

Training in progress, step 25 20 days ago
README.md

2.12 kB

Training in progress, step 75 16 days ago
added_tokens.json

707 Bytes

Training in progress, step 25 20 days ago
chat_template.jinja

4.17 kB

Training in progress, step 25 20 days ago
config.json

1.36 kB

Training in progress, step 25 20 days ago
merges.txt

1.67 MB

Training in progress, step 25 20 days ago
model.safetensors

4.06 GB
xet

Training in progress, step 225 2 days ago
special_tokens_map.json

613 Bytes

Training in progress, step 25 20 days ago
tokenizer.json

11.4 MB
xet

Training in progress, step 25 20 days ago
tokenizer_config.json

5.51 kB

Training in progress, step 25 20 days ago
training_args.bin
Detected Pickle imports (14)
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.trainer_utils.SchedulerType",
- "torch.bfloat16",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.integrations.deepspeed.HfDeepSpeedConfig",
- "transformers.trainer_utils.HubStrategy",
- "transformers.integrations.deepspeed.HfTrainerDeepSpeedConfig",
- "transformers.trainer_utils.SaveStrategy",
- "transformers.training_args.OptimizerNames",
- "accelerate.utils.dataclasses.DeepSpeedPlugin",
- "torch.device",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "open_r1.configs.GRPOConfig",
- "accelerate.state.PartialState"
How to fix it?
8.98 kB
xet

Training in progress, step 75 16 days ago
vocab.json

2.78 MB

Training in progress, step 25 20 days ago