neopolita
/

qwen2.5-3b-instruct-numinamath-tir-100p-lr16-la32-qkvo-gspo-x4

Generated from Trainer

Model card Files Files and versions Community

qwen2.5-3b-instruct-numinamath-tir-100p-lr16-la32-qkvo-gspo-x4

Ctrl+K

Ctrl+K

1 contributor

History: 58 commits

neopolita's picture

Training in progress, step 565

d91a77e verified 24 days ago

.gitattributes

1.57 kB

Training in progress, step 10 24 days ago
README.md

2.15 kB

Training in progress, step 10 24 days ago
adapter_config.json

857 Bytes

Training in progress, step 10 24 days ago
adapter_model.safetensors

29.5 MB
LFS

Training in progress, step 565 24 days ago
added_tokens.json

605 Bytes

Training in progress, step 10 24 days ago
chat_template.jinja

2.51 kB

Training in progress, step 10 24 days ago
merges.txt

1.67 MB

Training in progress, step 10 24 days ago
special_tokens_map.json

613 Bytes

Training in progress, step 10 24 days ago
tokenizer.json

11.4 MB
LFS

Training in progress, step 10 24 days ago
tokenizer_config.json

4.69 kB

Training in progress, step 10 24 days ago
training_args.bin
Detected Pickle imports (10)
- "torch.device",
- "accelerate.state.PartialState",
- "transformers.trainer_utils.SaveStrategy",
- "transformers.trainer_utils.HubStrategy",
- "trl.trainer.grpo_config.GRPOConfig",
- "transformers.trainer_utils.IntervalStrategy",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_utils.SchedulerType",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.training_args.OptimizerNames"
How to fix it?
7.06 kB
LFS

Training in progress, step 10 24 days ago
vocab.json

2.78 MB

Training in progress, step 10 24 days ago