Training in progress, epoch 1, checkpoint

Files changed (14) hide show

last-checkpoint/config.json ADDED Viewed

+{
+  "_name_or_path": "microsoft/mdeberta-v3-base",
+  "architectures": [
+    "DebertaV2ForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-07,
+  "max_position_embeddings": 512,
+  "max_relative_positions": -1,
+  "model_type": "deberta-v2",
+  "norm_rel_ebd": "layer_norm",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 0,
+  "pooler_dropout": 0,
+  "pooler_hidden_act": "gelu",
+  "pooler_hidden_size": 768,
+  "pos_att_type": [
+    "p2c",
+    "c2p"
+  ],
+  "position_biased_input": false,
+  "position_buckets": 256,
+  "relative_attention": true,
+  "share_att_key": true,
+  "torch_dtype": "float32",
+  "transformers_version": "4.39.1",
+  "type_vocab_size": 0,
+  "vocab_size": 251000
+}

last-checkpoint/model.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:89c03989f75d0aa4bd09aa494db2abf9fdb0699814577f09a2b8630feeff3136
+size 1115268200

last-checkpoint/optimizer.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:122128e68accfbfaa61106e4a08a7177da6af52b3b3da0e1b17c0c52f40ef1dc
+size 2230655994

last-checkpoint/rng_state_0.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:21c2e0a4cab570225070feda692b2162a9b40fcabdd5637926e2d942260865f5
+size 15984

last-checkpoint/rng_state_1.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:719551c691645b80be6d64346b6b37cbcf1c3bcf115735210b293531a14241f1
+size 15984

last-checkpoint/rng_state_2.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:e1abbaa3e61df15650b0b8d5e31d1765de2d084229bfb2c0930169fd3f38b650
+size 15984

last-checkpoint/rng_state_3.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:697b606be1130775bd88ffdee4a1649261f6a26edeb2e1eb8717d55a9b3c7246
+size 15984

last-checkpoint/rng_state_4.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:2308ce4ffc571a690001de8ba0878d90739f84e4e4454d446e6a0d99a5cf7725
+size 15984

last-checkpoint/rng_state_5.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:a9979034fcf548b3e23fd45a62872fd7ef6105dc04e4dd23df2112f398552a57
+size 15984

last-checkpoint/rng_state_6.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:449907656080f489d0957ade04723380fc9c1022cbe70db248bd76c2479b6cb3
+size 15984

last-checkpoint/rng_state_7.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:4d07c008bd2cdb25b485adf5e638dba6920e10d6fcd21f404a65d134bb5f6bf5
+size 15984

last-checkpoint/scheduler.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:cd329b76d03f410648ef363897eabe18ec0afb682154549bd5a0ea9c20f875eb
+size 1064

last-checkpoint/trainer_state.json ADDED Viewed

+{
+  "best_metric": 0.5555555524691358,
+  "best_model_checkpoint": "checkpoint/cross_encoder_20250522_full_data/checkpoint-1",
+  "epoch": 1.0,
+  "eval_steps": 500,
+  "global_step": 1,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "grad_norm": 3.537013292312622,
+      "learning_rate": 1e-06,
+      "loss": 0.7455,
+      "step": 1
+    },
+    {
+      "epoch": 1.0,
+      "eval_f2": 0.5555555524691358,
+      "eval_loss": 0.6809892654418945,
+      "eval_precision": 0.2,
+      "eval_recall": 1.0,
+      "eval_runtime": 0.1671,
+      "eval_samples_per_second": 59.844,
+      "eval_steps_per_second": 5.984,
+      "step": 1
+    }
+  ],
+  "logging_steps": 200,
+  "max_steps": 2,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 2,
+  "save_steps": 500,
+  "total_flos": 16839409139712.0,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

last-checkpoint/training_args.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:8c35a0a052756eed7c3a8019317fe0fdeda73d19c1f4811fdf8efcef22ec1a7d
+size 5048