Upload 9 files

Browse files

Files changed (9) hide show

config.json +82 -0
model.safetensors +3 -0
optimizer.pt +3 -0
preprocessor_config.json +11 -0
rng_state.pth +3 -0
scaler.pt +3 -0
scheduler.pt +3 -0
trainer_state.json +401 -0
training_args.bin +3 -0

config.json ADDED Viewed

	@@ -0,0 +1,82 @@

+{
+  "_name_or_path": "facebook/w2v-bert-2.0",
+  "activation_dropout": 0.0,
+  "adapter_act": "relu",
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": true,
+  "apply_spec_augment": false,
+  "architectures": [
+    "Wav2Vec2BertForCTC"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 768,
+  "codevector_dim": 768,
+  "conformer_conv_dropout": 0.1,
+  "contrastive_logits_temperature": 0.1,
+  "conv_depthwise_kernel_size": 31,
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": true,
+  "diversity_loss_weight": 0.1,
+  "eos_token_id": 2,
+  "feat_proj_dropout": 0.0,
+  "feat_quantizer_dropout": 0.0,
+  "feature_projection_input_dim": 160,
+  "final_dropout": 0.1,
+  "hidden_act": "swish",
+  "hidden_dropout": 0.1,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.1,
+  "left_max_position_embeddings": 64,
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_prob": 0.05,
+  "max_source_positions": 5000,
+  "model_type": "wav2vec2-bert",
+  "num_adapter_layers": 1,
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "output_hidden_size": 1024,
+  "pad_token_id": 10,
+  "position_embeddings_type": "relative_key",
+  "proj_codevector_dim": 768,
+  "right_max_position_embeddings": 8,
+  "rotary_embedding_base": 10000,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.49.0",
+  "use_intermediate_ffn_before_adapter": false,
+  "use_weighted_layer_sum": false,
+  "vocab_size": 121,
+  "xvector_output_dim": 512
+}

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fe3f69ea60011292e84ab93b103a62e1fce63b30f017aff547a4bdab44ad8597
+size 2423314860

optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:27cfd8f3eb4f93d3708b58b75ac0aab026a11983d182ce8e71348c3029cc50c5
+size 4847082090

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,11 @@

+{
+  "feature_extractor_type": "SeamlessM4TFeatureExtractor",
+  "feature_size": 80,
+  "num_mel_bins": 80,
+  "padding_side": "right",
+  "padding_value": 1,
+  "processor_class": "Wav2Vec2BertProcessor",
+  "return_attention_mask": true,
+  "sampling_rate": 16000,
+  "stride": 2
+}

rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6776dffe13e7ea552ae69e8260f4c497e5ee6ac9a084534a89cacd6b0a0bdf13
+size 14244

scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:31ee2633ecfe9c976e676fd6a2873f9f50962a60410ec4ea8bca55113c97dd18
+size 988

scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ee5fa6b4c0f6eef770da13676691943657574e184c6e6df83c6c1388b333cab2
+size 1064

trainer_state.json ADDED Viewed

	@@ -0,0 +1,401 @@

+{
+  "best_metric": 0.2302779592132956,
+  "best_model_checkpoint": "Bengali_wav2vec2_bert_punct\\checkpoint-230000",
+  "epoch": 4.0,
+  "eval_steps": 10000,
+  "global_step": 232060,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.17236921485822632,
+      "grad_norm": 4.759167671203613,
+      "learning_rate": 4.79499913629297e-05,
+      "loss": 1.4067,
+      "step": 10000
+    },
+    {
+      "epoch": 0.17236921485822632,
+      "eval_WER": 0.40140793961825966,
+      "eval_loss": 0.3006719648838043,
+      "eval_runtime": 76.2909,
+      "eval_samples_per_second": 39.323,
+      "eval_steps_per_second": 4.915,
+      "step": 10000
+    },
+    {
+      "epoch": 0.34473842971645263,
+      "grad_norm": 3.7281529903411865,
+      "learning_rate": 4.5791371566764555e-05,
+      "loss": 1.0498,
+      "step": 20000
+    },
+    {
+      "epoch": 0.34473842971645263,
+      "eval_WER": 0.35401698236446766,
+      "eval_loss": 0.24728824198246002,
+      "eval_runtime": 78.6228,
+      "eval_samples_per_second": 38.157,
+      "eval_steps_per_second": 4.77,
+      "step": 20000
+    },
+    {
+      "epoch": 0.517107644574679,
+      "grad_norm": 3.5825536251068115,
+      "learning_rate": 4.363253584384177e-05,
+      "loss": 0.9196,
+      "step": 30000
+    },
+    {
+      "epoch": 0.517107644574679,
+      "eval_WER": 0.3367080339647289,
+      "eval_loss": 0.22603251039981842,
+      "eval_runtime": 77.3702,
+      "eval_samples_per_second": 38.775,
+      "eval_steps_per_second": 4.847,
+      "step": 30000
+    },
+    {
+      "epoch": 0.6894768594329053,
+      "grad_norm": 5.719975471496582,
+      "learning_rate": 4.147434790119192e-05,
+      "loss": 0.8347,
+      "step": 40000
+    },
+    {
+      "epoch": 0.6894768594329053,
+      "eval_WER": 0.32026997605051166,
+      "eval_loss": 0.1984129399061203,
+      "eval_runtime": 76.0573,
+      "eval_samples_per_second": 39.444,
+      "eval_steps_per_second": 4.93,
+      "step": 40000
+    },
+    {
+      "epoch": 0.8618460742911316,
+      "grad_norm": 12.707213401794434,
+      "learning_rate": 3.931594403178442e-05,
+      "loss": 0.7728,
+      "step": 50000
+    },
+    {
+      "epoch": 0.8618460742911316,
+      "eval_WER": 0.30205385006168806,
+      "eval_loss": 0.18471553921699524,
+      "eval_runtime": 77.2641,
+      "eval_samples_per_second": 38.828,
+      "eval_steps_per_second": 4.853,
+      "step": 50000
+    },
+    {
+      "epoch": 1.034215289149358,
+      "grad_norm": 2.484391689300537,
+      "learning_rate": 3.715732423561928e-05,
+      "loss": 0.7257,
+      "step": 60000
+    },
+    {
+      "epoch": 1.034215289149358,
+      "eval_WER": 0.29552217142027726,
+      "eval_loss": 0.17463411390781403,
+      "eval_runtime": 77.8642,
+      "eval_samples_per_second": 38.529,
+      "eval_steps_per_second": 4.816,
+      "step": 60000
+    },
+    {
+      "epoch": 1.2065845040075842,
+      "grad_norm": 2.728205680847168,
+      "learning_rate": 3.4999136292969425e-05,
+      "loss": 0.6895,
+      "step": 70000
+    },
+    {
+      "epoch": 1.2065845040075842,
+      "eval_WER": 0.2906596995427825,
+      "eval_loss": 0.16489063203334808,
+      "eval_runtime": 85.1263,
+      "eval_samples_per_second": 35.242,
+      "eval_steps_per_second": 4.405,
+      "step": 70000
+    },
+    {
+      "epoch": 1.3789537188658105,
+      "grad_norm": 3.63918399810791,
+      "learning_rate": 3.284030057004664e-05,
+      "loss": 0.6653,
+      "step": 80000
+    },
+    {
+      "epoch": 1.3789537188658105,
+      "eval_WER": 0.28917192829668337,
+      "eval_loss": 0.16142985224723816,
+      "eval_runtime": 77.5124,
+      "eval_samples_per_second": 38.704,
+      "eval_steps_per_second": 4.838,
+      "step": 80000
+    },
+    {
+      "epoch": 1.5513229337240368,
+      "grad_norm": 3.3453214168548584,
+      "learning_rate": 3.06816807738815e-05,
+      "loss": 0.6418,
+      "step": 90000
+    },
+    {
+      "epoch": 1.5513229337240368,
+      "eval_WER": 0.2765440162566224,
+      "eval_loss": 0.1598576009273529,
+      "eval_runtime": 77.4372,
+      "eval_samples_per_second": 38.741,
+      "eval_steps_per_second": 4.843,
+      "step": 90000
+    },
+    {
+      "epoch": 1.7236921485822632,
+      "grad_norm": 3.1832072734832764,
+      "learning_rate": 2.8523492831231646e-05,
+      "loss": 0.6241,
+      "step": 100000
+    },
+    {
+      "epoch": 1.7236921485822632,
+      "eval_WER": 0.2766165904637492,
+      "eval_loss": 0.14717546105384827,
+      "eval_runtime": 77.4687,
+      "eval_samples_per_second": 38.725,
+      "eval_steps_per_second": 4.841,
+      "step": 100000
+    },
+    {
+      "epoch": 1.8960613634404895,
+      "grad_norm": 4.113869667053223,
+      "learning_rate": 2.6364873035066505e-05,
+      "loss": 0.6092,
+      "step": 110000
+    },
+    {
+      "epoch": 1.8960613634404895,
+      "eval_WER": 0.26765367588359096,
+      "eval_loss": 0.1441964954137802,
+      "eval_runtime": 77.6139,
+      "eval_samples_per_second": 38.653,
+      "eval_steps_per_second": 4.832,
+      "step": 110000
+    },
+    {
+      "epoch": 2.068430578298716,
+      "grad_norm": 1.85727858543396,
+      "learning_rate": 2.4206253238901367e-05,
+      "loss": 0.5805,
+      "step": 120000
+    },
+    {
+      "epoch": 2.068430578298716,
+      "eval_WER": 0.26322664924885697,
+      "eval_loss": 0.13760210573673248,
+      "eval_runtime": 77.692,
+      "eval_samples_per_second": 38.614,
+      "eval_steps_per_second": 4.827,
+      "step": 120000
+    },
+    {
+      "epoch": 2.2407997931569423,
+      "grad_norm": 2.774275779724121,
+      "learning_rate": 2.204741751597858e-05,
+      "loss": 0.5611,
+      "step": 130000
+    },
+    {
+      "epoch": 2.2407997931569423,
+      "eval_WER": 0.2587633355105595,
+      "eval_loss": 0.1326003223657608,
+      "eval_runtime": 75.6029,
+      "eval_samples_per_second": 39.681,
+      "eval_steps_per_second": 4.96,
+      "step": 130000
+    },
+    {
+      "epoch": 2.4131690080151684,
+      "grad_norm": 1.8835299015045166,
+      "learning_rate": 1.9889013646571085e-05,
+      "loss": 0.5433,
+      "step": 140000
+    },
+    {
+      "epoch": 2.4131690080151684,
+      "eval_WER": 0.2550983380506568,
+      "eval_loss": 0.12959806621074677,
+      "eval_runtime": 75.9556,
+      "eval_samples_per_second": 39.497,
+      "eval_steps_per_second": 4.937,
+      "step": 140000
+    },
+    {
+      "epoch": 2.585538222873395,
+      "grad_norm": 2.7739031314849854,
+      "learning_rate": 1.773060977716359e-05,
+      "loss": 0.5315,
+      "step": 150000
+    },
+    {
+      "epoch": 2.585538222873395,
+      "eval_WER": 0.2523405181798389,
+      "eval_loss": 0.12333784997463226,
+      "eval_runtime": 75.6489,
+      "eval_samples_per_second": 39.657,
+      "eval_steps_per_second": 4.957,
+      "step": 150000
+    },
+    {
+      "epoch": 2.757907437731621,
+      "grad_norm": 5.59724235534668,
+      "learning_rate": 1.5572421834513734e-05,
+      "loss": 0.5192,
+      "step": 160000
+    },
+    {
+      "epoch": 2.757907437731621,
+      "eval_WER": 0.2465708687132593,
+      "eval_loss": 0.11873666197061539,
+      "eval_runtime": 75.813,
+      "eval_samples_per_second": 39.571,
+      "eval_steps_per_second": 4.946,
+      "step": 160000
+    },
+    {
+      "epoch": 2.9302766525898476,
+      "grad_norm": 1.7511285543441772,
+      "learning_rate": 1.3413802038348594e-05,
+      "loss": 0.508,
+      "step": 170000
+    },
+    {
+      "epoch": 2.9302766525898476,
+      "eval_WER": 0.24355903911749763,
+      "eval_loss": 0.11491911858320236,
+      "eval_runtime": 76.2555,
+      "eval_samples_per_second": 39.341,
+      "eval_steps_per_second": 4.918,
+      "step": 170000
+    },
+    {
+      "epoch": 3.1026458674480737,
+      "grad_norm": 1.3240278959274292,
+      "learning_rate": 1.1255830022456384e-05,
+      "loss": 0.4885,
+      "step": 180000
+    },
+    {
+      "epoch": 3.1026458674480737,
+      "eval_WER": 0.24315988097830032,
+      "eval_loss": 0.11166874319314957,
+      "eval_runtime": 77.1138,
+      "eval_samples_per_second": 38.904,
+      "eval_steps_per_second": 4.863,
+      "step": 180000
+    },
+    {
+      "epoch": 3.2750150823063002,
+      "grad_norm": 1.0281517505645752,
+      "learning_rate": 9.096994299533598e-06,
+      "loss": 0.4709,
+      "step": 190000
+    },
+    {
+      "epoch": 3.2750150823063002,
+      "eval_WER": 0.23887800275781987,
+      "eval_loss": 0.10879674553871155,
+      "eval_runtime": 77.1588,
+      "eval_samples_per_second": 38.881,
+      "eval_steps_per_second": 4.86,
+      "step": 190000
+    },
+    {
+      "epoch": 3.4473842971645263,
+      "grad_norm": 2.2434046268463135,
+      "learning_rate": 6.938590430126101e-06,
+      "loss": 0.4669,
+      "step": 200000
+    },
+    {
+      "epoch": 3.4473842971645263,
+      "eval_WER": 0.23492270846940996,
+      "eval_loss": 0.10604960471391678,
+      "eval_runtime": 77.0841,
+      "eval_samples_per_second": 38.919,
+      "eval_steps_per_second": 4.865,
+      "step": 200000
+    },
+    {
+      "epoch": 3.619753512022753,
+      "grad_norm": 0.7335111498832703,
+      "learning_rate": 4.780186560718605e-06,
+      "loss": 0.451,
+      "step": 210000
+    },
+    {
+      "epoch": 3.619753512022753,
+      "eval_WER": 0.23452355033021263,
+      "eval_loss": 0.10134341567754745,
+      "eval_runtime": 77.1143,
+      "eval_samples_per_second": 38.903,
+      "eval_steps_per_second": 4.863,
+      "step": 210000
+    },
+    {
+      "epoch": 3.792122726880979,
+      "grad_norm": 1.7208735942840576,
+      "learning_rate": 2.6215667645534633e-06,
+      "loss": 0.445,
+      "step": 220000
+    },
+    {
+      "epoch": 3.792122726880979,
+      "eval_WER": 0.2329632048769867,
+      "eval_loss": 0.10342755168676376,
+      "eval_runtime": 77.7151,
+      "eval_samples_per_second": 38.603,
+      "eval_steps_per_second": 4.825,
+      "step": 220000
+    },
+    {
+      "epoch": 3.9644919417392055,
+      "grad_norm": 1.0953819751739502,
+      "learning_rate": 4.6316289514596653e-07,
+      "loss": 0.4379,
+      "step": 230000
+    },
+    {
+      "epoch": 3.9644919417392055,
+      "eval_WER": 0.2302779592132956,
+      "eval_loss": 0.09944533556699753,
+      "eval_runtime": 78.1453,
+      "eval_samples_per_second": 38.39,
+      "eval_steps_per_second": 4.799,
+      "step": 230000
+    }
+  ],
+  "logging_steps": 10000,
+  "max_steps": 232060,
+  "num_input_tokens_seen": 0,
+  "num_train_epochs": 4,
+  "save_steps": 10000,
+  "stateful_callbacks": {
+    "TrainerControl": {
+      "args": {
+        "should_epoch_stop": false,
+        "should_evaluate": false,
+        "should_log": false,
+        "should_save": true,
+        "should_training_stop": true
+      },
+      "attributes": {}
+    }
+  },
+  "total_flos": 4.7334394582539475e+20,
+  "train_batch_size": 8,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:26dffa834fdd7c5b630dd22f4c0b5efd73ad1ae918e2a4b5a2e02f9475aa5335
+size 5304