Upload folder using huggingface_hub

Browse files

Files changed (8) hide show

assets/tokenizer/vocabulary.txt +0 -0
config.json +11 -10
metadata.json +2 -2
model.weights.h5 +2 -2
preprocessor.json +16 -12
task.json +34 -26
task.weights.h5 +3 -0
tokenizer.json +10 -5

assets/tokenizer/vocabulary.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

config.json CHANGED Viewed

@@ -1,16 +1,17 @@
 {
-    "module": "keras_nlp.src.models.gpt2.gpt2_backbone",
-    "class_name": "GPT2Backbone",
     "config": {
-        "name": "gpt2_backbone",
         "trainable": true,
-        "vocabulary_size": 50257,
-        "num_layers": 12,
-        "num_heads": 12,
-        "hidden_dim": 768,
-        "intermediate_dim": 3072,
         "dropout": 0.1,
-        "max_sequence_length": 1024
     },
-    "registered_name": "keras_nlp>GPT2Backbone"
 }

 {
+    "module": "keras_nlp.src.models.bert.bert_backbone",
+    "class_name": "BertBackbone",
     "config": {
+        "name": "bert_backbone",
         "trainable": true,
+        "vocabulary_size": 30522,
+        "num_layers": 2,
+        "num_heads": 2,
+        "hidden_dim": 128,
+        "intermediate_dim": 512,
         "dropout": 0.1,
+        "max_sequence_length": 512,
+        "num_segments": 2
     },
+    "registered_name": "keras_nlp>BertBackbone"
 }

metadata.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
     "keras_version": "3.3.3",
     "keras_nlp_version": "0.10.0",
-    "parameter_count": 124439808,
-    "date_saved": "2024-05-02@01:13:08"
 }

 {
     "keras_version": "3.3.3",
     "keras_nlp_version": "0.10.0",
+    "parameter_count": 4385920,
+    "date_saved": "2024-05-02@01:15:04"
 }

model.weights.h5 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:73faf6047a426161b11cb2a39ff951e04e42e6fc756038fef31b32e3a631b699
-size 498160592

 version https://git-lfs.github.com/spec/v1
+oid sha256:6cd686cb39d95b258d02990e71512600d26c06e902f3b2f7d9ec1a6e4f559efc
+size 17632104

preprocessor.json CHANGED Viewed

@@ -1,25 +1,29 @@
 {
-    "module": "keras_nlp.src.models.gpt2.gpt2_causal_lm_preprocessor",
-    "class_name": "GPT2CausalLMPreprocessor",
     "config": {
-        "name": "gpt2_causal_lm_preprocessor",
         "trainable": true,
         "dtype": "float32",
         "tokenizer": {
-            "module": "keras_nlp.src.models.gpt2.gpt2_tokenizer",
-            "class_name": "GPT2Tokenizer",
             "config": {
-                "name": "gpt2_tokenizer",
                 "trainable": true,
                 "dtype": "int32",
                 "sequence_length": null,
-                "add_prefix_space": false
             },
-            "registered_name": "keras_nlp>GPT2Tokenizer"
         },
-        "sequence_length": 1024,
-        "add_start_token": true,
-        "add_end_token": true
     },
-    "registered_name": "keras_nlp>GPT2CausalLMPreprocessor"
 }

 {
+    "module": "keras_nlp.src.models.bert.bert_preprocessor",
+    "class_name": "BertPreprocessor",
     "config": {
+        "name": "bert_preprocessor",
         "trainable": true,
         "dtype": "float32",
         "tokenizer": {
+            "module": "keras_nlp.src.models.bert.bert_tokenizer",
+            "class_name": "BertTokenizer",
             "config": {
+                "name": "bert_tokenizer",
                 "trainable": true,
                 "dtype": "int32",
+                "vocabulary": null,
                 "sequence_length": null,
+                "lowercase": true,
+                "strip_accents": false,
+                "split": true,
+                "suffix_indicator": "##",
+                "oov_token": "[UNK]"
             },
+            "registered_name": "keras_nlp>BertTokenizer"
         },
+        "sequence_length": 512,
+        "truncate": "round_robin"
     },
+    "registered_name": "keras_nlp>BertPreprocessor"
 }

task.json CHANGED Viewed

@@ -1,49 +1,57 @@
 {
-    "module": "keras_nlp.src.models.gpt2.gpt2_causal_lm",
-    "class_name": "GPT2CausalLM",
     "config": {
         "backbone": {
-            "module": "keras_nlp.src.models.gpt2.gpt2_backbone",
-            "class_name": "GPT2Backbone",
             "config": {
-                "name": "gpt2_backbone",
                 "trainable": true,
-                "vocabulary_size": 50257,
-                "num_layers": 12,
-                "num_heads": 12,
-                "hidden_dim": 768,
-                "intermediate_dim": 3072,
                 "dropout": 0.1,
-                "max_sequence_length": 1024
             },
-            "registered_name": "keras_nlp>GPT2Backbone"
         },
         "preprocessor": {
-            "module": "keras_nlp.src.models.gpt2.gpt2_causal_lm_preprocessor",
-            "class_name": "GPT2CausalLMPreprocessor",
             "config": {
-                "name": "gpt2_causal_lm_preprocessor",
                 "trainable": true,
                 "dtype": "float32",
                 "tokenizer": {
-                    "module": "keras_nlp.src.models.gpt2.gpt2_tokenizer",
-                    "class_name": "GPT2Tokenizer",
                     "config": {
-                        "name": "gpt2_tokenizer",
                         "trainable": true,
                         "dtype": "int32",
                         "sequence_length": null,
-                        "add_prefix_space": false
                     },
-                    "registered_name": "keras_nlp>GPT2Tokenizer"
                 },
-                "sequence_length": 1024,
-                "add_start_token": true,
-                "add_end_token": true
             },
-            "registered_name": "keras_nlp>GPT2CausalLMPreprocessor"
         },
-        "name": "gpt2_causal_lm"
     },
-    "registered_name": "keras_nlp>GPT2CausalLM"
 }

 {
+    "module": "keras_nlp.src.models.bert.bert_classifier",
+    "class_name": "BertClassifier",
     "config": {
         "backbone": {
+            "module": "keras_nlp.src.models.bert.bert_backbone",
+            "class_name": "BertBackbone",
             "config": {
+                "name": "bert_backbone",
                 "trainable": true,
+                "vocabulary_size": 30522,
+                "num_layers": 2,
+                "num_heads": 2,
+                "hidden_dim": 128,
+                "intermediate_dim": 512,
                 "dropout": 0.1,
+                "max_sequence_length": 512,
+                "num_segments": 2
             },
+            "registered_name": "keras_nlp>BertBackbone"
         },
         "preprocessor": {
+            "module": "keras_nlp.src.models.bert.bert_preprocessor",
+            "class_name": "BertPreprocessor",
             "config": {
+                "name": "bert_preprocessor",
                 "trainable": true,
                 "dtype": "float32",
                 "tokenizer": {
+                    "module": "keras_nlp.src.models.bert.bert_tokenizer",
+                    "class_name": "BertTokenizer",
                     "config": {
+                        "name": "bert_tokenizer",
                         "trainable": true,
                         "dtype": "int32",
+                        "vocabulary": null,
                         "sequence_length": null,
+                        "lowercase": true,
+                        "strip_accents": false,
+                        "split": true,
+                        "suffix_indicator": "##",
+                        "oov_token": "[UNK]"
                     },
+                    "registered_name": "keras_nlp>BertTokenizer"
                 },
+                "sequence_length": 512,
+                "truncate": "round_robin"
             },
+            "registered_name": "keras_nlp>BertPreprocessor"
         },
+        "name": "bert_classifier",
+        "num_classes": 2,
+        "activation": "linear",
+        "dropout": 0.1
     },
+    "registered_name": "keras_nlp>BertClassifier"
 }

task.weights.h5 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bb6e04f49859cc11d6fe47a002594165a9082f5e13182fe60a0b83575c10b439
+size 52766840

tokenizer.json CHANGED Viewed

@@ -1,12 +1,17 @@
 {
-    "module": "keras_nlp.src.models.gpt2.gpt2_tokenizer",
-    "class_name": "GPT2Tokenizer",
     "config": {
-        "name": "gpt2_tokenizer",
         "trainable": true,
         "dtype": "int32",
         "sequence_length": null,
-        "add_prefix_space": false
     },
-    "registered_name": "keras_nlp>GPT2Tokenizer"
 }

 {
+    "module": "keras_nlp.src.models.bert.bert_tokenizer",
+    "class_name": "BertTokenizer",
     "config": {
+        "name": "bert_tokenizer",
         "trainable": true,
         "dtype": "int32",
+        "vocabulary": null,
         "sequence_length": null,
+        "lowercase": true,
+        "strip_accents": false,
+        "split": true,
+        "suffix_indicator": "##",
+        "oov_token": "[UNK]"
     },
+    "registered_name": "keras_nlp>BertTokenizer"
 }