maybe last groot model?

Browse files

Files changed (10) hide show

checkpoint-20000/config.json +65 -0
checkpoint-20000/experiment_cfg/metadata.json +467 -0
checkpoint-20000/model-00001-of-00002.safetensors +3 -0
checkpoint-20000/model-00002-of-00002.safetensors +3 -0
checkpoint-20000/model.safetensors.index.json +809 -0
checkpoint-20000/optimizer.pt +3 -0
checkpoint-20000/rng_state.pth +3 -0
checkpoint-20000/scheduler.pt +3 -0
checkpoint-20000/trainer_state.json +0 -0
experiment_cfg/metadata.json +467 -0

checkpoint-20000/config.json ADDED Viewed

	@@ -0,0 +1,65 @@

+{
+  "_name_or_path": "/home/ubuntu/.cache/huggingface/hub/models--nvidia--GR00T-N1-2B/snapshots/32e1fd2507f7739fad443e6b449c8188e0e02fcb",
+  "action_dim": 32,
+  "action_head_cfg": {
+    "action_dim": 32,
+    "action_horizon": 16,
+    "add_pos_embed": true,
+    "diffusion_model_cfg": {
+      "attention_head_dim": 48,
+      "dropout": 0.2,
+      "final_dropout": true,
+      "interleave_self_attention": true,
+      "norm_type": "ada_norm",
+      "num_attention_heads": 32,
+      "num_layers": 16,
+      "output_dim": 1024,
+      "positional_embeddings": null
+    },
+    "freeze_decode_layer": false,
+    "hidden_size": 1024,
+    "input_embedding_dim": 1536,
+    "load_pretrained_det_decode_layer_path": null,
+    "max_action_dim": 32,
+    "max_state_dim": 64,
+    "model_dtype": "float32",
+    "noise_beta_alpha": 1.5,
+    "noise_beta_beta": 1.0,
+    "noise_s": 0.999,
+    "num_inference_timesteps": 16,
+    "num_timestep_buckets": 1000,
+    "tune_diffusion_model": true,
+    "tune_projector": true
+  },
+  "action_horizon": 16,
+  "architectures": [
+    "GR00T_N1"
+  ],
+  "attn_implementation": null,
+  "backbone_cfg": {
+    "allow_reshape_visual": true,
+    "load_pretrained_det_eagle_path": null,
+    "model_name": "$GR00T_BACKBONE_PATH/eagle2_hg_model",
+    "processor_cfg": {
+      "max_input_tiles": 1,
+      "model_path": "$GR00T_BACKBONE_PATH/eagle2_hg_model",
+      "model_spec": {
+        "num_image_token": 64,
+        "template": "qwen2-chat"
+      }
+    },
+    "projector_dim": 2048,
+    "remove_llm": false,
+    "reproject_vision": false,
+    "scale_image_resolution": 1,
+    "select_layer": 12,
+    "tune_llm": false,
+    "tune_visual": true
+  },
+  "compute_dtype": "bfloat16",
+  "hidden_size": 1536,
+  "model_dtype": "float32",
+  "model_type": "gr00t_n1",
+  "torch_dtype": "float32",
+  "transformers_version": "4.45.2"
+}

checkpoint-20000/experiment_cfg/metadata.json ADDED Viewed

	@@ -0,0 +1,467 @@

+{
+    "new_embodiment": {
+        "statistics": {
+            "state": {
+                "franka_eef_pos": {
+                    "max": [
+                        0.690919041633606,
+                        0.2623455822467804,
+                        0.4056587219238281
+                    ],
+                    "min": [
+                        0.28664281964302063,
+                        -0.2571396827697754,
+                        0.11134574562311172
+                    ],
+                    "mean": [
+                        0.4634382128715515,
+                        0.0848732516169548,
+                        0.2357439547777176
+                    ],
+                    "std": [
+                        0.07045646756887436,
+                        0.09220043569803238,
+                        0.05206894874572754
+                    ],
+                    "q01": [
+                        0.31849947571754456,
+                        -0.1664549469947815,
+                        0.13728147149085998
+                    ],
+                    "q99": [
+                        0.6351520419120789,
+                        0.23361742496490479,
+                        0.36140872240066513
+                    ]
+                },
+                "franka_eef_6d_rot": {
+                    "max": [
+                        0.9877848625183105,
+                        0.7002321481704712,
+                        0.8402191996574402,
+                        0.7514026165008545,
+                        0.8680896759033203,
+                        0.9978066086769104
+                    ],
+                    "min": [
+                        -0.9991759061813354,
+                        -0.999967098236084,
+                        -0.4956780970096588,
+                        -0.8792480230331421,
+                        -0.7835543155670166,
+                        0.2781556248664856
+                    ],
+                    "mean": [
+                        0.12430186569690704,
+                        -0.5880382061004639,
+                        0.3773862421512604,
+                        -0.4543558657169342,
+                        0.18046835064888,
+                        0.7508696913719177
+                    ],
+                    "std": [
+                        0.49978262186050415,
+                        0.4465165138244629,
+                        0.21720384061336517,
+                        0.1877666860818863,
+                        0.37941059470176697,
+                        0.1341215819120407
+                    ],
+                    "q01": [
+                        -0.8600624442100525,
+                        -0.9967439651489258,
+                        -0.28675371408462524,
+                        -0.7474671840667725,
+                        -0.6014941692352295,
+                        0.4258335828781128
+                    ],
+                    "q99": [
+                        0.9392379403114319,
+                        0.5857639312744141,
+                        0.7270987868309021,
+                        0.19900349378585594,
+                        0.7900682091712949,
+                        0.972002387046814
+                    ]
+                },
+                "hand_joint_pos": {
+                    "max": [
+                        50.0,
+                        37.95140838623047,
+                        -15.636697769165039,
+                        -28.069446563720703,
+                        27.5,
+                        69.52964782714844,
+                        40.8275146484375,
+                        21.369964599609375,
+                        64.89373779296875,
+                        54.604087829589844,
+                        13.512350082397461,
+                        66.78776550292969,
+                        60.377662658691406,
+                        13.5,
+                        92.31311798095703,
+                        79.11392211914062
+                    ],
+                    "min": [
+                        -10.65101432800293,
+                        -28.00597381591797,
+                        -40.0,
+                        -40.0,
+                        -8.5,
+                        -6.483209609985352,
+                        -12.879666328430176,
+                        -12.5,
+                        -15.0,
+                        -4.245664596557617,
+                        -17.5,
+                        -15.0,
+                        -9.95943832397461,
+                        -22.5,
+                        -13.69697380065918,
+                        -15.0
+                    ],
+                    "mean": [
+                        37.9445686340332,
+                        -7.3860650062561035,
+                        -33.78374099731445,
+                        -38.54960632324219,
+                        -0.05513725429773331,
+                        32.388065338134766,
+                        14.628562927246094,
+                        -4.78059196472168,
+                        21.373214721679688,
+                        23.20292091369629,
+                        -8.092843055725098,
+                        22.910865783691406,
+                        23.602975845336914,
+                        -11.123340606689453,
+                        40.79413986206055,
+                        10.297532081604004
+                    ],
+                    "std": [
+                        12.184592247009277,
+                        5.354432106018066,
+                        5.950627326965332,
+                        1.916318655014038,
+                        7.077040672302246,
+                        17.607648849487305,
+                        11.312039375305176,
+                        4.351393699645996,
+                        17.957801818847656,
+                        13.184988021850586,
+                        4.607062816619873,
+                        22.36219024658203,
+                        12.939791679382324,
+                        9.088964462280273,
+                        25.48943328857422,
+                        12.344303131103516
+                    ],
+                    "q01": [
+                        9.505097961425783,
+                        -20.783349609375,
+                        -40.0,
+                        -40.0,
+                        -8.5,
+                        0.5165536880493167,
+                        -5.125764465332031,
+                        -12.5,
+                        -10.18576946258545,
+                        2.0945491790771484,
+                        -17.5,
+                        -14.958829307556153,
+                        1.9903202056884766,
+                        -22.5,
+                        -6.446310806274414,
+                        -10.32488956451416
+                    ],
+                    "q99": [
+                        50.0,
+                        7.9011306762695215,
+                        -20.968732833862312,
+                        -33.44684600830078,
+                        21.196063995361254,
+                        64.41703186035156,
+                        37.54317016601562,
+                        9.0063133239746,
+                        51.415377807617176,
+                        48.739594268798825,
+                        6.476033782958984,
+                        60.04581909179687,
+                        48.05571517944336,
+                        13.5,
+                        80.64421997070312,
+                        38.7237663269043
+                    ]
+                }
+            },
+            "action": {
+                "franka_eef_pos": {
+                    "max": [
+                        0.690919041633606,
+                        0.2623455822467804,
+                        0.4056587219238281
+                    ],
+                    "min": [
+                        0.28664281964302063,
+                        -0.2571396827697754,
+                        0.11134574562311172
+                    ],
+                    "mean": [
+                        0.46344804763793945,
+                        0.08499258756637573,
+                        0.23588033020496368
+                    ],
+                    "std": [
+                        0.07042189687490463,
+                        0.0919296145439148,
+                        0.05217698961496353
+                    ],
+                    "q01": [
+                        0.31849947571754456,
+                        -0.16346744000911712,
+                        0.13728147149085998
+                    ],
+                    "q99": [
+                        0.6351520419120789,
+                        0.23361742496490479,
+                        0.3619115889072418
+                    ]
+                },
+                "franka_eef_6d_rot": {
+                    "max": [
+                        0.9877848625183105,
+                        0.7002321481704712,
+                        0.8402191996574402,
+                        0.7484395503997803,
+                        0.8680896759033203,
+                        0.9978066086769104
+                    ],
+                    "min": [
+                        -0.9991759061813354,
+                        -0.999967098236084,
+                        -0.4956780970096588,
+                        -0.8792480230331421,
+                        -0.7835543155670166,
+                        0.2781556248664856
+                    ],
+                    "mean": [
+                        0.12383365631103516,
+                        -0.5891051888465881,
+                        0.37734243273735046,
+                        -0.45466047525405884,
+                        0.18076813220977783,
+                        0.7511017322540283
+                    ],
+                    "std": [
+                        0.49903711676597595,
+                        0.44640615582466125,
+                        0.21659795939922333,
+                        0.18666498363018036,
+                        0.37894150614738464,
+                        0.13424521684646606
+                    ],
+                    "q01": [
+                        -0.8555441498756409,
+                        -0.9967665910720825,
+                        -0.28509931564331054,
+                        -0.7474671840667725,
+                        -0.6008584141731262,
+                        0.4258335828781128
+                    ],
+                    "q99": [
+                        0.938888669013977,
+                        0.5857639312744141,
+                        0.726944625377655,
+                        0.18731310665607387,
+                        0.7900682091712949,
+                        0.97224383354187
+                    ]
+                },
+                "hand_joint_pos": {
+                    "max": [
+                        50.0,
+                        37.95140838623047,
+                        -15.636697769165039,
+                        -28.069446563720703,
+                        27.5,
+                        69.52964782714844,
+                        40.8275146484375,
+                        21.369964599609375,
+                        64.89373779296875,
+                        54.604087829589844,
+                        13.512350082397461,
+                        66.78776550292969,
+                        60.377662658691406,
+                        13.5,
+                        92.31311798095703,
+                        79.11392211914062
+                    ],
+                    "min": [
+                        -10.65101432800293,
+                        -28.00597381591797,
+                        -40.0,
+                        -40.0,
+                        -8.5,
+                        -6.483209609985352,
+                        -12.879666328430176,
+                        -12.5,
+                        -15.0,
+                        -4.245664596557617,
+                        -17.5,
+                        -15.0,
+                        -9.95943832397461,
+                        -22.5,
+                        -13.69697380065918,
+                        -15.0
+                    ],
+                    "mean": [
+                        37.93864440917969,
+                        -7.391177654266357,
+                        -33.79348373413086,
+                        -38.55232238769531,
+                        -0.05473555997014046,
+                        32.35673522949219,
+                        14.620677947998047,
+                        -4.785501956939697,
+                        21.34109878540039,
+                        23.186412811279297,
+                        -8.095688819885254,
+                        22.878921508789062,
+                        23.581470489501953,
+                        -11.136092185974121,
+                        40.77717590332031,
+                        10.275049209594727
+                    ],
+                    "std": [
+                        12.18165397644043,
+                        5.3397111892700195,
+                        5.951189994812012,
+                        1.9152079820632935,
+                        7.070333957672119,
+                        17.603782653808594,
+                        11.31222152709961,
+                        4.343321323394775,
+                        17.950090408325195,
+                        13.185937881469727,
+                        4.600419521331787,
+                        22.35536003112793,
+                        12.938926696777344,
+                        9.089351654052734,
+                        25.47988510131836,
+                        12.337271690368652
+                    ],
+                    "q01": [
+                        9.505097961425783,
+                        -20.783349609375,
+                        -40.0,
+                        -40.0,
+                        -8.5,
+                        0.5165536880493167,
+                        -5.124459075927734,
+                        -12.5,
+                        -10.193243598937988,
+                        2.088201141357422,
+                        -17.5,
+                        -14.958829307556153,
+                        1.9819808959960938,
+                        -22.5,
+                        -6.434903717041015,
+                        -10.33674659729004
+                    ],
+                    "q99": [
+                        50.0,
+                        7.776638031005849,
+                        -20.97244453430176,
+                        -33.451379394531266,
+                        21.13194656372068,
+                        64.40765533447265,
+                        37.54317016601562,
+                        8.97600440979,
+                        51.37096557617186,
+                        48.739594268798825,
+                        6.437651824951136,
+                        60.013037109375,
+                        48.05359802246093,
+                        13.5,
+                        80.64421997070312,
+                        38.68595123291007
+                    ]
+                }
+            }
+        },
+        "modalities": {
+            "video": {
+                "workspace_view": {
+                    "resolution": [
+                        224,
+                        224
+                    ],
+                    "channels": 3,
+                    "fps": 20.0
+                },
+                "wrist_view_palm": {
+                    "resolution": [
+                        224,
+                        224
+                    ],
+                    "channels": 3,
+                    "fps": 20.0
+                }
+            },
+            "state": {
+                "franka_eef_pos": {
+                    "absolute": true,
+                    "rotation_type": null,
+                    "shape": [
+                        3
+                    ],
+                    "continuous": true
+                },
+                "franka_eef_6d_rot": {
+                    "absolute": true,
+                    "rotation_type": null,
+                    "shape": [
+                        6
+                    ],
+                    "continuous": true
+                },
+                "hand_joint_pos": {
+                    "absolute": true,
+                    "rotation_type": null,
+                    "shape": [
+                        16
+                    ],
+                    "continuous": true
+                }
+            },
+            "action": {
+                "franka_eef_pos": {
+                    "absolute": true,
+                    "rotation_type": null,
+                    "shape": [
+                        3
+                    ],
+                    "continuous": true
+                },
+                "franka_eef_6d_rot": {
+                    "absolute": true,
+                    "rotation_type": null,
+                    "shape": [
+                        6
+                    ],
+                    "continuous": true
+                },
+                "hand_joint_pos": {
+                    "absolute": true,
+                    "rotation_type": null,
+                    "shape": [
+                        16
+                    ],
+                    "continuous": true
+                }
+            }
+        },
+        "embodiment_tag": "new_embodiment"
+    }
+}

checkpoint-20000/model-00001-of-00002.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:155d4a9f1d45b6de36b66469bde7e5040047003912eb64f6cf43f914facabbc0
+size 4938446392

checkpoint-20000/model-00002-of-00002.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c5b2cda549e8961c5627fbb01884916eddffe83bb2e0b1c88628b1279685d5e2
+size 3821736024

checkpoint-20000/model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,809 @@

+{
+  "metadata": {
+    "total_size": 8760067008
+  },
+  "weight_map": {
+    "action_head.action_decoder.layer1.W": "model-00002-of-00002.safetensors",
+    "action_head.action_decoder.layer1.b": "model-00002-of-00002.safetensors",
+    "action_head.action_decoder.layer2.W": "model-00002-of-00002.safetensors",
+    "action_head.action_decoder.layer2.b": "model-00002-of-00002.safetensors",
+    "action_head.action_encoder.W1.W": "model-00002-of-00002.safetensors",
+    "action_head.action_encoder.W1.b": "model-00002-of-00002.safetensors",
+    "action_head.action_encoder.W2.W": "model-00002-of-00002.safetensors",
+    "action_head.action_encoder.W2.b": "model-00002-of-00002.safetensors",
+    "action_head.action_encoder.W3.W": "model-00002-of-00002.safetensors",
+    "action_head.action_encoder.W3.b": "model-00002-of-00002.safetensors",
+    "action_head.model.proj_out_1.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.proj_out_1.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.proj_out_2.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.proj_out_2.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.timestep_encoder.timestep_embedder.linear_1.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.timestep_encoder.timestep_embedder.linear_1.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.timestep_encoder.timestep_embedder.linear_2.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.timestep_encoder.timestep_embedder.linear_2.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.0.attn1.to_k.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.0.attn1.to_k.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.0.attn1.to_out.0.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.0.attn1.to_out.0.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.0.attn1.to_q.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.0.attn1.to_q.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.0.attn1.to_v.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.0.attn1.to_v.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.0.ff.net.0.proj.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.0.ff.net.0.proj.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.0.ff.net.2.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.0.ff.net.2.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.0.norm1.linear.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.0.norm1.linear.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.1.attn1.to_k.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.1.attn1.to_k.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.1.attn1.to_out.0.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.1.attn1.to_out.0.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.1.attn1.to_q.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.1.attn1.to_q.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.1.attn1.to_v.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.1.attn1.to_v.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.1.ff.net.0.proj.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.1.ff.net.0.proj.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.1.ff.net.2.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.1.ff.net.2.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.1.norm1.linear.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.1.norm1.linear.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.10.attn1.to_k.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.10.attn1.to_k.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.10.attn1.to_out.0.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.10.attn1.to_out.0.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.10.attn1.to_q.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.10.attn1.to_q.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.10.attn1.to_v.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.10.attn1.to_v.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.10.ff.net.0.proj.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.10.ff.net.0.proj.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.10.ff.net.2.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.10.ff.net.2.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.10.norm1.linear.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.10.norm1.linear.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.11.attn1.to_k.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.11.attn1.to_k.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.11.attn1.to_out.0.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.11.attn1.to_out.0.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.11.attn1.to_q.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.11.attn1.to_q.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.11.attn1.to_v.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.11.attn1.to_v.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.11.ff.net.0.proj.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.11.ff.net.0.proj.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.11.ff.net.2.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.11.ff.net.2.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.11.norm1.linear.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.11.norm1.linear.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.12.attn1.to_k.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.12.attn1.to_k.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.12.attn1.to_out.0.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.12.attn1.to_out.0.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.12.attn1.to_q.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.12.attn1.to_q.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.12.attn1.to_v.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.12.attn1.to_v.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.12.ff.net.0.proj.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.12.ff.net.0.proj.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.12.ff.net.2.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.12.ff.net.2.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.12.norm1.linear.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.12.norm1.linear.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.13.attn1.to_k.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.13.attn1.to_k.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.13.attn1.to_out.0.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.13.attn1.to_out.0.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.13.attn1.to_q.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.13.attn1.to_q.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.13.attn1.to_v.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.13.attn1.to_v.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.13.ff.net.0.proj.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.13.ff.net.0.proj.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.13.ff.net.2.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.13.ff.net.2.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.13.norm1.linear.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.13.norm1.linear.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.14.attn1.to_k.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.14.attn1.to_k.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.14.attn1.to_out.0.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.14.attn1.to_out.0.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.14.attn1.to_q.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.14.attn1.to_q.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.14.attn1.to_v.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.14.attn1.to_v.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.14.ff.net.0.proj.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.14.ff.net.0.proj.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.14.ff.net.2.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.14.ff.net.2.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.14.norm1.linear.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.14.norm1.linear.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.15.attn1.to_k.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.15.attn1.to_k.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.15.attn1.to_out.0.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.15.attn1.to_out.0.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.15.attn1.to_q.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.15.attn1.to_q.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.15.attn1.to_v.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.15.attn1.to_v.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.15.ff.net.0.proj.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.15.ff.net.0.proj.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.15.ff.net.2.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.15.ff.net.2.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.15.norm1.linear.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.15.norm1.linear.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.2.attn1.to_k.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.2.attn1.to_k.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.2.attn1.to_out.0.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.2.attn1.to_out.0.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.2.attn1.to_q.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.2.attn1.to_q.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.2.attn1.to_v.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.2.attn1.to_v.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.2.ff.net.0.proj.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.2.ff.net.0.proj.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.2.ff.net.2.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.2.ff.net.2.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.2.norm1.linear.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.2.norm1.linear.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.3.attn1.to_k.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.3.attn1.to_k.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.3.attn1.to_out.0.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.3.attn1.to_out.0.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.3.attn1.to_q.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.3.attn1.to_q.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.3.attn1.to_v.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.3.attn1.to_v.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.3.ff.net.0.proj.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.3.ff.net.0.proj.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.3.ff.net.2.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.3.ff.net.2.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.3.norm1.linear.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.3.norm1.linear.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.4.attn1.to_k.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.4.attn1.to_k.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.4.attn1.to_out.0.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.4.attn1.to_out.0.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.4.attn1.to_q.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.4.attn1.to_q.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.4.attn1.to_v.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.4.attn1.to_v.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.4.ff.net.0.proj.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.4.ff.net.0.proj.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.4.ff.net.2.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.4.ff.net.2.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.4.norm1.linear.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.4.norm1.linear.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.5.attn1.to_k.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.5.attn1.to_k.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.5.attn1.to_out.0.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.5.attn1.to_out.0.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.5.attn1.to_q.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.5.attn1.to_q.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.5.attn1.to_v.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.5.attn1.to_v.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.5.ff.net.0.proj.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.5.ff.net.0.proj.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.5.ff.net.2.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.5.ff.net.2.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.5.norm1.linear.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.5.norm1.linear.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.6.attn1.to_k.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.6.attn1.to_k.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.6.attn1.to_out.0.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.6.attn1.to_out.0.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.6.attn1.to_q.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.6.attn1.to_q.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.6.attn1.to_v.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.6.attn1.to_v.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.6.ff.net.0.proj.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.6.ff.net.0.proj.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.6.ff.net.2.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.6.ff.net.2.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.6.norm1.linear.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.6.norm1.linear.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.7.attn1.to_k.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.7.attn1.to_k.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.7.attn1.to_out.0.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.7.attn1.to_out.0.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.7.attn1.to_q.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.7.attn1.to_q.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.7.attn1.to_v.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.7.attn1.to_v.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.7.ff.net.0.proj.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.7.ff.net.0.proj.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.7.ff.net.2.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.7.ff.net.2.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.7.norm1.linear.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.7.norm1.linear.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.8.attn1.to_k.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.8.attn1.to_k.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.8.attn1.to_out.0.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.8.attn1.to_out.0.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.8.attn1.to_q.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.8.attn1.to_q.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.8.attn1.to_v.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.8.attn1.to_v.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.8.ff.net.0.proj.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.8.ff.net.0.proj.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.8.ff.net.2.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.8.ff.net.2.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.8.norm1.linear.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.8.norm1.linear.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.9.attn1.to_k.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.9.attn1.to_k.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.9.attn1.to_out.0.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.9.attn1.to_out.0.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.9.attn1.to_q.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.9.attn1.to_q.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.9.attn1.to_v.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.9.attn1.to_v.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.9.ff.net.0.proj.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.9.ff.net.0.proj.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.9.ff.net.2.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.9.ff.net.2.weight": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.9.norm1.linear.bias": "model-00002-of-00002.safetensors",
+    "action_head.model.transformer_blocks.9.norm1.linear.weight": "model-00002-of-00002.safetensors",
+    "action_head.position_embedding.weight": "model-00002-of-00002.safetensors",
+    "action_head.state_encoder.layer1.W": "model-00002-of-00002.safetensors",
+    "action_head.state_encoder.layer1.b": "model-00002-of-00002.safetensors",
+    "action_head.state_encoder.layer2.W": "model-00002-of-00002.safetensors",
+    "action_head.state_encoder.layer2.b": "model-00002-of-00002.safetensors",
+    "backbone.linear.bias": "model-00002-of-00002.safetensors",
+    "backbone.linear.weight": "model-00002-of-00002.safetensors",
+    "backbone.model.language_model.model.embed_tokens.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.0.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.0.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.0.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.0.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.0.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.0.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.0.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.0.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.0.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.1.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.1.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.1.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.1.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.1.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.1.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.1.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.1.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.1.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.10.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.10.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.10.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.10.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.10.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.10.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.10.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.10.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.10.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.11.input_layernorm.weight": "model-00002-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.11.mlp.down_proj.weight": "model-00002-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.11.mlp.gate_proj.weight": "model-00002-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.11.mlp.up_proj.weight": "model-00002-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.11.post_attention_layernorm.weight": "model-00002-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.11.self_attn.k_proj.weight": "model-00002-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.11.self_attn.o_proj.weight": "model-00002-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.11.self_attn.q_proj.weight": "model-00002-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.11.self_attn.v_proj.weight": "model-00002-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.2.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.2.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.2.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.2.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.2.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.2.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.2.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.2.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.2.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.3.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.3.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.3.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.3.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.3.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.3.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.3.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.3.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.3.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.4.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.4.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.4.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.4.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.4.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.4.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.4.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.4.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.4.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.5.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.5.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.5.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.5.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.5.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.5.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.5.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.5.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.5.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.6.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.6.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.6.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.6.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.6.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.6.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.6.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.6.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.6.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.7.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.7.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.7.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.7.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.7.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.7.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.7.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.7.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.7.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.8.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.8.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.8.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.8.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.8.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.8.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.8.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.8.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.8.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.9.input_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.9.mlp.down_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.9.mlp.gate_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.9.mlp.up_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.9.post_attention_layernorm.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.9.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.9.self_attn.o_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.9.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.layers.9.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.language_model.model.norm.weight": "model-00002-of-00002.safetensors",
+    "backbone.model.mlp1.0.bias": "model-00002-of-00002.safetensors",
+    "backbone.model.mlp1.0.weight": "model-00002-of-00002.safetensors",
+    "backbone.model.mlp1.1.bias": "model-00002-of-00002.safetensors",
+    "backbone.model.mlp1.1.weight": "model-00002-of-00002.safetensors",
+    "backbone.model.mlp1.3.bias": "model-00002-of-00002.safetensors",
+    "backbone.model.mlp1.3.weight": "model-00002-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.embeddings.patch_embedding.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.embeddings.patch_embedding.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.embeddings.position_embedding.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.0.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.0.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.0.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.0.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.0.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.0.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.0.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.0.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.0.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.0.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.0.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.0.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.0.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.0.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.0.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.0.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.1.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.1.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.1.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.1.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.1.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.1.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.1.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.1.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.1.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.1.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.1.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.1.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.1.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.1.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.1.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.1.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.10.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.10.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.10.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.10.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.10.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.10.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.10.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.10.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.10.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.10.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.10.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.10.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.10.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.10.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.10.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.10.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.11.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.11.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.11.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.11.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.11.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.11.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.11.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.11.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.11.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.11.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.11.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.11.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.11.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.11.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.11.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.11.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.12.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.12.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.12.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.12.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.12.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.12.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.12.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.12.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.12.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.12.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.12.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.12.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.12.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.12.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.12.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.12.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.13.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.13.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.13.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.13.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.13.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.13.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.13.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.13.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.13.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.13.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.13.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.13.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.13.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.13.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.13.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.13.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.14.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.14.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.14.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.14.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.14.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.14.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.14.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.14.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.14.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.14.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.14.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.14.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.14.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.14.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.14.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.14.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.15.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.15.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.15.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.15.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.15.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.15.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.15.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.15.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.15.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.15.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.15.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.15.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.15.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.15.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.15.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.15.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.16.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.16.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.16.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.16.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.16.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.16.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.16.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.16.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.16.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.16.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.16.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.16.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.16.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.16.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.16.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.16.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.17.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.17.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.17.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.17.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.17.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.17.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.17.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.17.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.17.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.17.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.17.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.17.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.17.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.17.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.17.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.17.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.18.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.18.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.18.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.18.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.18.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.18.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.18.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.18.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.18.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.18.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.18.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.18.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.18.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.18.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.18.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.18.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.19.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.19.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.19.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.19.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.19.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.19.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.19.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.19.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.19.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.19.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.19.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.19.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.19.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.19.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.19.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.19.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.2.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.2.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.2.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.2.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.2.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.2.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.2.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.2.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.2.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.2.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.2.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.2.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.2.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.2.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.2.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.2.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.20.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.20.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.20.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.20.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.20.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.20.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.20.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.20.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.20.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.20.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.20.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.20.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.20.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.20.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.20.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.20.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.21.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.21.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.21.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.21.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.21.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.21.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.21.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.21.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.21.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.21.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.21.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.21.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.21.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.21.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.21.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.21.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.22.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.22.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.22.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.22.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.22.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.22.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.22.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.22.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.22.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.22.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.22.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.22.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.22.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.22.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.22.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.22.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.23.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.23.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.23.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.23.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.23.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.23.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.23.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.23.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.23.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.23.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.23.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.23.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.23.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.23.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.23.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.23.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.24.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.24.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.24.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.24.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.24.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.24.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.24.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.24.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.24.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.24.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.24.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.24.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.24.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.24.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.24.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.24.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.25.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.25.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.25.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.25.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.25.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.25.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.25.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.25.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.25.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.25.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.25.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.25.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.25.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.25.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.25.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.25.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.26.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.26.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.26.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.26.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.26.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.26.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.26.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.26.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.26.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.26.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.26.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.26.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.26.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.26.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.26.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.26.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.3.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.3.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.3.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.3.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.3.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.3.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.3.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.3.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.3.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.3.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.3.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.3.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.3.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.3.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.3.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.3.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.4.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.4.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.4.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.4.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.4.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.4.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.4.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.4.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.4.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.4.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.4.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.4.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.4.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.4.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.4.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.4.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.5.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.5.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.5.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.5.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.5.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.5.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.5.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.5.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.5.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.5.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.5.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.5.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.5.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.5.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.5.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.5.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.6.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.6.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.6.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.6.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.6.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.6.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.6.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.6.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.6.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.6.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.6.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.6.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.6.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.6.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.6.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.6.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.7.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.7.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.7.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.7.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.7.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.7.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.7.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.7.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.7.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.7.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.7.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.7.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.7.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.7.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.7.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.7.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.8.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.8.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.8.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.8.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.8.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.8.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.8.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.8.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.8.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.8.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.8.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.8.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.8.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.8.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.8.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.8.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.9.layer_norm1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.9.layer_norm1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.9.layer_norm2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.9.layer_norm2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.9.mlp.fc1.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.9.mlp.fc1.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.9.mlp.fc2.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.9.mlp.fc2.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.9.self_attn.k_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.9.self_attn.k_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.9.self_attn.out_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.9.self_attn.out_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.9.self_attn.q_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.9.self_attn.q_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.9.self_attn.v_proj.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.encoder.layers.9.self_attn.v_proj.weight": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.post_layernorm.bias": "model-00001-of-00002.safetensors",
+    "backbone.model.vision_model.vision_model.post_layernorm.weight": "model-00001-of-00002.safetensors"
+  }
+}

checkpoint-20000/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ab5677fc9c0b109c6e259f537c8b67eb7be6f6fc4fb821188bdfa19e0131cebd
+size 10272357262

checkpoint-20000/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8759cf913dd6aec55fdb592d42f0a78c1d2b50b167c2884228d0c251e5cae512
+size 14244

checkpoint-20000/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:96dedd731c018af5121e5a6273b315a5ea44ce825ed023675cb4a9716b4911be
+size 1064

checkpoint-20000/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

experiment_cfg/metadata.json ADDED Viewed

	@@ -0,0 +1,467 @@

+{
+    "new_embodiment": {
+        "statistics": {
+            "state": {
+                "franka_eef_pos": {
+                    "max": [
+                        0.690919041633606,
+                        0.2623455822467804,
+                        0.4056587219238281
+                    ],
+                    "min": [
+                        0.28664281964302063,
+                        -0.2571396827697754,
+                        0.11134574562311172
+                    ],
+                    "mean": [
+                        0.4634382128715515,
+                        0.0848732516169548,
+                        0.2357439547777176
+                    ],
+                    "std": [
+                        0.07045646756887436,
+                        0.09220043569803238,
+                        0.05206894874572754
+                    ],
+                    "q01": [
+                        0.31849947571754456,
+                        -0.1664549469947815,
+                        0.13728147149085998
+                    ],
+                    "q99": [
+                        0.6351520419120789,
+                        0.23361742496490479,
+                        0.36140872240066513
+                    ]
+                },
+                "franka_eef_6d_rot": {
+                    "max": [
+                        0.9877848625183105,
+                        0.7002321481704712,
+                        0.8402191996574402,
+                        0.7514026165008545,
+                        0.8680896759033203,
+                        0.9978066086769104
+                    ],
+                    "min": [
+                        -0.9991759061813354,
+                        -0.999967098236084,
+                        -0.4956780970096588,
+                        -0.8792480230331421,
+                        -0.7835543155670166,
+                        0.2781556248664856
+                    ],
+                    "mean": [
+                        0.12430186569690704,
+                        -0.5880382061004639,
+                        0.3773862421512604,
+                        -0.4543558657169342,
+                        0.18046835064888,
+                        0.7508696913719177
+                    ],
+                    "std": [
+                        0.49978262186050415,
+                        0.4465165138244629,
+                        0.21720384061336517,
+                        0.1877666860818863,
+                        0.37941059470176697,
+                        0.1341215819120407
+                    ],
+                    "q01": [
+                        -0.8600624442100525,
+                        -0.9967439651489258,
+                        -0.28675371408462524,
+                        -0.7474671840667725,
+                        -0.6014941692352295,
+                        0.4258335828781128
+                    ],
+                    "q99": [
+                        0.9392379403114319,
+                        0.5857639312744141,
+                        0.7270987868309021,
+                        0.19900349378585594,
+                        0.7900682091712949,
+                        0.972002387046814
+                    ]
+                },
+                "hand_joint_pos": {
+                    "max": [
+                        50.0,
+                        37.95140838623047,
+                        -15.636697769165039,
+                        -28.069446563720703,
+                        27.5,
+                        69.52964782714844,
+                        40.8275146484375,
+                        21.369964599609375,
+                        64.89373779296875,
+                        54.604087829589844,
+                        13.512350082397461,
+                        66.78776550292969,
+                        60.377662658691406,
+                        13.5,
+                        92.31311798095703,
+                        79.11392211914062
+                    ],
+                    "min": [
+                        -10.65101432800293,
+                        -28.00597381591797,
+                        -40.0,
+                        -40.0,
+                        -8.5,
+                        -6.483209609985352,
+                        -12.879666328430176,
+                        -12.5,
+                        -15.0,
+                        -4.245664596557617,
+                        -17.5,
+                        -15.0,
+                        -9.95943832397461,
+                        -22.5,
+                        -13.69697380065918,
+                        -15.0
+                    ],
+                    "mean": [
+                        37.9445686340332,
+                        -7.3860650062561035,
+                        -33.78374099731445,
+                        -38.54960632324219,
+                        -0.05513725429773331,
+                        32.388065338134766,
+                        14.628562927246094,
+                        -4.78059196472168,
+                        21.373214721679688,
+                        23.20292091369629,
+                        -8.092843055725098,
+                        22.910865783691406,
+                        23.602975845336914,
+                        -11.123340606689453,
+                        40.79413986206055,
+                        10.297532081604004
+                    ],
+                    "std": [
+                        12.184592247009277,
+                        5.354432106018066,
+                        5.950627326965332,
+                        1.916318655014038,
+                        7.077040672302246,
+                        17.607648849487305,
+                        11.312039375305176,
+                        4.351393699645996,
+                        17.957801818847656,
+                        13.184988021850586,
+                        4.607062816619873,
+                        22.36219024658203,
+                        12.939791679382324,
+                        9.088964462280273,
+                        25.48943328857422,
+                        12.344303131103516
+                    ],
+                    "q01": [
+                        9.505097961425783,
+                        -20.783349609375,
+                        -40.0,
+                        -40.0,
+                        -8.5,
+                        0.5165536880493167,
+                        -5.125764465332031,
+                        -12.5,
+                        -10.18576946258545,
+                        2.0945491790771484,
+                        -17.5,
+                        -14.958829307556153,
+                        1.9903202056884766,
+                        -22.5,
+                        -6.446310806274414,
+                        -10.32488956451416
+                    ],
+                    "q99": [
+                        50.0,
+                        7.9011306762695215,
+                        -20.968732833862312,
+                        -33.44684600830078,
+                        21.196063995361254,
+                        64.41703186035156,
+                        37.54317016601562,
+                        9.0063133239746,
+                        51.415377807617176,
+                        48.739594268798825,
+                        6.476033782958984,
+                        60.04581909179687,
+                        48.05571517944336,
+                        13.5,
+                        80.64421997070312,
+                        38.7237663269043
+                    ]
+                }
+            },
+            "action": {
+                "franka_eef_pos": {
+                    "max": [
+                        0.690919041633606,
+                        0.2623455822467804,
+                        0.4056587219238281
+                    ],
+                    "min": [
+                        0.28664281964302063,
+                        -0.2571396827697754,
+                        0.11134574562311172
+                    ],
+                    "mean": [
+                        0.46344804763793945,
+                        0.08499258756637573,
+                        0.23588033020496368
+                    ],
+                    "std": [
+                        0.07042189687490463,
+                        0.0919296145439148,
+                        0.05217698961496353
+                    ],
+                    "q01": [
+                        0.31849947571754456,
+                        -0.16346744000911712,
+                        0.13728147149085998
+                    ],
+                    "q99": [
+                        0.6351520419120789,
+                        0.23361742496490479,
+                        0.3619115889072418
+                    ]
+                },
+                "franka_eef_6d_rot": {
+                    "max": [
+                        0.9877848625183105,
+                        0.7002321481704712,
+                        0.8402191996574402,
+                        0.7484395503997803,
+                        0.8680896759033203,
+                        0.9978066086769104
+                    ],
+                    "min": [
+                        -0.9991759061813354,
+                        -0.999967098236084,
+                        -0.4956780970096588,
+                        -0.8792480230331421,
+                        -0.7835543155670166,
+                        0.2781556248664856
+                    ],
+                    "mean": [
+                        0.12383365631103516,
+                        -0.5891051888465881,
+                        0.37734243273735046,
+                        -0.45466047525405884,
+                        0.18076813220977783,
+                        0.7511017322540283
+                    ],
+                    "std": [
+                        0.49903711676597595,
+                        0.44640615582466125,
+                        0.21659795939922333,
+                        0.18666498363018036,
+                        0.37894150614738464,
+                        0.13424521684646606
+                    ],
+                    "q01": [
+                        -0.8555441498756409,
+                        -0.9967665910720825,
+                        -0.28509931564331054,
+                        -0.7474671840667725,
+                        -0.6008584141731262,
+                        0.4258335828781128
+                    ],
+                    "q99": [
+                        0.938888669013977,
+                        0.5857639312744141,
+                        0.726944625377655,
+                        0.18731310665607387,
+                        0.7900682091712949,
+                        0.97224383354187
+                    ]
+                },
+                "hand_joint_pos": {
+                    "max": [
+                        50.0,
+                        37.95140838623047,
+                        -15.636697769165039,
+                        -28.069446563720703,
+                        27.5,
+                        69.52964782714844,
+                        40.8275146484375,
+                        21.369964599609375,
+                        64.89373779296875,
+                        54.604087829589844,
+                        13.512350082397461,
+                        66.78776550292969,
+                        60.377662658691406,
+                        13.5,
+                        92.31311798095703,
+                        79.11392211914062
+                    ],
+                    "min": [
+                        -10.65101432800293,
+                        -28.00597381591797,
+                        -40.0,
+                        -40.0,
+                        -8.5,
+                        -6.483209609985352,
+                        -12.879666328430176,
+                        -12.5,
+                        -15.0,
+                        -4.245664596557617,
+                        -17.5,
+                        -15.0,
+                        -9.95943832397461,
+                        -22.5,
+                        -13.69697380065918,
+                        -15.0
+                    ],
+                    "mean": [
+                        37.93864440917969,
+                        -7.391177654266357,
+                        -33.79348373413086,
+                        -38.55232238769531,
+                        -0.05473555997014046,
+                        32.35673522949219,
+                        14.620677947998047,
+                        -4.785501956939697,
+                        21.34109878540039,
+                        23.186412811279297,
+                        -8.095688819885254,
+                        22.878921508789062,
+                        23.581470489501953,
+                        -11.136092185974121,
+                        40.77717590332031,
+                        10.275049209594727
+                    ],
+                    "std": [
+                        12.18165397644043,
+                        5.3397111892700195,
+                        5.951189994812012,
+                        1.9152079820632935,
+                        7.070333957672119,
+                        17.603782653808594,
+                        11.31222152709961,
+                        4.343321323394775,
+                        17.950090408325195,
+                        13.185937881469727,
+                        4.600419521331787,
+                        22.35536003112793,
+                        12.938926696777344,
+                        9.089351654052734,
+                        25.47988510131836,
+                        12.337271690368652
+                    ],
+                    "q01": [
+                        9.505097961425783,
+                        -20.783349609375,
+                        -40.0,
+                        -40.0,
+                        -8.5,
+                        0.5165536880493167,
+                        -5.124459075927734,
+                        -12.5,
+                        -10.193243598937988,
+                        2.088201141357422,
+                        -17.5,
+                        -14.958829307556153,
+                        1.9819808959960938,
+                        -22.5,
+                        -6.434903717041015,
+                        -10.33674659729004
+                    ],
+                    "q99": [
+                        50.0,
+                        7.776638031005849,
+                        -20.97244453430176,
+                        -33.451379394531266,
+                        21.13194656372068,
+                        64.40765533447265,
+                        37.54317016601562,
+                        8.97600440979,
+                        51.37096557617186,
+                        48.739594268798825,
+                        6.437651824951136,
+                        60.013037109375,
+                        48.05359802246093,
+                        13.5,
+                        80.64421997070312,
+                        38.68595123291007
+                    ]
+                }
+            }
+        },
+        "modalities": {
+            "video": {
+                "workspace_view": {
+                    "resolution": [
+                        224,
+                        224
+                    ],
+                    "channels": 3,
+                    "fps": 20.0
+                },
+                "wrist_view_palm": {
+                    "resolution": [
+                        224,
+                        224
+                    ],
+                    "channels": 3,
+                    "fps": 20.0
+                }
+            },
+            "state": {
+                "franka_eef_pos": {
+                    "absolute": true,
+                    "rotation_type": null,
+                    "shape": [
+                        3
+                    ],
+                    "continuous": true
+                },
+                "franka_eef_6d_rot": {
+                    "absolute": true,
+                    "rotation_type": null,
+                    "shape": [
+                        6
+                    ],
+                    "continuous": true
+                },
+                "hand_joint_pos": {
+                    "absolute": true,
+                    "rotation_type": null,
+                    "shape": [
+                        16
+                    ],
+                    "continuous": true
+                }
+            },
+            "action": {
+                "franka_eef_pos": {
+                    "absolute": true,
+                    "rotation_type": null,
+                    "shape": [
+                        3
+                    ],
+                    "continuous": true
+                },
+                "franka_eef_6d_rot": {
+                    "absolute": true,
+                    "rotation_type": null,
+                    "shape": [
+                        6
+                    ],
+                    "continuous": true
+                },
+                "hand_joint_pos": {
+                    "absolute": true,
+                    "rotation_type": null,
+                    "shape": [
+                        16
+                    ],
+                    "continuous": true
+                }
+            }
+        },
+        "embodiment_tag": "new_embodiment"
+    }
+}