Uploading the finetuned RT-DETRV2 object detection model.

Browse files

Files changed (4) hide show

README.md +36 -36
config.json +10 -2
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -16,33 +16,33 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [PekingU/rtdetr_v2_r50vd](https://huggingface.co/PekingU/rtdetr_v2_r50vd) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 9.1887
-- Map: 0.516
-- Map 50: 0.6509
-- Map 75: 0.5577
 - Map Small: -1.0
-- Map Medium: 0.1465
-- Map Large: 0.5361
-- Mar 1: 0.6255
-- Mar 10: 0.7556
-- Mar 100: 0.786
 - Mar Small: -1.0
-- Mar Medium: 0.5637
-- Mar Large: 0.8027
-- Map Bin: 0.7726
-- Mar 100 Bin: 0.9132
-- Map Hand: 0.5162
-- Mar 100 Hand: 0.7731
-- Map Not Bin: 0.2831
-- Mar 100 Not Bin: 0.7692
-- Map Not Hand: 0.0462
-- Mar 100 Not Hand: 0.6
-- Map Not Trash: 0.3102
-- Mar 100 Not Trash: 0.6485
-- Map Trash: 0.6838
-- Mar 100 Trash: 0.7981
-- Map Trash Arm: 1.0
-- Mar 100 Trash Arm: 1.0
 ## Model description
@@ -75,21 +75,21 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss | Map    | Map 50 | Map 75 | Map Small | Map Medium | Map Large | Mar 1  | Mar 10 | Mar 100 | Mar Small | Mar Medium | Mar Large | Map Bin | Mar 100 Bin | Map Hand | Mar 100 Hand | Map Not Bin | Mar 100 Not Bin | Map Not Hand | Mar 100 Not Hand | Map Not Trash | Mar 100 Not Trash | Map Trash | Mar 100 Trash | Map Trash Arm | Mar 100 Trash Arm |
 |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:------:|:---------:|:----------:|:---------:|:------:|:------:|:-------:|:---------:|:----------:|:---------:|:-------:|:-----------:|:--------:|:------------:|:-----------:|:---------------:|:------------:|:----------------:|:-------------:|:-----------------:|:---------:|:-------------:|:-------------:|:-----------------:|
-| 73.0385       | 1.0   | 99   | 16.1476         | 0.2559 | 0.3523 | 0.2786 | -1.0      | 0.1203     | 0.2694    | 0.305  | 0.4485 | 0.4743  | -1.0      | 0.3356     | 0.4912    | 0.7098  | 0.875       | 0.3021   | 0.763        | 0.0037      | 0.2692          | 0.0          | 0.0              | 0.2008        | 0.6136            | 0.5747    | 0.799         | 0.0           | 0.0               |
-| 20.8938       | 2.0   | 198  | 11.2207         | 0.3295 | 0.4568 | 0.3674 | -1.0      | 0.1394     | 0.3469    | 0.5065 | 0.6807 | 0.7124  | -1.0      | 0.55       | 0.7261    | 0.742   | 0.8972      | 0.5014   | 0.8083       | 0.1158      | 0.8077          | 0.0          | 0.0              | 0.3182        | 0.6879            | 0.6057    | 0.7856        | 0.0233        | 1.0               |
-| 17.2604       | 3.0   | 297  | 10.2906         | 0.4936 | 0.6164 | 0.5357 | -1.0      | 0.1417     | 0.5104    | 0.6102 | 0.7463 | 0.7983  | -1.0      | 0.3537     | 0.8172    | 0.7323  | 0.9007      | 0.5651   | 0.837        | 0.2457      | 0.8             | 0.0014       | 0.6              | 0.2901        | 0.6667            | 0.6206    | 0.7837        | 1.0           | 1.0               |
-| 15.3086       | 4.0   | 396  | 9.9059          | 0.4946 | 0.6345 | 0.5437 | -1.0      | 0.1648     | 0.514     | 0.6033 | 0.7707 | 0.7999  | -1.0      | 0.5375     | 0.8142    | 0.7691  | 0.9104      | 0.4992   | 0.8046       | 0.301       | 0.8308          | 0.0021       | 0.6              | 0.3382        | 0.6621            | 0.6506    | 0.7913        | 0.9023        | 1.0               |
-| 14.1086       | 5.0   | 495  | 9.1062          | 0.5161 | 0.683  | 0.5945 | -1.0      | 0.1595     | 0.5335    | 0.5241 | 0.7207 | 0.7477  | -1.0      | 0.5        | 0.7624    | 0.7918  | 0.9104      | 0.5518   | 0.8019       | 0.467       | 0.7692          | 0.0004       | 0.5              | 0.3226        | 0.6561            | 0.6788    | 0.7962        | 0.8           | 0.8               |
-| 13.041        | 6.0   | 594  | 9.4640          | 0.4996 | 0.6449 | 0.551  | -1.0      | 0.1426     | 0.5179    | 0.5856 | 0.7273 | 0.7577  | -1.0      | 0.4956     | 0.7719    | 0.7709  | 0.9007      | 0.4963   | 0.7806       | 0.3204      | 0.7769          | 0.0031       | 0.5              | 0.3478        | 0.6667            | 0.6588    | 0.7788        | 0.9           | 0.9               |
-| 12.2011       | 7.0   | 693  | 9.2667          | 0.5034 | 0.6563 | 0.5612 | -1.0      | 0.1798     | 0.5209    | 0.5974 | 0.7344 | 0.7696  | -1.0      | 0.5164     | 0.7866    | 0.7656  | 0.9125      | 0.533    | 0.7935       | 0.2981      | 0.7923          | 0.002        | 0.5              | 0.3632        | 0.6833            | 0.6618    | 0.8058        | 0.9           | 0.9               |
-| 11.6345       | 8.0   | 792  | 9.0542          | 0.529  | 0.6674 | 0.5864 | -1.0      | 0.1682     | 0.5749    | 0.6365 | 0.7616 | 0.7921  | -1.0      | 0.5843     | 0.8077    | 0.7765  | 0.9069      | 0.5336   | 0.7806       | 0.2773      | 0.8077          | 0.1          | 0.6              | 0.3154        | 0.6485            | 0.7001    | 0.801         | 1.0           | 1.0               |
-| 10.936        | 9.0   | 891  | 9.1628          | 0.514  | 0.6679 | 0.5774 | -1.0      | 0.1642     | 0.5566    | 0.6115 | 0.7408 | 0.7863  | -1.0      | 0.6032     | 0.8021    | 0.7752  | 0.9042      | 0.5274   | 0.7852       | 0.2702      | 0.7692          | 0.1201       | 0.7              | 0.3242        | 0.6515            | 0.681     | 0.7942        | 0.9           | 0.9               |
-| 10.464        | 10.0  | 990  | 9.1887          | 0.516  | 0.6509 | 0.5577 | -1.0      | 0.1465     | 0.5361    | 0.6255 | 0.7556 | 0.786   | -1.0      | 0.5637     | 0.8027    | 0.7726  | 0.9132      | 0.5162   | 0.7731       | 0.2831      | 0.7692          | 0.0462       | 0.6              | 0.3102        | 0.6485            | 0.6838    | 0.7981        | 1.0           | 1.0               |
 ### Framework versions
-- Transformers 4.55.1
 - Pytorch 2.6.0+cu124
 - Datasets 4.0.0
 - Tokenizers 0.21.4

 This model is a fine-tuned version of [PekingU/rtdetr_v2_r50vd](https://huggingface.co/PekingU/rtdetr_v2_r50vd) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 8.9725
+- Map: 0.5905
+- Map 50: 0.8099
+- Map 75: 0.585
 - Map Small: -1.0
+- Map Medium: 0.1987
+- Map Large: 0.6051
+- Mar 1: 0.5952
+- Mar 10: 0.7398
+- Mar 100: 0.7694
 - Mar Small: -1.0
+- Mar Medium: 0.4083
+- Mar Large: 0.7836
+- Map Bin: 0.7678
+- Mar 100 Bin: 0.8854
+- Map Hand: 0.5506
+- Mar 100 Hand: 0.812
+- Map Not Bin: 0.364
+- Mar 100 Not Bin: 0.8231
+- Map Not Hand: 0.5
+- Mar 100 Not Hand: 0.5
+- Map Not Trash: 0.3577
+- Mar 100 Not Trash: 0.6621
+- Map Trash: 0.6931
+- Mar 100 Trash: 0.8029
+- Map Trash Arm: 0.9
+- Mar 100 Trash Arm: 0.9
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss | Map    | Map 50 | Map 75 | Map Small | Map Medium | Map Large | Mar 1  | Mar 10 | Mar 100 | Mar Small | Mar Medium | Mar Large | Map Bin | Mar 100 Bin | Map Hand | Mar 100 Hand | Map Not Bin | Mar 100 Not Bin | Map Not Hand | Mar 100 Not Hand | Map Not Trash | Mar 100 Not Trash | Map Trash | Mar 100 Trash | Map Trash Arm | Mar 100 Trash Arm |
 |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:------:|:---------:|:----------:|:---------:|:------:|:------:|:-------:|:---------:|:----------:|:---------:|:-------:|:-----------:|:--------:|:------------:|:-----------:|:---------------:|:------------:|:----------------:|:-------------:|:-----------------:|:---------:|:-------------:|:-------------:|:-----------------:|
+| 56.0833       | 1.0   | 99   | 14.4917         | 0.251  | 0.3699 | 0.2677 | -1.0      | 0.0382     | 0.2631    | 0.3236 | 0.5319 | 0.5788  | -1.0      | 0.2299     | 0.5996    | 0.6863  | 0.8785      | 0.3992   | 0.7657       | 0.006       | 0.5385          | 0.0125       | 0.5              | 0.1087        | 0.5894            | 0.544     | 0.7798        | 0.0           | 0.0               |
+| 19.9472       | 2.0   | 198  | 10.7902         | 0.3449 | 0.4688 | 0.3833 | -1.0      | 0.1237     | 0.3634    | 0.4878 | 0.6536 | 0.6974  | -1.0      | 0.3775     | 0.7142    | 0.7445  | 0.891       | 0.5697   | 0.8213       | 0.0428      | 0.8077          | 0.0          | 0.0              | 0.2844        | 0.6591            | 0.6233    | 0.8029        | 0.15          | 0.9               |
+| 16.9985       | 3.0   | 297  | 10.5698         | 0.4685 | 0.5915 | 0.505  | -1.0      | 0.1523     | 0.4833    | 0.5794 | 0.7138 | 0.7468  | -1.0      | 0.4437     | 0.7606    | 0.7377  | 0.8736      | 0.5315   | 0.8037       | 0.0872      | 0.7077          | 0.004        | 0.4              | 0.3097        | 0.6712            | 0.6096    | 0.7712        | 1.0           | 1.0               |
+| 15.2209       | 4.0   | 396  | 9.7026          | 0.4404 | 0.6253 | 0.5316 | -1.0      | 0.1433     | 0.4574    | 0.4729 | 0.6705 | 0.7037  | -1.0      | 0.3792     | 0.7182    | 0.7588  | 0.8792      | 0.543    | 0.8167       | 0.2046      | 0.7615          | 0.0004       | 0.2              | 0.3168        | 0.6803            | 0.657     | 0.7885        | 0.6023        | 0.8               |
+| 14.0156       | 5.0   | 495  | 9.2429          | 0.5383 | 0.7779 | 0.5542 | -1.0      | 0.1713     | 0.555     | 0.5592 | 0.7057 | 0.7386  | -1.0      | 0.4301     | 0.7534    | 0.7617  | 0.8861      | 0.567    | 0.8157       | 0.2142      | 0.8154          | 0.4          | 0.4              | 0.3556        | 0.6606            | 0.6696    | 0.7923        | 0.8           | 0.8               |
+| 13.0117       | 6.0   | 594  | 9.1901          | 0.5242 | 0.7239 | 0.5611 | -1.0      | 0.214      | 0.5722    | 0.5831 | 0.7207 | 0.7569  | -1.0      | 0.4093     | 0.7696    | 0.77    | 0.8924      | 0.5561   | 0.825        | 0.281       | 0.8154          | 0.25         | 0.5              | 0.3353        | 0.6773            | 0.6774    | 0.7885        | 0.8           | 0.8               |
+| 12.2036       | 7.0   | 693  | 9.0578          | 0.5599 | 0.7899 | 0.5545 | -1.0      | 0.1587     | 0.575     | 0.5796 | 0.7315 | 0.7598  | -1.0      | 0.375      | 0.7744    | 0.7702  | 0.8903      | 0.5628   | 0.8148       | 0.2581      | 0.7538          | 0.4002       | 0.5              | 0.3388        | 0.6712            | 0.689     | 0.7885        | 0.9           | 0.9               |
+| 11.6258       | 8.0   | 792  | 9.0316          | 0.5895 | 0.8044 | 0.5828 | -1.0      | 0.1906     | 0.6042    | 0.6052 | 0.7474 | 0.7674  | -1.0      | 0.3697     | 0.7815    | 0.7629  | 0.8896      | 0.5686   | 0.8167       | 0.3441      | 0.8154          | 0.5          | 0.5              | 0.355         | 0.6591            | 0.6959    | 0.7913        | 0.9           | 0.9               |
+| 10.9674       | 9.0   | 891  | 8.9229          | 0.5912 | 0.8145 | 0.5821 | -1.0      | 0.1891     | 0.6051    | 0.6038 | 0.7388 | 0.7659  | -1.0      | 0.387      | 0.7791    | 0.7701  | 0.8833      | 0.5554   | 0.812        | 0.3581      | 0.8             | 0.5          | 0.5              | 0.3606        | 0.6652            | 0.6941    | 0.801         | 0.9           | 0.9               |
+| 10.5124       | 10.0  | 990  | 8.9725          | 0.5905 | 0.8099 | 0.585  | -1.0      | 0.1987     | 0.6051    | 0.5952 | 0.7398 | 0.7694  | -1.0      | 0.4083     | 0.7836    | 0.7678  | 0.8854      | 0.5506   | 0.812        | 0.364       | 0.8231          | 0.5          | 0.5              | 0.3577        | 0.6621            | 0.6931    | 0.8029        | 0.9           | 0.9               |
 ### Framework versions
+- Transformers 4.55.2
 - Pytorch 2.6.0+cu124
 - Datasets 4.0.0
 - Tokenizers 0.21.4

config.json CHANGED Viewed

@@ -102,7 +102,15 @@
   "initializer_bias_prior_prob": null,
   "initializer_range": 0.01,
   "is_encoder_decoder": true,
-  "label2id": 6,
   "label_noise_ratio": 0.5,
   "layer_norm_eps": 1e-05,
   "learn_initial_query": false,
@@ -118,7 +126,7 @@
   "num_queries": 300,
   "positional_encoding_temperature": 10000,
   "torch_dtype": "float32",
-  "transformers_version": "4.55.1",
   "use_focal_loss": true,
   "use_pretrained_backbone": false,
   "use_timm_backbone": false,

   "initializer_bias_prior_prob": null,
   "initializer_range": 0.01,
   "is_encoder_decoder": true,
+  "label2id": {
+    "bin": 0,
+    "hand": 1,
+    "not_bin": 2,
+    "not_hand": 3,
+    "not_trash": 4,
+    "trash": 5,
+    "trash_arm": 6
+  },
   "label_noise_ratio": 0.5,
   "layer_norm_eps": 1e-05,
   "learn_initial_query": false,
   "num_queries": 300,
   "positional_encoding_temperature": 10000,
   "torch_dtype": "float32",
+  "transformers_version": "4.55.2",
   "use_focal_loss": true,
   "use_pretrained_backbone": false,
   "use_timm_backbone": false,

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6a2f6604afa4f00e49b3594c85108de6f8b5452636ab90e407eb9ab6945c97f7
 size 171576780

 version https://git-lfs.github.com/spec/v1
+oid sha256:13bb80fc1443f2d8dfe944dbd86fdf4553dccb6e5cca81c00d762336bce905e8
 size 171576780

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0633e18f73ceb4670f3415c2ba861eaf5d631836bf1e02789099f62186ba7e69
 size 5368

 version https://git-lfs.github.com/spec/v1
+oid sha256:dba0e59d75b5f26b72c9149dff43eb10a8840397c11d5fc13fd5ffb131627d82
 size 5368