AT
/

distilroberta-base-finetuned-wikitext2

@@ -14,7 +14,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [distilroberta-base](https://huggingface.co/distilroberta-base) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.0047
 ## Model description
@@ -45,91 +45,91 @@ The following hyperparameters were used during training:
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 0.079         | 1.0   | 24   | 0.0748          |
-| 0.045         | 2.0   | 48   | 0.0507          |
-| 0.0253        | 3.0   | 72   | 0.0494          |
-| 0.0285        | 4.0   | 96   | 0.0469          |
-| 0.0189        | 5.0   | 120  | 0.0319          |
-| 0.0014        | 6.0   | 144  | 0.0220          |
-| 0.0023        | 7.0   | 168  | 0.0108          |
-| 0.0012        | 8.0   | 192  | 0.0079          |
-| 0.0067        | 9.0   | 216  | 0.0061          |
-| 0.0006        | 10.0  | 240  | 0.0099          |
-| 0.0004        | 11.0  | 264  | 0.0067          |
-| 0.0007        | 12.0  | 288  | 0.0060          |
-| 0.0005        | 13.0  | 312  | 0.0050          |
-| 0.0005        | 14.0  | 336  | 0.0050          |
-| 0.0005        | 15.0  | 360  | 0.0046          |
-| 0.0001        | 16.0  | 384  | 0.0052          |
-| 0.0001        | 17.0  | 408  | 0.0047          |
-| 0.0001        | 18.0  | 432  | 0.0046          |
-| 0.0001        | 19.0  | 456  | 0.0050          |
-| 0.0001        | 20.0  | 480  | 0.0046          |
-| 0.0001        | 21.0  | 504  | 0.0046          |
-| 0.0007        | 22.0  | 528  | 0.0046          |
-| 0.0001        | 23.0  | 552  | 0.0046          |
-| 0.0001        | 24.0  | 576  | 0.0049          |
-| 0.0001        | 25.0  | 600  | 0.0043          |
-| 0.0001        | 26.0  | 624  | 0.0046          |
-| 0.0           | 27.0  | 648  | 0.0044          |
-| 0.0001        | 28.0  | 672  | 0.0045          |
-| 0.0001        | 29.0  | 696  | 0.0045          |
-| 0.0002        | 30.0  | 720  | 0.0044          |
-| 0.0           | 31.0  | 744  | 0.0044          |
-| 0.0001        | 32.0  | 768  | 0.0044          |
-| 0.0           | 33.0  | 792  | 0.0044          |
-| 0.0001        | 34.0  | 816  | 0.0050          |
-| 0.0001        | 35.0  | 840  | 0.0050          |
-| 0.0002        | 36.0  | 864  | 0.0049          |
-| 0.0           | 37.0  | 888  | 0.0048          |
-| 0.0           | 38.0  | 912  | 0.0054          |
-| 0.0           | 39.0  | 936  | 0.0048          |
-| 0.0           | 40.0  | 960  | 0.0047          |
-| 0.0002        | 41.0  | 984  | 0.0048          |
-| 0.0           | 42.0  | 1008 | 0.0068          |
-| 0.0           | 43.0  | 1032 | 0.0051          |
-| 0.0002        | 44.0  | 1056 | 0.0049          |
-| 0.0           | 45.0  | 1080 | 0.0049          |
-| 0.0           | 46.0  | 1104 | 0.0048          |
-| 0.0           | 47.0  | 1128 | 0.0046          |
-| 0.0           | 48.0  | 1152 | 0.0046          |
-| 0.0           | 49.0  | 1176 | 0.0048          |
-| 0.0           | 50.0  | 1200 | 0.0049          |
-| 0.0           | 51.0  | 1224 | 0.0047          |
-| 0.0           | 52.0  | 1248 | 0.0046          |
-| 0.0001        | 53.0  | 1272 | 0.0046          |
-| 0.0           | 54.0  | 1296 | 0.0045          |
-| 0.0           | 55.0  | 1320 | 0.0045          |
-| 0.0           | 56.0  | 1344 | 0.0046          |
-| 0.0           | 57.0  | 1368 | 0.0046          |
-| 0.0           | 58.0  | 1392 | 0.0046          |
-| 0.0           | 59.0  | 1416 | 0.0046          |
-| 0.0           | 60.0  | 1440 | 0.0046          |
-| 0.0           | 61.0  | 1464 | 0.0047          |
-| 0.0           | 62.0  | 1488 | 0.0047          |
-| 0.0           | 63.0  | 1512 | 0.0047          |
-| 0.0           | 64.0  | 1536 | 0.0046          |
-| 0.0           | 65.0  | 1560 | 0.0045          |
-| 0.0           | 66.0  | 1584 | 0.0045          |
-| 0.0           | 67.0  | 1608 | 0.0046          |
-| 0.0           | 68.0  | 1632 | 0.0047          |
-| 0.0           | 69.0  | 1656 | 0.0048          |
-| 0.0001        | 70.0  | 1680 | 0.0048          |
-| 0.0           | 71.0  | 1704 | 0.0048          |
-| 0.0           | 72.0  | 1728 | 0.0047          |
-| 0.0001        | 73.0  | 1752 | 0.0049          |
-| 0.0           | 74.0  | 1776 | 0.0048          |
-| 0.0           | 75.0  | 1800 | 0.0048          |
-| 0.0           | 76.0  | 1824 | 0.0047          |
-| 0.0           | 77.0  | 1848 | 0.0047          |
-| 0.0           | 78.0  | 1872 | 0.0047          |
-| 0.0           | 79.0  | 1896 | 0.0047          |
-| 0.0           | 80.0  | 1920 | 0.0047          |
 ### Framework versions
-- Transformers 4.14.1
 - Pytorch 1.10.0+cu111
 - Datasets 1.17.0
 - Tokenizers 0.10.3

 This model is a fine-tuned version of [distilroberta-base](https://huggingface.co/distilroberta-base) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0003
 ## Model description
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 0.0439        | 1.0   | 30   | 0.0535          |
+| 0.0415        | 2.0   | 60   | 0.0434          |
+| 0.0289        | 3.0   | 90   | 0.0293          |
+| 0.0046        | 4.0   | 120  | 0.0171          |
+| 0.0021        | 5.0   | 150  | 0.0066          |
+| 0.0006        | 6.0   | 180  | 0.0051          |
+| 0.0003        | 7.0   | 210  | 0.0032          |
+| 0.0006        | 8.0   | 240  | 0.0024          |
+| 0.0031        | 9.0   | 270  | 0.0040          |
+| 0.0002        | 10.0  | 300  | 0.0031          |
+| 0.0001        | 11.0  | 330  | 0.0016          |
+| 0.0038        | 12.0  | 360  | 0.0015          |
+| 0.0001        | 13.0  | 390  | 0.0018          |
+| 0.0001        | 14.0  | 420  | 0.0020          |
+| 0.0001        | 15.0  | 450  | 0.0023          |
+| 0.0001        | 16.0  | 480  | 0.0019          |
+| 0.0001        | 17.0  | 510  | 0.0027          |
+| 0.0001        | 18.0  | 540  | 0.0024          |
+| 0.0001        | 19.0  | 570  | 0.0010          |
+| 0.0001        | 20.0  | 600  | 0.0011          |
+| 0.0001        | 21.0  | 630  | 0.0012          |
+| 0.0001        | 22.0  | 660  | 0.0012          |
+| 0.0001        | 23.0  | 690  | 0.0012          |
+| 0.0001        | 24.0  | 720  | 0.0011          |
+| 0.0           | 25.0  | 750  | 0.0013          |
+| 0.0002        | 26.0  | 780  | 0.0006          |
+| 0.0001        | 27.0  | 810  | 0.0012          |
+| 0.0001        | 28.0  | 840  | 0.0007          |
+| 0.0001        | 29.0  | 870  | 0.0008          |
+| 0.0           | 30.0  | 900  | 0.0009          |
+| 0.0001        | 31.0  | 930  | 0.0009          |
+| 0.0001        | 32.0  | 960  | 0.0006          |
+| 0.0           | 33.0  | 990  | 0.0005          |
+| 0.0           | 34.0  | 1020 | 0.0005          |
+| 0.0           | 35.0  | 1050 | 0.0005          |
+| 0.0001        | 36.0  | 1080 | 0.0008          |
+| 0.0001        | 37.0  | 1110 | 0.0006          |
+| 0.0001        | 38.0  | 1140 | 0.0005          |
+| 0.0           | 39.0  | 1170 | 0.0007          |
+| 0.0001        | 40.0  | 1200 | 0.0010          |
+| 0.0002        | 41.0  | 1230 | 0.0009          |
+| 0.0           | 42.0  | 1260 | 0.0007          |
+| 0.0           | 43.0  | 1290 | 0.0005          |
+| 0.0001        | 44.0  | 1320 | 0.0005          |
+| 0.0           | 45.0  | 1350 | 0.0005          |
+| 0.0           | 46.0  | 1380 | 0.0005          |
+| 0.0           | 47.0  | 1410 | 0.0005          |
+| 0.0           | 48.0  | 1440 | 0.0005          |
+| 0.0001        | 49.0  | 1470 | 0.0005          |
+| 0.0           | 50.0  | 1500 | 0.0006          |
+| 0.0           | 51.0  | 1530 | 0.0006          |
+| 0.0           | 52.0  | 1560 | 0.0005          |
+| 0.0           | 53.0  | 1590 | 0.0006          |
+| 0.0           | 54.0  | 1620 | 0.0006          |
+| 0.0           | 55.0  | 1650 | 0.0006          |
+| 0.0           | 56.0  | 1680 | 0.0007          |
+| 0.0           | 57.0  | 1710 | 0.0007          |
+| 0.0           | 58.0  | 1740 | 0.0007          |
+| 0.0           | 59.0  | 1770 | 0.0007          |
+| 0.0           | 60.0  | 1800 | 0.0006          |
+| 0.0           | 61.0  | 1830 | 0.0007          |
+| 0.0           | 62.0  | 1860 | 0.0006          |
+| 0.0           | 63.0  | 1890 | 0.0006          |
+| 0.0           | 64.0  | 1920 | 0.0003          |
+| 0.0           | 65.0  | 1950 | 0.0003          |
+| 0.0           | 66.0  | 1980 | 0.0003          |
+| 0.0           | 67.0  | 2010 | 0.0003          |
+| 0.0           | 68.0  | 2040 | 0.0003          |
+| 0.0           | 69.0  | 2070 | 0.0003          |
+| 0.0           | 70.0  | 2100 | 0.0003          |
+| 0.0           | 71.0  | 2130 | 0.0003          |
+| 0.0           | 72.0  | 2160 | 0.0003          |
+| 0.0           | 73.0  | 2190 | 0.0003          |
+| 0.0           | 74.0  | 2220 | 0.0003          |
+| 0.0           | 75.0  | 2250 | 0.0003          |
+| 0.0           | 76.0  | 2280 | 0.0003          |
+| 0.0           | 77.0  | 2310 | 0.0003          |
+| 0.0           | 78.0  | 2340 | 0.0003          |
+| 0.0           | 79.0  | 2370 | 0.0003          |
+| 0.0           | 80.0  | 2400 | 0.0003          |
 ### Framework versions
+- Transformers 4.15.0
 - Pytorch 1.10.0+cu111
 - Datasets 1.17.0
 - Tokenizers 0.10.3