Update README.md
Browse files
README.md
CHANGED
@@ -17,3 +17,7 @@ Transformer_depthだけ変わっているので(多分)Attention層のパラ
|
|
17 |
10層⇒4層となる場合1,2,3,7番目の層が残ります。
|
18 |
|
19 |
※up層の3番目は10層のままですが、コサイン類似度の結果が不可解なものになっていました。とりあえずここは変更されていないと仮定しています。
|
|
|
|
|
|
|
|
|
|
17 |
10層⇒4層となる場合1,2,3,7番目の層が残ります。
|
18 |
|
19 |
※up層の3番目は10層のままですが、コサイン類似度の結果が不可解なものになっていました。とりあえずここは変更されていないと仮定しています。
|
20 |
+
|
21 |
+
|
22 |
+

|
23 |
+

|