uzabase
/

UBKE-LUKE

KenyaNonaka0210 commited on Dec 24, 2024

Commit

d397f88

verified ·

1 Parent(s): 3d3d7f4

Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -67,12 +67,12 @@ Entity Recognition Results:
 - 各次元のlogit値は，入力文章における各entityの関連度を表現しています．
 ### 4. entity_logits(entityの埋め込み表現)
-- entityの一覧は，tokenizerがentity_vocabに辞書形式で持つ．
 ```
 tokenizer.entity_vocab # => {"": 0, ... ,"AGC": 48, ....
 tokenizer.entity_vocab["味の素"] # => 8469(味の素のentity_id)
 ```
-- entity_spans及びentitties引数をtokenizerに渡し，tokenをencodeすることで，entityの埋め込み表現を得る．
 ```
 model.eval()
 tokens = tokenizer("味の素", entities=["味の素"], entity_spans=[(0, 3)], truncation=True, max_length=512, return_tensors="pt")
@@ -81,7 +81,7 @@ with torch.no_grad():
     outputs = model(**tokens)
 outputs.entity_logits.shape # 味の素のentity_vector
 ```
-- entityの埋め込み表現の内積(やコサイン類似度)を計算することで，entity同士の類似度を計算可能
 ```
 def encode(entity_text):
     model.eval()

 - 各次元のlogit値は，入力文章における各entityの関連度を表現しています．
 ### 4. entity_logits(entityの埋め込み表現)
+- entityの一覧は，tokenizerがentity_vocabに辞書形式で持ちます．
 ```
 tokenizer.entity_vocab # => {"": 0, ... ,"AGC": 48, ....
 tokenizer.entity_vocab["味の素"] # => 8469(味の素のentity_id)
 ```
+- entity_spans及びentitties引数をtokenizerに渡し，tokenをencodeすることで，entityの埋め込み表現を得ます．
 ```
 model.eval()
 tokens = tokenizer("味の素", entities=["味の素"], entity_spans=[(0, 3)], truncation=True, max_length=512, return_tensors="pt")
     outputs = model(**tokens)
 outputs.entity_logits.shape # 味の素のentity_vector
 ```
+- entityの埋め込み表現の内積(やコサイン類似度)を計算することで，entity同士の類似度を計算可能です．
 ```
 def encode(entity_text):
     model.eval()