PatrickHaller
/

snowflake-arctic-embed-m-v2.0

Sentence Similarity

sentence-transformers

Transformers.js

feature-extraction

snowflake-arctic-embed

Model card Files Files and versions Community

Patrick Haller commited on 12 days ago

Commit

efaa79d

·

1 Parent(s): fac4c2e

Fix

Files changed (1) hide show

modeling_hf_alibaba_nlp_gte.py +7 -1

modeling_hf_alibaba_nlp_gte.py CHANGED Viewed

@@ -16,7 +16,7 @@
 import math
 from dataclasses import dataclass
-from typing import List, Optional, Tuple, Union
 import torch
 import torch.utils.checkpoint
@@ -994,6 +994,7 @@ class GteForSequenceClassification(GtePreTrainedModel):
         use_cache: Optional[bool] = None,
         output_attentions: Optional[bool] = None,
         output_hidden_states: Optional[bool] = None,
     ) -> SequenceClassifierOutputWithPast:
         r"""
         labels (`torch.LongTensor` of shape `(batch_size,)`, *optional*):
@@ -1009,6 +1010,7 @@ class GteForSequenceClassification(GtePreTrainedModel):
             inputs_embeds=inputs_embeds,
             output_attentions=output_attentions,
             output_hidden_states=output_hidden_states,
         )
         if self.config.add_pooling_layer:
             hidden_states = transformer_outputs.pooler_output
@@ -1021,6 +1023,10 @@ class GteForSequenceClassification(GtePreTrainedModel):
         if labels is not None:
             loss = self.loss_function(labels, logits, self.config)
         return SequenceClassifierOutputWithPast(
             loss=loss,
             logits=logits,

 import math
 from dataclasses import dataclass
+from typing import Any, List, Optional, Tuple, Union
 import torch
 import torch.utils.checkpoint
         use_cache: Optional[bool] = None,
         output_attentions: Optional[bool] = None,
         output_hidden_states: Optional[bool] = None,
+        **kwargs: Any,
     ) -> SequenceClassifierOutputWithPast:
         r"""
         labels (`torch.LongTensor` of shape `(batch_size,)`, *optional*):
             inputs_embeds=inputs_embeds,
             output_attentions=output_attentions,
             output_hidden_states=output_hidden_states,
+            **kwargs
         )
         if self.config.add_pooling_layer:
             hidden_states = transformer_outputs.pooler_output
         if labels is not None:
             loss = self.loss_function(labels, logits, self.config)
+        # if not return_dict:
+        #     output = (logits,) + transformer_outputs[1:]
+        #     return ((loss,) + output) if loss is not None else output
         return SequenceClassifierOutputWithPast(
             loss=loss,
             logits=logits,