msbayindir's picture
Add new SentenceTransformer model
820f38a verified
---
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:23103
- loss:CosineSimilarityLoss
base_model: distilbert/distilroberta-base
widget:
- source_sentence: 'Davacı vekili dava dilekçesinde özetle: Müvekkilinin davalı Şti
''nin müdürü olup ortaklıktan çıkmak için dava açtığını, söz konusu yargılamanın
Antalya Asliye Ticaret Mahkemesi Esas sayılı dosyası ile görülmekte olduğunu ve
bu davanın tarihli celsesinde şirkete kayyım atanması için taraflarına iki haftalık
kesin süre verildiğini, ortaklıktan çıkma esnasında şirketi mahkemede temsil edecek
bir kayyım yasa gereği zorunlu bulunduğundan Şirketi''ye kayyum atanmasına karar
verilmesini talep etmiştir.'
sentences:
- )Davacı vekili dava dilekçesinde özetle; Bankası şubesine ait, numaralı, 13/09/2017
tarihli, keşidecisi A.Ş. olan, 69.000,00 TL bedelli çekin müvekkilinin uhdesinde
iken kaybolduğunu, tüm aramalara rağmen bulunamadığını, müvekkilinin zarara uğrayacağından
bahisle, öncelikle çek üzerine ödeme yasağı kararı konularak, çekin iptaline karar
verilmesini talep ve dava etmiştir.
- Davacı vekili dava dilekçesinde özetle; Müvekkilinin bir ticari ilişki sebebiyle
tanzim tarihli; tanzim tarihli; aldığını müvekkili uhdesinde iken kaybedildiğini
beyan ederek tanzim tarihli tanzim tarihli; vade tarihli bedelli bonoların iptaline
karar verilmesini talep ve dava etmiştir.
- Kıymetli evrak zayi olduğu takdirde mahkeme tarafından iptaline karar verilebilir.Kıymetli
evrakın zayi olduğu veya zıyaın ortaya çıktığı anda senet üzerinde hak sahibi
olan kişi, senedin iptaline karar verilmesini isteyebilir.
- source_sentence: 'Davacı vekili dava dilekçesinde özetle: Davacının yazılı sözleşmeden
kaynaklı alacağını davalı borçludan tahsilini sağlaması amacıyla Bursa 16. İcra
Müdürlüğü''nün 2020/7093 esas sayılı dosyası ile icra takibi başlattığını, başlatılan
icra takibine davalı tarafça itiraz edilmesi nedeniyle takibin durdurulduğunu
bu nedenle itirazın iptali ile borçlunun takip konusu borcu takip dosyasında belirtilen
faiziyle birlikte ödemeye ve takip konusu alacağın %20''sinden az olmamak üzere
tazminata mahkum edilmesine ayrıca yargılama giderleri ve vekalet ücretinin karşı
tarafa yükletilmesine karar verilmesini talep ve dava etmiştir.'
sentences:
- Bir tacirin borçlarının ticari olması asıldır. Ancak, gerçek kişi olan bir tacir,
işlemi yaptığı anda bunun ticari işletmesiyle ilgili olmadığını diğer tarafa açıkça
bildirdiği veya işin ticari sayılmasına durum elverişli olmadığı takdirde borç
adi sayılır.Taraflardan yalnız biri için ticari niteliğinde olan sözleşmeler,
Kanunda aksine hüküm bulunmadıkça, diğeri için de ticari sayılır.
- İradesi dışında poliçe elinden çıkan kişi, ödeme veya hamilin yerleşim yerindeki
asliye ticaret mahkemesinden, muhatabın poliçeyi ödemekten menedilmesini isteyebilir.Mahkeme,
ödemeyi meneden kararında muhataba, vadenin gelmesi üzerine poliçe bedelini tevdi
etmeye izin verir ve tevdi yerini gösterir.
- Kıymetli evrak zayi olduğu takdirde mahkeme tarafından iptaline karar verilebilir.Kıymetli
evrakın zayi olduğu veya zıyaın ortaya çıktığı anda senet üzerinde hak sahibi
olan kişi, senedin iptaline karar verilmesini isteyebilir.
- source_sentence: Davacı vekili dava dilekçesinde özetle; Davacı dava dilekçesinde
özetle; 31/10/2014 tarihinde bağlı olduğu Vergi Dairesinde kayıtlı yeri adresini,
işlerinin bozulmasından dolayı terk etmek zorunda kalındığını, başka bir adreste
faaliyete geçmediklerini, bu sebeple vergi kayıtlarının silindiğini, şirketin
ticaret sicilinde halen faal olarak gözüktüğünü, bağkur mülkiyetlerinin de sonlandıramayıp
kapatamadıkları için mağduriyet yaşadıklarını, ticaret sicilinden silinme için
başvurduklarını ancak dava tarihine kadar herhangi bir işlem yapılmadığını, açıklanan
sebeplerle Ticaret Sicil Müdürlüğünün sicil numarasında kayıtlı şirketin kaydının
silinmesini talep ve dava etmiştir.
sentences:
- Davacı vekili dava dilekçesinde özetle; Tic. Ltd. Şti. tarafından ticari ilişki
gereği davacı lehine düzenlenen Şubesi nezdinde IBAN nolu hesaba ait seri numaralı
keşide yeri İstanbul, 11/07/2020 keşide tarihli, 16.700,00-TL bedelli çekin davacı
şirketin elindeyken zayi olduğunu beyanla çekin zayi nedeniyle iptaline karar
verilmesini talep ve dava etmiştir.
- Davacı vekili dava dilekçesinde özetle; ile müvekkili arasında İstanbul Anadolu
İş Mahkemesi'nin esas sayılı dosyası ile alacak davası görüldüğünü, şirketin sicilden
terkin olması nedeniyle tebligat yapılamadığını ve dosyada taraf teşkilinin sağlanamadığını
belirterek ihyasına karar verilmesini talep ve dava etmiştir.
- Mahkeme, dilekçe sahibinin, poliçe elinde iken zıyaa uğradığına dair verdiği açıklamaları
inandırıcı bulursa, verilecek ilanla, poliçeyi eline geçireni, poliçeyi belirli
bir süre içinde getirmeye davet ve aksi takdirde poliçenin iptaline karar vereceğini
ihtar eder.
- source_sentence: Davacı vekili dava dilekçesinde özetle; müvekkilinin 1 adet çeki
zayii ettiğini bu nedenle çek üzerine ödeme yasağı konularak iptaline karar verilmesini
talep ve dava etmiştir.
sentences:
- Kıymetli evrak zayi olduğu takdirde mahkeme tarafından iptaline karar verilebilir.Kıymetli
evrakın zayi olduğu veya zıyaın ortaya çıktığı anda senet üzerinde hak sahibi
olan kişi, senedin iptaline karar verilmesini isteyebilir.
- Davacı vekili dava dilekçesinde özetle; davalılardan ile ibraz ettiğini, davacının
ibraz ettiği çekin sahte olduğunu, çekteki imzanın davacıya ait olmadığını, davalı
çeki incelemeden ödeme yaptığını, mağduriyetin giderilmesi için sayılı dosyası
ile icra takibi başlatıldığını, takibin itiraz üzerine durduğunu belirtmiş, sayılı
takip dosyasına davalılar tarafından yapılan itirazın iptaline, takibin devamına,
davalılar aleyhine %20 icra inkar tazminatına hükmedilmesine karar verilmesini
talep etmiştir.
- Davacı vekili dava dilekçesinde özetle, müvekkili şirkete keşide edilen 25/08/2020
tarihli T Bankası Şubesi 8517461 nolu tacir çekinin müvekkili uhtesindeyken kaybedildiğini,
çekin keşideci Bilişim Elektrik ve Elektronik İnşaat San ve Tic.Ltd.Şti. Tarafından
30.000 USD miktarlı olarak meşru hamili iken kaybı nedeniyle çekin 3. kişilerin
eline geçmesi ihtimali nedeniyle bu davanın ikame edildiğini bildirmiş, takdir
edilecek teminat mukabili ödeme yasağı kararı verilerek durumun ilgili bankaya
bildirilmesi ve çekin zayi nedeniyle iptaline karar verilmesini istemiştir.
- source_sentence: Davacı vekili dava dilekçesinde özetle; sıra nolu tutarlı çek (
İbraz tarihi sıra nolu tutarlı çek ( İbraz tarihi sıra nolu keşide tarihi çeklerin
zayi olduğundan bahisle çeklerin iptaline karar verilmesini talep ve dava etmiştir.
sentences:
- Davacı vekili dava dilekçesinde özetle; bank A.Ş. Şubesine ait 2 adet çekin müvekkilin
elinde kaybolduğunu, çekin yetkili hamilinin müvekkil olduğunu, müvekkilin borçlu
Dış Ticaret Ve San. Ltd. Şti.'ne haksız bir ödeme yapmak zorunda kalarak zarara
uğramaması için çek hakkında ödeme yasağı kararı verilmesi gerektiğini, teslim
alındığı sırada çek fotoğrafının müvekkil tarafından saklandığını, bu nedenlerle
2 adet çeke teminat karşılığında ödemeden men yasağı kararı verilmesine, yargılama
sonunda da çekin kaybolması nedeniyle iptaline karar verilmesini talep ve dava
etmiştir.
- İradesi dışında poliçe elinden çıkan kişi, ödeme veya hamilin yerleşim yerindeki
asliye ticaret mahkemesinden, muhatabın poliçeyi ödemekten menedilmesini isteyebilir.Mahkeme,
ödemeyi meneden kararında muhataba, vadenin gelmesi üzerine poliçe bedelini tevdi
etmeye izin verir ve tevdi yerini gösterir.
- Davacı vekili dava dilekçesinde özetle; müvekkillerinin her türlü ticari defter
ve kayıtlarının tutulduğu bilgisayarların bilişim sistemlerine girme saldırısı
yaşadığını, şirketlerin tüm verilerinin hacklendiğini beyanla; TTK 82/7. Maddesi
uyarınca 2020 yılı Nisan ayından itibaren tutulan tüm defter, fatura ve sair belgelerin
zayi olduğunun tespitine karar verilmesini talep ve dava etmiştir.
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
- pearson_cosine
- spearman_cosine
model-index:
- name: SentenceTransformer based on distilbert/distilroberta-base
results:
- task:
type: semantic-similarity
name: Semantic Similarity
dataset:
name: tr dev
type: tr-dev
metrics:
- type: pearson_cosine
value: 0.9286904784110396
name: Pearson Cosine
- type: spearman_cosine
value: 0.9261864868985737
name: Spearman Cosine
---
# SentenceTransformer based on distilbert/distilroberta-base
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [distilbert/distilroberta-base](https://huggingface.co/distilbert/distilroberta-base). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
## Model Details
### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [distilbert/distilroberta-base](https://huggingface.co/distilbert/distilroberta-base) <!-- at revision fb53ab8802853c8e4fbdbcd0529f21fc6f459b2b -->
- **Maximum Sequence Length:** 256 tokens
- **Output Dimensionality:** 768 dimensions
- **Similarity Function:** Cosine Similarity
<!-- - **Training Dataset:** Unknown -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->
### Model Sources
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
### Full Model Architecture
```
SentenceTransformer(
(0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: RobertaModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
```
## Usage
### Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
```bash
pip install -U sentence-transformers
```
Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("msbayindir/legal-text-embedding-turkish-v1")
# Run inference
sentences = [
'Davacı vekili dava dilekçesinde özetle; sıra nolu tutarlı çek ( İbraz tarihi sıra nolu tutarlı çek ( İbraz tarihi sıra nolu keşide tarihi çeklerin zayi olduğundan bahisle çeklerin iptaline karar verilmesini talep ve dava etmiştir.',
'Davacı vekili dava dilekçesinde özetle; müvekkillerinin her türlü ticari defter ve kayıtlarının tutulduğu bilgisayarların bilişim sistemlerine girme saldırısı yaşadığını, şirketlerin tüm verilerinin hacklendiğini beyanla; TTK 82/7. Maddesi uyarınca 2020 yılı Nisan ayından itibaren tutulan tüm defter, fatura ve sair belgelerin zayi olduğunun tespitine karar verilmesini talep ve dava etmiştir.',
"Davacı vekili dava dilekçesinde özetle; bank A.Ş. Şubesine ait 2 adet çekin müvekkilin elinde kaybolduğunu, çekin yetkili hamilinin müvekkil olduğunu, müvekkilin borçlu Dış Ticaret Ve San. Ltd. Şti.'ne haksız bir ödeme yapmak zorunda kalarak zarara uğramaması için çek hakkında ödeme yasağı kararı verilmesi gerektiğini, teslim alındığı sırada çek fotoğrafının müvekkil tarafından saklandığını, bu nedenlerle 2 adet çeke teminat karşılığında ödemeden men yasağı kararı verilmesine, yargılama sonunda da çekin kaybolması nedeniyle iptaline karar verilmesini talep ve dava etmiştir.",
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
```
<!--
### Direct Usage (Transformers)
<details><summary>Click to see the direct usage in Transformers</summary>
</details>
-->
<!--
### Downstream Usage (Sentence Transformers)
You can finetune this model on your own dataset.
<details><summary>Click to expand</summary>
</details>
-->
<!--
### Out-of-Scope Use
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->
## Evaluation
### Metrics
#### Semantic Similarity
* Dataset: `tr-dev`
* Evaluated with [<code>EmbeddingSimilarityEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.EmbeddingSimilarityEvaluator)
| Metric | Value |
|:--------------------|:-----------|
| pearson_cosine | 0.9287 |
| **spearman_cosine** | **0.9262** |
<!--
## Bias, Risks and Limitations
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->
<!--
### Recommendations
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->
## Training Details
### Training Dataset
#### Unnamed Dataset
* Size: 23,103 training samples
* Columns: <code>sentence1</code>, <code>sentence2</code>, and <code>score</code>
* Approximate statistics based on the first 1000 samples:
| | sentence1 | sentence2 | score |
|:--------|:-------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:---------------------------------------------------------------|
| type | string | string | float |
| details | <ul><li>min: 23 tokens</li><li>mean: 174.44 tokens</li><li>max: 256 tokens</li></ul> | <ul><li>min: 35 tokens</li><li>mean: 173.08 tokens</li><li>max: 256 tokens</li></ul> | <ul><li>min: 0.13</li><li>mean: 0.6</li><li>max: 1.0</li></ul> |
* Samples:
| sentence1 | sentence2 | score |
|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:--------------------------------|
| <code>Davacı vekili dava dilekçesinde özetle, müvekkilinin elinde bulanan ve keşidecisinin müvekkili olduğunu beyan ettiği 3 adet çekin zayi olduğunu, ilgili çekler üzerine ihtiyati tedbir ile ödemeden men yasağı kararı verilmesini ve dava konusu çeklerin iptaline karar verilmesini talep ve dava etmiştir.</code> | <code>Davacı vekili dava dilekçesinde özetle; müvekkillerinin her türlü ticari defter ve kayıtlarının tutulduğu bilgisayarların bilişim sistemlerine girme saldırısı yaşadığını, şirketlerin tüm verilerinin hacklendiğini beyanla; TTK 82/7. Maddesi uyarınca 2020 yılı Nisan ayından itibaren tutulan tüm defter, fatura ve sair belgelerin zayi olduğunun tespitine karar verilmesini talep ve dava etmiştir.</code> | <code>0.5695858597755432</code> |
| <code>Davacı vekili dava dilekçesinde özetle; bank Şubesine ait, Keşidecisi Tic. A.Ş. olan, Seri Numaralı, 24.01.2015 keşide tarihli, 25.000 TL bedelli, bank Şubesine ait, Keşidecisi Tic. A.Ş. olan Seri Numaralı, 24.02.2015 keşide tarihli, 25.000 TL bedelli ve bank Şubesine ait, Keşidecisi A.Ş. olan Seri Numaralı, 29.12.2010 keşide tarihli, 5.000 TL bedelli çeklerin kaybolduğunu, bu nedenle çeklerin iptaline karar verilmesini talep ve dava etmiştir.</code> | <code>Davacı vekili dava dilekçesinde özetle; müvekkilin Bankası Şubesi'ne ait 26.500,00 TL lik çeki zilyedinde iken kaybettiğini, çeki tüm aramalarına rağmen bulamadığını, çekin yetkili hamili ve lehtarı olduğunu, bu nedenlerle çek üzerine ödeme yasağı konulmasını, çekin iptaline karar verilmesini talep ve dava etmiştir.</code> | <code>0.74713134765625</code> |
| <code>Davacı vekili dava dilekçesinde özetle; müvekkili şirketin keşidecisi, Bankası Şubesi'nin aval veren , dava dışı Tekstil San. Ve Tic. Ltd.Şti'nin muhatabı olduğu 15/06/2017 tarih 103.000,00 TL bedelli ve 21/06/2018 vade tarihli poliçenin müvekkilinin elinde iken kaybolduğunu, poliçe aslının yapılan tüm aramalara rağmen şirket kasasında bulunamadığını, dava konusu poliçe bedelinin ödenmesinin tedbiren önlenmesini ,yargılama sonunda TTK 757 md gere- ğince zayi nedeniyle poliçenin iptalini talep ve dava etmiştir.</code> | <code>İradesi dışında poliçe elinden çıkan kişi, ödeme veya hamilin yerleşim yerindeki asliye ticaret mahkemesinden, muhatabın poliçeyi ödemekten menedilmesini isteyebilir.Mahkeme, ödemeyi meneden kararında muhataba, vadenin gelmesi üzerine poliçe bedelini tevdi etmeye izin verir ve tevdi yerini gösterir.</code> | <code>0.4938291609287262</code> |
* Loss: [<code>CosineSimilarityLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cosinesimilarityloss) with these parameters:
```json
{
"loss_fct": "torch.nn.modules.loss.MSELoss"
}
```
### Evaluation Dataset
#### Unnamed Dataset
* Size: 5,776 evaluation samples
* Columns: <code>sentence1</code>, <code>sentence2</code>, and <code>score</code>
* Approximate statistics based on the first 1000 samples:
| | sentence1 | sentence2 | score |
|:--------|:-------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:---------------------------------------------------------------|
| type | string | string | float |
| details | <ul><li>min: 23 tokens</li><li>mean: 177.14 tokens</li><li>max: 256 tokens</li></ul> | <ul><li>min: 31 tokens</li><li>mean: 171.69 tokens</li><li>max: 256 tokens</li></ul> | <ul><li>min: 0.07</li><li>mean: 0.6</li><li>max: 1.0</li></ul> |
* Samples:
| sentence1 | sentence2 | score |
|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:--------------------------------|
| <code>Davacı vekili dava dilekçesinde özetle; Müvekkili şirkete sonucu ciro yolu ile verilen, zayi olduğunu, müvekkilinin haklı ve yasal hamili bulunduğu sırada zayi edilen bu çeklerin kötüniyetli üçüncü şahısların eline geçmesi ve müvekkilinin mağdur duruma düşürülmesi mümkün olduğundan zayi edilen bu çek bedelleri üzerine öncelikle ödeme yasağı tesis edilmesine ve bilahare çeklerin iptaline karar verilmesini dava ve talep etmiştir.</code> | <code>İradesi dışında poliçe elinden çıkan kişi, ödeme veya hamilin yerleşim yerindeki asliye ticaret mahkemesinden, muhatabın poliçeyi ödemekten menedilmesini isteyebilir.Mahkeme, ödemeyi meneden kararında muhataba, vadenin gelmesi üzerine poliçe bedelini tevdi etmeye izin verir ve tevdi yerini gösterir.</code> | <code>0.7115448713302612</code> |
| <code>Davacı vekili dava dilekçesinde özetle; müvekkilinin dilekçe içeriğinde bildirdiği çekin yasal hamili olduğunu, çekin kaybediğildiğini belirterek çekin üzerine ödeme yasağı konulması ile çekin iptaline karar verilmesini talep ve dava etmiştir.</code> | <code>Kıymetli evrak zayi olduğu takdirde mahkeme tarafından iptaline karar verilebilir.Kıymetli evrakın zayi olduğu veya zıyaın ortaya çıktığı anda senet üzerinde hak sahibi olan kişi, senedin iptaline karar verilmesini isteyebilir.</code> | <code>0.53521329164505</code> |
| <code>Davacı vekili dava dilekçesinde özetle; müvekkilinin dilekçe içeriğinde bildirdiği çekin yasal hamili olduğunu, çekin kaybediğildiğini belirterek çekin üzerine ödeme yasağı konulması ile çekin iptaline karar verilmesini talep ve dava etmiştir.</code> | <code>İradesi dışında poliçe elinden çıkan kişi, ödeme veya hamilin yerleşim yerindeki asliye ticaret mahkemesinden, muhatabın poliçeyi ödemekten menedilmesini isteyebilir.Mahkeme, ödemeyi meneden kararında muhataba, vadenin gelmesi üzerine poliçe bedelini tevdi etmeye izin verir ve tevdi yerini gösterir.</code> | <code>0.6673290133476257</code> |
* Loss: [<code>CosineSimilarityLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#cosinesimilarityloss) with these parameters:
```json
{
"loss_fct": "torch.nn.modules.loss.MSELoss"
}
```
### Training Hyperparameters
#### Non-Default Hyperparameters
- `eval_strategy`: epoch
- `per_device_train_batch_size`: 64
- `per_device_eval_batch_size`: 64
- `num_train_epochs`: 4
- `warmup_ratio`: 0.1
- `fp16`: True
- `batch_sampler`: no_duplicates
#### All Hyperparameters
<details><summary>Click to expand</summary>
- `overwrite_output_dir`: False
- `do_predict`: False
- `eval_strategy`: epoch
- `prediction_loss_only`: True
- `per_device_train_batch_size`: 64
- `per_device_eval_batch_size`: 64
- `per_gpu_train_batch_size`: None
- `per_gpu_eval_batch_size`: None
- `gradient_accumulation_steps`: 1
- `eval_accumulation_steps`: None
- `torch_empty_cache_steps`: None
- `learning_rate`: 5e-05
- `weight_decay`: 0.0
- `adam_beta1`: 0.9
- `adam_beta2`: 0.999
- `adam_epsilon`: 1e-08
- `max_grad_norm`: 1.0
- `num_train_epochs`: 4
- `max_steps`: -1
- `lr_scheduler_type`: linear
- `lr_scheduler_kwargs`: {}
- `warmup_ratio`: 0.1
- `warmup_steps`: 0
- `log_level`: passive
- `log_level_replica`: warning
- `log_on_each_node`: True
- `logging_nan_inf_filter`: True
- `save_safetensors`: True
- `save_on_each_node`: False
- `save_only_model`: False
- `restore_callback_states_from_checkpoint`: False
- `no_cuda`: False
- `use_cpu`: False
- `use_mps_device`: False
- `seed`: 42
- `data_seed`: None
- `jit_mode_eval`: False
- `use_ipex`: False
- `bf16`: False
- `fp16`: True
- `fp16_opt_level`: O1
- `half_precision_backend`: auto
- `bf16_full_eval`: False
- `fp16_full_eval`: False
- `tf32`: None
- `local_rank`: 0
- `ddp_backend`: None
- `tpu_num_cores`: None
- `tpu_metrics_debug`: False
- `debug`: []
- `dataloader_drop_last`: False
- `dataloader_num_workers`: 0
- `dataloader_prefetch_factor`: None
- `past_index`: -1
- `disable_tqdm`: False
- `remove_unused_columns`: True
- `label_names`: None
- `load_best_model_at_end`: False
- `ignore_data_skip`: False
- `fsdp`: []
- `fsdp_min_num_params`: 0
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
- `fsdp_transformer_layer_cls_to_wrap`: None
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
- `deepspeed`: None
- `label_smoothing_factor`: 0.0
- `optim`: adamw_torch
- `optim_args`: None
- `adafactor`: False
- `group_by_length`: False
- `length_column_name`: length
- `ddp_find_unused_parameters`: None
- `ddp_bucket_cap_mb`: None
- `ddp_broadcast_buffers`: False
- `dataloader_pin_memory`: True
- `dataloader_persistent_workers`: False
- `skip_memory_metrics`: True
- `use_legacy_prediction_loop`: False
- `push_to_hub`: False
- `resume_from_checkpoint`: None
- `hub_model_id`: None
- `hub_strategy`: every_save
- `hub_private_repo`: None
- `hub_always_push`: False
- `gradient_checkpointing`: False
- `gradient_checkpointing_kwargs`: None
- `include_inputs_for_metrics`: False
- `include_for_metrics`: []
- `eval_do_concat_batches`: True
- `fp16_backend`: auto
- `push_to_hub_model_id`: None
- `push_to_hub_organization`: None
- `mp_parameters`:
- `auto_find_batch_size`: False
- `full_determinism`: False
- `torchdynamo`: None
- `ray_scope`: last
- `ddp_timeout`: 1800
- `torch_compile`: False
- `torch_compile_backend`: None
- `torch_compile_mode`: None
- `dispatch_batches`: None
- `split_batches`: None
- `include_tokens_per_second`: False
- `include_num_input_tokens_seen`: False
- `neftune_noise_alpha`: None
- `optim_target_modules`: None
- `batch_eval_metrics`: False
- `eval_on_start`: False
- `use_liger_kernel`: False
- `eval_use_gather_object`: False
- `average_tokens_across_devices`: False
- `prompts`: None
- `batch_sampler`: no_duplicates
- `multi_dataset_batch_sampler`: proportional
</details>
### Training Logs
| Epoch | Step | Training Loss | Validation Loss | tr-dev_spearman_cosine |
|:------:|:----:|:-------------:|:---------------:|:----------------------:|
| 0 | 0 | - | - | 0.2161 |
| 0.2770 | 100 | 0.0626 | - | - |
| 0.5540 | 200 | 0.0102 | - | - |
| 0.8310 | 300 | 0.0082 | - | - |
| 1.0028 | 362 | - | 0.0085 | 0.7776 |
| 1.1053 | 400 | 0.0095 | - | - |
| 1.3823 | 500 | 0.0061 | - | - |
| 1.6593 | 600 | 0.005 | - | - |
| 1.9363 | 700 | 0.0047 | - | - |
| 2.0028 | 724 | - | 0.0054 | 0.8873 |
| 2.2105 | 800 | 0.005 | - | - |
| 2.4875 | 900 | 0.0042 | - | - |
| 2.7645 | 1000 | 0.0034 | - | - |
| 3.0028 | 1086 | - | 0.0032 | 0.9026 |
| 3.0388 | 1100 | 0.0032 | - | - |
| 3.3158 | 1200 | 0.0038 | - | - |
| 3.5928 | 1300 | 0.0032 | - | - |
| 3.8698 | 1400 | 0.0024 | - | - |
| 3.9917 | 1444 | - | 0.0026 | 0.9262 |
### Framework Versions
- Python: 3.11.11
- Sentence Transformers: 3.3.1
- Transformers: 4.47.1
- PyTorch: 2.5.1+cu124
- Accelerate: 1.2.1
- Datasets: 3.2.0
- Tokenizers: 0.21.0
## Citation
### BibTeX
#### Sentence Transformers
```bibtex
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
```
<!--
## Glossary
*Clearly define terms in order to be accessible across audiences.*
-->
<!--
## Model Card Authors
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->
<!--
## Model Card Contact
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
-->