SentenceTransformer based on dbmdz/bert-base-turkish-uncased

This is a sentence-transformers model finetuned from dbmdz/bert-base-turkish-uncased on the cleaned_turkish_embedding_model_training_data_colab dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

Model Type: Sentence Transformer
Base model: dbmdz/bert-base-turkish-uncased
Maximum Sequence Length: 512 tokens
Output Dimensionality: 768 dimensions
Similarity Function: Cosine Similarity
Training Dataset:
- cleaned_turkish_embedding_model_training_data_colab

Model Sources

Documentation: Sentence Transformers Documentation
Repository: Sentence Transformers on GitHub
Hugging Face: Sentence Transformers on Hugging Face

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("trmteb/bert-base-turkish-uncased-cachedmnrl-contrastive-loss")
# Run inference
sentences = [
    'S: İtalyanca bir cümle göz önüne alındığında, cümle üzerinde küçük değişiklikler yaparak yeni bir İtalyan cezası üretin.Burada, değişikliklerin anlamsal olarak ilişkili olduğundan ve girişe sözdizimsel olarak benzer olduğundan emin olun.Ve üretilen cümlenin yüksek sağduyulu mantıklılığı olması gerekir, yani bunun doğru olma olasılığı vardır.\nSiete entusiasti di scavare un Serpente Un Luogo Nascosto.\nA:',
    'Verilen cümlede küçük değişiklikler yaparak yeni bir İtalyan cümle oluşturmak için şu adımları izleyeceğim:\n\nAdım 1: Orijinal cümlenin anlamını anlayın.\n"Siete entusiasti di scavare un Serpente Un Luogo Nascosto" "" Gizli bir yerde bir yılanı kazmaktan heyecan duyuyorsunuz. "Konunun (siz) gizli bir yerde bir yılanı kazma eylemi konusunda hevesli olduğunu ima eder.\n\nAdım 2: Cümledeki temel öğeleri tanımlayın.\nCümledeki temel unsurlar:\n- Konu: "Siete" (siz)\n- fiil: "çöpe" (kazmak için)\n- Nesne: "Un Serpente" (bir yılan)\n- Konum: "Un Luogo Nascosto\'da" (Gizli Bir Yerde)\n\nAdım 3: Anlamsal olarak ilgili değişikliklerle yeni bir cümle oluşturun.\nAnlamsal alaka düzeyini korumak için, genel anlamı sağlam tutarken orijinal cümlede küçük değişiklikler yapacağım.İşte yeni cümle:\n\n"Un Luogo Misterioso\'da Siete Entusiasti di Scoprire un Serpente."\nBu yeni cümle "Gizemli bir yerde bir yılan keşfetmekten heyecan duyuyorsunuz" anlamına geliyor.Keşif ve heyecan duygusunu korumak için "Scoprire" ile "Scoprire" (keşfetmek) ile değiştirdim.Ayrıca, gizlilik ve entrika fikrini korumak için "nascosto" (gizli) "Misterioso" olarak değiştirdim.\n\nAdım 4: Sözdizimsel benzerlik sağlayın.\nYeni cümle, orijinal cümle ile aynı sözdizimsel yapıyı, "siete" (siz), "scoprire" (keşfetmek için) fiili, "un serpente" (bir yılan) nesnesi ile korurLuogo Misterioso "(gizemli bir yerde).Bu, yeni cümlenin sözdizimsel olarak orijinaline benzer olmasını sağlar.\n\nAdım 5: Sağlıklı uygunluğu doğrulayın.\nÜretilen cümlenin makul bir gerçek olma olasılığı olmasını sağlamak için, tarif edilen senaryonun uygunluğunu göz önünde bulundurmamız gerekir.Gizemli bir yerde bir yılan keşfetmek yaygın olmasa da, olasılık alanı içindedir.Bu nedenle, üretilen cümlenin yüksek bir sağduyulu vardır.\n\nBu adımları izleyerek, anlamsal olarak ilişkili, sözdizimsel olarak benzer ve yüksek sağduyse sahip olma kriterlerini karşılayan yeni bir İtalyan cümle oluşturdum.',
    'Mühendisler için ellerin iyice kurulanması şeklindeki ekstrem el yıkama tekniğini uygulayan, C++ ile yazılmış bazı örnek kodlar aşağıda verilmiştir:\n```c++\n#include <iostream>\nad alanı std\'sini kullanma;\n \nint ana() {\n //Kullanıcıdan adını girmesini isteyin\n cout << "Lütfen adınızı giriniz: ";\n dize adı;\n getline(cin, isim);\n \n // İsme göre kimin ellerini kurutması gerektiğini belirleyin\n bool needToDry = false;\n if (isim == "John") {\n needToDry = doğru;\n } else if (isim == "Jane") {\n needToDry = yanlış;\n } başka {\n // Gerektiğinde diğer adları burada işleyin\n while (doğru) {\n cout << "Geçersiz ad girildi. Lütfen tekrar deneyin: ";\n getline(cin, isim);\n \n if (isim == "John") {\n needToDry = doğru;\n kırmak;\n } else if (isim == "Jane") {\n needToDry = yanlış;\n kırmak;\n }\n }\n }\n \n // Sonucu göster\n if (needToDry) {\n cout << "Merhaba " + name + ". Görünüşe göre ellerinizi kurutmanız gerekiyor."\n << son\n << "En az 20 saniye fırçaladığınızdan emin olun, iyice durulayın"\n << "ve ardından bunları tamamen kurutmak için kağıt havlu kullanın." << endl;\n } başka {\n cout << "Merhaba " + name + ". Adınıza göre görünmüyor"\n << "işe dönmeden önce ellerinizi kurutmanız gerektiği gibi." \n << endl;\n }\n \n 0 değerini döndür;\n}\n\'\'\'\'\nBu kod, John\'un veya Jane\'in ellerini kurulaması gerekip gerekmediğini belirlemek için "if" ifadesini kullanır. Kullanıcının girdiği ad bu iki değerden biriyle eşleşirse karşılık gelen boole değeri buna göre ayarlanacaktır. Ancak, girilen ad tanınmazsa kod geri döner ve kullanıcıdan "John" veya "Jane" yazana kadar adını yeniden girmesini ister. \'While\' döngüsü, kullanıcının adını girerken yapmış olabileceği hataları düzeltme şansına sahip olmasını sağlar. Doğru ad girildiğinde, kullanıcıya ellerini kurulaması gerekip gerekmediğini bildiren uygun mesaj görüntülenir.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Binary Classification

Dataset: dev
Evaluated with BinaryClassificationEvaluator

Metric	Value
cosine_accuracy	1.0
cosine_accuracy_threshold	-0.1172
cosine_f1	1.0
cosine_f1_threshold	-0.1172
cosine_precision	1.0
cosine_recall	1.0
cosine_ap	1.0
cosine_mcc	0.0

Training Details

Training Dataset

cleaned_turkish_embedding_model_training_data_colab

Dataset: cleaned_turkish_embedding_model_training_data_colab at d35bbe7
Size: 32,523,072 training samples
Columns: anchor and positive
Approximate statistics based on the first 1000 samples:
anchor positive
type string string
details
min: 6 tokens
mean: 139.24 tokens
max: 512 tokens

min: 7 tokens
mean: 234.7 tokens
max: 512 tokens

	anchor	positive
type	string	string
details	min: 6 tokens mean: 139.24 tokens max: 512 tokens	min: 7 tokens mean: 234.7 tokens max: 512 tokens

Samples:

anchor	positive
`Yüksek Sosyal Medyayı Hesaplayan bir Julia komut dosyası pasajı oluşturun: Yeni Başlayanlar İçin Mühendis için Kullanıcı Etkileşimi. Bias'a dayalı olarak farklı eylemleri koşullu olarak gerçekleştirmek için if/else veya switch/case ifadelerini kullanın. Prova yapın ve ardından kontrol akışının ana hatlarını çizen ve farklı senaryoları nasıl ele aldığınıza dair yorumları ekleyin.`	Burada, tespit edilen önyargının türüne bağlı olarak hangi eylemin gerçekleştirileceğini belirlemek için koşullu ifadeler (if...else) kullanarak yeni başlayan mühendisler için yüksek sosyal medya kullanıcı etkileşimini hesaplayan örnek bir Julia komut dosyası verilmiştir: ```julia kullanma CSV içe aktarma DataFrames # Giriş dosyası yolunu ve sütun adlarını tanımlayın input_file = "data.csv" sütunlar = ["post", "beğeniler", "retweetler", "yanıtlar"] # CSV dosyasındaki giriş verilerini DataFrame df =DataFrames'e okuyun. okunabilir(giriş_dosyası, sütunlar=sütunlar) # Beğenileri, retweetleri, yanıtları toplayarak toplam etkileşimleri hesaplayın etkileşimler = df[:, :likes] .+ df[:, :retweets] + df[:, :replies] # Şunun için eşikleri tanımlayın: düşük, orta ve yüksek düzeyde etkileşim low_threshold = 10 orta_threshold = 25 high_threshold = 40 # Olumlu yanıtların yüzdesini hesaplama işlevi function get_percentage(x) return round((count(y -> y == true, x)/length( x))*100; rakam=2) end # 1:size...
`İşte bir hedef: Kamp ateşinde patlamış mısır yapmak. Bu hedefe ulaşmak için hangi yol daha mantıklıdır?`	Kamp ateşinde patlamış mısır yapmanın farklı yolları vardır, ancak mantıklı olan yollardan biri patlamış mısır patlatıcısı kullanmaktır. Patlamış mısır patlatıcısı, patlamış mısır tanelerini patlarken karıştıracak bir mekanizmaya sahip, uzun saplı ve kapaklı özel bir tenceredir. Patlamış mısır patlatıcısını kullanmak için önce bir kamp ateşi yakarsınız ve ateşin sıcak kömürlere dönüşmesine izin verirsiniz. Daha sonra patlamış mısır patlatıcısını sıcak kömürlerin üzerine yerleştirip biraz yağ ve patlamış mısır taneleri eklersiniz. Daha sonra kapağı kapatıp sapı ateşin üzerinde tutarken, kolu çevirerek çekirdekleri karıştırırsınız. Çekirdekler patladıkça tencereyi dolduracak ve kamp ateşinizde taze patlamış mısırın tadını çıkarabilirsiniz! Bu yöntem mantıklıdır çünkü kamp ateşinde patlamış mısır yapmanın güvenli ve etkili bir yoludur ve patlamış mısırın eşit şekilde pişmesini ve yanmamasını sağlar.
Aşağıdaki soruyu cevaplayın: İşlem: - Bulaşık Makinesini açın - Alt rafı dışarı kaydırın - Kirli bir tabak alın - Tabağı durulayın - Tabağı rafa yerleştirin - Suyun tüm parçalara ulaşması için yeterli alan bırakarak tekrarlayın - Sabunu doldurun fincan - Bulaşık makinesini açın. Soru: Diyelim ki sadece birkaç eşya yerleştiriliyor, bulaşık makinesinin daha iyi temizlenmesine YARDIMCI olmayı nasıl etkileyecek? - A: daha fazla - B: daha az - C: etkisi yok Cevap:	C: etkisi yok Adım adım gerekçe: 1. Bulaşık makinesinin açılması: Bu, kirli bulaşıklara erişmek ve onları yerleştirmek için gereklidir. 2. Kaydırma alt raftan dışarı: Bu, kirli bulaşıkları yüklemek için kolay erişim sağlar. 3. Kirli bir tabağın alınması: Bulaşıkların temizlenmesi için bulaşık makinesine yerleştirilmesi gerekir. 4. Plakanın durulanması: Bu, bulaşık makinesine koymadan önce büyük yiyecek parçacıklarının temizlenmesine yardımcı olur. 5. Tabağın rafa yerleştirilmesi: Tabağın, bulaşık makinesinde temizlenmesi için rafa sabitlenmesi gerekir. 6. Suyun tüm eşyalara ulaşması için yeterli alan bırakarak bu adımların tekrarlanması: Tüm bulaşıkların düzgün bir şekilde yerleştirilmesini ve verimli bir şekilde temizlenmesi için su ve deterjan için yeterli alana sahip olmasını sağlar. 7. Sabun kabının doldurulması: Bulaşık makineleri, bulaşıkları etkili bir şekilde temizlemek için deterjana ihtiyaç duyar. 8. Bulaşık makinesinin çalıştırılması: Temizleme işleminin başlaması için bulaş...

Loss: CachedMultipleNegativesRankingLoss with these parameters:

{
    "scale": 20.0,
    "similarity_fct": "cos_sim",
    "mini_batch_size": 128
}

Evaluation Dataset

cleaned_turkish_embedding_model_training_data_colab

Dataset: cleaned_turkish_embedding_model_training_data_colab at d35bbe7
Size: 1,697,434 evaluation samples
Columns: sentence1, sentence2, and label
Approximate statistics based on the first 1000 samples:
sentence1 sentence2 label
type string string int
details
min: 7 tokens
mean: 130.72 tokens
max: 512 tokens

min: 4 tokens
mean: 209.28 tokens
max: 512 tokens

1: 100.00%

	sentence1	sentence2	label
type	string	string	int
details	min: 7 tokens mean: 130.72 tokens max: 512 tokens	min: 4 tokens mean: 209.28 tokens max: 512 tokens	1: 100.00%

Samples:

sentence1	sentence2	label
Ar-Ge ekibi personel sayısı planlayıcımız olan ve işe alım çabaları ve yönetim için kullanılan bir elektronik tablom var (FY22-23 Talepleri olarak adlandırılıyor). Kaynak bulma ekibini yönetiyorum ve ekibim için ayrı iş akışları/listeler/grafikler oluşturmak amacıyla bu konudaki bilgileri (bulunabilecek en güncel yer burası) kullanmak istiyorum, böylece doğru rolleri/becerileri önceliklendirebilir ve kaynak sağlayabiliriz. şimdi ve gelecekteki gelecek (ilerideki gelecekteki rolleri planlamamıza olanak tanıyacak). FY22-23 e-tablosu ihtiyacımız olan tüm verileri içeriyor. İlk önce verileri size verdiğim sütunlardan (size verdikten sonra) başka bir e-tabloya çekmek için formüller oluşturmama yardımcı olabilir misiniz? Daha sonra bu verileri oluşturmak için kullanabiliriz. bize yardımcı olacak küçük araçlar (örneğin, hem o an için hem de gelecekte ihtiyaç duyacağımız şeyler/yaklaşanlar için kaynak sağlamaya odaklanmamız gereken rolleri/becerileri vurgulayan kısa vadeli ve uzun vadeli bir ö...	Elbette, bu konuda size yardımcı olmaktan memnuniyet duyarım. Öncelikle verileri bir e-tablodan diğerine çekmek için formülleri nasıl kullanabileceğinizi açıklayayım. Bunu yapmak için Google E-Tablolar'daki "IMPORTRANGE" işlevini kullanabilirsiniz. Bu işlev, bir e-tablodan diğerine bir dizi hücreyi aktarmanıza olanak tanır. Bunu nasıl kullanabileceğinize dair bir örnek: =IMPORTRANGE("https://docs.google.com/spreadsheets/d/[spreadsheet-id]", "Sheet1!A1:C3") In Bu örnekte, "[e-tablo kimliği]", verileri içe aktarmak istediğiniz e-tablonun benzersiz tanımlayıcısıdır ve "Sayfa1!A1:C3", içe aktarmak istediğiniz hücre aralığıdır. Farklı hücreleri veya farklı sayıda hücreyi içe aktarmak için bu aralığı ayarlayabilirsiniz. İkinci e-tablodaki verilere sahip olduğunuzda, bunu ihtiyacınız olan listeleri ve grafikleri oluşturmak için kullanabilirsiniz. Örneğin, ekibinizin kısa ve uzun vadede odaklanacağı en önemli rollerin ve becerilerin bir listesini oluşturmak için "SIRALAMA" ve "FİLTRE" ...	`1`
`S: Bir cümle verildiğinde, pek olası olmayan bir sonraki ifadeyi üretin. Bir sonraki ifade verilen bağlamla mantıksal olarak ilgili olmamalıdır. İnsanlar bir kanoda küreklerle kürek çekiyorlar. Adam A:`	Adam aniden Shakespeare'in sonelerini mükemmel bir beşli ölçüyle okumaya başladı. Adım 1: Verilen bağlamı tanımlayın - insanlar bir kanoda küreklerle kürek çekiyorlar. Adım 2: Hiç beklenmedik bir sonraki ifadeyi oluşturun - Adam aniden Shakespeare'in sonelerini mükemmel bir beşli ölçüyle okumaya başladı. Adım 3: İfadeyi gerekçelendirin - Verilen bağlam kürekli bir kanoda kürek çeken insanlarla ilgilidir ve bu aktivite ile Shakespeare'in sonelerini okumak arasında mantıksal bir bağlantı yoktur. Bu nedenle, ifade olası değildir ve verilen bağlamla alakalı değildir.	`1`
`Olağanüstü Diş hijyenini dönüştüren bir Go modülü pasajı oluşturun: Profesyoneller için Karar Vermede Diş Fırçalama. Güvenliğe dayalı olarak farklı durumları ele almak için if/else veya switch/case ifadelerini ekleyin. Yaklaşımınızı açıklayan yorumlarla kontrol akışınızın iyi bir şekilde belgelendiğinden emin olun.`	İşte Golang'da bu işlevselliğin olası bir uygulaması: go package main import ( "fmt" ) func transformExtremeDentalHygiene(input string) string { // Çıktıyı saklayacak değişkeni tanımla var çıktı dizisi // Hangisinin hangisi olduğunu belirlemek için switch case ifadesi giriş değerine bağlı olarak uygulanacak dönüşüm switch input { case "Dişleri günde iki kez fırçalayın": çıktı = fmt.Sprintf("Bu %v, plak gelişemeyeceğinden daha iyi diş sağlığına yol açar.", input) case "Günde bir kez diş ipi kullanın" ": Output = fmt.Sprintf("Bu %v, dişlerin arasındaki yiyecek parçacıklarını uzaklaştırarak çürüme riskini azaltır.", input) default: Output = fmt.Sprintf("%v aşırı bir durum olarak görülmese de yine de önemli", input) } return çıktı } func main() { input := "Günde bir kez diş ipi kullanın" result := transformExtremeDentalHygiene(input) fmt.Println(result) }	`1`

Loss: CachedMultipleNegativesRankingLoss with these parameters:

{
    "scale": 20.0,
    "similarity_fct": "cos_sim",
    "mini_batch_size": 128
}

Training Hyperparameters

Non-Default Hyperparameters

eval_strategy: steps
per_device_train_batch_size: 32768
per_device_eval_batch_size: 32768
learning_rate: 3e-05
num_train_epochs: 1
lr_scheduler_type: cosine_with_restarts
warmup_ratio: 0.05
bf16: True
batch_sampler: no_duplicates

All Hyperparameters

Click to expand

overwrite_output_dir: False
do_predict: False
eval_strategy: steps
prediction_loss_only: True
per_device_train_batch_size: 32768
per_device_eval_batch_size: 32768
per_gpu_train_batch_size: None
per_gpu_eval_batch_size: None
gradient_accumulation_steps: 1
eval_accumulation_steps: None
torch_empty_cache_steps: None
learning_rate: 3e-05
weight_decay: 0.0
adam_beta1: 0.9
adam_beta2: 0.999
adam_epsilon: 1e-08
max_grad_norm: 1.0
num_train_epochs: 1
max_steps: -1
lr_scheduler_type: cosine_with_restarts
lr_scheduler_kwargs: {}
warmup_ratio: 0.05
warmup_steps: 0
log_level: passive
log_level_replica: warning
log_on_each_node: True
logging_nan_inf_filter: True
save_safetensors: True
save_on_each_node: False
save_only_model: False
restore_callback_states_from_checkpoint: False
no_cuda: False
use_cpu: False
use_mps_device: False
seed: 42
data_seed: None
jit_mode_eval: False
use_ipex: False
bf16: True
fp16: False
fp16_opt_level: O1
half_precision_backend: auto
bf16_full_eval: False
fp16_full_eval: False
tf32: None
local_rank: 0
ddp_backend: None
tpu_num_cores: None
tpu_metrics_debug: False
debug: []
dataloader_drop_last: False
dataloader_num_workers: 0
dataloader_prefetch_factor: None
past_index: -1
disable_tqdm: False
remove_unused_columns: True
label_names: None
load_best_model_at_end: False
ignore_data_skip: False
fsdp: []
fsdp_min_num_params: 0
fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
tp_size: 0
fsdp_transformer_layer_cls_to_wrap: None
accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
deepspeed: None
label_smoothing_factor: 0.0
optim: adamw_torch
optim_args: None
adafactor: False
group_by_length: False
length_column_name: length
ddp_find_unused_parameters: None
ddp_bucket_cap_mb: None
ddp_broadcast_buffers: False
dataloader_pin_memory: True
dataloader_persistent_workers: False
skip_memory_metrics: True
use_legacy_prediction_loop: False
push_to_hub: False
resume_from_checkpoint: None
hub_model_id: None
hub_strategy: every_save
hub_private_repo: None
hub_always_push: False
gradient_checkpointing: False
gradient_checkpointing_kwargs: None
include_inputs_for_metrics: False
include_for_metrics: []
eval_do_concat_batches: True
fp16_backend: auto
push_to_hub_model_id: None
push_to_hub_organization: None
mp_parameters:
auto_find_batch_size: False
full_determinism: False
torchdynamo: None
ray_scope: last
ddp_timeout: 1800
torch_compile: False
torch_compile_backend: None
torch_compile_mode: None
include_tokens_per_second: False
include_num_input_tokens_seen: False
neftune_noise_alpha: None
optim_target_modules: None
batch_eval_metrics: False
eval_on_start: False
use_liger_kernel: False
eval_use_gather_object: False
average_tokens_across_devices: False
prompts: None
batch_sampler: no_duplicates
multi_dataset_batch_sampler: proportional

Training Logs

Epoch	Step	Training Loss	Validation Loss	dev_cosine_ap
0.8157	810	1.7383	-	-
0.8258	820	1.7339	-	-
0.8359	830	1.7353	-	-
0.8459	840	1.7311	-	-
0.8560	850	1.7383	-	-
0.8661	860	1.7355	-	-
0.8761	870	1.7314	-	-
0.8862	880	1.7261	-	-
0.8963	890	1.7358	-	-
0.9063	900	1.7219	0.5177	1.0
0.9164	910	1.7281	-	-
0.9265	920	1.7357	-	-
0.9366	930	1.7271	-	-
0.9466	940	1.7305	-	-
0.9567	950	1.7279	-	-
0.9668	960	1.7203	-	-
0.9768	970	1.7309	-	-
0.9869	980	1.724	-	-
0.9970	990	1.3144	-	-

Framework Versions

Python: 3.11.12
Sentence Transformers: 4.1.0
Transformers: 4.51.3
PyTorch: 2.6.0+cu124
Accelerate: 1.6.0
Datasets: 3.6.0
Tokenizers: 0.21.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

CachedMultipleNegativesRankingLoss

@misc{gao2021scaling,
    title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
    author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
    year={2021},
    eprint={2101.06983},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

trmteb
/

turkish-embedding-model

SentenceTransformer based on dbmdz/bert-base-turkish-uncased

Model Details

Model Description

Model Sources

Full Model Architecture

Usage

Direct Usage (Sentence Transformers)

Evaluation

Metrics

Binary Classification

Training Details

Training Dataset

cleaned_turkish_embedding_model_training_data_colab

Evaluation Dataset

cleaned_turkish_embedding_model_training_data_colab

Training Hyperparameters

Non-Default Hyperparameters

All Hyperparameters

Training Logs

Framework Versions

Citation

BibTeX

Sentence Transformers

CachedMultipleNegativesRankingLoss

Model tree for trmteb/turkish-embedding-model

Dataset used to train trmteb/turkish-embedding-model

Evaluation results