modernbert-tr
Collection
2 items
•
Updated
This is a Cross Encoder model finetuned from Alibaba-NLP/gte-modernbert-base using the sentence-transformers library. It computes scores for pairs of texts, which can be used for text reranking and semantic search.
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import CrossEncoder
# Download from the 🤗 Hub
model = CrossEncoder("SMARTICT/reranker-gte-modernbert-base-tr-wiki-25964-train-sample")
# Get scores for pairs of texts
pairs = [
['poodle saldırısının ssl 3.0 mekanizmasının nasıl bir avantajından faydalandığını açıklayabilir misiniz?', "poodle saldırısı, ssl 3.0'ın şifreleme bloklarının boyutunu tahmin etme imkanı sunan bir zayıflıktan yararlanır. saldırganlar, şifreli mesajları küçük parçalara bölerek ve her parçanın şifresini çözmeye çalışarak, hangi bloğun doğru olduğunu belirleyebilirler."],
['poodle saldırısının ssl 3.0 mekanizmasının nasıl bir avantajından faydalandığını açıklayabilir misiniz?', 'moodle, php dilinde yazılmış bir yazılımdır ve mysql ile postgresql veri tabanı sistemlerini destekler.'],
['poodle saldırısının ssl 3.0 mekanizmasının nasıl bir avantajından faydalandığını açıklayabilir misiniz?', 'pozole çorbası; sinaloa, michoacán, guerrero, zacatecas, jalisco, morelos, meksika eyaleti ve meksiko gibi bölgelerde tipik sunulan bir yemektir.'],
['poodle saldırısının ssl 3.0 mekanizmasının nasıl bir avantajından faydalandığını açıklayabilir misiniz?', "metinde pozolun hem fermente mısır hamuru hem de ondan yapılan içeceğin adı olduğu belirtilmiştir. ayrıca, amerika'nın yerli halkları tarafından ormandaki uzun yolculuklarında geçim kaynağı olarak kullanıldığı da yazmaktadır. bu da pozolun sadece içecek olarak değil, besin kaynağı olarak da kullanıldığını gösteriyor."],
['poodle saldırısının ssl 3.0 mekanizmasının nasıl bir avantajından faydalandığını açıklayabilir misiniz?', "hayır, pgp sadece metin belgelerini, e-postaları ve dosyaları değil, aynı zamanda klasörleri ve disk bölümlerini de şifrelemek için kullanılabilir. yani, bilgisayarınızdaki çeşitli veri türlerini korumak için pgp'yi kullanabilirsiniz."],
]
scores = model.predict(pairs)
print(scores.shape)
# (5,)
# Or rank different texts based on similarity to a single text
ranks = model.rank(
'poodle saldırısının ssl 3.0 mekanizmasının nasıl bir avantajından faydalandığını açıklayabilir misiniz?',
[
"poodle saldırısı, ssl 3.0'ın şifreleme bloklarının boyutunu tahmin etme imkanı sunan bir zayıflıktan yararlanır. saldırganlar, şifreli mesajları küçük parçalara bölerek ve her parçanın şifresini çözmeye çalışarak, hangi bloğun doğru olduğunu belirleyebilirler.",
'moodle, php dilinde yazılmış bir yazılımdır ve mysql ile postgresql veri tabanı sistemlerini destekler.',
'pozole çorbası; sinaloa, michoacán, guerrero, zacatecas, jalisco, morelos, meksika eyaleti ve meksiko gibi bölgelerde tipik sunulan bir yemektir.',
"metinde pozolun hem fermente mısır hamuru hem de ondan yapılan içeceğin adı olduğu belirtilmiştir. ayrıca, amerika'nın yerli halkları tarafından ormandaki uzun yolculuklarında geçim kaynağı olarak kullanıldığı da yazmaktadır. bu da pozolun sadece içecek olarak değil, besin kaynağı olarak da kullanıldığını gösteriyor.",
"hayır, pgp sadece metin belgelerini, e-postaları ve dosyaları değil, aynı zamanda klasörleri ve disk bölümlerini de şifrelemek için kullanılabilir. yani, bilgisayarınızdaki çeşitli veri türlerini korumak için pgp'yi kullanabilirsiniz.",
]
)
# [{'corpus_id': ..., 'score': ...}, {'corpus_id': ..., 'score': ...}, ...]
question
, answer
, and label
question | answer | label | |
---|---|---|---|
type | string | string | int |
details |
|
|
|
question | answer | label |
---|---|---|
poodle saldırısının ssl 3.0 mekanizmasının nasıl bir avantajından faydalandığını açıklayabilir misiniz? |
poodle saldırısı, ssl 3.0'ın şifreleme bloklarının boyutunu tahmin etme imkanı sunan bir zayıflıktan yararlanır. saldırganlar, şifreli mesajları küçük parçalara bölerek ve her parçanın şifresini çözmeye çalışarak, hangi bloğun doğru olduğunu belirleyebilirler. |
1 |
poodle saldırısının ssl 3.0 mekanizmasının nasıl bir avantajından faydalandığını açıklayabilir misiniz? |
moodle, php dilinde yazılmış bir yazılımdır ve mysql ile postgresql veri tabanı sistemlerini destekler. |
0 |
poodle saldırısının ssl 3.0 mekanizmasının nasıl bir avantajından faydalandığını açıklayabilir misiniz? |
pozole çorbası; sinaloa, michoacán, guerrero, zacatecas, jalisco, morelos, meksika eyaleti ve meksiko gibi bölgelerde tipik sunulan bir yemektir. |
0 |
BinaryCrossEntropyLoss
with these parameters:{
"activation_fn": "torch.nn.modules.linear.Identity",
"pos_weight": 5
}
eval_strategy
: stepsper_device_train_batch_size
: 16per_device_eval_batch_size
: 16learning_rate
: 2e-05num_train_epochs
: 2warmup_ratio
: 0.1seed
: 12bf16
: Truedataloader_num_workers
: 4load_best_model_at_end
: Trueoverwrite_output_dir
: Falsedo_predict
: Falseeval_strategy
: stepsprediction_loss_only
: Trueper_device_train_batch_size
: 16per_device_eval_batch_size
: 16per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 1eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 2e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1.0num_train_epochs
: 2max_steps
: -1lr_scheduler_type
: linearlr_scheduler_kwargs
: {}warmup_ratio
: 0.1warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 12data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Truefp16
: Falsefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Nonelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 4dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Trueignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torchoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Nonehub_always_push
: Falsegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseinclude_for_metrics
: []eval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
: auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Nonedispatch_batches
: Nonesplit_batches
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseuse_liger_kernel
: Falseeval_use_gather_object
: Falseaverage_tokens_across_devices
: Falseprompts
: Nonebatch_sampler
: batch_samplermulti_dataset_batch_sampler
: proportionalEpoch | Step | Training Loss |
---|---|---|
0.0006 | 1 | 3.0927 |
0.6158 | 1000 | 0.3722 |
1.2315 | 2000 | 0.1146 |
1.8473 | 3000 | 0.0476 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
Base model
answerdotai/ModernBERT-base