CrossEncoder based on BAAI/bge-reranker-v2-m3

This is a Cross Encoder model finetuned from BAAI/bge-reranker-v2-m3 using the sentence-transformers library. It computes scores for pairs of texts, which can be used for text pair classification.

Model Details

Model Description

  • Model Type: Cross Encoder
  • Base model: BAAI/bge-reranker-v2-m3
  • Maximum Sequence Length: 8192 tokens
  • Number of Output Labels: 3 labels

Model Sources

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import CrossEncoder

# Download from the 🤗 Hub
model = CrossEncoder("cross_encoder_model_id")
# Get scores for pairs of texts
pairs = [
    ['[PROMPT]\nJackson đã giành được giải Oscar cho bộ phim tài liệu "This Is It" vào năm 2009, đúng không?\n[CONTEXT]\nBài hát phát hành đầu tiên sau khi qua đời của Jackson mang tên "This Is It", do ông đồng sáng tác cùng Paul Anka vào những năm 1980. Bài hát không được xuất hiện trong đêm nhạc cùng tên và bản thu âm dựa trên một đoạn thu thử cũ. Các anh em còn lại của nhà Jackson đã vào phòng thu lần đầu kể từ năm 1989 để thu giọng bè cho bài hát này. Vào ngày 28 tháng 10 năm 2009, một bộ phim tài liệu về khâu tập dượt cho đêm diễn mang tên Michael Jackson\'s This Is It được ra mắt. Dù chỉ phát hành trong 2 tuần giới hạn, đây lại là bộ phim tài liệu hay đêm diễn đạt doanh thu cao nhất mọi thời đại, với 260 triệu đô-la Mỹ trên toàn cầu. Tài sản của Jackson thu về 90% lợi nhuận. Bộ phim ra mắt cùng một album tổng hợp cùng tên. Hai phiên bản mới của bài hát xuất hiện trong album này, cùng một đĩa bổ sung với bài thơ mang tựa đề "Planet Earth". Tại Giải thưởng âm nhạc Mỹ 2009, Jackson thằng 4 giải, trong đó có 2 giải cho Number Ones.', '[RESPONSE]\nKhông, Jackson không giành được giải Oscar cho bộ phim tài liệu "This Is It" vào năm 2009. Bộ phim đạt doanh thu cao nhưng không giành được giải Oscar.'],
    ['[PROMPT]\nVua Philippos II được thần linh bắt phải làm gì?\n[CONTEXT]\nNói chung, sau khi có chiêm bao, vua Philippos II sai Chaero người xứ Megalopolis) đến ngôi điện thờ thần Apollo tại Delphi, để hỏi ý thần linh xem giấc mộng của vua báo hiệu điều gì sẽ xảy ra? Philippos II đã nhận được câu trả lời rằng, ông phải thờ phụng thần Zeus chu đáo, hơn hết tất cả mọi vị thần khác. Và, nhà vua đã bị mất một con mắt khi đi chinh chiến, mà với con mắt này ông đã nhìn trộm qua buồng ngủ của vợ, thấy thần linh đội lốt loài rắn mà ngủ chung với vợ ông. Hơn nữa, theo như Eratosthenes, sau này khi Alexandros Đại Đế lên đường chinh phạt Á châu, Olympias đã tử tế từ biệt con mình, sau khi bà đã nói riêng với ông rằng ông thực chất là con của ai? Bà đã cúng tế vị thần ấy như thế nào? Để rồi ông thật xứng đáng là con của vị thần ấy. Cũng có người viết rằng Olympias bác bỏ huyền thoại này, bà nói:', '[RESPONSE]\nVua Philippos II được thần linh bắt phải thờ phụng thần Apollo chu đáo, hơn hết tất cả mọi vị thần khác, để đảm bảo sự thịnh vượng của vương quốc mình.'],
    ['[PROMPT]\nViệc thành lập liên bang đã vấp phải những mâu thuẫn nào, chẳng hạn như việc Singapore gia nhập liên bang vào năm 1975 và không bao giờ bị trục xuất?\n[CONTEXT]\nSự thành lập liên bang khiến các căng thẳng tăng cao, bao gồm một cuộc xung đột với Indonesia, Singapore bị trục xuất vào năm 1965, và xung đột sắc tộc. Xung đột sắc tộc lên đến đỉnh điểm trong các cuộc bạo loạn sắc tộc ngày 13 tháng 5 năm 1969. Sau các cuộc bạo loạn, Thủ tướng Tun Abdul Razak đưa ra Chính sách Kinh tế mới gây tranh cãi, mục đích là nhằm nâng cao phần sở hữu kinh tế của bumiputera. Dưới thời Thủ tướng Mahathir Mohamad, Malaysia trải qua tăng trưởng kinh tế và đô thị hóa nhanh chóng. Kinh tế Malaysia chuyển đổi từ dựa vào nông nghiệp sang dựa vào chế tạo và công nghiệp. Nhiều siêu dự án được hoàn thành, chẳng hạn như tháp đôi Petronas, xa lộ Nam-Bắc, hành lang đa phương tiện siêu cấp, và thủ đô hành chính liên bang mới Putrajaya. Tuy nhiên, vào cuối thập niên 1990, Khủng hoảng tài chính châu Á suýt khiến cho đồng Ringgit cùng các thị trường chứng khoán và bất động sản Malaysia sụp đổ.', '[RESPONSE]\nSingapore gia nhập liên bang vào năm 1975 và không bao giờ bị trục xuất, dẫn đến sự ổn định và hòa hợp lâu dài với Malaysia mà không có bất kỳ xung đột sắc tộc nào xảy ra.'],
    ['[PROMPT]\nVì Kepler đã bị trục xuất khỏi Graz do cải sang Công giáo, nên thời gian hoàng kim nhất trong sự nghiệp nghiên cứu khoa học của ông phải là trước khi ông rời Graz, đúng không?\n[CONTEXT]\nNgày 2 tháng 8, sau khi từ chối cải sang Công giáo, Kepler và gia đình bị trục xuất khỏi Graz. Vài tháng sau, Kepler đưa cả gia đình tới Praha. Trong suốt năm 1601, ông được Tycho hỗ trợ trực tiếp, giao cho ông việc phân tích các quan sát về hành tinh và viết một đoản luận chống lại Ursus (đã quá cố). Vào tháng 9, Tycho đảm bảo cho ông một vị trí cộng tác viên trong một dự án mới mà ông đề xuất với hoàng đế: Bảng Rudolf thay thế cho danh mục sao trước đây của Erasmus Reinhold. Hai ngày sau cái chết đột ngột của Tycho vào ngày 24 tháng 10 năm 1601, Kepler được bổ nhiệm làm người kế nhiệm ở vị trí nhà toán học hoàng gia với trách nhiệm hoàn thành những công trình dang dở của Tycho. Đã có những giả thiết rằng Kepler đầu độc Tycho để hưởng lợi nhưng một nghiên cứu khai quật tử thi xác nhận rằng đó là đột tử do suy thận. 11 năm làm nhà thiên văn hoàng gia từ đó sẽ là những năm nghiên cứu sôi nổi nhất cuộc đời ông.', '[RESPONSE]\nThời gian hoàng kim nhất trong sự nghiệp nghiên cứu của Kepler thực sự là trước khi ông rời Graz, vì ông đã thực hiện những nghiên cứu đột phá quan trọng nhất của mình tại đó trước khi đến Praha.'],
    ['[PROMPT]\nThuật ngữ thực vật hạt kín Angiosperm được định nghĩa đầu tiên trên ngôn ngữ Hy Lạp cổ đại phải không, mặc dù nó thực sự có nguồn gốc từ tiếng Latin?\n[CONTEXT]\nThuật ngữ để chỉ thực vật hạt kín là "Angiosperm", có nguồn gốc từ tiếng Hy Lạp cổ đại αγγειον (chỗ chứa) và σπερμα (hạt), được Paul Hermann tạo thành dưới dạng thuật ngữ Angiospermae vào năm 1690, như là tên gọi của một trong các ngành chính trong giới thực vật của ông, nó bao gồm thực vật có hoa và tạo ra các hạt được bao phủ trong các bao vỏ (quả nang), ngược lại với Gymnospermae của ông, hay thực vật có hoa với các quả thuộc loại quả bế hay quả nứt - toàn bộ quả hay mỗi miếng riêng rẽ của nó được coi như là hạt và trần trụi. Thuật ngữ này và từ trái nghĩa của nó đã được Carolus Linnaeus duy trì với cùng ngữ cảnh, nhưng với các ứng dụng hạn hẹp hơn, như trong tên gọi của các bộ trong lớp Didynamia của ông. Việc sử dụng nó trong bất kỳ cách tiếp cận nào đối với lĩnh vực hiện đại của nó chỉ trở thành có thể sau khi Robert Brown thiết lập vào năm 1827 sự tồn tại của các noãn trần thực sự trong Cycadeae (Tuế) và Coniferae (Thông), cho phép gọi chúng một cách chính xác là thực vật hạt trần. Từ thời điểm này trở đi, cũng giống như Gymnosperm được dùng để chỉ thực vật hạt trần thì thuật ngữ Angiosperm đã được nhiều nhà thực vật học dùng với ý nghĩa đối lập, nhưng với giới hạn thay đổi, như là tên nhóm cho các thực vật hai lá mầm khác.', '[RESPONSE]\nThuật ngữ "Angiosperm" thực chất có nguồn gốc từ tiếng Latin, không phải tiếng Hy Lạp cổ đại, và lần đầu tiên được định nghĩa vào năm 1690 bởi Carolus Linnaeus, người đã sử dụng nó để mô tả thực vật hạt trần.'],
]
scores = model.predict(pairs)
print(scores.shape)
# (5, 3)

Training Details

Training Dataset

Unnamed Dataset

  • Size: 6,478 training samples
  • Columns: sentence_0, sentence_1, and label
  • Approximate statistics based on the first 1000 samples:
    sentence_0 sentence_1 label
    type string string int
    details
    • min: 546 characters
    • mean: 978.27 characters
    • max: 7362 characters
    • min: 28 characters
    • mean: 192.72 characters
    • max: 311 characters
    • 0: ~31.50%
    • 1: ~35.30%
    • 2: ~33.20%
  • Samples:
    sentence_0 sentence_1 label
    [PROMPT]
    Jackson đã giành được giải Oscar cho bộ phim tài liệu "This Is It" vào năm 2009, đúng không?
    [CONTEXT]
    Bài hát phát hành đầu tiên sau khi qua đời của Jackson mang tên "This Is It", do ông đồng sáng tác cùng Paul Anka vào những năm 1980. Bài hát không được xuất hiện trong đêm nhạc cùng tên và bản thu âm dựa trên một đoạn thu thử cũ. Các anh em còn lại của nhà Jackson đã vào phòng thu lần đầu kể từ năm 1989 để thu giọng bè cho bài hát này. Vào ngày 28 tháng 10 năm 2009, một bộ phim tài liệu về khâu tập dượt cho đêm diễn mang tên Michael Jackson's This Is It được ra mắt. Dù chỉ phát hành trong 2 tuần giới hạn, đây lại là bộ phim tài liệu hay đêm diễn đạt doanh thu cao nhất mọi thời đại, với 260 triệu đô-la Mỹ trên toàn cầu. Tài sản của Jackson thu về 90% lợi nhuận. Bộ phim ra mắt cùng một album tổng hợp cùng tên. Hai phiên bản mới của bài hát xuất hiện trong album này, cùng một đĩa bổ sung với bài thơ mang tựa đề "Planet Earth". Tại Giải thưởng âm nhạc Mỹ 2009, Jackson thằng 4 gi...
    [RESPONSE]
    Không, Jackson không giành được giải Oscar cho bộ phim tài liệu "This Is It" vào năm 2009. Bộ phim đạt doanh thu cao nhưng không giành được giải Oscar.
    2
    [PROMPT]
    Vua Philippos II được thần linh bắt phải làm gì?
    [CONTEXT]
    Nói chung, sau khi có chiêm bao, vua Philippos II sai Chaero người xứ Megalopolis) đến ngôi điện thờ thần Apollo tại Delphi, để hỏi ý thần linh xem giấc mộng của vua báo hiệu điều gì sẽ xảy ra? Philippos II đã nhận được câu trả lời rằng, ông phải thờ phụng thần Zeus chu đáo, hơn hết tất cả mọi vị thần khác. Và, nhà vua đã bị mất một con mắt khi đi chinh chiến, mà với con mắt này ông đã nhìn trộm qua buồng ngủ của vợ, thấy thần linh đội lốt loài rắn mà ngủ chung với vợ ông. Hơn nữa, theo như Eratosthenes, sau này khi Alexandros Đại Đế lên đường chinh phạt Á châu, Olympias đã tử tế từ biệt con mình, sau khi bà đã nói riêng với ông rằng ông thực chất là con của ai? Bà đã cúng tế vị thần ấy như thế nào? Để rồi ông thật xứng đáng là con của vị thần ấy. Cũng có người viết rằng Olympias bác bỏ huyền thoại này, bà nói:
    [RESPONSE]
    Vua Philippos II được thần linh bắt phải thờ phụng thần Apollo chu đáo, hơn hết tất cả mọi vị thần khác, để đảm bảo sự thịnh vượng của vương quốc mình.
    1
    [PROMPT]
    Việc thành lập liên bang đã vấp phải những mâu thuẫn nào, chẳng hạn như việc Singapore gia nhập liên bang vào năm 1975 và không bao giờ bị trục xuất?
    [CONTEXT]
    Sự thành lập liên bang khiến các căng thẳng tăng cao, bao gồm một cuộc xung đột với Indonesia, Singapore bị trục xuất vào năm 1965, và xung đột sắc tộc. Xung đột sắc tộc lên đến đỉnh điểm trong các cuộc bạo loạn sắc tộc ngày 13 tháng 5 năm 1969. Sau các cuộc bạo loạn, Thủ tướng Tun Abdul Razak đưa ra Chính sách Kinh tế mới gây tranh cãi, mục đích là nhằm nâng cao phần sở hữu kinh tế của bumiputera. Dưới thời Thủ tướng Mahathir Mohamad, Malaysia trải qua tăng trưởng kinh tế và đô thị hóa nhanh chóng. Kinh tế Malaysia chuyển đổi từ dựa vào nông nghiệp sang dựa vào chế tạo và công nghiệp. Nhiều siêu dự án được hoàn thành, chẳng hạn như tháp đôi Petronas, xa lộ Nam-Bắc, hành lang đa phương tiện siêu cấp, và thủ đô hành chính liên bang mới Putrajaya. Tuy nhiên, vào cuối thập niên 1990, Khủng hoảng tài chính châu Á suýt khiến...
    [RESPONSE]
    Singapore gia nhập liên bang vào năm 1975 và không bao giờ bị trục xuất, dẫn đến sự ổn định và hòa hợp lâu dài với Malaysia mà không có bất kỳ xung đột sắc tộc nào xảy ra.
    1
  • Loss: CrossEntropyLoss

Training Hyperparameters

Non-Default Hyperparameters

  • per_device_train_batch_size: 4
  • per_device_eval_batch_size: 4
  • num_train_epochs: 4
  • fp16: True

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: no
  • prediction_loss_only: True
  • per_device_train_batch_size: 4
  • per_device_eval_batch_size: 4
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1
  • num_train_epochs: 4
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.0
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • parallelism_config: None
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch_fused
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • hub_revision: None
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • liger_kernel_config: None
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: proportional
  • router_mapping: {}
  • learning_rate_mapping: {}

Training Logs

Epoch Step Training Loss
0.3086 500 0.8509
0.6173 1000 0.7573
0.9259 1500 0.7314
1.2346 2000 0.6552
1.5432 2500 0.6549
1.8519 3000 0.6612
2.1605 3500 0.6118
2.4691 4000 0.4973
2.7778 4500 0.5137
3.0864 5000 0.4802
3.3951 5500 0.3779
3.7037 6000 0.4395

Framework Versions

  • Python: 3.12.3
  • Sentence Transformers: 5.1.1
  • Transformers: 4.56.2
  • PyTorch: 2.8.0+cu128
  • Accelerate: 1.10.1
  • Datasets: 4.1.1
  • Tokenizers: 0.22.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}
Downloads last month
3
Safetensors
Model size
0.6B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for htNghiaaa/nextlevelv1-bge-finetuned-v1

Finetuned
(33)
this model