ModernBERT-base-2e / README.md
anhtuansh's picture
Add new SentenceTransformer model
a49c6b3 verified
metadata
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:63130
  - loss:CachedMultipleNegativesRankingLoss
base_model: answerdotai/ModernBERT-base
widget:
  - source_sentence: >-
      người đã phạm_tội và đang bị truy_cứu trách_nhiệm hình_sự có được phép
      hành_nghề thẩm_định_giá không ?
    sentences:
      - >-
        b ) kiểm_tra , giám_sát hoạt_động tài_chính và thực_hiện chế_độ
        tài_chính công_khai của trường . 
         c ) định_kỳ thông_báo với hội_đồng trường về kết_quả hoạt_động của mình và nội_dung các báo_cáo , kết_luận , kiến_nghị của ban kiểm_soát trước khi chính_thức thông_qua hội_nghị nhà đầu_tư hoặc chủ sở_hữu . 
         d ) báo_cáo hội_nghị nhà đầu_tư hoặc chủ sở_hữu về kết_quả kiểm_tra , giám_sát các hoạt_động của nhà_trường tại các kỳ họp của hội_nghị nhà đầu_tư hoặc chủ sở_hữu . 
         đ ) thực_hiện các quyền và nhiệm_vụ khác theo quy_chế tổ_chức và hoạt_động của trường .
      - |-
        điều 7 . quy_định chung về bảo_vệ môi_trường nước mặt 
         1 . chất_lượng nước , trầm_tích và môi_trường thủy_sinh của nguồn nước mặt phải được theo_dõi , đánh_giá ; khả_năng chịu_tải của môi_trường nước mặt phải được tính_toán , xác_định và công_bố . 
         2 . nguồn thải vào môi_trường nước mặt phải được quản_lý phù_hợp với mục_đích sử_dụng và khả_năng chịu_tải của môi_trường nước mặt . không phê_duyệt kết_quả thẩm_định báo_cáo đánh_giá tác_động môi_trường hoặc cấp giấy_phép môi_trường cho dự_án đầu_tư mới có hoạt_động xả nước_thải trực_tiếp vào môi_trường nước mặt không còn khả_năng chịu_tải theo công_bố của cơ_quan nhà_nước có thẩm_quyền , trừ trường_hợp chủ dự_án đầu_tư có phương_án xử_lý nước_thải đạt quy_chuẩn kỹ_thuật môi_trường về chất_lượng nước mặt trước khi thải vào môi_trường tiếp_nhận hoặc có phương_án tuần_hoàn , tái sử_dụng để không làm phát_sinh thêm nước_thải hoặc trường_hợp dự_án đầu_tư xử_lý ô_nhiễm , cải_tạo , phục_hồi , cải_thiện chất_lượng môi_trường khu_vực bị ô_nhiễm .
      - >-
        điều 36 . những người không được hành_nghề tại doanh_nghiệp
        thẩm_định_giá 
         1 . người không đủ tiêu_chuẩn quy_định tại điều 34 của luật này . 
         2 . cán_bộ , công_chức theo quy_định của pháp_luật về cán_bộ , công_chức ; sĩ_quan , quân_nhân chuyên_nghiệp , công_nhân quốc_phòng trong cơ_quan , đơn_vị thuộc quân_đội nhân_dân ; sĩ_quan , hạ_sĩ_quan nghiệp_vụ , sĩ_quan , hạ_sĩ_quan chuyên_môn kỹ_thuật trong cơ_quan , đơn_vị thuộc công_an nhân_dân . 
         3 . người đang bị cấm hành_nghề thẩm_định_giá theo bản_án , quyết_định của tòa_án đã có hiệu_lực pháp_luật ; người đang bị truy_cứu trách_nhiệm hình_sự ; người đã bị kết_án một trong các tội về kinh_tế , chức_vụ liên_quan đến tài_chính , giá , thẩm_định_giá mà chưa được xóa_án tích ; người đang bị áp_dụng biện_pháp xử_lý hành_chính giáo_dục tại xã , phường , thị_trấn , người đang bị đưa vào cơ_sở cai_nghiện bắt_buộc , đưa vào cơ_sở giáo_dục bắt_buộc . 
         4 . người đã bị kết_án về tội kinh_tế từ nghiêm_trọng trở lên .
  - source_sentence: >-
      bộ tài_chính quy_định như thế_nào về điều_kiện không thu thuế_nhập_khẩu
      đối_với hàng_hóa tái_nhập_khẩu là hàng đã xuất_khẩu trước đây ?
    sentences:
      - >-
        khoản 3 . trường_hợp hàng_hóa_nhập_khẩu từ nước , nhóm nước hoặc vùng
        lãnh_thổ không có thỏa_thuận ưu_đãi đặc_biệt về thuế_nhập_khẩu trong
        quan_hệ thương_mại với việt_nam , giấy chứng_nhận xuất_xứ hàng_hóa phải
        có các thông_tin tối_thiểu sau : 
         a ) người xuất_khẩu ; 
         b ) người nhập_khẩu ; 
         c ) phương_tiện vận_tải ; 
         d ) mô_tả hàng_hóa , mã_số hàng_hóa ; 
         đ ) số_lượng , trọng_lượng hoặc khối_lượng hàng_hóa ; 
         e ) nước , nhóm nước , vùng lãnh_thổ xuất_xứ hàng_hóa ; 
         g ) ngày / tháng / năm cấp giấy chứng_nhận xuất_xứ hàng_hóa ; 
         h ) chữ_ký của người có thẩm_quyền và cơ_quan có thẩm_quyền cấp giấy chứng_nhận xuất_xứ hàng_hóa . trường_hợp giấy chứng_nhận xuất_xứ hàng_hóa được cấp điện_tử thì cơ_quan hải_quan kiểm_tra tính hợp_lệ của giấy chứng_nhận xuất_xứ hàng_hóa trên trang thông_tin điện_tử hoặc phương_thức khác thể_hiện trên giấy chứng_nhận xuất_xứ hàng_hóa .
      - >-
        c ) giấy chứng_minh nhân_dân hoặc thẻ căn_cước công_dân hoặc hộ_chiếu
        hoặc các giấy_tờ tùy_thân khác của người lái_xe . 
         d ) giấy chứng_nhận bảo_hiểm . 
         3 . tài_liệu chứng_minh thiệt_hại về sức_khỏe , tính_mạng ( bản_sao của các cơ_sở y_tế hoặc bản_sao có xác_nhận của doanh_nghiệp bảo_hiểm sau khi đã đối_chiếu với bản_chính hoặc bản ảnh chụp ) . tùy theo mức_độ thiệt_hại về người có_thể bao_gồm một hoặc một_số các tài_liệu sau : 
         a ) giấy chứng_nhận thương_tích . 
         b ) hồ_sơ bệnh_án . 
         c ) trích lục khai_tử hoặc giấy_báo_tử hoặc văn_bản xác_nhận của cơ_quan công_an hoặc kết_quả giám_định của cơ_quan giám_định pháp_y đối_với trường_hợp nạn_nhân chết trên phương_tiện giao_thông , chết do tai_nạn . 
         4 . tài_liệu chứng_minh thiệt_hại đối_với tài_sản : 
         a ) hóa_đơn , chứng từ hợp_lệ hoặc bằng_chứng chứng_minh về việc sửa_chữa , thay mới tài_sản bị thiệt_hại do tai_nạn gây ra ( trường_hợp_doanh_nghiệp bảo_hiểm thực_hiện sửa_chữa , khắc_phục thiệt_hại , doanh_nghiệp bảo_hiểm có trách_nhiệm thu_thập giấy_tờ này ) .
      - >-
        12 . cơ_quan hải_quan ra quyết_định không thu thuế_nhập_khẩu đối_với
        hàng_hóa tái_nhập là hàng đã xuất_khẩu trước đây , không thu
        thuế_xuất_khẩu đối_với hàng_hóa tái_xuất_khẩu trả lại hoặc xuất_khẩu
        sang nước thứ ba hoặc xuất_khẩu vào khu phi thuế_quan là hàng đã
        nhập_khẩu trước đây , nếu tại thời_điểm làm thủ_tục tái_nhập , tái_xuất
        người khai hải_quan nộp đủ hồ_sơ không thu thuế theo hướng_dẫn tại điều
        121 hoặc điều 122 thông_tư này ( trường_hợp không thu thuế_xuất_khẩu
        đối_với hàng_hóa tái_xuất_khẩu trả lại hoặc xuất_khẩu sang nước thứ ba
        hoặc xuất_khẩu vào khu phi thuế_quan , cơ_quan hải_quan không yêu_cầu
        người nộp thuế phải có chứng_từ , thông_tin về hàng_hóa đã xuất_khẩu
        theo quy_định tại điều 53 thông_tư này ) và cơ_quan hải_quan có đủ cơ_sở
        xác_định hàng_hóa_nhập_khẩu là hàng đã xuất_khẩu trước đây , hàng_hóa
        xuất_khẩu là hàng đã nhập_khẩu trước đây .
  - source_sentence: >-
      ai là người chịu trách_nhiệm soạn_thảo và biên_tập các tài_liệu phục_vụ
      thủ_tướng chính_phủ , và quy_trình này được thực_hiện như thế_nào ?
    sentences:
      - >-
        đ ) kiến_nghị chính_phủ , thủ_tướng chính_phủ giao các bộ , ngành ,
        ủy_ban nhân_dân cấp tỉnh , các cơ_quan , tổ_chức liên_quan xây_dựng
        cơ_chế , chính_sách , các đề_án , dự_án , dự_thảo văn_bản
        quy_phạm_pháp_luật để trình cấp có thẩm_quyền quyết_định ; hoặc chủ_động
        nghiên_cứu , đề_xuất các cơ_chế , chính_sách trình chính_phủ , thủ_tướng
        chính_phủ xem_xét , quyết_định ; 
         e ) chủ_trì , phối_hợp với các bộ , ngành , ủy_ban nhân_dân cấp tỉnh , các cơ_quan , tổ_chức liên_quan xây_dựng báo_cáo công_tác , báo_cáo giải_trình , trả_lời chất_vấn của chính_phủ , thủ_tướng chính_phủ trước quốc_hội , ủy_ban thường_vụ quốc_hội , chủ_tịch nước , các cơ_quan có thẩm_quyền và nhân_dân theo chỉ_đạo của thủ_tướng chính_phủ ; 
         g ) chủ_trì soạn_thảo , biên_tập các bài viết , bài phát_biểu , trả_lời phỏng_vấn báo_chí , tài_liệu phục_vụ thủ_tướng chính_phủ và các báo_cáo , tài_liệu khác theo chỉ_đạo của thủ_tướng chính_phủ ;
      - |-
        đ ) các quyết_định được thông_qua và tỷ_lệ phiếu biểu_quyết tương_ứng ; 
         e ) họ , tên , chữ_ký và nội_dung ý_kiến của người dự họp không đồng_ý thông_qua biên_bản họp ( nếu có ) ; 
         g ) họ , tên , chữ_ký của người ghi biên_bản và chủ tọa cuộc họp , trừ trường_hợp quy_định tại khoản 3 điều này . 
         3 . trường_hợp chủ tọa , người ghi biên_bản từ_chối ký biên_bản họp thì biên_bản này có hiệu_lực nếu được tất_cả thành_viên khác của hội_đồng thành_viên tham_dự họp ký và có đầy_đủ nội_dung theo quy_định tại các điểm a , b , c , d , đ và e khoản 2 điều này . biên_bản họp ghi rõ việc chủ tọa , người ghi biên_bản từ_chối ký biên_bản họp . người ký biên_bản họp chịu trách_nhiệm liên_đới về tính chính_xác và trung_thực của nội_dung biên_bản họp hội_đồng thành_viên .
      - >-
        chương ii. quản_lý và tổ_chức thực_hiện nhiệm_vụ khoa_học và công_nghệ
        cấp_thiết địa_phương 
         điều 4 . đề_xuất , xác_định và phê_duyệt danh_mục đặt_hàng nhiệm_vụ kh & cn cấp_thiết địa_phương 
         1 . ủy_ban nhân_dân tỉnh , thành_phố trực_thuộc trung_ương xem_xét , lựa_chọn các vấn_đề khoa_học và công_nghệ đáp_ứng những yêu_cầu quy_định tại điều 2 thông_tư này xây_dựng đề_xuất đặt_hàng kèm theo văn_bản cam_kết bố_trí phần ngân_sách địa_phương và địa_chỉ áp_dụng thực_hiện nhiệm_vụ gửi bộ khoa_học và công_nghệ . việc xây_dựng đề_xuất đặt_hàng , hoàn_thiện đề_xuất đặt_hàng , tổng_hợp_đề_xuất đặt_hàng nhiệm_vụ kh & cn cấp_thiết địa_phương thực_hiện theo quy_định tại điều 11 , 12 và điều 13 thông_tư số 07 / 2014 / tt - bkhcn. 
         2 . bộ khoa_học và công_nghệ thực_hiện tổ_chức xác_định nhiệm_vụ kh & cn cấp_thiết địa_phương theo quy_định tại thông_tư số 07 / 2014 / tt - bkhcn . 
         điều 5 . tổ_chức tuyển_chọn , giao trực_tiếp tổ_chức , cá_nhân thực_hiện nhiệm_vụ kh & cn cấp_thiết địa_phương
  - source_sentence: >-
      giảng_viên đại_học cần phải có những kiến_thức và kỹ_năng tối_thiểu nào để
      phát_triển chương_trình và tổ_chức quá_trình đào_tạo ?
    sentences:
      - >-
        khoản 6 . trường_hợp viện_dẫn phần , chương , mục , tiểu mục , điều ,
        khoản , điểm của một văn_bản cụ_thể thì viết hoa chữ_cái đầu của phần ,
        chương , mục , tiểu mục , điều . ví_dụ : - căn_cứ điều 10 của luật
        tổ_chức quốc_hội ... - căn_cứ khoản 4 điều 18 của luật an_toàn vệ_sinh
        lao_động ... - căn_cứ_điểm a khoản 2 điều 103 mục 5 chương xii phần i
        của bộ_luật hình_sự ... - theo quy_định tại điểm a khoản 1 điều 24
        tiểu_mục 1 mục 1 chương iii của nghị_quyết số 351 / 2017 / ubtvqh14 ...
      - >-
        việc nộp dần tiền thuế nợ được thủ_trưởng cơ_quan quản_lý trực_tiếp
        người nộp thuế xem_xét trên cơ_sở đề_nghị của người nộp thuế và phải có
        bảo_lãnh của tổ_chức tín_dụng . bộ_trưởng bộ tài_chính quy_định số lần
        nộp dần và hồ_sơ , thủ_tục về nộp dần tiền thuế nợ . 
         6 . không thực_hiện biện_pháp cưỡng_chế đối_với người nộp thuế có nợ phí hải_quan và lệ_phí hàng_hóa , phương_tiện quá_cảnh . 
         7 . cá_nhân là người đại_diện theo pháp_luật của người nộp thuế phải hoàn_thành nghĩa_vụ nộp thuế của doanh_nghiệp đang bị cưỡng_chế thi_hành_quyết_định hành_chính về quản_lý thuế trước khi xuất_cảnh và có_thể bị tạm hoãn xuất_cảnh theo quy_định của pháp_luật về xuất_cảnh , nhập_cảnh .
      - >-
        khoản 4 . phát_triển chư ­ ơng trình và tổ_chức quá_trình đào_tạo
        đại_học ( 2 tín_chỉ ) 
         a ) mục_tiêu trang_bị cho người học những kiến_thức và kĩ_năng tối_thiểu về chương_trình , phát_triển chương_trình và tổ_chức quá_trình đào_tạo trong cơ_sở giáo_dục đại_học . giúp người học biết cách thiết_kế chương_trình , đề_cương chi_tiết học_phần , đánh_giá chương_trình và quá_trình đào_tạo trong cơ_sở giáo_dục đại_học . 
         b ) nội_dung học_phần này bao_gồm các nội_dung : - khái_niệm chương_trình ; - cấu_trúc ch ­ ương trình ; - phát_triển ch ­ ương trình ; - phân_cấp quản_lí ch ­ ương trình ; - tổ_chức quá_trình đào_tạo trong cơ_sở giáo_dục đại_học ; - vai_trò của giảng_viên trong cơ_sở giáo_dục đại_học với việc phát_triển chương_trình môn_học .
  - source_sentence: >-
      ai quyết_định mức cấp tín_dụng tối_đa vượt quá các giới_hạn quy_định trong
      trường_hợp đặc_biệt ?
    sentences:
      - >-
        4 . mức dư_nợ cấp tín_dụng quy_định tại khoản 1 và khoản 2 điều này
        bao_gồm cả tổng mức đầu_tư vào trái_phiếu do khách_hàng phát_hành . 
         5 . giới_hạn và điều_kiện cấp tín_dụng để đầu_tư , kinh_doanh cổ_phiếu của ngân_hàng thương_mại , chi_nhánh ngân_hàng nước_ngoài do ngân_hàng nhà_nước quy_định . 
         6 . trường_hợp nhu_cầu vốn của một khách_hàng và người có liên_quan vượt quá giới_hạn cấp tín_dụng quy_định tại khoản 1 và khoản 2 điều này thì tổ_chức tín_dụng , chi_nhánh ngân_hàng nước_ngoài được cấp tín_dụng hợp vốn theo quy_định của ngân_hàng nhà_nước . 
         7 . trong trường_hợp đặc_biệt , để thực_hiện nhiệm_vụ kinh_tế - xã_hội mà khả_năng hợp vốn của các tổ_chức tín_dụng , chi_nhánh ngân_hàng nước_ngoài chưa đáp_ứng được yêu_cầu vay vốn của một khách_hàng thì thủ_tướng chính_phủ quyết_định mức cấp tín_dụng tối_đa vượt quá các giới_hạn quy_định tại khoản 1 và khoản 2 điều này đối_với từng trường_hợp cụ_thể .
      - |-
        khoản 1 . nhiệm_vụ , quyền_hạn của thủ_tướng chính_phủ : 
         a ) quyết_định việc sử_dụng quỹ_tích_lũy trả nợ để xử_lý rủi_ro đối_với các khoản cho vay lại và bảo_lãnh chính_phủ theo quy_định tại khoản 4 điều 14 của luật quản_lý nợ công , bao_gồm quyết_định về bên nhận ứng vốn , trị_giá ứng vốn , lãi_suất ứng vốn , thời_hạn hoàn_trả ứng vốn . 
         b ) quyết_định việc khoanh nợ khoản ứng vốn hoặc cơ_cấu lại khoản ứng vốn . quyết_định việc sử_dụng nguồn quỹ để xử_lý rủi_ro phát_sinh , bao_gồm xóa nợ gốc , lãi , lãi phạt , thay_đổi lãi_suất ứng vốn khi bên nhận ứng vốn gặp khó_khăn do nguyên_nhân bất_khả_kháng . 
         c ) quyết_định việc trích một phần phí bảo_lãnh , phí cho vay lại và quy_định việc quản_lý sử_dụng kinh_phí được trích từ phí bảo_lãnh , phí quản_lý cho vay lại cho nghiệp_vụ quản_lý nợ công .
      - >-
        điều 14 . trách_nhiệm của ủy_ban nhân_dân tỉnh , thành_phố trực_thuộc
        trung_ương 
         1 . chỉ_đạo sở khoa_học và công_nghệ phối_hợp với các cơ_quan_chức_năng thuộc ủy_ban nhân_dân tỉnh , thành_phố trực_thuộc trung_ương tổ_chức hướng_dẫn triển_khai thực_hiện thông_tư này . 
         2 . chỉ_đạo sở khoa_học và công_nghệ phối_hợp với cơ_quan , đơn_vị có liên_quan tiến_hành thanh_tra , kiểm_tra thực_hiện quy_định pháp_luật trong việc thuê và sử_dụng người việt_nam ở nước_ngoài và chuyên_gia nước_ngoài đảm_nhiệm chức_danh lãnh_đạo tại các tổ_chức khoa_học và công_nghệ công_lập trên địa_bàn tỉnh . 
         3 . định_kỳ hằng năm , gửi báo_cáo về bộ khoa_học và công_nghệ về tình_hình thuê người việt_nam ở nước_ngoài và chuyên_gia nước_ngoài đảm_nhiệm chức_danh lãnh_đạo tổ_chức khoa_học và công_nghệ công_lập thuộc phạm_vi quản_lý .
pipeline_tag: sentence-similarity
library_name: sentence-transformers

SentenceTransformer based on answerdotai/ModernBERT-base

This is a sentence-transformers model finetuned from answerdotai/ModernBERT-base. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: answerdotai/ModernBERT-base
  • Maximum Sequence Length: 8192 tokens
  • Output Dimensionality: 768 dimensions
  • Similarity Function: Cosine Similarity

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: ModernBertModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("anhtuansh/ModernBERT-base-2e")
# Run inference
sentences = [
    'ai quyết_định mức cấp tín_dụng tối_đa vượt quá các giới_hạn quy_định trong trường_hợp đặc_biệt ?',
    '4 . mức dư_nợ cấp tín_dụng quy_định tại khoản 1 và khoản 2 điều này bao_gồm cả tổng mức đầu_tư vào trái_phiếu do khách_hàng phát_hành . \n 5 . giới_hạn và điều_kiện cấp tín_dụng để đầu_tư , kinh_doanh cổ_phiếu của ngân_hàng thương_mại , chi_nhánh ngân_hàng nước_ngoài do ngân_hàng nhà_nước quy_định . \n 6 . trường_hợp nhu_cầu vốn của một khách_hàng và người có liên_quan vượt quá giới_hạn cấp tín_dụng quy_định tại khoản 1 và khoản 2 điều này thì tổ_chức tín_dụng , chi_nhánh ngân_hàng nước_ngoài được cấp tín_dụng hợp vốn theo quy_định của ngân_hàng nhà_nước . \n 7 . trong trường_hợp đặc_biệt , để thực_hiện nhiệm_vụ kinh_tế - xã_hội mà khả_năng hợp vốn của các tổ_chức tín_dụng , chi_nhánh ngân_hàng nước_ngoài chưa đáp_ứng được yêu_cầu vay vốn của một khách_hàng thì thủ_tướng chính_phủ quyết_định mức cấp tín_dụng tối_đa vượt quá các giới_hạn quy_định tại khoản 1 và khoản 2 điều này đối_với từng trường_hợp cụ_thể .',
    'điều 14 . trách_nhiệm của ủy_ban nhân_dân tỉnh , thành_phố trực_thuộc trung_ương \n 1 . chỉ_đạo sở khoa_học và công_nghệ phối_hợp với các cơ_quan_chức_năng thuộc ủy_ban nhân_dân tỉnh , thành_phố trực_thuộc trung_ương tổ_chức hướng_dẫn triển_khai thực_hiện thông_tư này . \n 2 . chỉ_đạo sở khoa_học và công_nghệ phối_hợp với cơ_quan , đơn_vị có liên_quan tiến_hành thanh_tra , kiểm_tra thực_hiện quy_định pháp_luật trong việc thuê và sử_dụng người việt_nam ở nước_ngoài và chuyên_gia nước_ngoài đảm_nhiệm chức_danh lãnh_đạo tại các tổ_chức khoa_học và công_nghệ công_lập trên địa_bàn tỉnh . \n 3 . định_kỳ hằng năm , gửi báo_cáo về bộ khoa_học và công_nghệ về tình_hình thuê người việt_nam ở nước_ngoài và chuyên_gia nước_ngoài đảm_nhiệm chức_danh lãnh_đạo tổ_chức khoa_học và công_nghệ công_lập thuộc phạm_vi quản_lý .',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Training Details

Training Dataset

Unnamed Dataset

  • Size: 63,130 training samples
  • Columns: query, positive, and negative
  • Approximate statistics based on the first 1000 samples:
    query positive negative
    type string string string
    details
    • min: 35 tokens
    • mean: 85.74 tokens
    • max: 225 tokens
    • min: 289 tokens
    • mean: 584.64 tokens
    • max: 923 tokens
    • min: 299 tokens
    • mean: 581.07 tokens
    • max: 929 tokens
  • Samples:
    query positive negative
    bộ tài_chính quy_định thế_nào về chi_phí cho cán_bộ , công_chức , viên_chức đi công_tác nước_ngoài để kiểm_tra tình_hình phát_triển của trẻ_em việt_nam được nhận làm con_nuôi ở nước_ngoài ? c ) chi công_tác_phí cho cán_bộ , công_chức , viên_chức đi công_tác nước_ngoài để kiểm_tra tình_hình phát_triển của trẻ_em việt_nam được nhận làm con_nuôi ở nước_ngoài ( nếu có ) thực_hiện theo quy_định tại thông_tư số 102 / 2012 / tt - btc ngày 21 / 6 / 2012 của bộ tài_chính quy_định_chế_độ công_tác_phí cho cán_bộ , công_chức nhà_nước đi công_tác ngắn_hạn ở nước_ngoài do ngân_sách nhà_nước bảo_đảm kinh_phí ;
    d ) chi tập_huấn nghiệp_vụ cho văn_phòng con_nuôi nước_ngoài tại việt_nam được thực_hiện theo quy_định tại thông_tư số 139 / 2010 / tt - btc ngày 21 / 9 / 2010 của bộ tài_chính quy_định việc lập dự_toán , quản_lý và sử_dụng kinh_phí từ ngân_sách nhà_nước dành cho công_tác đào_tạo , bồi_dưỡng cán_bộ , công_chức ;
    điều 15 . nhiệm_vụ , quyền_hạn của bộ tài_chính
    1 . là cơ_quan đầu_mối giúp chính_phủ thống_nhất quản_lý nhà_nước về tài_sản công .
    2 . chủ_trì xây_dựng , trình cơ_quan , người có thẩm_quyền ban_hành_văn_bản quy_phạm_pháp_luật về :
    a ) chế_độ quản_lý , sử_dụng tài_sản công tại cơ_quan , tổ_chức , đơn_vị ; việc phân_cấp thẩm_quyền quyết_định trong quản_lý , sử_dụng tài_sản công ;
    b ) tiêu_chuẩn , định mức sử_dụng trụ_sở làm_việc , xe ô_tô , tài_sản công của cơ_quan đại_diện ngoại_giao , cơ_quan đại_diện lãnh_sự , cơ_quan đại_diện tại tổ_chức quốc_tế theo quy_định của pháp_luật về cơ_quan đại_diện của việt_nam ở nước_ngoài và cơ_quan , tổ_chức , đơn_vị khác của việt_nam ở nước_ngoài ( sau đây gọi là cơ_quan việt_nam ở nước_ngoài ) , máy_móc , thiết_bị và các tài_sản công được sử_dụng phổ_biến tại cơ_quan , tổ_chức , đơn_vị , trừ nhà ở công_vụ và tài_sản đặc_biệt tại đơn_vị lực_lượng vũ_trang nhân_dân ;
    khi thuê đất để xây_dựng cơ_sở hạ_tầng , xây_dựng nhà để bán , giá đất được trừ để tính thuế giá_trị gia_tăng bao_gồm những chi_phí nào ? a ) giá đất được trừ để tính thuế giá_trị gia_tăng được quy_định cụ_thể như sau : - trường_hợp được nhà_nước giao đất để đầu_tư cơ_sở hạ_tầng xây_dựng nhà để bán , giá đất được trừ để tính thuế giá_trị gia_tăng bao_gồm tiền_sử_dụng đất phải nộp ngân_sách nhà_nước ( không kể tiền_sử_dụng đất được miễn , giảm ) và chi_phí bồi_thường , giải_phóng mặt_bằng theo quy_định của pháp_luật ; - trường_hợp đấu_giá quyền sử_dụng đất thì giá đất được trừ để tính thuế giá_trị gia_tăng là giá đất trúng đấu_giá ; - trường_hợp thuê đất để xây_dựng cơ_sở hạ_tầng , xây_dựng nhà để bán , giá đất được trừ để tính thuế giá_trị gia_tăng là tiền thuê đất phải nộp ngân_sách nhà_nước ( không bao_gồm tiền thuê đất được miễn , giảm ) và chi_phí đền_bù , giải_phóng mặt_bằng theo quy_định của pháp_luật ; - trường_hợp cơ_sở kinh_doanh nhận chuyển_nhượng quyền sử_dụng đất của các tổ_chức , cá_nhân thì giá đất được trừ để tính thuế giá_trị gia_tăng là giá đất tại thời_điểm nhận chuyển_nhượng quyền sử_dụng đất bao_gồm c... 5 . phối_hợp với cơ_quan bảo_hiểm xã_hội trả sổ bảo_hiểm xã_hội cho người lao_động , xác_nhận thời_gian đóng bảo_hiểm xã_hội khi người lao_động chấm_dứt hợp_đồng lao_động , hợp_đồng làm_việc hoặc thôi_việc theo quy_định của pháp_luật .
    6 . cung_cấp chính_xác , đầy_đủ , kịp_thời thông_tin , tài_liệu liên_quan đến việc đóng , hưởng bảo_hiểm xã_hội theo yêu_cầu của cơ_quan quản_lý nhà_nước có thẩm_quyền , cơ_quan bảo_hiểm xã_hội .
    7 . định_kỳ 06 tháng , niêm_yết công_khai_thông_tin về việc đóng bảo_hiểm xã_hội cho người lao_động ; cung_cấp thông_tin về việc đóng bảo_hiểm xã_hội của người lao_động khi người lao_động hoặc tổ_chức công_đoàn yêu_cầu .
    8 . hằng năm , niêm_yết công_khai_thông_tin đóng bảo_hiểm xã_hội của người lao_động do cơ_quan bảo_hiểm xã_hội cung_cấp theo quy_định tại khoản 7 điều 23 của luật này .
    điều 22 . quyền của cơ_quan bảo_hiểm xã_hội
    1 . tổ_chức quản_lý nhân_sự , tài_chính và tài_sản theo quy_định của pháp_luật .
    2 . từ_chối yêu_cầu trả bảo_hiểm xã_hội ,...
    nếu tôi vừa có số tiền thuế đủ điều_kiện hoàn , vừa có số tiền thuế tiền chậm nộp , tiền phạt bị truy_thu thì cơ_quan thuế sẽ xử_lý như thế_nào ? trường_hợp tại biên_bản kiểm_tra trước hoàn thuế xác_định người nộp thuế vừa có số tiền thuế đủ điều_kiện hoàn , vừa có số tiền thuế tiền chậm nộp , tiền phạt bị truy_thu thì cơ_quan thuế_ban_hành quyết_định xử_lý vi_phạm_pháp_luật về thuế và bù_trừ số tiền thuế được hoàn của người nộp thuế tại quyết_định hoàn thuế_kiêm bù_trừ thu ngân_sách nhà_nước theo mẫu_số 02 / qđ - ht ban_hành kèm theo phụ_lục i thông_tư này .
    d ) đối_với hồ_sơ hoàn nộp thừa của người nộp thuế có khoản nộp thừa tại tỉnh nơi được hưởng khoản thu_phân_bổ , cơ_quan thuế quản_lý trực_tiếp chủ_trì tổng_hợp nghĩa_vụ thuế , số thuế đã nộp ngân_sách nhà_nước tại trụ_sở chính và các tỉnh nơi được hưởng khoản thu_phân_bổ .
    điều 59 . quản_lý nhà_nước về kinh_doanh casino
    1 . chính_phủ thống_nhất quản_lý nhà_nước về kinh_doanh casino và ban_hành chính_sách điều_chỉnh hoạt_động_kinh_doanh casino theo thẩm_quyền .
    2 . thủ_tướng chính_phủ
    a ) phê_duyệt chủ_trương , chính_sách , ban_hành các văn_bản quy_phạm_pháp_luật và biện_pháp cần_thiết theo thẩm_quyền để quản_lý hoạt_động_kinh_doanh casino theo quy_định tại nghị_định này và quy_định của pháp_luật có liên_quan ;
    b ) chấp_thuận số_lượng máy trò_chơi , bàn trò_chơi và điều_chỉnh số_lượng máy trò_chơi , bàn trò_chơi tối_đa đối_với dự_án khu dịch_vụ , du_lịch và vui_chơi giải_trí tổng_hợp có casino theo quy_định tại điều 7 và điều 8 nghị_định này ;
    c ) quyết_định các nội_dung khác có liên_quan đến hoạt_động_kinh_doanh casino theo thẩm_quyền quy_định tại nghị_định này và quy_định của pháp_luật .
    3 . bộ tài_chính chịu trách_nhiệm trước chính_phủ thực_hiện quản_lý nhà_nước về kinh_doanh casino , bao_gồm :
    a ) nghiên_cứu , xây_dựng trình cấp có thẩm_...
  • Loss: CachedMultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Evaluation Dataset

Unnamed Dataset

  • Size: 2,000 evaluation samples
  • Columns: query, positive, and negative
  • Approximate statistics based on the first 1000 samples:
    query positive negative
    type string string string
    details
    • min: 37 tokens
    • mean: 85.51 tokens
    • max: 173 tokens
    • min: 297 tokens
    • mean: 587.0 tokens
    • max: 931 tokens
    • min: 276 tokens
    • mean: 585.64 tokens
    • max: 906 tokens
  • Samples:
    query positive negative
    cục y_tế dự_phòng có vai_trò gì trong việc xây_dựng và phát_triển các kế_hoạch hoạt_động phối_hợp trong phòng , chống bệnh lây_truyền từ động_vật sang người ? điều 13 . trách_nhiệm của cục y_tế dự_phòng - bộ y_tế
    1 . đầu_mối của bộ y_tế phối_hợp với cục thú_y - bộ nông_nghiệp và phát_triển nông_thôn triển_khai các hoạt_động phối_hợp phòng , chống bệnh lây_truyền từ động_vật sang người .
    2 . chỉ_đạo toàn_bộ các hoạt_động về phối_hợp giữa ngành y_tế và nông_nghiệp trong phòng , chống bệnh lây_truyền từ động_vật sang người đối_với các đơn_vị trong ngành y_tế .
    3 . phối_hợp với cục thú_y - bộ nông_nghiệp và phát_triển nông_thôn xây_dựng , đề_xuất sửa_đổi các hướng_dẫn giám_sát bệnh lây_truyền từ động_vật sang người ; xây_dựng và phát_triển các kế_hoạch hoạt_động phối_hợp trong phòng , chống bệnh lây_truyền từ động_vật sang người .
    4 . định_kỳ 6 tháng_một lần , tổ_chức họp giao_ban với cục thú_y - bộ nông_nghiệp và phát_triển nông_thôn và các đơn_vị liên_quan để đánh_giá hoạt_động phối_hợp trong giám_sát phòng , chống bệnh lây_truyền từ động_vật sang người .
    khoản 1 . chi thường_xuyên :
    a ) chi thanh_toán cá_nhân : tiền_lương , tiền công , phụ_cấp lương , các khoản đóng_góp theo lương ( bảo_hiểm xã_hội , bảo_hiểm y_tế , bảo_hiểm_thất_nghiệp ( nếu có ) , kinh_phí công_đoàn ) ; tiền khen_thưởng thành_tích theo danh_hiệu thi_đua và các khoản thanh_toán khác cho cá_nhân ;
    b ) chi quản_lý hành_chính : chi thanh_toán dịch_vụ công_cộng ; vật_tư văn_phòng ; thông_tin tuyên_truyền , liên_lạc ; hội_nghị ; chi công_tác_phí ; chi thuê_mướn ; sửa_chữa , bảo_trì , bảo_dưỡng thường_xuyên tài_sản cố_định và các khoản chi hành_chính khác ;
    c ) chi hoạt_động nghiệp_vụ : mua_sắm vật_tư , hàng_hóa dùng cho chuyên_môn , nghiệp_vụ ; thiết_bị an_toàn kho_quỹ , thiết_bị kiểm_đếm ; ấn chỉ các loại ; trang_phục , bảo_hộ lao_động ; các khoản nghiệp_vụ kiểm_đếm , đảo kho , điều_chuyển , bảo_vệ an_toàn kho , tiền , vàng_bạc , đá_quý , ngoại_tệ và các chứng_chỉ có_giá ; bảo_quản , lưu_trữ tài_liệu , chứng_từ ; các khoản nghiệp_vụ khác ;
    d ) chi_phối_hợp tổ_chức...
    theo quy_định , tay_vịn phải được lắp_đặt như thế_nào ở khu_vực cạnh cửa ra vào trên xe_khách thành_phố để người khuyết_tật tiếp_cận ? trong bất_kỳ khu_vực nào không phải lối đi dọc mà hành_khách có_thể đứng : 2.3.4.1.3 . từ khu_vực cạnh cửa ra vào liền kề ngay cửa ra vào ưu_tiên đến ít_nhất một ghế ưu_tiên , tay_vịn có độ cao từ 800 mm đến 900 mm so với sàn xe ; hoặc ở khu_vực không phù_hợp với những yêu_cầu đó , tay_vịn không cần phải bố_trí liên_tục , nhưng khoảng trống giữa các tay_vịn không được lớn hơn 1050 mm , và phải có một tay_vịn thẳng_đứng bố_trí tại ít_nhất một phía của khoảng trống giữa các tay_vịn nói trên với chiều dài nằm trong khoảng từ độ cao 1200 mm đến độ cao không nhỏ hơn 1500 mm so với sàn xe . 2.3.4.1.4 . tay_vịn được bố_trí ở cả hai bên của khu_vực phía trong cửa vào hoặc cửa ra : 2.3.4.2 . điều 15 .
    1 . hội_đồng quản_trị thực_hiện chức_năng quản_lý hoạt_động của tổng_công_ty , chịu trách_nhiệm về sự phát_triển của tổng_công_ty theo nhiệm_vụ nhà_nước giao .
    2 . hội_đồng quản_trị có các quyền_hạn và nhiệm_vụ sau :
    a ) nhận vốn ( kể_cả nợ ) , đất_đai , tài_nguyên và các nguồn_lực khác do nhà_nước giao cho tổng_công_ty .
    b ) xem_xét , phê_duyệt phương_án do tổng_giám_đốc đề_nghị về việc phân giao vốn và các nguồn_lực khác cho các đơn_vị thành_viên và phương_án điều_hoà_vốn và các nguồn_lực khác giữa các đơn_vị thành_viên ; kiểm_tra , giám_sát việc thực_hiện các phương_án đó ;
    c ) kiểm_tra , giám_sát mọi hoạt_động trong tổng_công_ty ; trong đó có việc sử_dụng , bảo_toàn , phát_triển vốn và các nguồn_lực được giao ; việc thực_hiện các nghị_định và quyết_định của hội_đồng quản_trị , các quy_định của luật_pháp ; việc thực_hiện nghĩa_vụ đối_với nhà_nước .
    ngày 01 tháng 01 năm 2018 có ý_nghĩa gì đối_với nghị_định về trình_tự , thủ_tục , mức tiền pháp_nhân thương_mại phải nộp để bảo_đảm thi_hành án ? chương iv. điều_khoản thi_hành
    điều 10 . hiệu_lực thi_hành . nghị_định này có hiệu_lực thi_hành từ ngày 01 tháng 01 năm 2018 .
    điều 11 . trách_nhiệm thi_hành . các bộ_trưởng , thủ_trưởng cơ_quan ngang bộ , thủ_trưởng cơ_quan thuộc chính_phủ , chủ_tịch ủy_ban nhân_dân các tỉnh , thành_phố trực_thuộc trung_ương và các đối_tượng áp_dụng của nghị_định chịu trách_nhiệm thi_hành nghị_định này . / nơi nhận : - ban bí_thư trung_ương đảng ; - thủ_tướng , các phó_thủ_tướng chính_phủ ; - các bộ , cơ_quan ngang bộ , cơ_quan thuộc chính_phủ ; - hđnd , ubnd các tỉnh , thành_phố trực_thuộc trung_ương ; - văn_phòng trung_ương và các ban của đảng ; - văn_phòng tổng_bí_thư ; - văn_phòng chủ_tịch nước ; - hội_đồng dân_tộc và các ủy_ban của quốc_hội ; - văn_phòng quốc_hội ; - tòa_án nhân_dân tối_cao ; - viện kiểm_sát_nhân_dân tối_cao ; - kiểm_toán nhà_nước ; - ủy_ban giám_sát tài_chính quốc_gia ; - ngân_hàng chính_sách xã_hội ; - ngân_hàng phát_triển việt_nam ;
    viên_chức đăng_ký dự_thi thăng_hạng được miễn thi môn ngoại_ngữ , tin_học theo quy_định tại khoản 6 và khoản 7 điều 39 nghị_định số 115 / 2020 / nđ - cp. viên_chức đăng_ký dự_xét thăng_hạng thuộc đối_tượng được miễn thi môn ngoại_ngữ , tin_học theo quy_định tại khoản 6 và khoản 7 điều 39 nghị_định số 115 / 2020 / nđ - cp được xác_nhận đáp_ứng tiêu_chuẩn về ngoại_ngữ , tin_học khi đăng_ký dự_xét thăng_hạng . trường_hợp không thuộc đối_tượng miễn thi môn ngoại_ngữ , tin_học theo quy_định tại khoản 6 và khoản 7 điều 39 nghị_định số 115 / 2020 / nđ - cp thì trong hồ_sơ dự xét phải có minh chứng đáp_ứng yêu_cầu về tiêu_chuẩn ngoại_ngữ , tin_học của chức_danh nghề_nghiệp đăng_ký dự_xét thăng_hạng .
  • Loss: CachedMultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • per_device_train_batch_size: 4
  • per_device_eval_batch_size: 4
  • learning_rate: 8e-05
  • warmup_ratio: 0.05
  • bf16: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: no
  • prediction_loss_only: True
  • per_device_train_batch_size: 4
  • per_device_eval_batch_size: 4
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 8e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 3
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.05
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: True
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss
0.0317 500 0.0
0.0634 1000 0.0
0.0950 1500 0.0
0.1267 2000 0.0
0.1584 2500 0.0
0.1901 3000 0.0
0.2218 3500 0.0
0.2534 4000 0.0
0.2851 4500 0.0
0.3168 5000 0.0
0.3485 5500 0.0
0.3802 6000 0.0
0.4118 6500 0.0
0.4435 7000 0.0
0.4752 7500 0.0
0.5069 8000 0.0
0.5386 8500 0.0
0.5702 9000 0.0
0.6019 9500 0.0
0.6336 10000 0.0
0.6653 10500 0.0
0.6970 11000 0.0
0.7286 11500 0.0
0.7603 12000 0.0
0.7920 12500 0.0
0.8237 13000 0.0
0.8554 13500 0.0
0.8870 14000 0.0
0.9187 14500 0.0
0.9504 15000 0.0
0.9821 15500 0.0
1.0137 16000 0.0
1.0454 16500 0.0
1.0771 17000 0.0
1.1088 17500 0.0
1.1405 18000 0.0
1.1721 18500 0.0
1.2038 19000 0.0
1.2355 19500 0.0
1.2672 20000 0.0
1.2989 20500 0.0
1.3305 21000 0.0
1.3622 21500 0.0
1.3939 22000 0.0
1.4256 22500 0.0
1.4573 23000 0.0
1.4889 23500 0.0
1.5206 24000 0.0
1.5523 24500 0.0
1.5840 25000 0.0
1.6157 25500 0.0
1.6473 26000 0.0
1.6790 26500 0.0
1.7107 27000 0.0
1.7424 27500 0.0
1.7741 28000 0.0
1.8057 28500 0.0
1.8374 29000 0.0
1.8691 29500 0.0
1.9008 30000 0.0
1.9325 30500 0.0
1.9641 31000 0.0
1.9958 31500 0.0
2.0275 32000 0.0
2.0592 32500 0.0
2.0909 33000 0.0
2.1225 33500 0.0
2.1542 34000 0.0
2.1859 34500 0.0
2.2176 35000 0.0
2.2493 35500 0.0
2.2809 36000 0.0
2.3126 36500 0.0
2.3443 37000 0.0
2.3760 37500 0.0
2.4077 38000 0.0
2.4393 38500 0.0
2.4710 39000 0.0
2.5027 39500 0.0
2.5344 40000 0.0
2.5661 40500 0.0
2.5977 41000 0.0
2.6294 41500 0.0
2.6611 42000 0.0
2.6928 42500 0.0
2.7245 43000 0.0
2.7561 43500 0.0
2.7878 44000 0.0
2.8195 44500 0.0
2.8512 45000 0.0
2.8828 45500 0.0
2.9145 46000 0.0
2.9462 46500 0.0
2.9779 47000 0.0

Framework Versions

  • Python: 3.10.10
  • Sentence Transformers: 3.3.1
  • Transformers: 4.49.0.dev0
  • PyTorch: 2.2.1+cu121
  • Accelerate: 1.2.1
  • Datasets: 3.2.0
  • Tokenizers: 0.21.0

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

CachedMultipleNegativesRankingLoss

@misc{gao2021scaling,
    title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
    author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
    year={2021},
    eprint={2101.06983},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}