SentenceTransformer based on answerdotai/ModernBERT-base
This is a sentence-transformers model finetuned from answerdotai/ModernBERT-base. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: answerdotai/ModernBERT-base
- Maximum Sequence Length: 8192 tokens
- Output Dimensionality: 768 dimensions
- Similarity Function: Cosine Similarity
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: ModernBertModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("anhtuansh/ModernBERT-base-test")
# Run inference
sentences = [
'thống_đốc ngân_hàng nhà_nước có vai_trò gì trong việc quyết_định loại tiền_tệ được sử_dụng trong hệ_thống thanh_toán điện_tử liên ngân_hàng quốc_gia ?',
'điều 1 . phạm_vi điều_chỉnh và đối_tượng áp_dụng \n 1 . phạm_vi điều_chỉnh : thông_tư này quy_định việc quản_lý , vận_hành và sử_dụng hệ_thống thanh_toán điện_tử liên ngân_hàng quốc_gia ( sau đây viết tắt là hệ_thống ttlnh ) để thực_hiện việc thanh_toán và quyết_toán giữa các đơn_vị tham_gia hệ_thống thanh_toán này bằng đồng việt_nam ( vnd ) , đô_la mỹ ( usd ) , đồng_tiền chung châu_âu ( eur ) và các loại ngoại_tệ khác do thống_đốc ngân_hàng nhà_nước quyết_định trong từng thời_kỳ . \n 2 . đối_tượng áp_dụng : là thành_viên , đơn_vị thành_viên , thành_viên gián_tiếp của hệ_thống ttlnh , đơn_vị vận_hành hệ_thống ttlnh , tổ_chức chủ_trì hệ_thống bù_trừ có kết_nối đến hệ_thống ttlnh , các đơn_vị liên_quan của ngân_hàng nhà_nước .',
'điều 3 . trách_nhiệm của nhà_nước . . 1 - nhà_nước chăm_lo bảo_vệ và tăng_cường sức_khoẻ nhân_dân ; đưa công_tác bảo_vệ sức_khoẻ nhân_dân vào kế_hoạch phát_triển kinh_tế - xã_hội và ngân_sách nhà_nước ; quyết_định những chế_độ chính_sách , biện_pháp để bảo_vệ và tăng_cường sức_khoẻ nhân_dân . 2 - bộ y_tế có trách_nhiệm quản_lý , hoàn_thiện , nâng cao chất_lượng và phát_triển hệ_thống phòng_bệnh , chống dịch , khám bệnh , chữa bệnh , sản_xuất , lưu_thông thuốc và thiết_bị y_tế , kiểm_tra việc thực_hiện các quy_định về chuyên_môn nghiệp_vụ y , dược . 3 - hội_đồng nhân_dân các cấp dành tỷ_lệ ngân_sách thích_đáng cho công_tác bảo_vệ sức_khoẻ nhân_dân ở địa_phương ; thường_xuyên giám_sát , kiểm_tra việc tuân theo pháp_luật về bảo_vệ sức_khoẻ nhân_dân của uỷ_ban nhân_dân cùng cấp , của các cơ_quan , các tổ_chức xã_hội , cơ_sở sản_xuất , kinh_doanh của nhà_nước , tập_thể , tư_nhân và mọi công_dân trong địa_phương .',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Evaluation
Metrics
Triplet
- Dataset:
public_administrative
- Evaluated with
TripletEvaluator
Metric | Value |
---|---|
cosine_accuracy | 0.8 |
Training Details
Training Dataset
Unnamed Dataset
- Size: 450 training samples
- Columns:
query
,positive
, andnegative
- Approximate statistics based on the first 450 samples:
query positive negative type string string string details - min: 40 tokens
- mean: 84.83 tokens
- max: 167 tokens
- min: 260 tokens
- mean: 563.37 tokens
- max: 904 tokens
- min: 320 tokens
- mean: 562.85 tokens
- max: 853 tokens
- Samples:
query positive negative ngân_hàng nhà_nước quy_định thế_nào về việc tạm ngừng dịch_vụ gửi lệnh thanh_toán trên hệ_thống thanh_toán điện_tử liên ngân_hàng quốc_gia do lỗi kỹ_thuật ?
khoản 3 . thống_đốc ngân_hàng nhà_nước quyết_định tạm ngừng dịch_vụ gửi lệnh thanh_toán trên hệ_thống ttlnh của thành_viên , đơn_vị thành_viên trong trường_hợp_thành_viên , đơn_vị thành_viên để xảy ra sự_cố kỹ_thuật làm gián_đoạn hệ_thống ttlnh tại đơn_vị , cụ_thể :
a ) gián_đoạn quá 04 lần trong 01 tháng thì bị tạm ngừng dịch_vụ gửi lệnh thanh_toán trong vòng 05 ngày làm_việc kể từ ngày vi_phạm ;
b ) gián_đoạn quá 11 lần trong 01 quý thì bị tạm ngừng dịch_vụ gửi lệnh thanh_toán trong vòng 10 ngày làm_việc kể 10 ngày vi_phạm ;
c ) gián_đoạn quá 19 lần trong 01 năm thì bị tạm ngừng dịch_vụ gửi lệnh thanh_toán trong vòng 01 tháng kể từ ngày vi_phạm .6 . cây có chứa_chất ma_túy là cây thuốc_phiện , cây côca , cây cần_sa và các loại cây khác có chứa_chất ma_túy do chính_phủ quy_định .
7 . phòng , chống ma_túy là phòng_ngừa , ngăn_chặn , đấu_tranh chống tội_phạm và tệ_nạn ma_túy ; kiểm_soát các hoạt_động hợp_pháp liên_quan đến ma_túy .
8 . tệ_nạn ma_túy là việc sử_dụng trái_phép chất ma_túy , nghiện ma_túy và các hành_vi vi_phạm_pháp_luật về ma_túy mà chưa đến mức hoặc không bị truy_cứu trách_nhiệm hình_sự .
9 . kiểm_soát các hoạt_động hợp_pháp liên_quan đến ma_túy là việc cho phép , theo_dõi , kiểm_tra , giám_sát các hoạt_động hợp_pháp liên_quan đến ma_túy và phòng_ngừa , ngăn_chặn việc lợi_dụng các hoạt_động đó vào mục_đích khác .pháp_luật quy_định như thế_nào về hạch_toán đối_với lệnh thanh_toán bị sai thừa ?
khoản 3 . đối_với lệnh thanh_toán bị sai thừa :
a ) phát_hiện trước khi trả tiền cho khách_hàng : nếu đơn_vị nhận lệnh chưa nhận được lệnh thanh_toán bị sai thừa nhưng đã nhận được yêu_cầu hoàn_trả của đơn_vị khởi tạo lệnh về chuyển tiền thừa thì đơn_vị nhận lệnh phải ghi sổ theo_dõi lệnh thanh_toán bị sai_sót để có biện_pháp xử_lý kịp_thời . khi nhận được lệnh thanh_toán bị sai thừa , đơn_vị nhận lệnh kiểm_soát , đối_chiếu với nội_dung yêu_cầu hoàn_trả nhận được , nếu đúng thì hạch_toán theo quy_định của pháp_luật hiện_hành . - đối_với lệnh thanh_toán có bị sai thừa : khi nhận được yêu_cầu hoàn_trả đối_với số tiền thừa thì lập lệnh thanh_toán có đi hoàn_trả đơn_vị khởi tạo lệnh số tiền thừa ; - đối_với lệnh thanh_toán nợ bị sai thừa : theo_dõi và xử_lý lệnh_hủy lệnh thanh_toán nợ đối_với số tiền thừa của đơn_vị khởi tạo lệnh ;điều 45 . tín_hiệu của phương_tiện
1 . tín_hiệu của phương_tiện dùng để thông_báo tình_trạng hoạt_động của phương_tiện , bao_gồm :
a ) âm hiệu là tín_hiệu âm_thanh phát ra từ còi , chuông , kẻng hoặc từ các vật khác ;
b ) đèn_hiệu là tín_hiệu ánh_sáng được sử_dụng từ lúc mặt_trời lặn đến lúc mặt_trời mọc hoặc trong trường_hợp tầm nhìn bị hạn_chế ;
c ) dấu_hiệu là những vật_thể có hình_dáng , màu_sắc , kích_thước được sử_dụng trong các trường_hợp do luật này quy_định ;
d ) cờ hiệu là loại cờ có hình_dáng , màu_sắc , kích_thước được sử_dụng trong các trường_hợp do luật này quy_định .
2 . bộ_trưởng bộ giao_thông vận_tải quy_định tiêu_chuẩn kỹ_thuật của âm hiệu , đèn_hiệu , dấu_hiệu và cờ hiệu .những thông_tin nào cần phải có trong báo_cáo sự_cố y_khoa ?
riêng đối_với sự_cố y_khoa nghiêm_trọng quy_định tại điểm b khoản 1 điều 5 phải báo_cáo trước bằng điện_thoại trong thời_hạn 01 giờ , kể từ khi phát_hiện sự_cố .
3 . báo_cáo và ghi_nhận sự_cố y_khoa tại cơ_sở khám bệnh , chữa bệnh
a ) báo_cáo sự_cố y_khoa - báo_cáo tự_nguyện : người trực_tiếp gây ra sự_cố y_khoa hoặc người phát_hiện sự_cố y_khoa báo_cáo cho bộ_phận tiếp_nhận và quản_lý_sự_cố y_khoa của cơ_sở khám bệnh , chữa bệnh . nội_dung báo_cáo tối_thiểu cần có : địa_điểm , thời_điểm xảy ra và mô_tả , đánh_giá sơ_bộ về sự_cố , tình_trạng của người bị ảnh_hưởng , biện_pháp xử_lý ban_đầu theo mẫu báo_cáo sự_cố y_khoa quy_định tại phụ_lục iii ban_hành kèm theo thông_tư này . - báo_cáo bắt_buộc : người trực_tiếp gây ra sự_cố y_khoa hoặc người phát_hiện sự_cố y_khoa phải báo_cáo cho trưởng khoa , bộ_phận tiếp_nhận và quản_lý_sự_cố y_khoa . trưởng khoa chịu trách_nhiệm báo_cáo cho lãnh_đạo cơ_sở khám bệnh , chữa bệnh .điều 14 . ban chỉ_đạo thống_kê hình_sự liên_ngành
1 . ban chỉ_đạo thống_kê hình_sự liên_ngành trung_ương gồm có : đại_diện lãnh_đạo viện kiểm_sát_nhân_dân tối_cao là trưởng ban , đại_diện lãnh_đạo toà_án nhân_dân tối_cao , đại_diện lãnh_đạo bộ công_an và đại_diện lãnh_đạo bộ quốc_phòng là thành_viên .
2 . ban chỉ_đạo thống_kê hình_sự liên_ngành cấp cao gồm có : đại_diện lãnh_đạo viện kiểm_sát_nhân_dân cấp cao là trưởng ban , đại_diện lãnh_đạo toà_án nhân_dân cấp cao là thành_viên .
3 . ban chỉ_đạo thống_kê hình_sự liên_ngành cấp tỉnh gồm có : đại_diện lãnh_đạo viện kiểm_sát_nhân_dân cấp tỉnh là trưởng ban , đại_diện lãnh_đạo toà_án nhân_dân cấp tỉnh , đại_diện lãnh_đạo công_an cấp tỉnh là thành_viên .
4 . ban chỉ_đạo thống_kê hình_sự liên_ngành cấp huyện gồm có : đại_diện lãnh_đạo viện kiểm_sát_nhân_dân cấp huyện là trưởng ban , đại_diện lãnh_đạo toà_án nhân_dân cấp huyện , đại_diện lãnh_đạo công_an cấp huyện là thành_viên . - Loss:
CachedMultipleNegativesRankingLoss
with these parameters:{ "scale": 20.0, "similarity_fct": "cos_sim" }
Evaluation Dataset
Unnamed Dataset
- Size: 50 evaluation samples
- Columns:
query
,positive
, andnegative
- Approximate statistics based on the first 50 samples:
query positive negative type string string string details - min: 50 tokens
- mean: 85.42 tokens
- max: 160 tokens
- min: 272 tokens
- mean: 591.1 tokens
- max: 819 tokens
- min: 309 tokens
- mean: 584.06 tokens
- max: 853 tokens
- Samples:
query positive negative bộ y_tế quy_định thế_nào về các dị_dạng , dị_tật bẩm_sinh ở tai đối_với người hoạt_động kháng_chiến và con_đẻ của họ ?
các dị_dạng , dị_tật bẩm_sinh ở tai 14 dị_tật thiếu tai ngoài bẩm_sinh - tật không tai ( congenital absence of ( ear ) auricle ) 15 thiếu , teo hoặc chít hẹp bẩm_sinh ống tai ngoài ( congenital absence , atresia and stricture of auditory canal ( external ) ) 16 dị_tật thừa ở vành_tai ( biến_dạng vành_tai - accessory auricle ) : - gờ bình tai phụ ( accessory tragus ) - tật_thừa tai ( polyotia ) - thịt thừa trước tai ( preauricular appendage or tag ) - thừa : tai ; dái_tai ( supernumerary : ear , lobule ) 17 dị_tật tai bé ( dị_tật tai nhỏ - microtia ) iv.
khoản 4 . sửa_đổi , bổ_sung khoản 3 điều 8 như sau : “ 3 . căn_cứ quy_định tại khoản 2 điều này , tổng_cục_trưởng tổng_cục quản_lý đất_đai xem_xét , quyết_định thu_hồi chứng_chỉ_định_giá đất theo mẫu quy_định tại phụ_lục số 06 ban_hành kèm theo thông_tư này . quyết_định thu_hồi chứng_chỉ_định_giá đất được gửi tới người bị thu_hồi , cơ_quan công_tác của người bị thu_hồi , đồng_thời đăng trên cổng thông_tin điện_tử của bộ tài_nguyên và môi_trường , cổng thông_tin điện_tử của tổng_cục quản_lý đất_đai . ”
luật bảo_vệ sức_khỏe nhân_dân quy_định thế_nào về phát_triển y_học cổ_truyền dân_tộc và ứng_dụng tiến_bộ khoa_học kỹ_thuật của y_học thế_giới ?
điều 2 . nguyên_tắc chỉ_đạo công_tác bảo_vệ sức_khoẻ . . 1 - đẩy_mạnh tuyên_truyền , giáo_dục vệ_sinh trong nhân_dân ; tiến_hành các biện_pháp dự_phòng , cải_tạo và làm sạch môi_trường sống ; bảo_đảm tiêu_chuẩn vệ_sinh lao_động , vệ_sinh lương_thực , thực_phẩm và nước uống theo quy_định của hội_đồng_bộ trngưở . 2 - mở_rộng mạng_lưới nhà_nghỉ , nhà điều_dưỡng , cơ_sở tập_luyện thể_dục thể_thao ; kết_hợp lao_động , học_tập với nghỉ_ngơi và giải_trí ; phát_triển thể_dục thể_thao quần_chúng để duy_trì và phục_hồi khả_năng lao_động . 3 - hoàn_thiện , nâng cao chất_lượng và phát_triển mạng_lưới phòng , chống dịch , khám bệnh , chữa bệnh ; kết_hợp phát_triển hệ_thống y_tế nhà_nước với y_tế tập_thể và y_tế tư_nhân . 4 - xây_dựng nền y_học việt_nam kế_thừa và phát_triển nền y_học , dược_học cổ_truyền dân_tộc ; kết_hợp y_học , dược_học hiện_đại với y_học , dược_học cổ_truyền dân_tộc , nghiên_cứu và ứng_dụng những tiến_bộ khoa_học kỹ_thuật của y_học thế_giới vào thực_tiễn việt_nam , xây_dựng các ...
điều 25 . xử_lý kết_quả_quyết_toán ròng từ các hệ_thống khác
1 . hệ_thống ttlnh được phép tiếp_nhận và xử_lý kết_quả_quyết_toán ròng từ hệ_thống bù_trừ tự_động ( ach ) , hệ_thống bù_trừ thẻ và các hệ_thống thanh_toán bù_trừ khác .
2 . việc xử_lý kết_quả_quyết_toán ròng được thực_hiện bằng phương_thức xử_lý theo lô trên cơ_sở đủ số_dư tài_khoản thanh_toán của các thành_viên tham_gia quyết_toán . trong trường_hợp tài_khoản thanh_toán của thành_viên không đủ số_dư , xử_lý như sau :
a ) thành_viên thực_hiện thấu chi trong hạn_mức được cấp theo quy_định về việc thấu chi thấu chi và cho vay qua đêm trong ttlnh của ngân_hàng nhà_nước để xử_lý kết_quả_quyết_toán ròng ;
b ) khi thành_viên sử_dụng hết hạn_mức thấu chi được ngân_hàng nhà_nước cấp mà vẫn không đủ vốn quyết_toán thì kết_quả_quyết_toán ròng đó được chuyển vào hàng đợi quyết_toán . khi đủ số_dư trên tài_khoản thanh_toán thì kết_quả_quyết_toán ròng được xử_lý tiếp ;bộ lao_động - thương_binh và xã_hội quy_định thế_nào về trách_nhiệm của cơ_sở cung_cấp dịch_vụ công_tác xã_hội trong giáo_dục ý_thức tuân_thủ các quy_định về tiêu_chuẩn đạo_đức nghề_nghiệp ?
điều 8 . trách_nhiệm của cơ_sở cung_cấp dịch_vụ công_tác xã_hội
1 . thường_xuyên tổ_chức giáo_dục ý_thức tuân_thủ các quy_định về tiêu_chuẩn đạo_đức nghề_nghiệp đối_với người làm công_tác xã_hội thuộc phạm_vi quản_lý .
2 . phối_hợp với các cơ_sở đào_tạo , cơ_sở giáo_dục nghề_nghiệp để đào_tạo , bồi_dưỡng , nâng cao năng_lực chuyên_môn và đạo_đức nghề_nghiệp đối_với người làm công_tác xã_hội .
3 . công_bố công_khai tiêu_chuẩn đạo_đức nghề công_tác xã_hội để người làm công_tác xã_hội biết và nghiêm_túc thực_hiện .
4 . tạo điều_kiện thuận_lợi và hỗ_trợ để người làm công_tác xã_hội thực_hiện tốt các tiêu_chuẩn đạo_đức nghề_nghiệp trong quá_trình thực_hành công_tác xã_hội .
5 . tiếp_nhận , giải_quyết các khiếu_nại , tố_cáo của đối_tượng liên_quan đến việc thực_hiện đạo_đức nghề_nghiệp của người làm công_tác xã_hội theo thẩm_quyền ; xử_lý nghiêm các hành_vi vi_phạm đạo_đức nghề_nghiệp thuộc phạm_vi quản_lý theo quy_định của pháp_luật .
6 . thường_xuyên kiểm_tra , đánh_giá kết_quả...g ) tỷ_lệ người lái_xe vi_phạm_quy_định về thời_gian lái_xe liên_tục , thời_gian làm_việc của lái_xe trong ngày trên số ngày xe hoạt_động ;
h ) số lần và thời_gian không truyền dữ_liệu trong tháng của từng đơn_vị kinh_doanh vận_tải , sở giao_thông vận_tải ;
i ) tổng_hợp tình_hình vi_phạm theo từng tuyến đường và theo các thời_điểm khác nhau .
2 . sở giao_thông vận_tải thực_hiện việc khai_thác , quản_lý dữ_liệu về biển số xe , trọng_tải xe ( số_lượng hành_khách hoặc khối_lượng hàng chuyên_chở cho phép tham_gia giao_thông ) , tên đơn_vị kinh_doanh vận_tải và các dữ_liệu vi_phạm về hành_trình , tốc_độ xe chạy , thời_gian lái_xe liên_tục , thời_gian làm_việc của lái_xe trong ngày của từng đơn_vị kinh_doanh vận_tải thuộc sở trực_tiếp_quản_lý thông_qua tài_khoản đăng_nhập và mật_khẩu được cung_cấp để truy_cập vào hệ_thống thông_tin của tổng_cục đường_bộ việt_nam .
3 . bến_xe_khách , bến_xe hàng được cung_cấp tài_khoản đăng_nhập vào cơ_sở dữ_liệu của tổng_cục đường_bộ việt_nam để phục... - Loss:
CachedMultipleNegativesRankingLoss
with these parameters:{ "scale": 20.0, "similarity_fct": "cos_sim" }
Training Hyperparameters
Non-Default Hyperparameters
per_device_train_batch_size
: 2per_device_eval_batch_size
: 2learning_rate
: 8e-05num_train_epochs
: 1warmup_ratio
: 0.05bf16
: Truebatch_sampler
: no_duplicates
All Hyperparameters
Click to expand
overwrite_output_dir
: Falsedo_predict
: Falseeval_strategy
: noprediction_loss_only
: Trueper_device_train_batch_size
: 2per_device_eval_batch_size
: 2per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 1eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 8e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1.0num_train_epochs
: 1max_steps
: -1lr_scheduler_type
: linearlr_scheduler_kwargs
: {}warmup_ratio
: 0.05warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Truefp16
: Falsefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Nonelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Falseignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torchoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Nonehub_always_push
: Falsegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseinclude_for_metrics
: []eval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Nonedispatch_batches
: Nonesplit_batches
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseuse_liger_kernel
: Falseeval_use_gather_object
: Falseaverage_tokens_across_devices
: Falseprompts
: Nonebatch_sampler
: no_duplicatesmulti_dataset_batch_sampler
: proportional
Training Logs
Epoch | Step | public_administrative_cosine_accuracy |
---|---|---|
0 | 0 | 0.56 |
1.0 | 225 | 0.8 |
Framework Versions
- Python: 3.11.11
- Sentence Transformers: 3.3.1
- Transformers: 4.49.0.dev0
- PyTorch: 2.5.1+cu121
- Accelerate: 1.2.1
- Datasets: 3.2.0
- Tokenizers: 0.21.0
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
CachedMultipleNegativesRankingLoss
@misc{gao2021scaling,
title={Scaling Deep Contrastive Learning Batch Size under Memory Limited Setup},
author={Luyu Gao and Yunyi Zhang and Jiawei Han and Jamie Callan},
year={2021},
eprint={2101.06983},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
- Downloads last month
- 4
Inference Providers
NEW
This model is not currently available via any of the supported third-party Inference Providers, and
the model is not deployed on the HF Inference API.
Model tree for anhtuansh/ModernBERT-base-test
Base model
answerdotai/ModernBERT-baseEvaluation results
- Cosine Accuracy on public administrativeself-reported0.800