metadata
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:2459
- loss:MatryoshkaLoss
- loss:MultipleNegativesRankingLoss
base_model: bkai-foundation-models/vietnamese-bi-encoder
widget:
- source_sentence: >-
Khi lấy ý kiến của những người liên quan, công chức tư pháp – hộ tịch phải
tư vấn điều gì để đảm bảo trẻ em tiếp tục được chăm sóc phù hợp?
sentences:
- >-
Điều 28. Hành vi vi phạm quy định về đăng ký kết hôn và môi giới kết hôn
1. Cảnh cáo hoặc phạt tiền từ 300.000 đồng đến 500.000 đồng đối với hành
vi sửa chữa, tẩy xóa, làm sai lệch nội dung giấy tờ do cơ quan có thẩm
quyền cấp để làm thủ tục đăng ký kết hôn.
2. Phạt tiền từ 1.000.000 đồng đến 3.000.000 đồng đối với một trong các
hành vi sau:
a) Cho người khác mượn giấy tờ để làm thủ tục đăng ký kết hôn; sử dụng
giấy tờ của người khác để làm thủ tục đăng ký kết hôn;
b) Sử dụng giấy tờ giả để làm thủ tục đăng ký kết hôn;
c) Cam đoan không đúng về tình trạng hôn nhân để làm thủ tục đăng ký kết
hôn.
3. Phạt tiền từ 3.000.000 đồng đến 5.000.000 đồng đối với hành vi làm
giả giấy tờ để làm thủ tục đăng ký kết hôn.
4.
- >-
Điều 5. Lệ phí
1. Người yêu cầu đăng ký kết hôn, nhận cha, mẹ, con, cấp Giấy xác nhận
tình trạng hôn nhân, công nhận việc kết hôn, ghi vào sổ hộ tịch việc
nhận cha, mẹ, con của công dân Việt Nam đã giải quyết tại cơ quan có
thẩm quyền của nước ngoài theo quy định tại Nghị định này phải nộp lệ
phí theo quy định của pháp luật.
2. Miễn lệ phí đăng ký kết hôn, nhận cha, mẹ, con có yếu tố nước ngoài ở
khu vực biên giới.
Chương 2.
KẾT HÔN
MỤC 1. ĐĂNG KÝ KẾT HÔN
- >-
Điều 9. Yêu cầu về kiểm tra hồ sơ và lấy ý kiến của những người liên
quan
1. Khi kiểm tra hồ sơ, công chức tư pháp – hộ tịch phải nghiên cứu, tìm
hiểu tâm tư, nguyện vọng và hoàn cảnh của những người liên quan. Trường
hợp người được nhận làm con nuôi có cha mẹ đẻ, thì công chức tư pháp –
hộ tịch kiểm tra việc cha mẹ đẻ có thỏa thuận với cha mẹ nuôi để giữ lại
quyền, nghĩa vụ đối với con và cách thức thực hiện quyền, nghĩa vụ đó
sau khi đã cho làm con nuôi.
2. Khi lấy ý kiến của những người liên quan theo quy định tại Điều 20 và
Điều 21 của Luật Nuôi con nuôi, công chức tư pháp – hộ tịch phải tư vấn
để trẻ em tiếp tục được chăm sóc, nuôi dưỡng, giáo dục phù hợp với điều
kiện và khả năng thực tế của gia đình.
- source_sentence: >-
Những cơ quan, tổ chức nào không thuộc đối tượng áp dụng của quyết định về
dân số và kế hoạch hóa gia đình tại TP.HCM?
sentences:
- >-
2. Đối tượng áp dụng của quyết định này là cá nhân, là người Việt Nam,
cư trú thực tế trên địa bàn thành phố Hồ Chí Minh ổn định từ 06 tháng
trở lên (bao gồm những người thường trú và tạm trú); cơ quan, tổ chức
trú đóng trên địa bàn thành phố Hồ Chí Minh là các cơ quan: hành chính,
sự nghiệp, kinh tế, các đoàn thể, các tổ chức chính trị, tổ chức chính
trị xã hội, tổ chức xã hội nghề nghiệp (bao gồm các cơ quan, tổ chức của
thành phố, của các tỉnh, thành phố khác và của Trung ương trú đóng trên
địa bàn thành phố Hồ Chí Minh, áp dụng và thực hiện tốt công tác dân số
và kế hoạch hóa gia đình.
3. Riêng các doanh trại quân đội, công an, trại giam và các cơ quan
ngoại giao không thuộc đối tượng áp dụng quyết định này.
Điều 2. Chính sách và nơi cung cấp dịch vụ đối với người áp dụng biện
pháp tránh thai
1. Chính sách đối với người áp dụng biện pháp tránh thai:
a) Người áp dụng biện pháp đặt dụng cụ tử cung, được cấp thuốc theo quy
định của Bộ Y tế; được miễn phí hoàn toàn khi thực hiện việc đặt, tái
khám và tháo dụng cụ tử cung.
- >-
Điều 65. Thẩm quyền lập biên bản vi phạm hành chính
1. Người có thẩm quyền lập biên bản quy định tại Điều này chỉ được lập
biên bản vi phạm hành chính đối với những vi phạm hành chính thuộc phạm
vi thi hành công vụ, nhiệm vụ được giao theo mẫu quy định và chịu trách
nhiệm về việc lập biên bản.
2. Những người sau đây đang thi hành công vụ, nhiệm vụ có thẩm quyền lập
biên bản vi phạm hành chính:
a) Người có thẩm quyền xử phạt vi phạm hành chính quy định tại các Điều
66, 67, 68, 69 và 70 của Nghị định này lập biên bản vi phạm hành chính
đối với các hành vi trong lĩnh vực thuộc thẩm quyền xử phạt của mình;
b) Công chức tư pháp - hộ tịch cấp xã lập biên bản vi phạm hành chính
đối với các hành vi quy định tại các Điều 24, 25, 27, 28, 30, 31, 32,
33, 34, 35, 36, 47, 48, 49 và 50 của Nghị định này;
c) Công chức Phòng Tư pháp cấp huyện lập biên bản vi phạm hành chính đối
với các hành vi quy định tại Mục 1 Chương III, các Điều 27, 28, 30, 31,
32, 33, 34, 35, 36, 39 và 40,
- >-
Điều 33. Trình tự cấp giấy phép cho tổ chức con nuôi nước ngoài hoạt
động tại Việt Nam
1. Trong thời hạn 60 ngày, kể từ ngày nhận đủ hồ sơ hợp lệ, Cục Con nuôi
kiểm tra, thẩm định hồ sơ; phỏng vấn để kiểm tra, đánh giá về tiêu chuẩn
của người dự kiến đứng đầu Văn phòng con nuôi nước ngoài tại Việt Nam;
kiểm tra, đánh giá về điều kiện, năng lực chuyên môn của tổ chức và đội
ngũ nhân viên của tổ chức con nuôi nước ngoài; báo cáo Bộ trưởng Bộ Tư
pháp đề nghị Bộ Công an cho ý kiến.
2. Trong thời hạn 30 ngày, kể từ ngày nhận được đề nghị của Bộ Tư pháp,
Bộ Công an trả lời bằng văn bản cho Bộ Tư pháp.
3.
- source_sentence: Hành vi ép buộc người khác nhận cha, mẹ, con sẽ bị phạt tiền ở mức nào?
sentences:
- >-
Trong trường hợp từ chối đăng ký kết hôn, cơ quan đại diện có văn bản
thông báo cho hai bên nam, nữ, trong đó nêu rõ lý do từ chối.
2. Trường hợp xét thấy có vấn đề cần xác minh thuộc chức năng của cơ
quan hữu quan ở trong nước, cơ quan đại diện có công văn nêu rõ vấn đề
cần xác minh, gửi Bộ Ngoại giao để yêu cầu cơ quan hữu quan xác minh
theo chức năng chuyên ngành.
Trong thời hạn 10 ngày làm việc, kể từ ngày nhận được công văn của Bộ
Ngoại giao, cơ quan hữu quan ở trong nước thực hiện xác minh vấn đề được
yêu cầu và trả lời bằng văn bản gửi Bộ Ngoại giao để chuyển cho cơ quan
đại diện.
3. Lễ đăng ký kết hôn được tổ chức trong thời hạn 05 ngày làm việc, kể
từ ngày người đứng đầu cơ quan đại diện ký Giấy chứng nhận kết hôn.
4. Lễ đăng ký kết hôn được tổ chức trang trọng tại trụ sở cơ quan đại
diện. Khi tổ chức lễ đăng ký kết hôn phải có mặt hai bên nam, nữ. Đại
diện cơ quan đại diện chủ trì hôn lễ, yêu cầu hai bên cho biết ý định
lần cuối về sự tự nguyện kết hôn.
- >-
Điều 33. Hành vi vi phạm quy định về đăng ký việc nhận cha, mẹ, con
1. Cảnh cáo hoặc phạt tiền từ 300.000 đồng đến 500.000 đồng đối với hành
vi sửa chữa, tẩy xóa, làm sai lệch nội dung giấy tờ do cơ quan có thẩm
quyền cấp để làm thủ tục đăng ký nhận cha, mẹ, con.
2. Phạt tiền từ 1.000.000 đồng đến 3.000.000 đồng đối với một trong các
hành vi sau:
a) Sử dụng giấy tờ của người khác để làm thủ tục đăng ký nhận cha, mẹ,
con;
b) Sử dụng giấy tờ giả để làm thủ tục đăng ký nhận cha, mẹ, con;
c) Ép buộc người khác nhận cha, mẹ, con.
3. Phạt tiền từ 3.000.000 đồng đến 5.000.000 đồng đối với hành vi làm
giả giấy tờ để làm thủ tục đăng ký nhận cha, mẹ, con.
4. Biện pháp khắc phục hậu quả:
Hủy bỏ giấy tờ giả đối với hành vi quy định tại Điểm b Khoản 2, Khoản 3
Điều này.
- >-
Trường hợp cần phải xác minh, thì thời hạn xác minh không quá 05 ngày.”
13. Khoản 1 và khoản 2 Điều 48 được sửa đổi, bổ sung như sau:
“1. Người có yêu cầu đăng ký lại việc sinh, tử, kết hôn phải nộp Tờ khai
(theo mẫu quy định) và xuất trình bản sao giấy tờ hộ tịch đã cấp hợp lệ
trước đây (nếu có); trong trường hợp không có bản sao giấy tờ hộ tịch,
thì đương sự phải tự cam đoan về việc đã đăng ký, nhưng sổ hộ tịch không
còn lưu được và chịu trách nhiệm về nội dung cam đoan.
2. Sau khi nhận đủ giấy tờ hợp lệ, cán bộ Tư pháp hộ tịch ghi vào sổ hộ
tịch theo từng loại việc và bản chính Giấy khai sinh, Giấy chứng tử,
Giấy chứng nhận kết hôn. Chủ tịch Ủy ban nhân dân cấp xã ký và cấp cho
người đi đăng ký một bản chính giấy tờ hộ tịch theo từng loại việc. Các
giấy tờ hộ tịch cũ liên quan đến sự kiện hộ tịch đăng ký lại (nếu có)
được thu hồi và lưu hồ sơ.
Trường hợp cần phải xác minh, thì thời hạn được kéo dài không quá 03
ngày.”
14. Khoản 2 Điều 50 được sửa đổi như sau:
“2.
- source_sentence: >-
Nếu giấy xác nhận tình trạng hôn nhân được cấp tại tỉnh khác, Sở Tư pháp
cần làm gì trước khi ghi vào sổ việc kết hôn?
sentences:
- "Đơn vị chủ trì: Tổng cục Dân số.\n\nĐơn vị phối hợp: Vụ Truyền thông và Thi đua, khen thưởng; Sở Y tế các tỉnh/thành phố và các đơn vị liên quan.\n\n\tb) Đa dạng hóa các loại hình truyền thông, chú trọng kênh thông tin đại chúng; các sản phẩm truyền thông phù hợp với từng vùng miền, địa phương. Tăng cường áp dụng công nghệ hiện đại, internet, mạng xã hội trong tuyên truyền, vận động về kế hoạch hóa gia đình; lồng ghép với các hoạt động truyền thông của các Chương trình, Đề án khác."
- >-
Trường hợp công dân Việt Nam được cấp Giấy xác nhận tình trạng hôn nhân
tại địa bàn tỉnh khác, Sở Tư pháp có văn bản gửi Sở Tư pháp nơi đã cho ý
kiến về việc cấp Giấy xác nhận tình trạng hôn nhân đề nghị kiểm tra, đối
chiếu; nếu việc cấp Giấy xác nhận tình trạng hôn nhân bảo đảm đúng trình
tự, thủ tục, việc kết hôn bảo đảm điều kiện theo quy định tại khoản 1
Điều 16 của Nghị định số 24/2013/NĐ-CP, thì ghi vào sổ việc kết hôn.
2. Trường hợp việc cấp Giấy xác nhận tình trạng hôn nhân không đúng
trình tự, thủ tục, Sở Tư pháp tiến hành xác minh làm rõ. Nếu kết quả xác
minh cho thấy đương sự có đủ điều kiện kết hôn (vào thời điểm yêu cầu
cấp Giấy xác nhận tình trạng hôn nhân), tình trạng hôn nhân của công dân
Việt Nam được xác nhận là đúng, Sở Tư pháp vẫn tiến hành ghi vào sổ việc
kết hôn và cấp Giấy xác nhận cho đương sự.
Sau khi ghi vào sổ việc kết hôn, Sở Tư pháp có văn bản gửi Ủy ban nhân
dân cấp xã, nơi đã cấp Giấy xác nhận tình trạng hôn nhân để chấn chỉnh,
xử lý theo quy định.
- >-
6. Phạt tiền từ 20.000.000 đồng đến 30.000.000 đồng đối với một trong
các hành vi sau:
a) Không chấp hành quyết định của người có thẩm quyền thi hành án về
việc khấu trừ tài khoản, thu hồi giấy tờ có giá của người phải thi hành
án;
b) Không chấp hành quyết định của người có thẩm quyền thi hành án về
việc thu tiền từ hoạt động kinh doanh của người phải thi hành án; về
việc thu tiền của người phải thi hành án đang giữ.
7. Phạt tiền từ 30.000.000 đồng đến 40.000.000 đồng đối với hành vi
không thực hiện việc phong tỏa tài khoản của người phải thi hành án theo
quyết định của người có thẩm quyền thi hành án.
8. Biện pháp khắc phục hậu quả:
Buộc khôi phục lại tình trạng ban đầu đã bị thay đổi đối với hành vi quy
định tại Điểm a Khoản 4, Điểm a và Điểm b Khoản 5 Điều này.
Chương 6.
HÀNH VI VI PHẠM HÀNH CHÍNH, HÌNH THỨC XỬ PHẠT VÀ BIỆN PHÁP
KHẮC PHỤC HẬU QUẢ TRONG LĨNH VỰC PHÁ SẢN DOANH NGHIỆP, HỢP TÁC XÃ
- source_sentence: >-
Ai phải nộp lệ phí đăng ký nuôi con nuôi nước ngoài khi nộp hồ sơ xin nhận
con nuôi tại Cục Con nuôi?
sentences:
- "Các hoạt động:\n\n\t- Xây dựng bộ công cụ giám sát chất lượng sau đào tạo đối với người cung cấp dịch vụ; các quy định về cơ sở thực hiện dịch vụ kế hoạch hóa gia đình có chất lượng;\n\n\t- Hướng dẫn tổ chức thực hiện việc giám sát chất lượng đối với cơ sở và người cung cấp dịch vụ kế hoạch hóa gia đình;\n\n\t- Kiểm định chất lượng phương tiện tránh thai và hàng hóa sức khỏe sinh sản.\n\nĐơn vị chủ trì: Tổng cục Dân số.\n\nĐơn vị phối hợp: Vụ Sức khỏe Bà mẹ - Trẻ em; Sở Y tế các tỉnh/thành phố và các đơn vị liên quan.\n\n\t4. Đẩy mạnh xã hội hóa, huy động nguồn lực thực hiện Chương trình\n\nĐẩy mạnh xã hội hóa dịch vụ kế hoạch hóa gia đình, tạo điều kiện thuận lợi cho các tổ chức, cá nhân tham gia Chương trình; huy động toàn bộ hệ thống y tế, dân số tham gia thực hiện Chương trình theo chức năng, nhiệm vụ được giao, ưu tiên bảo đảm hoạt động ở tuyến cơ sở, vùng khó khăn có mức sinh cao."
- >-
tranh chấp giữa các thành viên gia đình, xử lý hành vi bạo lực gia đình;
g) Khiếu nại, tố cáo, khởi kiện đối với hành vi vi phạm pháp luật về
phòng, chống bạo lực gia đình;
h) Quyền khác theo quy định của pháp luật có liên quan đến phòng, chống
bạo lực gia đình.
2. Người bị bạo lực gia đình, người giám hộ hoặc người đại diện theo
pháp luật của người bị bạo lực gia đình có trách nhiệm cung cấp đầy đủ,
chính xác, kịp thời thông tin liên quan đến hành vi bạo lực gia đình khi
có yêu cầu của cơ quan, tổ chức, cá nhân có thẩm quyền.
- "Điều 42. Đối tượng phải nộp lệ phí đăng ký nuôi con nuôi \n\n1. Công dân Việt Nam thường trú tại Việt Nam phải nộp lệ phí đăng ký nuôi con nuôi trong nước theo quy định tại khoản 1 Điều 40 của Nghị định này khi nộp hồ sơ đăng ký nuôi con nuôi tại Ủy ban nhân dân cấp xã. \_\_\_\n\n2. Người Việt Nam định cư ở nước ngoài, người nước ngoài không thường trú tại Việt Nam phải nộp lệ phí đăng ký nuôi con nuôi nước ngoài theo quy định tại khoản 2 Điều 40 của Nghị định này khi nộp hồ sơ xin nhận con nuôi tại Cục Con nuôi.\n\n3. Công dân Việt Nam tạm trú ở nước ngoài phải nộp lệ phí đăng ký nuôi con nuôi theo quy định tại khoản 3 Điều 40 của Nghị định này khi nộp hồ sơ xin nhận con nuôi tại Cơ quan đại diện."
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
- cosine_accuracy@1
- cosine_accuracy@3
- cosine_accuracy@5
- cosine_accuracy@10
- cosine_precision@1
- cosine_precision@3
- cosine_precision@5
- cosine_precision@10
- cosine_recall@1
- cosine_recall@3
- cosine_recall@5
- cosine_recall@10
- cosine_ndcg@10
- cosine_mrr@10
- cosine_map@100
model-index:
- name: SentenceTransformer based on bkai-foundation-models/vietnamese-bi-encoder
results:
- task:
type: information-retrieval
name: Information Retrieval
dataset:
name: dim 768
type: dim_768
metrics:
- type: cosine_accuracy@1
value: 0.483529890199268
name: Cosine Accuracy@1
- type: cosine_accuracy@3
value: 0.7157381049206994
name: Cosine Accuracy@3
- type: cosine_accuracy@5
value: 0.7897519316795445
name: Cosine Accuracy@5
- type: cosine_accuracy@10
value: 0.8592923952826352
name: Cosine Accuracy@10
- type: cosine_precision@1
value: 0.483529890199268
name: Cosine Precision@1
- type: cosine_precision@3
value: 0.2385793683068998
name: Cosine Precision@3
- type: cosine_precision@5
value: 0.1579503863359089
name: Cosine Precision@5
- type: cosine_precision@10
value: 0.08592923952826352
name: Cosine Precision@10
- type: cosine_recall@1
value: 0.483529890199268
name: Cosine Recall@1
- type: cosine_recall@3
value: 0.7157381049206994
name: Cosine Recall@3
- type: cosine_recall@5
value: 0.7897519316795445
name: Cosine Recall@5
- type: cosine_recall@10
value: 0.8592923952826352
name: Cosine Recall@10
- type: cosine_ndcg@10
value: 0.6739315776091506
name: Cosine Ndcg@10
- type: cosine_mrr@10
value: 0.6141480599288642
name: Cosine Mrr@10
- type: cosine_map@100
value: 0.6195040501807831
name: Cosine Map@100
- task:
type: information-retrieval
name: Information Retrieval
dataset:
name: dim 512
type: dim_512
metrics:
- type: cosine_accuracy@1
value: 0.4827165514436763
name: Cosine Accuracy@1
- type: cosine_accuracy@3
value: 0.7104514030093534
name: Cosine Accuracy@3
- type: cosine_accuracy@5
value: 0.7873119154127695
name: Cosine Accuracy@5
- type: cosine_accuracy@10
value: 0.8613257421716145
name: Cosine Accuracy@10
- type: cosine_precision@1
value: 0.4827165514436763
name: Cosine Precision@1
- type: cosine_precision@3
value: 0.2368171343364511
name: Cosine Precision@3
- type: cosine_precision@5
value: 0.15746238308255386
name: Cosine Precision@5
- type: cosine_precision@10
value: 0.08613257421716145
name: Cosine Precision@10
- type: cosine_recall@1
value: 0.4827165514436763
name: Cosine Recall@1
- type: cosine_recall@3
value: 0.7104514030093534
name: Cosine Recall@3
- type: cosine_recall@5
value: 0.7873119154127695
name: Cosine Recall@5
- type: cosine_recall@10
value: 0.8613257421716145
name: Cosine Recall@10
- type: cosine_ndcg@10
value: 0.6723537916655246
name: Cosine Ndcg@10
- type: cosine_mrr@10
value: 0.6116990065648049
name: Cosine Mrr@10
- type: cosine_map@100
value: 0.6168201481483597
name: Cosine Map@100
- task:
type: information-retrieval
name: Information Retrieval
dataset:
name: dim 256
type: dim_256
metrics:
- type: cosine_accuracy@1
value: 0.46156974379829196
name: Cosine Accuracy@1
- type: cosine_accuracy@3
value: 0.6901179341195608
name: Cosine Accuracy@3
- type: cosine_accuracy@5
value: 0.777551850345669
name: Cosine Accuracy@5
- type: cosine_accuracy@10
value: 0.8487189914599431
name: Cosine Accuracy@10
- type: cosine_precision@1
value: 0.46156974379829196
name: Cosine Precision@1
- type: cosine_precision@3
value: 0.23003931137318692
name: Cosine Precision@3
- type: cosine_precision@5
value: 0.1555103700691338
name: Cosine Precision@5
- type: cosine_precision@10
value: 0.0848718991459943
name: Cosine Precision@10
- type: cosine_recall@1
value: 0.46156974379829196
name: Cosine Recall@1
- type: cosine_recall@3
value: 0.6901179341195608
name: Cosine Recall@3
- type: cosine_recall@5
value: 0.777551850345669
name: Cosine Recall@5
- type: cosine_recall@10
value: 0.8487189914599431
name: Cosine Recall@10
- type: cosine_ndcg@10
value: 0.6552643834357492
name: Cosine Ndcg@10
- type: cosine_mrr@10
value: 0.5931471368539272
name: Cosine Mrr@10
- type: cosine_map@100
value: 0.5986420157639187
name: Cosine Map@100
- task:
type: information-retrieval
name: Information Retrieval
dataset:
name: dim 128
type: dim_128
metrics:
- type: cosine_accuracy@1
value: 0.439609597397316
name: Cosine Accuracy@1
- type: cosine_accuracy@3
value: 0.6588043920292802
name: Cosine Accuracy@3
- type: cosine_accuracy@5
value: 0.7429849532330216
name: Cosine Accuracy@5
- type: cosine_accuracy@10
value: 0.8251321675477836
name: Cosine Accuracy@10
- type: cosine_precision@1
value: 0.439609597397316
name: Cosine Precision@1
- type: cosine_precision@3
value: 0.21960146400976008
name: Cosine Precision@3
- type: cosine_precision@5
value: 0.1485969906466043
name: Cosine Precision@5
- type: cosine_precision@10
value: 0.08251321675477835
name: Cosine Precision@10
- type: cosine_recall@1
value: 0.439609597397316
name: Cosine Recall@1
- type: cosine_recall@3
value: 0.6588043920292802
name: Cosine Recall@3
- type: cosine_recall@5
value: 0.7429849532330216
name: Cosine Recall@5
- type: cosine_recall@10
value: 0.8251321675477836
name: Cosine Recall@10
- type: cosine_ndcg@10
value: 0.6297155370556367
name: Cosine Ndcg@10
- type: cosine_mrr@10
value: 0.5673880206820422
name: Cosine Mrr@10
- type: cosine_map@100
value: 0.5736251203666848
name: Cosine Map@100
- task:
type: information-retrieval
name: Information Retrieval
dataset:
name: dim 64
type: dim_64
metrics:
- type: cosine_accuracy@1
value: 0.3904026026840179
name: Cosine Accuracy@1
- type: cosine_accuracy@3
value: 0.5957706384709232
name: Cosine Accuracy@3
- type: cosine_accuracy@5
value: 0.6766978446522977
name: Cosine Accuracy@5
- type: cosine_accuracy@10
value: 0.7726718178121188
name: Cosine Accuracy@10
- type: cosine_precision@1
value: 0.3904026026840179
name: Cosine Precision@1
- type: cosine_precision@3
value: 0.19859021282364103
name: Cosine Precision@3
- type: cosine_precision@5
value: 0.1353395689304595
name: Cosine Precision@5
- type: cosine_precision@10
value: 0.07726718178121188
name: Cosine Precision@10
- type: cosine_recall@1
value: 0.3904026026840179
name: Cosine Recall@1
- type: cosine_recall@3
value: 0.5957706384709232
name: Cosine Recall@3
- type: cosine_recall@5
value: 0.6766978446522977
name: Cosine Recall@5
- type: cosine_recall@10
value: 0.7726718178121188
name: Cosine Recall@10
- type: cosine_ndcg@10
value: 0.5745062884302428
name: Cosine Ndcg@10
- type: cosine_mrr@10
value: 0.5119518839120302
name: Cosine Mrr@10
- type: cosine_map@100
value: 0.5199027870677515
name: Cosine Map@100
SentenceTransformer based on bkai-foundation-models/vietnamese-bi-encoder
This is a sentence-transformers model finetuned from bkai-foundation-models/vietnamese-bi-encoder. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: bkai-foundation-models/vietnamese-bi-encoder
- Maximum Sequence Length: 256 tokens
- Output Dimensionality: 768 dimensions
- Similarity Function: Cosine Similarity
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: RobertaModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("khanglt0004/ltk_embedding")
# Run inference
sentences = [
'Ai phải nộp lệ phí đăng ký nuôi con nuôi nước ngoài khi nộp hồ sơ xin nhận con nuôi tại Cục Con nuôi?',
'Điều 42. Đối tượng phải nộp lệ phí đăng ký nuôi con nuôi \n\n1. Công dân Việt Nam thường trú tại Việt Nam phải nộp lệ phí đăng ký nuôi con nuôi trong nước theo quy định tại khoản 1 Điều 40 của Nghị định này khi nộp hồ sơ đăng ký nuôi con nuôi tại Ủy ban nhân dân cấp xã. \xa0\xa0\xa0\n\n2. Người Việt Nam định cư ở nước ngoài, người nước ngoài không thường trú tại Việt Nam phải nộp lệ phí đăng ký nuôi con nuôi nước ngoài theo quy định tại khoản 2 Điều 40 của Nghị định này khi nộp hồ sơ xin nhận con nuôi tại Cục Con nuôi.\n\n3. Công dân Việt Nam tạm trú ở nước ngoài phải nộp lệ phí đăng ký nuôi con nuôi theo quy định tại khoản 3 Điều 40 của Nghị định này khi nộp hồ sơ xin nhận con nuôi tại Cơ quan đại diện.',
'Các hoạt động:\n\n\t- Xây dựng bộ công cụ giám sát chất lượng sau đào tạo đối với người cung cấp dịch vụ; các quy định về cơ sở thực hiện dịch vụ kế hoạch hóa gia đình có chất lượng;\n\n\t- Hướng dẫn tổ chức thực hiện việc giám sát chất lượng đối với cơ sở và người cung cấp dịch vụ kế hoạch hóa gia đình;\n\n\t- Kiểm định chất lượng phương tiện tránh thai và hàng hóa sức khỏe sinh sản.\n\nĐơn vị chủ trì: Tổng cục Dân số.\n\nĐơn vị phối hợp: Vụ Sức khỏe Bà mẹ - Trẻ em; Sở Y tế các tỉnh/thành phố và các đơn vị liên quan.\n\n\t4. Đẩy mạnh xã hội hóa, huy động nguồn lực thực hiện Chương trình\n\nĐẩy mạnh xã hội hóa dịch vụ kế hoạch hóa gia đình, tạo điều kiện thuận lợi cho các tổ chức, cá nhân tham gia Chương trình; huy động toàn bộ hệ thống y tế, dân số tham gia thực hiện Chương trình theo chức năng, nhiệm vụ được giao, ưu tiên bảo đảm hoạt động ở tuyến cơ sở, vùng khó khăn có mức sinh cao.',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Evaluation
Metrics
Information Retrieval
- Dataset:
dim_768
- Evaluated with
InformationRetrievalEvaluator
with these parameters:{ "truncate_dim": 768 }
Metric | Value |
---|---|
cosine_accuracy@1 | 0.4835 |
cosine_accuracy@3 | 0.7157 |
cosine_accuracy@5 | 0.7898 |
cosine_accuracy@10 | 0.8593 |
cosine_precision@1 | 0.4835 |
cosine_precision@3 | 0.2386 |
cosine_precision@5 | 0.158 |
cosine_precision@10 | 0.0859 |
cosine_recall@1 | 0.4835 |
cosine_recall@3 | 0.7157 |
cosine_recall@5 | 0.7898 |
cosine_recall@10 | 0.8593 |
cosine_ndcg@10 | 0.6739 |
cosine_mrr@10 | 0.6141 |
cosine_map@100 | 0.6195 |
Information Retrieval
- Dataset:
dim_512
- Evaluated with
InformationRetrievalEvaluator
with these parameters:{ "truncate_dim": 512 }
Metric | Value |
---|---|
cosine_accuracy@1 | 0.4827 |
cosine_accuracy@3 | 0.7105 |
cosine_accuracy@5 | 0.7873 |
cosine_accuracy@10 | 0.8613 |
cosine_precision@1 | 0.4827 |
cosine_precision@3 | 0.2368 |
cosine_precision@5 | 0.1575 |
cosine_precision@10 | 0.0861 |
cosine_recall@1 | 0.4827 |
cosine_recall@3 | 0.7105 |
cosine_recall@5 | 0.7873 |
cosine_recall@10 | 0.8613 |
cosine_ndcg@10 | 0.6724 |
cosine_mrr@10 | 0.6117 |
cosine_map@100 | 0.6168 |
Information Retrieval
- Dataset:
dim_256
- Evaluated with
InformationRetrievalEvaluator
with these parameters:{ "truncate_dim": 256 }
Metric | Value |
---|---|
cosine_accuracy@1 | 0.4616 |
cosine_accuracy@3 | 0.6901 |
cosine_accuracy@5 | 0.7776 |
cosine_accuracy@10 | 0.8487 |
cosine_precision@1 | 0.4616 |
cosine_precision@3 | 0.23 |
cosine_precision@5 | 0.1555 |
cosine_precision@10 | 0.0849 |
cosine_recall@1 | 0.4616 |
cosine_recall@3 | 0.6901 |
cosine_recall@5 | 0.7776 |
cosine_recall@10 | 0.8487 |
cosine_ndcg@10 | 0.6553 |
cosine_mrr@10 | 0.5931 |
cosine_map@100 | 0.5986 |
Information Retrieval
- Dataset:
dim_128
- Evaluated with
InformationRetrievalEvaluator
with these parameters:{ "truncate_dim": 128 }
Metric | Value |
---|---|
cosine_accuracy@1 | 0.4396 |
cosine_accuracy@3 | 0.6588 |
cosine_accuracy@5 | 0.743 |
cosine_accuracy@10 | 0.8251 |
cosine_precision@1 | 0.4396 |
cosine_precision@3 | 0.2196 |
cosine_precision@5 | 0.1486 |
cosine_precision@10 | 0.0825 |
cosine_recall@1 | 0.4396 |
cosine_recall@3 | 0.6588 |
cosine_recall@5 | 0.743 |
cosine_recall@10 | 0.8251 |
cosine_ndcg@10 | 0.6297 |
cosine_mrr@10 | 0.5674 |
cosine_map@100 | 0.5736 |
Information Retrieval
- Dataset:
dim_64
- Evaluated with
InformationRetrievalEvaluator
with these parameters:{ "truncate_dim": 64 }
Metric | Value |
---|---|
cosine_accuracy@1 | 0.3904 |
cosine_accuracy@3 | 0.5958 |
cosine_accuracy@5 | 0.6767 |
cosine_accuracy@10 | 0.7727 |
cosine_precision@1 | 0.3904 |
cosine_precision@3 | 0.1986 |
cosine_precision@5 | 0.1353 |
cosine_precision@10 | 0.0773 |
cosine_recall@1 | 0.3904 |
cosine_recall@3 | 0.5958 |
cosine_recall@5 | 0.6767 |
cosine_recall@10 | 0.7727 |
cosine_ndcg@10 | 0.5745 |
cosine_mrr@10 | 0.512 |
cosine_map@100 | 0.5199 |
Training Details
Training Dataset
Unnamed Dataset
- Size: 2,459 training samples
- Columns:
anchor
andpositive
- Approximate statistics based on the first 1000 samples:
anchor positive type string string details - min: 13 tokens
- mean: 29.47 tokens
- max: 57 tokens
- min: 18 tokens
- mean: 207.63 tokens
- max: 256 tokens
- Samples:
anchor positive Quy định này áp dụng cho những đối tượng nào liên quan đến chính sách dân số và kế hoạch hóa gia đình?
Đối tượng áp dụng
Quy định này quy định tiêu chuẩn, điều kiện, thẩm quyền xem xét kết nạp lại vào Đảng đối với đảng viên đã bị đưa ra khỏi Đảng do vi phạm chính sách dân số và kế hoạch hoá gia đình, kết nạp quần chúng vi phạm chính sách dân số và kế hoạch hoá gia đình có nguyện vọng phấn đấu vào Đảng.
Điều 2. Những trường hợp sinh con không bị coi là vi phạm chính sách dân số và kế hoạch hoá gia đình
1. Cặp vợ chồng sinh con thứ ba, nếu cả hai hoặc một trong hai người thuộc dân tộc có số dân dưới 10.000 người hoặc thuộc dân tộc có nguy cơ suy giảm số dân (tỉ lệ nhỏ hơn hoặc bằng tỉ lệ chết) theo công bố chính thức của Bộ Kế hoạch và Đầu tư.
2. Cặp vợ chồng sinh lần thứ nhất mà sinh ba con trở lên.
3. Cặp vợ chồng đã có một con đẻ, sinh lần thứ hai mà sinh hai con trở lên.
4. Cặp vợ chồng sinh lần thứ ba trở lên, nếu tại thời điểm sinh chỉ có một con đẻ còn sống, kể cả con đẻ đã cho làm con nuôi.
5.Trong trường hợp nào cặp vợ chồng sinh con thứ ba nhưng không bị coi là vi phạm chính sách dân số nếu thuộc dân tộc thiểu số?
Đối tượng áp dụng
Quy định này quy định tiêu chuẩn, điều kiện, thẩm quyền xem xét kết nạp lại vào Đảng đối với đảng viên đã bị đưa ra khỏi Đảng do vi phạm chính sách dân số và kế hoạch hoá gia đình, kết nạp quần chúng vi phạm chính sách dân số và kế hoạch hoá gia đình có nguyện vọng phấn đấu vào Đảng.
Điều 2. Những trường hợp sinh con không bị coi là vi phạm chính sách dân số và kế hoạch hoá gia đình
1. Cặp vợ chồng sinh con thứ ba, nếu cả hai hoặc một trong hai người thuộc dân tộc có số dân dưới 10.000 người hoặc thuộc dân tộc có nguy cơ suy giảm số dân (tỉ lệ nhỏ hơn hoặc bằng tỉ lệ chết) theo công bố chính thức của Bộ Kế hoạch và Đầu tư.
2. Cặp vợ chồng sinh lần thứ nhất mà sinh ba con trở lên.
3. Cặp vợ chồng đã có một con đẻ, sinh lần thứ hai mà sinh hai con trở lên.
4. Cặp vợ chồng sinh lần thứ ba trở lên, nếu tại thời điểm sinh chỉ có một con đẻ còn sống, kể cả con đẻ đã cho làm con nuôi.
5.Cặp vợ chồng sinh lần thứ hai mà sinh hai con trở lên thì có bị xem là vi phạm chính sách dân số không?
Đối tượng áp dụng
Quy định này quy định tiêu chuẩn, điều kiện, thẩm quyền xem xét kết nạp lại vào Đảng đối với đảng viên đã bị đưa ra khỏi Đảng do vi phạm chính sách dân số và kế hoạch hoá gia đình, kết nạp quần chúng vi phạm chính sách dân số và kế hoạch hoá gia đình có nguyện vọng phấn đấu vào Đảng.
Điều 2. Những trường hợp sinh con không bị coi là vi phạm chính sách dân số và kế hoạch hoá gia đình
1. Cặp vợ chồng sinh con thứ ba, nếu cả hai hoặc một trong hai người thuộc dân tộc có số dân dưới 10.000 người hoặc thuộc dân tộc có nguy cơ suy giảm số dân (tỉ lệ nhỏ hơn hoặc bằng tỉ lệ chết) theo công bố chính thức của Bộ Kế hoạch và Đầu tư.
2. Cặp vợ chồng sinh lần thứ nhất mà sinh ba con trở lên.
3. Cặp vợ chồng đã có một con đẻ, sinh lần thứ hai mà sinh hai con trở lên.
4. Cặp vợ chồng sinh lần thứ ba trở lên, nếu tại thời điểm sinh chỉ có một con đẻ còn sống, kể cả con đẻ đã cho làm con nuôi.
5. - Loss:
MatryoshkaLoss
with these parameters:{ "loss": "MultipleNegativesRankingLoss", "matryoshka_dims": [ 768, 512, 256, 128, 64 ], "matryoshka_weights": [ 1, 1, 1, 1, 1 ], "n_dims_per_step": -1 }
Training Hyperparameters
Non-Default Hyperparameters
eval_strategy
: stepsper_device_eval_batch_size
: 4gradient_accumulation_steps
: 4learning_rate
: 2e-05num_train_epochs
: 1lr_scheduler_type
: cosinewarmup_ratio
: 0.1bf16
: Trueload_best_model_at_end
: Trueoptim
: adamw_torch_fusedbatch_sampler
: no_duplicates
All Hyperparameters
Click to expand
overwrite_output_dir
: Falsedo_predict
: Falseeval_strategy
: stepsprediction_loss_only
: Trueper_device_train_batch_size
: 8per_device_eval_batch_size
: 4per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 4eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 2e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1.0num_train_epochs
: 1max_steps
: -1lr_scheduler_type
: cosinelr_scheduler_kwargs
: {}warmup_ratio
: 0.1warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Truefp16
: Falsefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Nonelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Trueignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}tp_size
: 0fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torch_fusedoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Nonehub_always_push
: Falsegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseinclude_for_metrics
: []eval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseuse_liger_kernel
: Falseeval_use_gather_object
: Falseaverage_tokens_across_devices
: Falseprompts
: Nonebatch_sampler
: no_duplicatesmulti_dataset_batch_sampler
: proportional
Training Logs
Epoch | Step | Training Loss | dim_768_cosine_ndcg@10 | dim_512_cosine_ndcg@10 | dim_256_cosine_ndcg@10 | dim_128_cosine_ndcg@10 | dim_64_cosine_ndcg@10 |
---|---|---|---|---|---|---|---|
-1 | -1 | - | 0.5846 | 0.5778 | 0.5510 | 0.5090 | 0.4283 |
0.1299 | 10 | 5.2058 | 0.6314 | 0.6244 | 0.6004 | 0.5712 | 0.4874 |
0.2597 | 20 | 3.3976 | 0.6559 | 0.6534 | 0.6295 | 0.5986 | 0.5251 |
0.3896 | 30 | 3.4291 | 0.6574 | 0.6577 | 0.6355 | 0.6084 | 0.5438 |
0.5195 | 40 | 3.4904 | 0.6668 | 0.6642 | 0.6464 | 0.6225 | 0.5595 |
0.6494 | 50 | 3.379 | 0.6702 | 0.6672 | 0.6515 | 0.6237 | 0.5667 |
0.7792 | 60 | 2.5151 | 0.6732 | 0.6710 | 0.6536 | 0.6279 | 0.5720 |
0.9091 | 70 | 2.8592 | 0.6739 | 0.6724 | 0.6553 | 0.6297 | 0.5745 |
Framework Versions
- Python: 3.11.12
- Sentence Transformers: 4.1.0
- Transformers: 4.51.3
- PyTorch: 2.6.0+cu124
- Accelerate: 1.6.0
- Datasets: 3.6.0
- Tokenizers: 0.21.1
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
MatryoshkaLoss
@misc{kusupati2024matryoshka,
title={Matryoshka Representation Learning},
author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
year={2024},
eprint={2205.13147},
archivePrefix={arXiv},
primaryClass={cs.LG}
}
MultipleNegativesRankingLoss
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}