tanbinh2210 commited on
Commit
8210935
·
verified ·
1 Parent(s): aeaac70

Add new SentenceTransformer model

Browse files
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 768,
3
+ "pooling_mode_cls_token": false,
4
+ "pooling_mode_mean_tokens": true,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,668 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ base_model: bkai-foundation-models/vietnamese-bi-encoder
3
+ library_name: sentence-transformers
4
+ pipeline_tag: sentence-similarity
5
+ tags:
6
+ - sentence-transformers
7
+ - sentence-similarity
8
+ - feature-extraction
9
+ - generated_from_trainer
10
+ - dataset_size:198037
11
+ - loss:MultipleNegativesRankingLoss
12
+ widget:
13
+ - source_sentence: Lệ_phí thông_báo trên phương_tiện_thông_tin_đại_chúng do ai chịu
14
+ và quy_định pháp_luật quy_định về việc này như_thế_nào ?
15
+ sentences:
16
+ - động khai_thác nhưng không đạt được hiệu_quả đầu_tư tối_thiểu khi áp_dụng các
17
+ điều_kiện kinh_tế , kỹ_thuật của hợp_đồng dầu_khí được hưởng các chính_sách ưu_đãi
18
+ đầu_tư ; g ) Lô dầu_khí có đối_tượng là dầu_khí phi truyền_thống . 3 . Thủ_tướng
19
+ Chính_phủ ban_hành danh_mục các lô , mỏ dầu_khí được hưởng chính_sách ưu_đãi đầu_tư
20
+ và ưu_đãi đầu_tư đặc_biệt . 4 . Chính_phủ quy_định chi_tiết Điều này . Điều 54
21
+ . Chính_sách ưu_đãi 1 . Chính_sách ưu_đãi áp_dụng đối_với các lô , mỏ dầu_khí
22
+ được thực_hiện thông_qua hợp_đồng dầu_khí . 2 . Hợp_đồng dầu_khí đối_với lô ,
23
+ mỏ dầu_khí được hưởng chính_sách ưu_đãi đầu_tư được áp_dụng mức thuế_suất thuế_thu_nhập
24
+ doanh_nghiệp là 32 % , thuế_suất thuế xuất_khẩu dầu_thô là 10 % và mức thu_hồi
25
+ chi_phí tối_đa 70 % sản_lượng dầu_khí khai_thác được trong năm . 3 . Hợp_đồng
26
+ dầu_khí đối_với lô , mỏ dầu_khí được hưởng chính_sách ưu_đãi đầu_tư đặc_biệt được
27
+ áp_dụng mức thuế_suất thuế_thu_nhập doanh_nghiệp là 25 % , thuế_suất thuế xuất_khẩu
28
+ dầu_thô là 5 % và mức thu_hồi chi_phí tối_đa 80 % sản_lượng dầu_khí khai_thác
29
+ được trong năm .
30
+ - cùng của cơ_quan , tổ_chức được cấp , tống_đạt , thông_báo ; b ) Niêm_yết bản_sao
31
+ tại nơi cư_trú hoặc nơi cư_trú cuối_cùng của cá_nhân , nơi có trụ_sở hoặc trụ_sở
32
+ cuối_cùng của cơ_quan , tổ_chức được cấp , tống_đạt , thông_báo ; c ) Lập biên_bản
33
+ về việc thực_hiện thủ_tục niêm_yết công_khai , trong đó ghi rõ ngày , tháng ,
34
+ năm niêm_yết . 3 . Thời_hạn niêm_yết công_khai văn_bản tố_tụng là 15 ngày , kể
35
+ từ ngày niêm_yết . Điều 180 . Thủ_tục thông_báo trên phương_tiện_thông_tin_đại_chúng
36
+ 1 . Việc thông_báo trên phương_tiện_thông_tin_đại_chúng được thực_hiện khi pháp_luật
37
+ có quy_định hoặc có căn_cứ xác_định là việc niêm_yết công_khai không bảo_đảm cho
38
+ người được cấp , tống_đạt , thông_báo nhận được thông_tin về văn_bản cần được
39
+ cấp , tống_đạt , thông_báo . 2 . Việc thông_báo trên phương_tiện_thông_tin_đại_chúng
40
+ có_thể được thực_hiện nếu có yêu_cầu của các đương_sự khác . Trong trường_hợp
41
+ này , lệ_phí thông_báo trên phương_tiện_thông_tin_đại_chúng do đương_sự có yêu_cầu
42
+ thông_báo chịu .
43
+ - Trung_tâm Lưu_ký Chứng_khoán , thành_viên lưu_ký và Ngân_hàng chỉ_định thanh_toán
44
+ được thu các loại phí cung_cấp dịch_vụ theo quy_định của pháp_luật . Chương VI_Công_bố
45
+ thông_tin Điều 51 . Đối_tượng , nội_dung , phương_tiện công_bố thông_tin 1 . Trung_tâm
46
+ Giao_dịch Chứng_khoán , Sở Giao_dịch Chứng_khoán , tổ_chức phát_hành , tổ_chức
47
+ niêm_yết , công_ty chứng_khoán , công_ty quản_lý quỹ phải thực_hiện chế_độ công_bố
48
+ thông_tin kịp_thời , chính_xác và theo đúng quy_định của pháp_luật . 2 . Tổ_chức
49
+ phát_hành , tổ_chức niêm_yết có trách_nhiệm công_bố rõ_ràng các thông_tin về quyền
50
+ biểu_quyết , quyền đăng_ký mua chứng_khoán , quyền chuyển_đổi chứng_khoán và các
51
+ quyền khác cho tất_cả các cổ_đông biết ; quy_định và thực_hiện các quy_tắc công_bố
52
+ công_khai về sở_hữu cổ_phần của các thành_viên Hội_đồng_quản_trị , Ban Giám_đốc
53
+ , cổ_đông lớn và những người có liên_quan .
54
+ - source_sentence: Xã_hội có trách_nhiệm gì trong việc hỗ_trợ và phối_hợp với nhà_trường
55
+ để giáo_dục học_sinh , trẻ mầm_non ?
56
+ sentences:
57
+ - an_ninh nhân_dân , thế_trận an_ninh nhân_dân . 4 . Kết_hợp quốc_phòng với kinh_tế
58
+ - xã_hội và kinh_tế - xã_hội với quốc_phòng . 5 . Kết_hợp quốc_phòng với an_ninh
59
+ , đối_ngoại . Điều 4 . Chính_sách của Nhà_nước về quốc_phòng 1 . Củng_cố , tăng_cường
60
+ nền quốc_phòng toàn dân , sức_mạnh quân_sự để xây_dựng , bảo_vệ vững_chắc_Tổ_quốc_Việt_Nam
61
+ xã_hội_chủ_nghĩa , góp_phần bảo_vệ hòa_bình ở khu_vực và trên thế_giới . 2 . Thực_hiện
62
+ độc_lập , chủ_quyền , thống_nhất , toàn_vẹn lãnh_thổ , bao_gồm đất_liền , hải_đảo
63
+ , vùng_biển và vùng_trời ; thực_hiện chính_sách hòa_bình , tự_vệ ; sử_dụng các
64
+ biện_pháp chính_đáng , thích_hợp để phòng_ngừa , ngăn_chặn , đẩy_lùi , đánh_bại
65
+ mọi âm_mưu và hành_vi xâm_lược .
66
+ - cam_kết giữa nhà_trường , gia_đình và các đoàn_thể , tổ_chức xã_hội ngoài cơ_sở
67
+ giáo_dục thúc_đẩy và đảm_bảo tính dân_chủ , bình_đẳng trong việc tiếp_cận giáo_dục
68
+ đối_với mọi trẻ không phân_biệt giới_tính , vùng_miền và sắc_tộc . 2 . Nhà_trường
69
+ chủ_động tuyên_truyền , vận_động cha_mẹ hoặc người giám_hộ trẻ đưa trẻ đến lớp
70
+ chuyên cần , đúng giờ ; thông_báo tới gia_đình trẻ về kế_hoạch và hoạt_động giáo_dục
71
+ trong thời_gian chuẩn_bị cho trẻ vào lớp Một ; thường_xuyên trao_đổi với cha_mẹ
72
+ hoặc người giám_hộ của trẻ về tình_hình rèn_luyện , học_tập và thống_nhất biện_pháp
73
+ hỗ_trợ trẻ ; tạo điều_kiện để cha_mẹ hoặc người giám_hộ trẻ đến lớp tìm_hiểu và
74
+ hỗ_trợ trẻ học_tập ; huy_động , tạo điều_kiện để gia_đình trẻ tham_gia xây_dựng
75
+ nhà_trường theo đúng quy_định của pháp_luật và sử_dụng hiệu_quả các nguồn_lực
76
+ đóng_góp . 3 . Nhà_trường tuyên_truyền phổ_biến đối_với các đoàn_thể , tổ_chức
77
+ xã_hội trên địa_bàn về định_hướng , kế_hoạch của nhà_trường trong việc dạy và
78
+ học tiếng Việt cho trẻ trước khi vào lớp Một , những hoạt_động cần sự hợp_tác
79
+ , hỗ_trợ từ các đoàn_thể , tổ_chức xã_hội .
80
+ - 'của học_sinh 1 . Tiếp_nhận thông_tin về kết_quả học_tập , rèn_luyện của con hoặc
81
+ người được giám_hộ . 2 . Tham_gia hoạt_động giáo_dục theo kế_hoạch của nhà_trường
82
+ ; tham_gia hoạt_động của ban đại_diện cha_mẹ học_sinh trong nhà_trường . 3 . Phối_hợp
83
+ với nhà_trường , cơ_quan quản_lý giáo_dục giải_quyết các vấn_đề có liên_quan đến
84
+ việc giáo_dục con hoặc người được giám_hộ theo quy_định . Điều 92 . Ban đại_diện
85
+ cha_mẹ học_sinh , trẻ mầm_non 1 . Ban đại_diện cha_mẹ học_sinh , trẻ mầm_non được
86
+ tổ_chức trong mỗi năm_học ở giáo_dục_phổ_thông và giáo_dục mầm_non , do cha_mẹ
87
+ hoặc người giám_hộ học_sinh , trẻ mầm_non từng lớp , từng trường cử ra để phối_hợp
88
+ với nhà_trường trong việc chăm_sóc , nuôi_dưỡng , giáo_dục học_sinh , trẻ mầm_non
89
+ và hoạt_động theo quy_định của Bộ_trưởng Bộ_Giáo_dục_và_Đào_tạo . 2 . Không tổ_chức
90
+ ban đại_diện cha_mẹ học_sinh , trẻ mầm_non liên_trường và ở các cấp hành_chính
91
+ . Điều 93 . Trách_nhiệm của xã_hội 1 . Cơ_quan , tổ_chức , cá_nhân có trách_nhiệm
92
+ sau đây :'
93
+ - source_sentence: Luật quy_định trường_hợp nào cổ_đông sáng_lập được chuyển_nhượng
94
+ cổ_phần phổ_thông mà không cần sự chấp_thuận của Đại_hội_đồng cổ_đông ?
95
+ sentences:
96
+ - 'tự quản_lý kinh_tế liên_quan đến tài_chính , kế_toán mà chưa được xóa án_tích
97
+ ; người đang bị áp_dụng biện_pháp xử_lý hành_chính giáo_dục tại xã , phường ,
98
+ thị_trấn , đưa vào cơ_sở giáo_dục bắt_buộc , cơ_sở cai_nghiện bắt_buộc ; c ) Người
99
+ đã bị kết_án về tội_phạm nghiêm_trọng xâm_phạm trật_tự quản_lý kinh_tế mà chưa
100
+ được xóa án_tích ; d ) Người bị xử_phạt vi_phạm hành_chính về hành_vi vi_phạm
101
+ pháp_luật về tài_chính , kế_toán , kiểm_toán mà chưa hết thời_hạn 06 tháng , kể
102
+ từ ngày chấp_hành xong quyết_định xử_phạt trong trường_hợp bị phạt cảnh_cáo hoặc
103
+ chưa hết thời_hạn 01 năm , kể từ ngày chấp_hành xong quyết_định xử_phạt hành_chính
104
+ khác ; đ ) Người bị đình_chỉ hành_nghề dịch_vụ kế_toán . Điều 59 . Doanh_nghiệp
105
+ kinh_doanh dịch_vụ kế_toán 1 . Doanh_nghiệp kinh_doanh dịch_vụ kế_toán được thành_lập
106
+ theo các loại_hình sau đây : a ) Công_ty trách_nhiệm hữu_hạn hai thành_viên trở
107
+ lên ; b ) Công_ty hợp_danh ; c ) Doanh_nghiệp tư_nhân .'
108
+ - thiết phải có văn_bản chuyển_nhượng ; hoặc tùy từng thời_điểm Hội_đồng_quản_trị
109
+ có_thể ban_hành các quy_định khác thay_thế cho các quy_định tương_ứng trong Điều_lệ
110
+ này về chứng_chỉ và chuyển_nhượng cổ_phần . Điều 7 . Chuyển_nhượng cổ_phần . 1
111
+ . Tất_cả các cổ_phần đều có_thể được tự_do chuyển_nhượng trừ khi Điều_lệ này và
112
+ luật_pháp có quy_định khác . Tất_cả các cổ_phiếu niêm_yết trên Trung_tâm Giao_dịch
113
+ chứng_khoán sẽ được chuyển_nhượng theo các quy_định của Ủy_ban Chứng_khoán Nhà_nước
114
+ và Trung_tâm Giao_dịch chứng_khoán . 2 . [ Trong vòng 3 năm kể từ ngày thành_lập
115
+ , các cổ_đông sáng_lập phải cùng nhau nắm giữ ít_nhất 20 % tổng_số cổ_phần phổ_thông
116
+ có_thể chuyển_nhượng và trường_hợp chuyển_nhượng số cổ_phần này cho những người
117
+ không phải là thành_viên sáng_lập thì cần phải có sự đồng_ý của Đại_hội_đồng cổ_đông
118
+ trong Công_ty .
119
+ - 'ký của người đại_diện theo pháp_luật hoặc các cổ_đông phổ_thông của công_ty đó
120
+ . 2 . Các cổ_đông sáng_lập phải cùng nhau đăng_ký mua ít_nhất 20 % tổng_số cổ_phần
121
+ phổ_thông được quyền chào_bán khi đăng_ký thành_lập doanh_nghiệp . 3 . Trong thời_hạn
122
+ 03 năm kể từ ngày công_ty được cấp Giấy chứng_nhận đăng_ký doanh_nghiệp , cổ_phần
123
+ phổ_thông của cổ_đông sáng_lập được tự_do chuyển_nhượng cho cổ_đông sáng_lập khác
124
+ và chỉ được chuyển_nhượng cho người không phải là cổ_đông sáng_lập nếu được sự
125
+ chấp_thuận của Đại_hội_đồng cổ_đông . Trường_hợp này , cổ_đông sáng_lập dự_định
126
+ chuyển_nhượng cổ_phần phổ_thông thì không có quyền biểu_quyết về việc chuyển_nhượng
127
+ cổ_phần đó . 4 . Các hạn_chế quy_định tại khoản 3 Điều này không áp_dụng đối_với
128
+ cổ_phần phổ_thông sau đây : a ) Cổ_phần mà cổ_đông sáng_lập có thêm sau khi đăng_ký
129
+ thành_lập doanh_nghiệp ; b ) Cổ_phần đã được chuyển_nhượng cho người khác không
130
+ phải là cổ_đông sáng_lập . Điều 121 . Cổ_phiếu'
131
+ - source_sentence: Người giám_hộ có quyền đại_diện theo pháp_luật cho người được giám_hộ
132
+ khi nào ?
133
+ sentences:
134
+ - 'thực_hiện Chương_trình tổng_thể về thực_hành tiết_kiệm , chống lãng_phí hàng
135
+ năm và dài_hạn ; xác_định , định_hướng mục_tiêu , chỉ_tiêu tiết_kiệm và yêu_cầu
136
+ chống lãng_phí chung trong cả nước gắn với kế_hoạch phát_triển kinh_tế - xã_hội
137
+ . 3 . Chỉ_đạo các bộ , cơ_quan ngang bộ , cơ_quan thuộc Chính_phủ , Ủy_ban_nhân_dân
138
+ tỉnh , thành_phố trực_thuộc trung_ương : phối_hợp trong việc thực_hiện nhiệm_vụ
139
+ để bảo_đảm thực_hành tiết_kiệm , chống lãng_phí ; xây_dựng và thực_hiện Chương_trình
140
+ thực_hành tiết_kiệm , chống lãng_phí hàng năm và dài_hạn thuộc phạm_vi , lĩnh_vực
141
+ quản_lý , quyết_định chỉ_tiêu tiết_kiệm cụ_thể của ngành , lĩnh_vực trọng_yếu
142
+ trong Chương_trình thực_hành tiết_kiệm , chống lãng_phí của các bộ , ngành và
143
+ địa_phương . 4 . Quy_định chế_độ báo_cáo việc thực_hành tiết_kiệm , chống lãng_phí
144
+ ; tổng_hợp báo_cáo Quốc_hội kết_quả thực_hành tiết_kiệm , chống lãng_phí hàng
145
+ năm tại kỳ họp đầu năm sau . 5 . Tổ_chức công_tác thanh_tra , kiểm_tra việc thực_hành
146
+ tiết_kiệm , chống lãng_phí ; xử_lý kịp_thời , nghiêm_minh và công_khai việc xử_lý
147
+ đối_với hành_vi vi_phạm pháp_luật về thực_hành tiết_kiệm , chống lãng_phí theo
148
+ quy_định của pháp_luật .'
149
+ - 'của cá_nhân 1 . Cha , mẹ đối_với con chưa thành_niên . 2 . Người giám_hộ đối_với
150
+ người được giám_hộ . Người giám_hộ của người có khó_khăn trong nhận_thức , làm
151
+ chủ hành_vi là người đại_diện theo pháp_luật nếu được Tòa_án chỉ_định . 3 . Người
152
+ do Tòa_án chỉ_định trong trường_hợp không xác_định được người đại_diện quy_định
153
+ tại khoản 1 và khoản 2 Điều này . 4 . Người do Tòa_án chỉ_định đối_với người bị
154
+ hạn_chế năng_lực hành_vi dân_sự . Điều 137 . Đại_diện theo pháp_luật của pháp_nhân
155
+ 1 . Người đại_diện theo pháp_luật của pháp_nhân bao_gồm : a ) Người được pháp_nhân
156
+ chỉ_định theo điều_lệ ; b ) Người có thẩm_quyền đại_diện theo quy_định của pháp_luật
157
+ ; c ) Người do Tòa_án chỉ_định trong quá_trình tố_tụng tại Tòa_án . 2 . Một pháp_nhân
158
+ có_thể có nhiều người đại_diện theo pháp_luật và mỗi người đại_diện có quyền đại_diện
159
+ cho pháp_nhân theo quy_định tại Điều 140 và Điều 141 của Bộ_luật này . Điều 138
160
+ . Đại_diện theo ủy quyền 1 . Cá_nhân , pháp_nhân có_thể ủy quyền cho cá_nhân ,
161
+ pháp_nhân khác xác_lập , thực_hiện giao_dịch dân_sự .'
162
+ - 'chủ hành_vi 1 . Người giám_hộ của người mất năng_lực hành_vi dân_sự có các nghĩa_vụ
163
+ sau đây : a ) Chăm_sóc , bảo_đảm việc điều_trị bệnh cho người được giám_hộ ; b
164
+ ) Đại_diện cho người được giám_hộ trong các giao_dịch dân_sự ; c ) Quản_lý tài_sản
165
+ của người được giám_hộ ; d ) Bảo_vệ quyền , lợi_ích hợp_pháp của người được giám_hộ
166
+ . 2 . Người giám_hộ của người có khó_khăn trong nhận_thức , làm chủ hành_vi có
167
+ nghĩa_vụ theo quyết_định của Tòa_án trong số các nghĩa_vụ quy_định tại khoản 1
168
+ Điều này . Điều 58 . Quyền của người giám_hộ 1 . Người giám_hộ của người chưa
169
+ thành_niên , người mất năng_lực hành_vi dân_sự có các quyền sau đây : a ) Sử_dụng
170
+ tài_sản của người được giám_hộ để chăm_sóc , chi_dùng cho những nhu_cầu thiết_yếu
171
+ của người được giám_hộ ; b ) Được thanh_toán các chi_phí hợp_lý cho việc quản_lý
172
+ tài_sản của người được giám_hộ ; c ) Đại_diện cho người được giám_hộ trong việc
173
+ xác_lập , thực_hiện giao_dịch dân_sự và thực_hiện các quyền khác theo quy_định
174
+ của pháp_luật nhằm bảo_vệ quyền , lợi_ích hợp_pháp của người được giám_hộ .'
175
+ - source_sentence: Khi tham_gia tố_tụng , đương_sự có nghĩa_vụ cung_cấp chứng_cứ như_thế_nào
176
+ để bảo_vệ quyền_lợi của mình ?
177
+ sentences:
178
+ - vi_phạm pháp_luật của cơ_quan , người có thẩm_quyền trong việc thi_hành án hình_sự
179
+ ; e ) Kiến_nghị , yêu_cầu cơ_quan , tổ_chức , cá_nhân chấm_dứt , khắc_phục vi_phạm
180
+ pháp_luật trong thi_hành án hình_sự ; xử_lý nghiêm_minh người vi_phạm ; g ) Khởi_tố
181
+ hoặc yêu_cầu Cơ_quan điều_tra khởi_tố vụ án hình_sự khi phát_hiện vụ_việc có dấu_hiệu
182
+ tội_phạm trong thi_hành án hình_sự theo quy_định của pháp_luật ; h ) Thực_hiện
183
+ nhiệm_vụ , quyền_hạn khác trong kiểm_sát thi_hành án hình_sự theo quy_định của
184
+ pháp_luật về thi_hành án hình_sự . Điều 26 . Trách_nhiệm thực_hiện yêu_cầu , kiến_nghị
185
+ , kháng_nghị , quyết_định của Viện_kiểm_sát nhân_dân trong việc thi_hành án hình_sự
186
+ 1 . Đối_với yêu_cầu ra quyết_định thi_hành án hình_sự đúng quy_định của pháp_luật
187
+ , yêu_cầu cung_cấp hồ_sơ , tài_liệu có liên_quan đến việc thi_hành án hình_sự
188
+ , cơ_quan , tổ_chức , cá_nhân được yêu_cầu phải thực_hiện ngay .
189
+ - 'giải_quyết khiếu_nại về quyết_định xử_lý vụ_việc cạnh_tranh , bản_sao quyết_định
190
+ giải_quyết khiếu_nại ( nếu có ) , cung_cấp chứng_cứ khác để bảo_vệ quyền , lợi_ích
191
+ hợp_pháp của mình ; trường_hợp không cung_cấp được thì phải nêu rõ lý_do . 2 .
192
+ Người bị kiện có nghĩa_vụ cung_cấp cho Tòa_án hồ_sơ giải_quyết khiếu_nại ( nếu
193
+ có ) và bản_sao các văn_bản , tài_liệu mà căn_cứ vào đó để ra quyết_định hành_chính
194
+ , quyết_định kỷ_luật buộc thôi_việc , quyết_định giải_quyết khiếu_nại về quyết_định
195
+ xử_lý vụ_việc cạnh_tranh hoặc có hành_vi hành_chính . 3 . Người có quyền_lợi ,
196
+ nghĩa_vụ liên_quan có nghĩa_vụ cung_cấp chứng_cứ để bảo_vệ quyền , lợi_ích hợp_pháp
197
+ của mình . Điều 79 . Những tình_tiết , sự_kiện không phải chứng_minh 1 . Những
198
+ tình_tiết , sự_kiện sau đây không phải chứng_minh : a ) Những tình_tiết , sự_kiện
199
+ rõ_ràng mà mọi người đều biết và được Tòa_án thừa_nhận ; b ) Những tình_tiết ,
200
+ sự_kiện đã được xác_định trong bản_án , quyết_định của Tòa_án đã có hiệu_lực pháp_luật
201
+ ;'
202
+ - 'ra thì bên đương_sự đó không phải chứng_minh . 3 . Đương_sự có người đại_diện
203
+ tham_gia tố_tụng thì sự thừa_nhận của người đại_diện được coi là sự thừa_nhận
204
+ của đương_sự nếu không vượt quá phạm_vi đại_diện . Điều 93 . Chứng_cứ Chứng_cứ
205
+ trong vụ_việc dân_sự là những gì có thật được đương_sự và cơ_quan , tổ_chức ,
206
+ cá_nhân khác giao_nộp , xuất_trình cho Tòa_án trong quá_trình tố_tụng hoặc do
207
+ Tòa_án thu_thập được theo trình_tự , thủ_tục do Bộ_luật này quy_định và được Tòa_án
208
+ sử_dụng làm căn_cứ để xác_định các tình_tiết khách_quan của vụ án cũng như xác_định
209
+ yêu_cầu hay sự phản_đối của đương_sự là có căn_cứ và hợp_pháp . Điều 94 . Nguồn
210
+ chứng_cứ Chứng_cứ được thu_thập từ các nguồn sau đây : 1 . Tài_liệu đọc được ,
211
+ nghe được , nhìn được , dữ_liệu điện_tử ; 2 . Vật_chứng ; 3 . Lời khai của đương_sự
212
+ ; 4 . Lời khai của người làm_chứng ; 5 . Kết_luận giám_định ; 6 . Biên_bản ghi
213
+ kết_quả thẩm_định tại_chỗ ; 7 . Kết_quả định_giá tài_sản , thẩm_định giá tài_sản
214
+ ; 8 . Văn_bản ghi_nhận sự_kiện , hành_vi pháp_lý_do người có chức_năng lập ; 9
215
+ . Văn_bản công_chứng , chứng_thực ;'
216
+ ---
217
+
218
+ # SentenceTransformer based on bkai-foundation-models/vietnamese-bi-encoder
219
+
220
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [bkai-foundation-models/vietnamese-bi-encoder](https://huggingface.co/bkai-foundation-models/vietnamese-bi-encoder) on the json dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
221
+
222
+ ## Model Details
223
+
224
+ ### Model Description
225
+ - **Model Type:** Sentence Transformer
226
+ - **Base model:** [bkai-foundation-models/vietnamese-bi-encoder](https://huggingface.co/bkai-foundation-models/vietnamese-bi-encoder) <!-- at revision 84f9d9ada0d1a3c37557398b9ae9fcedcdf40be0 -->
227
+ - **Maximum Sequence Length:** 256 tokens
228
+ - **Output Dimensionality:** 768 tokens
229
+ - **Similarity Function:** Cosine Similarity
230
+ - **Training Dataset:**
231
+ - json
232
+ <!-- - **Language:** Unknown -->
233
+ <!-- - **License:** Unknown -->
234
+
235
+ ### Model Sources
236
+
237
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
238
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
239
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
240
+
241
+ ### Full Model Architecture
242
+
243
+ ```
244
+ SentenceTransformer(
245
+ (0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: RobertaModel
246
+ (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
247
+ )
248
+ ```
249
+
250
+ ## Usage
251
+
252
+ ### Direct Usage (Sentence Transformers)
253
+
254
+ First install the Sentence Transformers library:
255
+
256
+ ```bash
257
+ pip install -U sentence-transformers
258
+ ```
259
+
260
+ Then you can load this model and run inference.
261
+ ```python
262
+ from sentence_transformers import SentenceTransformer
263
+
264
+ # Download from the 🤗 Hub
265
+ model = SentenceTransformer("tanbinh2210/vietnamese-bi-encoder-synthetic")
266
+ # Run inference
267
+ sentences = [
268
+ 'Khi tham_gia tố_tụng , đương_sự có nghĩa_vụ cung_cấp chứng_cứ như_thế_nào để bảo_vệ quyền_lợi của mình ?',
269
+ 'ra thì bên đương_sự đó không phải chứng_minh . 3 . Đương_sự có người đại_diện tham_gia tố_tụng thì sự thừa_nhận của người đại_diện được coi là sự thừa_nhận của đương_sự nếu không vượt quá phạm_vi đại_diện . Điều 93 . Chứng_cứ Chứng_cứ trong vụ_việc dân_sự là những gì có thật được đương_sự và cơ_quan , tổ_chức , cá_nhân khác giao_nộp , xuất_trình cho Tòa_án trong quá_trình tố_tụng hoặc do Tòa_án thu_thập được theo trình_tự , thủ_tục do Bộ_luật này quy_định và được Tòa_án sử_dụng làm căn_cứ để xác_định các tình_tiết khách_quan của vụ án cũng như xác_định yêu_cầu hay sự phản_đối của đương_sự là có căn_cứ và hợp_pháp . Điều 94 . Nguồn chứng_cứ Chứng_cứ được thu_thập từ các nguồn sau đây : 1 . Tài_liệu đọc được , nghe được , nhìn được , dữ_liệu điện_tử ; 2 . Vật_chứng ; 3 . Lời khai của đương_sự ; 4 . Lời khai của người làm_chứng ; 5 . Kết_luận giám_định ; 6 . Biên_bản ghi kết_quả thẩm_định tại_chỗ ; 7 . Kết_quả định_giá tài_sản , thẩm_định giá tài_sản ; 8 . Văn_bản ghi_nhận sự_kiện , hành_vi pháp_lý_do người có chức_năng lập ; 9 . Văn_bản công_chứng , chứng_thực ;',
270
+ 'giải_quyết khi��u_nại về quyết_định xử_lý vụ_việc cạnh_tranh , bản_sao quyết_định giải_quyết khiếu_nại ( nếu có ) , cung_cấp chứng_cứ khác để bảo_vệ quyền , lợi_ích hợp_pháp của mình ; trường_hợp không cung_cấp được thì phải nêu rõ lý_do . 2 . Người bị kiện có nghĩa_vụ cung_cấp cho Tòa_án hồ_sơ giải_quyết khiếu_nại ( nếu có ) và bản_sao các văn_bản , tài_liệu mà căn_cứ vào đó để ra quyết_định hành_chính , quyết_định kỷ_luật buộc thôi_việc , quyết_định giải_quyết khiếu_nại về quyết_định xử_lý vụ_việc cạnh_tranh hoặc có hành_vi hành_chính . 3 . Người có quyền_lợi , nghĩa_vụ liên_quan có nghĩa_vụ cung_cấp chứng_cứ để bảo_vệ quyền , lợi_ích hợp_pháp của mình . Điều 79 . Những tình_tiết , sự_kiện không phải chứng_minh 1 . Những tình_tiết , sự_kiện sau đây không phải chứng_minh : a ) Những tình_tiết , sự_kiện rõ_ràng mà mọi người đều biết và được Tòa_án thừa_nhận ; b ) Những tình_tiết , sự_kiện đã được xác_định trong bản_án , quyết_định của Tòa_án đã có hiệu_lực pháp_luật ;',
271
+ ]
272
+ embeddings = model.encode(sentences)
273
+ print(embeddings.shape)
274
+ # [3, 768]
275
+
276
+ # Get the similarity scores for the embeddings
277
+ similarities = model.similarity(embeddings, embeddings)
278
+ print(similarities.shape)
279
+ # [3, 3]
280
+ ```
281
+
282
+ <!--
283
+ ### Direct Usage (Transformers)
284
+
285
+ <details><summary>Click to see the direct usage in Transformers</summary>
286
+
287
+ </details>
288
+ -->
289
+
290
+ <!--
291
+ ### Downstream Usage (Sentence Transformers)
292
+
293
+ You can finetune this model on your own dataset.
294
+
295
+ <details><summary>Click to expand</summary>
296
+
297
+ </details>
298
+ -->
299
+
300
+ <!--
301
+ ### Out-of-Scope Use
302
+
303
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
304
+ -->
305
+
306
+ <!--
307
+ ## Bias, Risks and Limitations
308
+
309
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
310
+ -->
311
+
312
+ <!--
313
+ ### Recommendations
314
+
315
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
316
+ -->
317
+
318
+ ## Training Details
319
+
320
+ ### Training Dataset
321
+
322
+ #### json
323
+
324
+ * Dataset: json
325
+ * Size: 198,037 training samples
326
+ * Columns: <code>query</code>, <code>pos</code>, and <code>neg</code>
327
+ * Approximate statistics based on the first 1000 samples:
328
+ | | query | pos | neg |
329
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
330
+ | type | string | string | string |
331
+ | details | <ul><li>min: 8 tokens</li><li>mean: 19.59 tokens</li><li>max: 50 tokens</li></ul> | <ul><li>min: 58 tokens</li><li>mean: 179.82 tokens</li><li>max: 256 tokens</li></ul> | <ul><li>min: 46 tokens</li><li>mean: 178.89 tokens</li><li>max: 256 tokens</li></ul> |
332
+ * Samples:
333
+ | query | pos | neg |
334
+ |:-------------------------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
335
+ | <code>Quy_định pháp_luật về lập kế_hoạch sử_dụng đất có những nguyên_tắc nào ?</code> | <code>d ) Khai_thác hợp_lý tài_nguyên thiên_nhiên ; thích_ứng với biến_đổi khí_hậu ; đ ) Nội_dung phân_bổ và sử_dụng đất trong quy_hoạch ngành quốc_gia , quy_hoạch_vùng , quy_hoạch tỉnh phải bảo_đảm phù_hợp với quy_hoạch sử_dụng đất quốc_gia . 2 . Việc lập kế_hoạch sử_dụng đất phải tuân_thủ các nguyên_tắc sau đây : a ) Phù_hợp với chiến_lược , kế_hoạch phát_triển kinh_tế-xã hội , quốc_phòng , an_ninh ; b ) Kế_hoạch sử_dụng đất phải phù_hợp với quy_hoạch sử_dụng đất cùng cấp đã được cơ_quan nhà_nước có thẩm_quyền phê_duyệt ; đối_với kế_hoạch sử_dụng đất cấp tỉnh phải phù_hợp với phương_án phân_bổ , khoanh vùng_đất_đai trong quy_hoạch tỉnh ; c ) Sử_dụng đất tiết_kiệm và có hiệu_quả ; d ) Khai_thác hợp_lý tài_nguyên thiên_nhiên và bảo_vệ môi_trường ; thích_ứng với biến_đổi khí_hậu ; đ ) Bảo_vệ , tôn_tạo di_tích lịch_sử - văn_hóa , danh_lam_thắng_cảnh ; e ) Kế_hoạch của ngành , lĩnh_vực , địa_phương có sử_dụng đất phải bảo_đảm phù_hợp với quy_hoạch , kế_hoạch sử_dụng đất đã được cơ_quan nhà_nước có thẩm_quyền quyết_định , phê_duyệt . Điều 36 . Hệ_thống quy_hoạch , kế_hoạch sử_dụng đất</code> | <code>phê_duyệt và điều_chỉnh quy_hoạch có tính_chất kỹ_thuật , chuyên_ngành để triển_khai các nội_dung quy_định tại khoản 2 Điều này được thực_hiện theo quy_định của pháp_luật có liên_quan . Điều 24 . Nội_dung quy_hoạch sử_dụng đất quốc_gia 1 . Nội_dung quy_hoạch sử_dụng đất quốc_gia xác_định việc phân_bổ và tổ_chức không_gian sử_dụng đất cho các mục_tiêu phát_triển kinh_tế - xã_hội , quốc_phòng , an_ninh , bảo_vệ môi_trường , phòng , chống thiên_tai và ứng_phó biến_đổi khí_hậu trên cơ_sở tiềm_năng đất_đai và nhu_cầu sử_dụng đất của các ngành , lĩnh_vực mang tính liên_vùng , liên tỉnh . 2 . Quy_hoạch sử_dụng đất quốc_gia bao_gồm những nội_dung chủ_yếu sau đây : a ) Phân_tích , đánh_giá về các yếu_tố , điều_kiện tự_nhiên , nguồn_lực , bối_cảnh trực_tiếp tác_động và thực_trạng sử_dụng đất của các ngành , lĩnh_vực ; b ) Dự_báo xu_thế biến_động của việc sử_dụng đất ; c ) Xác_định các quan_điểm và mục_tiêu sử_dụng đất trong thời_kỳ mới ; d ) Định_hướng phân_bổ không_gian và chỉ_tiêu sử_dụng đất nông_nghiệp , đất rừng ; đ ) Định_hướng phân_bổ không_gian và chỉ_tiêu sử_dụng đất phi_nông_nghiệp ;</code> |
336
+ | <code>Giấy chứng_nhận hành_nghề xử_lý vật_thể thuộc diện kiểm_dịch thực_vật có giá_trị trong bao_lâu ?</code> | <code>Giấy chứng_nhận sức_khỏe của người_quản_lý , điều_hành và những người trực_tiếp thực_hiện xử_lý vật_thể thuộc diện kiểm_dịch thực_vật ; đ ) Tài_liệu về quy_trình kỹ_thuật ; danh_mục phương_tiện , trang_thiết_bị hành_nghề tại thời_điểm đề_nghị ; e ) Giấy_tờ chứng_minh đủ điều_kiện phòng cháy và chữa_cháy , bảo_vệ môi_trường theo quy_định của pháp_luật . 3 . Trình_tự , thủ_tục cấp lại Giấy chứng_nhận hành_nghề xử_lý vật_thể thuộc diện kiểm_dịch thực_vật thực_hiện theo quy_định tại khoản 2 Điều 38 của Luật này . Điều 40 . Hiệu_lực của Giấy chứng_nhận hành_nghề xử_lý vật_thể thuộc diện kiểm_dịch thực_vật 1 . Giấy chứng_nhận hành_nghề xử_lý vật_thể thuộc diện kiểm_dịch thực_vật có giá_trị trong thời_hạn 05 năm . 2 . Trước 03 tháng tính đến ngày Giấy chứng_nhận hành_nghề xử_lý vật_thể thuộc diện kiểm_dịch thực_vật hết hạn , tổ_chức hành_nghề phải nộp hồ_sơ cho cơ_quan có thẩm_quyền cấp giấy chứng_nhận trong trường_hợp có nhu_cầu tiếp_tục hành_nghề . Điều 41 . Thu_hồi Giấy chứng_nhận hành_nghề xử_lý vật_thể thuộc diện kiểm_dịch thực_vật</code> | <code>định tại Điều 6 Thông_tư này cho Cục Bảo_vệ thực_vật trong trường_hợp có nhu_cầu tiếp_tục hành_nghề xử_lý vật_thể . Điều 13 . Điều_khoản thi_hành 1 . Thông_tư này có hiệu_lực thi_hành kể từ ngày 30 tháng 03 năm 2015 . 2 . Thay_thế Quyết_định số 89/2007 / QĐ-BNN ngày 01 tháng 11 năm 2007 của Bộ_trưởng Bộ Nông_nghiệp và_Phát_triển_nông_thôn ban_hành Quy_định quản_lý_nhà_nước về hoạt_động xông_hơi khử_trùng vật_thể thuộc diện kiểm_dịch thực_vật ; bãi_bỏ Điều 1 của Thông_tư số 85/2011 / TT-BNNPTNT ngày 14 tháng 12 năm 2011 của Bộ_trưởng Bộ Nông_nghiệp và_Phát_triển_nông_thôn về việc Sửa_đổi , bổ_sung một_số điều của Quyết_định số 89/2007 / QĐ-BNN ngày 01 tháng 11 năm 2007 Quy_định quản_lý_nhà_nước về hoạt_động xông_hơi khử_trùng vật_thể thuộc diện kiểm_dịch thực_vật và Quyết_định số 97/2008 / QĐ-BNN ngày 6/10/2008 Quy_định về việc cấp chứng_chỉ hành_nghề sản_xuất , gia_công , sang chai , đóng_gói , buôn_bán thuốc bảo_vệ thực_vật của Bộ_Nông_nghiệp và_Phát_triển_nông_thôn .</code> |
337
+ | <code>Thanh_niên xung_phong được hưởng chế_độ , chính_sách gì khi tham_gia và sau khi hoàn_thành nhiệm_vụ ?</code> | <code>quyết việc_làm , giáo_dục , đào_tạo , rèn_luyện thanh_niên và các nhiệm_vụ đột_xuất , cấp_bách , khó_khăn , gian_khổ trong xây_dựng và bảo_vệ Tổ_quốc . 2 . Nhà_nước ban_hành chính_sách để thanh_niên xung_phong thực_hiện các nhiệm_vụ sau đây : a ) Tham_gia dự_án phát_triển kinh_tế - xã_hội được Nhà_nước giao ; b ) Tham_gia khắc_phục hậu_quả thiên_tai , dịch_bệnh ; bảo_vệ môi_trường ; giữ_gìn trật_tự , an_toàn xã_hội , quốc_phòng , an_ninh quốc_gia ; c ) Tham_gia_sản_xuất hàng hóa , cung_ứng dịch_vụ , chuyển_giao tiến_bộ kỹ_thuật hỗ_trợ sản_xuất , đào_tạo nghề gắn với tạo việc_làm cho thanh_niên ; d ) Các nhiệm_vụ đột_xuất , cấp_bách , khó_khăn , gian_khổ theo quy_định của pháp_luật . 3 . Nhà_nước bảo_đảm điều_kiện về kinh_phí , cơ_sở_vật_chất và trang_thiết_bị cần_thiết cho tổ_chức thanh_niên xung_phong khi thực_hiện nhiệm_vụ được Nhà_nước giao . 4 . Thanh_niên xung_phong được hưởng chế_độ , chính_sách trong và sau khi hoàn_thành nhiệm_vụ . 5 . Chính_phủ quy_định chi_tiết Điều này . Điều 23 . Chính_sách đối_với thanh_niên tình_nguyện</code> | <code>sách_xã_hội cho đội_viên thanh_niên xung_phong thuộc tổng_đội để sản_xuất , cung_ứng dịch_vụ theo quy_định của pháp_luật . 2 . Trung_tâm , Trường Giáo_dục lao_động xã_hội của tổ_chức thanh_niên xung_phong được hưởng các chính_sách sau đây : a ) Được_hưởng chính_sách ưu_đãi đối_với hoạt_động cai_nghiện ma_túy và giải_quyết việc_làm cho người sau cai_nghiện ; hoạt_động dạy nghề và dịch_vụ việc_làm theo quy_định của pháp_luật ; b ) Nhà_nước đảm_bảo cho các hoạt_động thường_xuyên của bộ_máy quản_lý quy_định tại khoản 2 Điều 13 Nghị_định này theo quy_định của pháp_luật . 3 . Doanh_nghiệp thuộc tổ_chức thanh_niên xung_phong sản_xuất , cung_ứng các sản_phẩm , dịch_vụ công_ích do Nhà_nước giao được cấp kinh_phí tương_ứng và được hưởng các cơ_chế , chính_sách , ưu_đãi khác theo quy_định của pháp_luật . Doanh_nghiệp thuộc tổ_chức thanh_niên xung_phong tiếp_nhận đội_viên thanh_niên xung_phong sau khi hoàn_thành nhiệm_vụ hoặc thanh_niên sau cai_nghiện ma túy được hưởng các chính_sách quy_định tại điểm b , điểm c khoản 1 Điều 15 Nghị_định này . Điều 16 . Chính_sách đối_với đội_viên thanh_niên xung_phong</code> |
338
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
339
+ ```json
340
+ {
341
+ "scale": 20.0,
342
+ "similarity_fct": "cos_sim"
343
+ }
344
+ ```
345
+
346
+ ### Evaluation Dataset
347
+
348
+ #### json
349
+
350
+ * Dataset: json
351
+ * Size: 198,037 evaluation samples
352
+ * Columns: <code>query</code>, <code>pos</code>, and <code>neg</code>
353
+ * Approximate statistics based on the first 1000 samples:
354
+ | | query | pos | neg |
355
+ |:--------|:----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
356
+ | type | string | string | string |
357
+ | details | <ul><li>min: 8 tokens</li><li>mean: 19.87 tokens</li><li>max: 49 tokens</li></ul> | <ul><li>min: 43 tokens</li><li>mean: 179.64 tokens</li><li>max: 256 tokens</li></ul> | <ul><li>min: 23 tokens</li><li>mean: 179.49 tokens</li><li>max: 256 tokens</li></ul> |
358
+ * Samples:
359
+ | query | pos | neg |
360
+ |:---------------------------------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
361
+ | <code>Bộ Y_tế quy_định thế_nào về bảo_vệ , chăm_sóc sức khỏe sinh_sản , sức khỏe tình_dục cho thanh_niên ?</code> | <code>thức , kỹ_năng khởi_nghiệp cho thanh_niên . 2 . Cung_cấp thông_tin về thị_trường ; hỗ_trợ pháp_lý , khoa_học và công_nghệ , xúc_tiến đầu_tư , phát_triển nguồn nhân_lực ; ưu_đãi vay vốn từ các tổ_chức tín_dụng theo quy_định của pháp_luật . 3 . Khuyến_khích , tạo môi_trường thuận_lợi để thanh_niên khởi_nghiệp sáng_tạo ứng_dụng khoa_học và công_nghệ . 4 . Ưu_đãi , hỗ_trợ tổ_chức , cá_nhân tham_gia cung_ứng dịch_vụ hỗ_trợ thanh_niên khởi_nghiệp ; khuyến_khích thành_lập quỹ khởi_nghiệp cho thanh_niên theo quy_định của pháp_luật Điều 19 . Chính_sách về bảo_vệ , chăm_sóc và nâng cao sức khỏe 1 . Tư_vấn , hỗ_trợ nâng cao sức_khỏe cho thanh_niên ; phòng , chống bạo_lực gia_đình , bạo_lực học_đường , xâm_hại tình_dục ; phòng , chống ma_túy , HIV / AIDS ; phòng_ngừa bệnh lây_truyền qua đường tình_dục , bệnh_xã_hội khác và các nguy_cơ ảnh_hưởng đến sức khỏe thể_chất , tinh_thần của thanh_niên . 2 . Bảo_đảm cho thanh_niên được cung_cấp thông_tin , tiếp_cận dịch_vụ thân_thiện về bảo_vệ , chăm_sóc sức khỏe sinh_sản , sức khỏe tình_dục ; được tư_vấn , khám sức khỏe trước khi kết_hôn</code> | <code>thao cho thanh_niên ; d ) Hướng_dẫn thực_hiện các quy_định của pháp_luật về chính_sách tạo điều_kiện , hỗ_trợ các cơ_quan , tổ_chức , cá_nhân phát_triển các hoạt_động tư_vấn về tình_yêu , hôn_nhân và hạnh_phúc gia_đình cho thanh_niên . 9 . Bộ Y_tế Ban_hành hoặc trình cấp có thẩm_quyền ban_hành chương_trình , dự_án chăm_sóc sức_khỏe ; cung_cấp dịch_vụ chăm_sóc sức khỏe sinh_sản , sức khỏe tình_dục ; phòng_chống tác_hại thuốc_lá ; phòng_chống tác_hại rượu_bia , phòng_chống các bệnh truyền_nhiễm và các bệnh_xã_hội khác ; thực_hiện kế_hoạch hóa gia_đình cho thanh_niên . 10 . Bộ Quốc_phòng a ) Xây_dựng chương_trình giáo_dục , bồi_dưỡng kiến_thức quốc_phòng đối_với thanh_niên trong tình_hình mới ; b ) Hướng_dẫn thực_hiện chế_độ , chính_sách ưu_tiên đào_tạo nghề và giải_quyết việc_làm cho thanh_niên tham_gia nghĩa_vụ_quân_sự xuất_ngũ theo quy_định và thanh_niên tình_nguyện đã hoàn_thành nhiệm_vụ tham_gia phát_triển kinh_tế - xã_hội trong các khu kinh_tế quốc_phòng . 11 . Bộ Công_an a ) Xây_dựng chương_trình giáo_dục , bồi_dưỡng kiến_thức bảo_vệ an_ninh Tổ_quốc đối_với thanh_niên trong tình_hình mới ;</code> |
362
+ | <code>Thời_hạn để niêm_yết , công_bố , gửi bản_án và thông_báo là bao_lâu kể từ ngày bản_án có hiệu_lực pháp_luật ?</code> | <code>chức , cá_nhân khởi_kiện được Tòa_án cấp trích_lục bản_án . 2 . Trong thời_hạn 10 ngày , kể từ ngày tuyên_án , Tòa_án phải giao hoặc gửi bản_án cho các đương_sự , cơ_quan , tổ_chức , cá_nhân khởi_kiện và Viện_kiểm_sát cùng cấp . 3 . Bản_án sơ_thẩm có hiệu_lực pháp_luật của Tòa_án giải_quyết vụ án dân_sự bảo_vệ quyền_lợi người tiêu_dùng do tổ_chức xã_hội tham_gia bảo_vệ người tiêu_dùng khởi_kiện phải được niêm_yết công_khai tại trụ_sở Tòa_án và công_bố công_khai trên một trong các báo hàng ngày của trung_ương hoặc địa_phương trong ba số liên_tiếp . Bản_án sơ_thẩm có hiệu_lực pháp_luật của Tòa_án có liên_quan đến trách_nhiệm bồi_thường của Nhà_nước phải được Tòa_án cấp sơ_thẩm gửi cho cơ_quan quản_lý_nhà_nước có thẩm_quyền về bồi_thường nhà_nước . Bản_án sơ_thẩm có hiệu_lực pháp_luật của Tòa_án có liên_quan đến việc thay_đổi hộ_tịch của cá_nhân phải được Tòa_án cấp sơ_thẩm thông_báo bằng văn_bản kèm theo trích_lục bản_án cho Ủy_ban_nhân_dân nơi đã đăng_ký hộ_tịch của cá_nhân đó theo quy_định của Luật hộ_tịch . Thời_hạn niêm_yết , công_bố , gửi bản_án , thông_báo quy_định tại khoản này là 05 ngày làm_việc , kể từ ngày bản_án có hiệu_lực pháp_luật .</code> | <code>cùng của cơ_quan , tổ_chức được cấp , tống_đạt , thông_báo ; b ) Niêm_yết bản_sao tại nơi cư_trú hoặc nơi cư_trú cuối_cùng của cá_nhân , nơi có trụ_sở hoặc trụ_sở cuối_cùng của cơ_quan , tổ_chức được cấp , tống_đạt , thông_báo ; c ) Lập biên_bản về việc thực_hiện thủ_tục niêm_yết công_khai , trong đó ghi rõ ngày , tháng , năm niêm_yết . 3 . Thời_hạn niêm_yết công_khai văn_bản tố_tụng là 15 ngày , kể từ ngày niêm_yết . Điều 180 . Thủ_tục thông_báo trên phương_tiện_thông_tin_đại_chúng 1 . Việc thông_báo trên phương_tiện_thông_tin_đại_chúng được thực_hiện khi pháp_luật có quy_định hoặc có căn_cứ xác_định là việc niêm_yết công_khai không bảo_đảm cho người được cấp , tống_đạt , thông_báo nhận được thông_tin về văn_bản cần được cấp , tống_đạt , thông_báo . 2 . Việc thông_báo trên phương_tiện_thông_tin_đại_chúng có_thể được thực_hiện nếu có yêu_cầu của các đương_sự khác . Trong trường_hợp này , lệ_phí thông_báo trên phương_tiện_thông_tin_đại_chúng do đương_sự có yêu_cầu thông_báo chịu .</code> |
363
+ | <code>Quy_định pháp_luật quy_định như_thế_nào về quyền giám_sát của Thường_trực Hội_đồng_nhân_dân ?</code> | <code>định của Ủy_ban_nhân_dân cùng cấp và nghị_quyết của Hội_đồng_nhân_dân cấp dưới trực_tiếp có dấu_hiệu trái với Hiến_pháp , luật , văn_bản quy_phạm_pháp_luật của cơ_quan nhà_nước cấp trên , nghị_quy��t của Hội_đồng_nhân_dân cùng cấp . 2 . Xem_xét việc trả_lời chất_vấn của những người bị chất_vấn quy_định tại điểm đ khoản 1 Điều 5 của Luật này trong thời_gian giữa hai kỳ họp Hội_đồng_nhân_dân . 3 . Giám_sát chuyên_đề . 4 . Tổ_chức hoạt_động giải_trình tại phiên họp Thường_trực Hội_đồng_nhân_dân . 5 . Giám_sát việc giải_quyết khiếu_nại , tố_cáo của công_dân . 6 . Giám_sát việc giải_quyết kiến_nghị của cử_tri . Điều 67 . Chương_trình giám_sát của Thường_trực Hội_đồng_nhân_dân</code> | <code>Tòa_án nhân_dân , Viện_kiểm_sát nhân_dân , cơ_quan thi_hành án dân_sự cùng cấp và Ban của Hội_đồng_nhân_dân cấp mình ; giám_sát quyết_định của Ủy_ban_nhân_dân cùng cấp và nghị_quyết của Hội_đồng_nhân_dân cấp dưới trực_tiếp ; b ) Thường_trực Hội_đồng_nhân_dân giám_sát việc tuân theo Hiến_pháp , pháp_luật ở địa_phương và việc thực_hiện nghị_quyết của Hội_đồng_nhân_dân cùng cấp ; giám_sát hoạt_động của Ủy_ban_nhân_dân , các cơ_quan thuộc Ủy_ban_nhân_dân , Tòa_án nhân_dân , Viện_kiểm_sát nhân_dân , cơ_quan thi_hành án dân_sự cùng cấp và Hội_đồng_nhân_dân cấp dưới ; giám_sát quyết_định của Ủy_ban_nhân_dân cùng cấp , nghị_quyết của Hội_đồng_nhân_dân cấp dưới trực_tiếp ; giúp Hội_đồng_nhân_dân thực_hiện quyền giám_sát theo sự phân_công của Hội_đồng_nhân_dân ; c ) Ban của Hội_đồng_nhân_dân giúp Hội_đồng_nhân_dân giám_sát hoạt_động của Tòa_án nhân_dân , Viện_kiểm_sát nhân_dân , cơ_quan thi_hành án dân_sự cùng cấp ; giám_sát hoạt_động của Ủy_ban_nhân_dân , các cơ_quan thuộc Ủy_ban_nhân_dân cùng cấp thuộc lĩnh_vực Ban phụ_trách ; giám_sát văn_bản quy_phạm_pháp_luật thuộc lĩnh_vực Ban phụ_trách ;</code> |
364
+ * Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
365
+ ```json
366
+ {
367
+ "scale": 20.0,
368
+ "similarity_fct": "cos_sim"
369
+ }
370
+ ```
371
+
372
+ ### Training Hyperparameters
373
+ #### Non-Default Hyperparameters
374
+
375
+ - `overwrite_output_dir`: True
376
+ - `per_device_train_batch_size`: 12
377
+ - `per_device_eval_batch_size`: 12
378
+ - `learning_rate`: 1e-06
379
+ - `num_train_epochs`: 4
380
+ - `warmup_ratio`: 0.1
381
+ - `fp16`: True
382
+ - `batch_sampler`: no_duplicates
383
+
384
+ #### All Hyperparameters
385
+ <details><summary>Click to expand</summary>
386
+
387
+ - `overwrite_output_dir`: True
388
+ - `do_predict`: False
389
+ - `eval_strategy`: no
390
+ - `prediction_loss_only`: True
391
+ - `per_device_train_batch_size`: 12
392
+ - `per_device_eval_batch_size`: 12
393
+ - `per_gpu_train_batch_size`: None
394
+ - `per_gpu_eval_batch_size`: None
395
+ - `gradient_accumulation_steps`: 1
396
+ - `eval_accumulation_steps`: None
397
+ - `torch_empty_cache_steps`: None
398
+ - `learning_rate`: 1e-06
399
+ - `weight_decay`: 0.0
400
+ - `adam_beta1`: 0.9
401
+ - `adam_beta2`: 0.999
402
+ - `adam_epsilon`: 1e-08
403
+ - `max_grad_norm`: 1.0
404
+ - `num_train_epochs`: 4
405
+ - `max_steps`: -1
406
+ - `lr_scheduler_type`: linear
407
+ - `lr_scheduler_kwargs`: {}
408
+ - `warmup_ratio`: 0.1
409
+ - `warmup_steps`: 0
410
+ - `log_level`: passive
411
+ - `log_level_replica`: warning
412
+ - `log_on_each_node`: True
413
+ - `logging_nan_inf_filter`: True
414
+ - `save_safetensors`: True
415
+ - `save_on_each_node`: False
416
+ - `save_only_model`: False
417
+ - `restore_callback_states_from_checkpoint`: False
418
+ - `no_cuda`: False
419
+ - `use_cpu`: False
420
+ - `use_mps_device`: False
421
+ - `seed`: 42
422
+ - `data_seed`: None
423
+ - `jit_mode_eval`: False
424
+ - `use_ipex`: False
425
+ - `bf16`: False
426
+ - `fp16`: True
427
+ - `fp16_opt_level`: O1
428
+ - `half_precision_backend`: auto
429
+ - `bf16_full_eval`: False
430
+ - `fp16_full_eval`: False
431
+ - `tf32`: None
432
+ - `local_rank`: 0
433
+ - `ddp_backend`: None
434
+ - `tpu_num_cores`: None
435
+ - `tpu_metrics_debug`: False
436
+ - `debug`: []
437
+ - `dataloader_drop_last`: False
438
+ - `dataloader_num_workers`: 0
439
+ - `dataloader_prefetch_factor`: None
440
+ - `past_index`: -1
441
+ - `disable_tqdm`: False
442
+ - `remove_unused_columns`: True
443
+ - `label_names`: None
444
+ - `load_best_model_at_end`: False
445
+ - `ignore_data_skip`: False
446
+ - `fsdp`: []
447
+ - `fsdp_min_num_params`: 0
448
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
449
+ - `fsdp_transformer_layer_cls_to_wrap`: None
450
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
451
+ - `deepspeed`: None
452
+ - `label_smoothing_factor`: 0.0
453
+ - `optim`: adamw_torch
454
+ - `optim_args`: None
455
+ - `adafactor`: False
456
+ - `group_by_length`: False
457
+ - `length_column_name`: length
458
+ - `ddp_find_unused_parameters`: None
459
+ - `ddp_bucket_cap_mb`: None
460
+ - `ddp_broadcast_buffers`: False
461
+ - `dataloader_pin_memory`: True
462
+ - `dataloader_persistent_workers`: False
463
+ - `skip_memory_metrics`: True
464
+ - `use_legacy_prediction_loop`: False
465
+ - `push_to_hub`: False
466
+ - `resume_from_checkpoint`: None
467
+ - `hub_model_id`: None
468
+ - `hub_strategy`: every_save
469
+ - `hub_private_repo`: False
470
+ - `hub_always_push`: False
471
+ - `gradient_checkpointing`: False
472
+ - `gradient_checkpointing_kwargs`: None
473
+ - `include_inputs_for_metrics`: False
474
+ - `eval_do_concat_batches`: True
475
+ - `fp16_backend`: auto
476
+ - `push_to_hub_model_id`: None
477
+ - `push_to_hub_organization`: None
478
+ - `mp_parameters`:
479
+ - `auto_find_batch_size`: False
480
+ - `full_determinism`: False
481
+ - `torchdynamo`: None
482
+ - `ray_scope`: last
483
+ - `ddp_timeout`: 1800
484
+ - `torch_compile`: False
485
+ - `torch_compile_backend`: None
486
+ - `torch_compile_mode`: None
487
+ - `dispatch_batches`: None
488
+ - `split_batches`: None
489
+ - `include_tokens_per_second`: False
490
+ - `include_num_input_tokens_seen`: False
491
+ - `neftune_noise_alpha`: None
492
+ - `optim_target_modules`: None
493
+ - `batch_eval_metrics`: False
494
+ - `eval_on_start`: False
495
+ - `eval_use_gather_object`: False
496
+ - `batch_sampler`: no_duplicates
497
+ - `multi_dataset_batch_sampler`: proportional
498
+
499
+ </details>
500
+
501
+ ### Training Logs
502
+ <details><summary>Click to expand</summary>
503
+
504
+ | Epoch | Step | Training Loss |
505
+ |:------:|:-----:|:-------------:|
506
+ | 0.0379 | 500 | 0.6014 |
507
+ | 0.0757 | 1000 | 0.5533 |
508
+ | 0.1136 | 1500 | 0.5199 |
509
+ | 0.1515 | 2000 | 0.4743 |
510
+ | 0.1894 | 2500 | 0.4334 |
511
+ | 0.2272 | 3000 | 0.4158 |
512
+ | 0.2651 | 3500 | 0.401 |
513
+ | 0.3030 | 4000 | 0.3592 |
514
+ | 0.3408 | 4500 | 0.3334 |
515
+ | 0.3787 | 5000 | 0.3045 |
516
+ | 0.4166 | 5500 | 0.2926 |
517
+ | 0.4544 | 6000 | 0.2879 |
518
+ | 0.4923 | 6500 | 0.2603 |
519
+ | 0.5302 | 7000 | 0.2616 |
520
+ | 0.5681 | 7500 | 0.2466 |
521
+ | 0.6059 | 8000 | 0.2486 |
522
+ | 0.6438 | 8500 | 0.238 |
523
+ | 0.6817 | 9000 | 0.2364 |
524
+ | 0.7195 | 9500 | 0.2403 |
525
+ | 0.7574 | 10000 | 0.2194 |
526
+ | 0.7953 | 10500 | 0.2153 |
527
+ | 0.8331 | 11000 | 0.2266 |
528
+ | 0.8710 | 11500 | 0.2166 |
529
+ | 0.9089 | 12000 | 0.2175 |
530
+ | 0.9468 | 12500 | 0.1989 |
531
+ | 0.9846 | 13000 | 0.2101 |
532
+ | 1.0225 | 13500 | 0.2016 |
533
+ | 1.0604 | 14000 | 0.193 |
534
+ | 1.0982 | 14500 | 0.1907 |
535
+ | 1.1361 | 15000 | 0.1922 |
536
+ | 1.1740 | 15500 | 0.1873 |
537
+ | 1.2118 | 16000 | 0.1888 |
538
+ | 1.2497 | 16500 | 0.1891 |
539
+ | 1.2876 | 17000 | 0.1828 |
540
+ | 1.3255 | 17500 | 0.1768 |
541
+ | 1.3633 | 18000 | 0.1588 |
542
+ | 1.4012 | 18500 | 0.1681 |
543
+ | 1.4391 | 19000 | 0.1722 |
544
+ | 1.4769 | 19500 | 0.1624 |
545
+ | 1.5148 | 20000 | 0.1601 |
546
+ | 1.5527 | 20500 | 0.1631 |
547
+ | 1.5905 | 21000 | 0.1541 |
548
+ | 1.6284 | 21500 | 0.1544 |
549
+ | 1.6663 | 22000 | 0.1623 |
550
+ | 1.7042 | 22500 | 0.1533 |
551
+ | 1.7420 | 23000 | 0.1602 |
552
+ | 1.7799 | 23500 | 0.1494 |
553
+ | 1.8178 | 24000 | 0.16 |
554
+ | 1.8556 | 24500 | 0.1547 |
555
+ | 1.8935 | 25000 | 0.1601 |
556
+ | 1.9314 | 25500 | 0.1485 |
557
+ | 1.9692 | 26000 | 0.1488 |
558
+ | 2.0071 | 26500 | 0.1488 |
559
+ | 2.0450 | 27000 | 0.146 |
560
+ | 2.0829 | 27500 | 0.1426 |
561
+ | 2.1207 | 28000 | 0.148 |
562
+ | 2.1586 | 28500 | 0.1414 |
563
+ | 2.1965 | 29000 | 0.1434 |
564
+ | 2.2343 | 29500 | 0.145 |
565
+ | 2.2722 | 30000 | 0.1509 |
566
+ | 2.3101 | 30500 | 0.1347 |
567
+ | 2.3480 | 31000 | 0.1348 |
568
+ | 2.3858 | 31500 | 0.1271 |
569
+ | 2.4237 | 32000 | 0.1329 |
570
+ | 2.4616 | 32500 | 0.1372 |
571
+ | 2.4994 | 33000 | 0.1215 |
572
+ | 2.5373 | 33500 | 0.1353 |
573
+ | 2.5752 | 34000 | 0.1285 |
574
+ | 2.6130 | 34500 | 0.1275 |
575
+ | 2.6509 | 35000 | 0.1307 |
576
+ | 2.6888 | 35500 | 0.1285 |
577
+ | 2.7267 | 36000 | 0.1336 |
578
+ | 2.7645 | 36500 | 0.1294 |
579
+ | 2.8024 | 37000 | 0.1252 |
580
+ | 2.8403 | 37500 | 0.1331 |
581
+ | 2.8781 | 38000 | 0.1324 |
582
+ | 2.9160 | 38500 | 0.1311 |
583
+ | 2.9539 | 39000 | 0.1254 |
584
+ | 2.9917 | 39500 | 0.1319 |
585
+ | 3.0296 | 40000 | 0.1248 |
586
+ | 3.0675 | 40500 | 0.1228 |
587
+ | 3.1054 | 41000 | 0.1247 |
588
+ | 3.1432 | 41500 | 0.1264 |
589
+ | 3.1811 | 42000 | 0.1278 |
590
+ | 3.2190 | 42500 | 0.1265 |
591
+ | 3.2568 | 43000 | 0.1282 |
592
+ | 3.2947 | 43500 | 0.1267 |
593
+ | 3.3326 | 44000 | 0.1211 |
594
+ | 3.3704 | 44500 | 0.1158 |
595
+ | 3.4083 | 45000 | 0.1154 |
596
+ | 3.4462 | 45500 | 0.1206 |
597
+ | 3.4841 | 46000 | 0.115 |
598
+ | 3.5219 | 46500 | 0.1187 |
599
+ | 3.5598 | 47000 | 0.1228 |
600
+ | 3.5977 | 47500 | 0.112 |
601
+ | 3.6355 | 48000 | 0.113 |
602
+ | 3.6734 | 48500 | 0.1233 |
603
+ | 3.7113 | 49000 | 0.121 |
604
+ | 3.7491 | 49500 | 0.1176 |
605
+ | 3.7870 | 50000 | 0.1172 |
606
+ | 3.8249 | 50500 | 0.1196 |
607
+ | 3.8628 | 51000 | 0.1273 |
608
+ | 3.9006 | 51500 | 0.1303 |
609
+ | 3.9385 | 52000 | 0.114 |
610
+ | 3.9764 | 52500 | 0.121 |
611
+
612
+ </details>
613
+
614
+ ### Framework Versions
615
+ - Python: 3.10.14
616
+ - Sentence Transformers: 3.2.0
617
+ - Transformers: 4.44.0
618
+ - PyTorch: 2.4.0
619
+ - Accelerate: 0.33.0
620
+ - Datasets: 2.21.0
621
+ - Tokenizers: 0.19.1
622
+
623
+ ## Citation
624
+
625
+ ### BibTeX
626
+
627
+ #### Sentence Transformers
628
+ ```bibtex
629
+ @inproceedings{reimers-2019-sentence-bert,
630
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
631
+ author = "Reimers, Nils and Gurevych, Iryna",
632
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
633
+ month = "11",
634
+ year = "2019",
635
+ publisher = "Association for Computational Linguistics",
636
+ url = "https://arxiv.org/abs/1908.10084",
637
+ }
638
+ ```
639
+
640
+ #### MultipleNegativesRankingLoss
641
+ ```bibtex
642
+ @misc{henderson2017efficient,
643
+ title={Efficient Natural Language Response Suggestion for Smart Reply},
644
+ author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
645
+ year={2017},
646
+ eprint={1705.00652},
647
+ archivePrefix={arXiv},
648
+ primaryClass={cs.CL}
649
+ }
650
+ ```
651
+
652
+ <!--
653
+ ## Glossary
654
+
655
+ *Clearly define terms in order to be accessible across audiences.*
656
+ -->
657
+
658
+ <!--
659
+ ## Model Card Authors
660
+
661
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
662
+ -->
663
+
664
+ <!--
665
+ ## Model Card Contact
666
+
667
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
668
+ -->
added_tokens.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ {
2
+ "<mask>": 64000
3
+ }
bpe.codes ADDED
The diff for this file is too large to render. See raw diff
 
config.json ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "bkai-foundation-models/vietnamese-bi-encoder",
3
+ "architectures": [
4
+ "RobertaModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "bos_token_id": 0,
8
+ "classifier_dropout": null,
9
+ "eos_token_id": 2,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 768,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 3072,
15
+ "layer_norm_eps": 1e-05,
16
+ "max_position_embeddings": 258,
17
+ "model_type": "roberta",
18
+ "num_attention_heads": 12,
19
+ "num_hidden_layers": 12,
20
+ "pad_token_id": 1,
21
+ "position_embedding_type": "absolute",
22
+ "tokenizer_class": "PhobertTokenizer",
23
+ "torch_dtype": "float32",
24
+ "transformers_version": "4.44.0",
25
+ "type_vocab_size": 1,
26
+ "use_cache": true,
27
+ "vocab_size": 64001
28
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.2.0",
4
+ "transformers": "4.44.0",
5
+ "pytorch": "2.4.0"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": null
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:307d6a6fd31ffbdf4ddd82de5a86370a9594e0ab891b86718262430bbac01680
3
+ size 540015464
modules.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ }
14
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 256,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": false,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer_config.json ADDED
@@ -0,0 +1,54 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "64000": {
36
+ "content": "<mask>",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "mask_token": "<mask>",
49
+ "model_max_length": 256,
50
+ "pad_token": "<pad>",
51
+ "sep_token": "</s>",
52
+ "tokenizer_class": "PhobertTokenizer",
53
+ "unk_token": "<unk>"
54
+ }
vocab.txt ADDED
The diff for this file is too large to render. See raw diff