meandyou200175
commited on
Add new SentenceTransformer model
Browse files- 1_Pooling/config.json +10 -0
- README.md +755 -0
- added_tokens.json +3 -0
- bpe.codes +0 -0
- config.json +28 -0
- config_sentence_transformers.json +10 -0
- model.safetensors +3 -0
- modules.json +14 -0
- sentence_bert_config.json +4 -0
- special_tokens_map.json +51 -0
- tokenizer_config.json +54 -0
- vocab.txt +0 -0
1_Pooling/config.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"word_embedding_dimension": 768,
|
3 |
+
"pooling_mode_cls_token": false,
|
4 |
+
"pooling_mode_mean_tokens": true,
|
5 |
+
"pooling_mode_max_tokens": false,
|
6 |
+
"pooling_mode_mean_sqrt_len_tokens": false,
|
7 |
+
"pooling_mode_weightedmean_tokens": false,
|
8 |
+
"pooling_mode_lasttoken": false,
|
9 |
+
"include_prompt": true
|
10 |
+
}
|
README.md
ADDED
@@ -0,0 +1,755 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
<br>
|
1 |
<br>Em là nam nhưng vú to làm em rất mặc cảm. Em đã đi khám bệnh, sau khi làm các xét nghiệm và chiếu chụp, bác sĩ xác định em phì đại tuyến vú.
|
2 |
<br>
|
3 |
<br>Theo bác sĩ em nên dùng thuốc (nội khoa) hơn hay phẫu thuật (ngoại khoa) hơn? Mỗi phương pháp có lợi hay hại gì ạ? Em băn khoăn lắm, rất mong được bác sĩ tư vấn. Em cảm ơn bác sĩ!</code> | <code>Hùng thân mến, Vú to nam giới là tình trạng phì đại tuyến vú , thường không đối xứng hoặc một bên và có thể có mật độ mềm. Chẩn đoán phân biệt với ung thư vú và vú to nam giới giả, thường thấy ở nam giới béo phì và được đặc trưng bởi lắng đọng mô mỡ mà không có tăng sinh tuyến. Nguyên nhân là do tăng hoạt động của estrogen hoặc tăng tỷ số estrogen-androgen Điều trị phụ thuộc vào nguyên nhân gây vú to nam giới, phẫu thuật hay điều trị nội khoa phù hợp với các trường hợp khác nhau. Nội khoa điều trị hormon thay thế sẽ làm cải thiện vú to nam giới ở bệnh nhân nam suy sinh dục. Vú to nam giới do thuốc thì ngưng thuốc, vú to nam giới do dậy thì thì theo dõi. Phẫu thuật được chỉ định nếu có các vấn đề tâm lý, thẩm mỹ trường hợp nhu mô vú tiếp tục phát triển, ác tính. Trân trọng.</code> | <code>Chào em, Với kết quả giải phẫu bệnh của em, cho thấy bướu giáp này
|
4 |
<br>thuộc loại lành tính, nên không nhất thiết phải phẫu thuật ngay trong lúc này
|
5 |
<br>em à. Em có thể điều trị nội khoa vài tháng, để hạn chế sự phát triển của bướu, theo
|
6 |
<br>dõi bệnh có đáp ứng với thuốc không và độ lớn của bướu (được đánh giá qua siêu
|
7 |
<br>âm). Trường hợp bướu không đáp ứng với điều trị, hoặc kích thước bướu lớn nhanh, có
|
8 |
<br>dấu hiệu chèn ép, khó thở, khàn giọng, kèm nổi hạch cổ…thì cần tiến hành phẫu
|
9 |
<br>thuật. Thân mến!</code> |
|
|
|
|
|
10 |
<br>
|
11 |
<br>Em có đi nhà thuốc và được tư vấn thoa kem Mật Ong Madeleine Ritchie nhưng không thấy hiệu quả. Hiện tại em đang thoa kem Beprosone nhưng cũng không thấy cải thiện nhiều.
|
12 |
<br>
|
13 |
<br>Em không bị côn trùng đốt cũng nhưng không sử dụng mỹ phẩm gì cả, nên không hiểu sao lại bị như vậy. BS có thể tư vấn cho em thuốc thoa đồng thời trị thâm không ạ? Em sợ sẽ để lại thâm rất xấu nên lo lắng. Đây là những loại kem thoa em đã sử dụng nhưng không thấy hiệu quả. Chân thành cảm ơn BS.
|
14 |
<br>
|
15 |
<br>(Bạn đọc Nguyễn Lê Thanh Tâm)</code> | <code> Chào em, Em chụp hình những tuýp kem đã dùng nhưng không đưa kèm hình sang thương nên rất khó cho bác sĩ để chẩn đoán bệnh của em là gì và không thể kê toa cho em trong lúc này. Nếu được em vui lòng cung cấp hình ảnh cho chương trình. Em cũng không nên tự ý bôi thuốc vì có thể không điều trị được bệnh mà còn gây ra nhiều tác dụng phụ ảnh hưởng sức khỏe. Nếu quá lo lắng, em nên đến gặp bác sĩ chuyên khoa Da Liễu để được thăm khám trực tiếp và chỉ định xét nghiệm cần thiết để chẩn đoán bệnh em nhé! Thân mến! </code> | <code>Chào em, Hiện tượng nổi mụn nước kèm cảm giác đau và ngứa khi sử dụng thuốc trị sẹo cho thấy vết thương không hợp với thuốc này, có hiện tượng viêm da kích ứng. Em nên ngừng sử dụng loại thuốc trị sẹo này và đổi thử sang loại khác. An toàn nhất là em khám chuyên khoa da liễu để bác sĩ tìm loại thuốc phù hợp nhất cho em, em nhé.</code> |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
16 |
<br>
|
17 |
<br>Con là nữ, năm nay 14 tuổi. Dạo gần đây do uống thuốc nhiều con hay bị táo bón. Con có tìm hiểu sơ về bệnh trĩ, nhưng khi đi đại tiện con không bị chảy máu gì cả. Gần đây con có cảm giác hơi vướng ở hậu môn, không hẳn là ở hậu môn, cứ như ở ngoài phía 2 bên mép thôi.
|
18 |
<br>
|
19 |
<br>Cứ thi thoảng là bị rồi hình như tự hết thì phải, có cảm giác khi đi ngoài chưa đi hết và thi thoảng thấy như có vật gì nhỏ lòi ra ngoài nhưng tự cơ thể có thể đẩy vô được bình thường. Dấu hiệu như vậy giống với bệnh nào nhất vậy BS? Con cảm ơn BS.</code> | <code> Chào em, Theo thông tin em cung cấp, nhiều khả năng em có , nhưng ở mức độ nhẹ khoảng trĩ độ 1 mà thôi. Cảm giác đi cầu chưa hết thường là do khối phân tròn nhỏ sót lại, khó xuất ra do mô xung quanh hậu môn đã phù nề kèm với búi trĩ sau khi em đã cố rặn một lúc lâu, cũng có thể đó chính là búi trĩ nội. Vì thế em không cần và không nên ráng rặn tiếp để xuất hết khối phân này, ở lần đi tiêu tiếp theo sẽ tự khắc thải ra được. Tình trạng này thì không cần dùng thuốc, chỉ cần thay đổi lối sống bằng cách ăn nhiều rau xanh, trái cây, hạn chế thực phẩm cay, nhiều dầu mỡ, uống nhiều nước, tối thiểu phải 2-3 lít nước mỗi ngày, không ngồi lâu trên 5 phút khi đi vệ sinh, tập thể dục đều đặn sẽ giúp em cải thiện tình trạng này, em nhé. Thân mến!</code> | <code> Chào em, Chỉ thông qua mô tả của em BS chưa thể xác định được em bị bệnh gì. Triệu chứng em mô tả có thể xuất hiện khi , polyp hậu môn, rối loạn thần kinh chi phối cảm giác… Em cần đến khám chuyên khoa tiêu hóa (khám hậu môn) để BS trực tiếp thăm khám và tìm nguyên nhân. Tại TPHCM em có thể đến khám tại BV Đại học Y Dược TPHCM, BV Bình Dân, BV Nhân dân Gia Định, BV Nhân dân 115… Thân mến! </code> |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
base_model: bkai-foundation-models/vietnamese-bi-encoder
|
3 |
+
library_name: sentence-transformers
|
4 |
+
metrics:
|
5 |
+
- map
|
6 |
+
- mrr@1
|
7 |
+
- ndcg@1
|
8 |
+
pipeline_tag: sentence-similarity
|
9 |
+
tags:
|
10 |
+
- sentence-transformers
|
11 |
+
- sentence-similarity
|
12 |
+
- feature-extraction
|
13 |
+
- generated_from_trainer
|
14 |
+
- dataset_size:43000
|
15 |
+
- loss:MultipleNegativesRankingLoss
|
16 |
+
widget:
|
17 |
+
- source_sentence: Chào BS ạ, Em đi xét nghiệm máu và BS nói bị viêm gan B. CSBT là
|
18 |
+
0.9-1 kết quả là 7827POS. Vậy là như thế nào, nặng hay nhẹ ạ? BS có thể giải đáp
|
19 |
+
giúp em được không ạ?
|
20 |
+
sentences:
|
21 |
+
- ' Chào em, Em không nói rõ xét nghiệm em làm là gì mà dương tính? thường là HBSAg
|
22 |
+
và Anti HBS (hay có nơi dùng ký hiệu HBSAb). Nếu xét nghiệm HBSAg dương tính thì
|
23 |
+
có nghĩa là em đang mang trong người virus viêm gan B. Nhưng có 2 tình huống xảy
|
24 |
+
ra, một là “viêm gan B” (virus đang làm tổn thương tế bào gan, men gan sẽ tăng),
|
25 |
+
hai là “nhiễm virus viêm gan B thể không hoạt động”. HBSAg dương tính nghĩa là
|
26 |
+
có bệnh, tùy vào men gan có tăng hay không mới quyết định có viêm gan không, men
|
27 |
+
gan và chức năng gan mới là yếu tố quyết định bệnh nặng hay nhẹ chứ không phải
|
28 |
+
nồng độ HBSAg. Ngược lại, nếu xét nghiệm Anti HBS dương tính thì có nghĩa là em
|
29 |
+
không có bệnh viêm gan siêu vi B, mà đã có kháng thể bảo vệ cơ thể khỏi nhiễm
|
30 |
+
siêu vi gây viêm gan B (HBV), kháng thể được tạo ra trong 2 trường hợp, một là
|
31 |
+
em đã từng nhiễm HBV từ bên ngoài, có thể có biểu hiện viêm gan cấp do HBV hoặc
|
32 |
+
không nhưng nay cơ thể đã loại trừ hoàn toàn HBV ra khỏi cơ thể và tạo ra kháng
|
33 |
+
thể bảo vệ; hai là kháng thể được tạo ra nhờ vào chủng ngừa viêm gan B. Thân mến! Phần
|
34 |
+
tư vấn trên là gợi ý, định hướng ban đầu. Bạn đọc nên đi khám bác sĩ chuyên khoa.
|
35 |
+
Bởi muốn chẩn đoán đúng, bác sĩ cần thăm khám trực tiếp. Mọi thắc mắc về sức khỏe,
|
36 |
+
dịch vụ y tế, vui lòng: › Gửi đến email: › Đặt câu hỏi ngay chuyên mục Khám bệnh
|
37 |
+
Online và Hỏi đáp Dịch vụ Y tế trên trang › Để nói chuyện trực tiếp với bác sĩ,
|
38 |
+
hàng ngày, từ 17 -19g, Hotline: 08983 08983'
|
39 |
+
- ' Chào em, Xét nghiệm bình thường khoảng HBV-DNA = 1,36 x 106 copies/mL, chỉ số
|
40 |
+
của em 5,03 x 107 copies/mL cao biểu hiện viêm gan mạn tính. BS nói với em phải
|
41 |
+
diều trị lâu dài vì nếu điều trị không tốt sẽ bị biến chứng xơ gan, , suy gan...
|
42 |
+
Nếu em kèm viêm dạ dày thì điều trị hơi vất vả vì phải điều trị cả 2 bệnh và một
|
43 |
+
số thuốc phải tránh làm tăng đau dạ dày. Mong em yên tâm theo hướng dẫn của BS
|
44 |
+
và tuân thủ điều trị, tránh biến chứng, không phải vì nghe thời gian dài mà em
|
45 |
+
ngưng điều trị nhé. Cần kiểm tra xét nghiệm mỗi 3 tháng, nếu tiến triển tốt thì
|
46 |
+
bệnh ổn sớm hơn dự định. Thân mến! Phần tư vấn trên là gợi ý, định hướng ban
|
47 |
+
đầu. Bạn đọc nên đi khám bác sĩ chuyên khoa. Bởi muốn chẩn đoán đúng, bác sĩ cần
|
48 |
+
thăm khám trực tiếp. Mọi thắc mắc về sức khỏe, dịch vụ y tế, vui lòng: › Gửi đến
|
49 |
+
email: › Đặt câu hỏi ngay chuyên mục Khám bệnh Online và Hỏi đáp Dịch vụ Y tế
|
50 |
+
trên trang › Để nói chuyện trực tiếp với bác sĩ, hàng ngày, từ 17 -19g, Hotline:
|
51 |
+
08983 08983'
|
52 |
+
- 'Chào em, Thuốc Diane 35 có thành phần Cyproterone acetate 2 mg và Ethinylestradiol
|
53 |
+
0,035 mg, dùng để tránh thai và điều trị những bệnh mà nguyên nhân của nó là do
|
54 |
+
hoặc tăng sản xuất androgens hoặc do nhạy cảm đặc biệt với hormone này như mụn
|
55 |
+
trứng cá, rậm lông ở nữ... Thuốc tránh thai hàng ngày nhằm điều chỉnh hormone
|
56 |
+
của cơ thể, làm cho trứng không rụng. Thuốc còn làm mỏng niêm mạc tử cung để trứng
|
57 |
+
nếu được thụ tinh thì sẽ khó làm tổ; làm đặc chất nhày cổ tử cung cản trở tinh
|
58 |
+
trùng đi qua, giảm sự di chuyển của tinh trùng trong ống dẫn trứng. Thuốc tránh
|
59 |
+
thai hàng ngày loại 21 viên, ngưng thuốc 7 ngày, trong thời gian đó sẽ có kinh,
|
60 |
+
nhưng cũng có một số người ít mất kinh nhưng không ảnh hưởng gì cả. Trong thời
|
61 |
+
gian 7 ngày đó cũng như những ngày tiếp theo trong suốt quá trình uống thuốc,
|
62 |
+
có thể quan hệ bình thường và hoàn toàn yên tâm. Với điều kiện tuân thủ uống đúng
|
63 |
+
theo qui định: uống viên đầu tiên vào ngày có kinh thứ 1, và uống đều đặn vào
|
64 |
+
cùng thời điểm mỗi ngày. Tuy nhiên, trong vòng 5 ngày đầu, nếu uống viên đầu tiên
|
65 |
+
thì cũng có hiệu quả. Như vậy, trường hợp của em nếu uống đầy đủ và đều đặn, đúng
|
66 |
+
giờ, thì trong thời gian ngừng thuốc 7 ngày, dù không có kinh em vẫn có thể quan
|
67 |
+
hệ bình thường và hoàn toàn yên tâm, không lo có thai nhé. Thuốc tránh thai uống
|
68 |
+
hàng ngày sau thời gian dài uống thuốc, em có thể ngưng mà không ảnh hưởng gì
|
69 |
+
đến sức khỏe sinh sản. Tuy nhiên chu kỳ kinh có thể thay đổi, vì sau khi ngưng
|
70 |
+
thuốc chu kỳ kinh là do cơ thể em tự điều chỉnh hormon sinh dục, không phụ thuộc
|
71 |
+
vào thuốc nữa. Chúc em luôn có sức khỏe tốt!'
|
72 |
+
- source_sentence: "Chào BS,\r\n\r\nTôi bị viêm trợt + chuyển sản niêm mạc ruột vùng\
|
73 |
+
\ hang vị, khi ăn no hoặc chưa ăn thấy bụng rất khó chịu, có cảm giác nóng và\
|
74 |
+
\ xót. Xin hỏi BS như vậy thì tôi phải uống thuốc và điều trị ra sao?"
|
75 |
+
sentences:
|
76 |
+
- ' Chào em, Các triệu chứng của em có thể nằm trong nhóm triệu chứng của bệnh lý
|
77 |
+
do rối loạn vận động ruột, cơ chế bệnh sinh đại đa số là do nguyên nhân rối loạn
|
78 |
+
trầm cảm, rối loạn lo âu, ngoài ra còn có những nguyên nhân khác. Điều trị chủ
|
79 |
+
yếu là điều trị triệu chứng. Em có thể đến gặp BS chuyên khoa Nội tiêu hóa để
|
80 |
+
được điều trị và kiểm soát triệu chứng nhé. Thân mến! '
|
81 |
+
- Chào bạn, Tình trạng bệnh lý dạ dày của bạn khá xấu, bởi vì viêm dạ dày mà có
|
82 |
+
chuyển sản niêm mạc ruột vùng hang vị là tình trạng tiền ung thư, có nguy cơ tiến
|
83 |
+
triển đến ung thư nếu không điều trị sớm và đúng chuẩn. Tuy nhiên, bệnh vẫn chưa
|
84 |
+
đến mức là ung thư dạ dày. Do đó, bạn cần kiên trì theo dõi bệnh và điều trị bệnh
|
85 |
+
này với BS chuyên khoa Tiêu hóa, thuốc trọng yếu điều trị bệnh này là ức chế bơm
|
86 |
+
proton để giảm tiết acid dạ dày, các thuốc khác hỗ trợ điều trị triệu chứng đi
|
87 |
+
kèm nếu có (như đau bụng, đầy hơi, ợ chua…). Theo luật khám và chữa bệnh hiện
|
88 |
+
nay của Bộ Y tế, BS không được phép kê thuốc thông qua kênh truyền thông mà không
|
89 |
+
thông qua thăm khám + hỏi bệnh trực tiếp với người bệnh, điều này là do vấn đề
|
90 |
+
an toàn của người bệnh. Nếu muốn phối hợp các phương thức trị liệu Đông y như
|
91 |
+
nghệ, bài thuốc cổ truyền… thì phải thông báo với BS Tây y đang điều trị thuốc
|
92 |
+
cho bạn để tránh tương tác thuốc, quá liều thuốc. Song song đó, bạn cần hạn chế
|
93 |
+
ăn đồ chua cay, nước có gas, nhiều dầu mỡ, nhiều gia vị, café, bia rượu, không
|
94 |
+
hút thuốc lá và tránh căng thẳng đầu óc, ăn uống đúng giờ và nghỉ ngơi hợp lý.
|
95 |
+
Thân mến.
|
96 |
+
- Chào bạn Chương, Hở van động mạch chủ có một số nguyên nhân gây ra nhưng tại những
|
97 |
+
nước kém phát triển như Việt Nam thì do thấp tim là nguyên nhân thường gặp. Biểu
|
98 |
+
hiện trên siêu âm là hình ảnh lá van dày, dính có thể kết hợp vừa hẹp và hở. Bạn
|
99 |
+
thường xuyên luyện tập thể thao do đó nhịp tim khi nghỉ có thể khá chậm (< 60l/ph)
|
100 |
+
chủ yếu là do cường phó giao cảm, là sinh lý bình thường không cần phải điều trị.
|
101 |
+
Tuy nhiên trong hở van động mạch chủ thì nhịp tim nhanh hơn 1 chút sẽ có lợi vì
|
102 |
+
hạn chế thời gian phụt ngược của dòng hở. Hở van động mạch chủ độ 1 đến 2 khi
|
103 |
+
không có biểu hiện gì của suy tim thì không cần phải điều trị, chủ yếu là theo
|
104 |
+
dõi định kỳ, không có chỉ định mổ. Bạn thường xuyên luyện tập bơi 1km/ngày mà
|
105 |
+
không thấy có gì khó chịu thì vẫn có thể tiếp tục duy trì. Tuy nhiên cũng không
|
106 |
+
nên vận động quá sức làm tăng gánh trên tim. Thân ái!
|
107 |
+
- source_sentence: "Chào AloBacsi,\r\n\r\nHiện tại con gái em được 3 tháng 15 ngày\
|
108 |
+
\ ạ. Cháu cứ đến 4-5 ngày mới đi đại tiện, em muốn biết có phải cháu mắc chứng\
|
109 |
+
\ chậm tiêu không? Em đã ăn rất nhiều rau khoai và củ khoai mà đến hôm nay ngày\
|
110 |
+
\ thứ 4 rồi mà cháu vẫn chưa đi. Cho em lời khuyên sớm nhất BS nhé."
|
111 |
+
sentences:
|
112 |
+
- ' Chào bạn, Biểu hiện này có thể là do hoặc do thức ăn không phù hợp với hệ tiêu
|
113 |
+
hóa của bé. Ngoài ra, cũng có thể do bé có bệnh lý dạ dày - ruột. Tốt nhất, bạn
|
114 |
+
nên đưa bé đi khám để BS đánh giá, chẩn đoán đúng bệnh và đưa ra điều trị thích
|
115 |
+
hợp cho bé. Tôi không trực tiếp khám nên không thể tư vấn cách điều trị. Thân
|
116 |
+
mến! '
|
117 |
+
- ' Hồng Qúy thân mến, Theo mô tả của bạn thì con bạn bị . Muốn cải thiện tình trạng
|
118 |
+
này, bạn nên cho con bạn uống nhiều nước, vì bé bú mẹ hoàn toàn nên bạn phải ăn
|
119 |
+
nhiều rau xanh, chuối, cam, đu đủ để bé hấp thụ qua sữa mẹ. Từ đó, bé sẽ đi tiêu
|
120 |
+
được. Bạn nên lau mát cho bé trước khi đi ngủ. Nếu tình trạng của bé không cải
|
121 |
+
thiện, bạn nên cho bé đi khám với BS chuyên khoa Nhi để được tư vấn và điều trị.
|
122 |
+
Bạn không nên để tình trạng này kéo dài bạn nhé. Chúc gia đình bạn sức khỏe! '
|
123 |
+
- 'Phương pháp chẩn đoán & điều trị bệnh than Phương pháp xét nghiệm và chẩn đoán
|
124 |
+
bệnh than Lấy bệnh sử để xác định cách phơi nhiễm có thể xảy ra, và yêu cầu các
|
125 |
+
xét nghiệm chẩn đoán cần thiết. Nếu nghi ngờ bệnh than nhiễm qua đường hô hấp,
|
126 |
+
X-Quang ngực hay chụp CT nhằm đánh giá chức năng phổi, để xác định có tràn dịch
|
127 |
+
màng phổi hay không. Cách chẩn đoán xác định bệnh than: Đo lường các kháng thể
|
128 |
+
hay độc tố trong máu. Xét nghiệm trực tiếp để tìm vi khuẩn Bacillus anthracis
|
129 |
+
trong mẫu bệnh phẩm. Các mẫu phải được lấy trước khi bệnh nhân sử dụng kháng sinh
|
130 |
+
để điều trị. Phương pháp điều trị bệnh than Nguyên tắc điều trị: Bệnh than nhiễm
|
131 |
+
qua da: Dễ điều trị nhất. Bệnh than nhiễm qua đường hô hấp: Diễn tiến nhanh và
|
132 |
+
nguy cơ dẫn đến suy hô hấp, nhiễm khuẩn huyết, sốc nhiễm khuẩn và viêm màng não
|
133 |
+
nên cần được xử trí tích cực. Bệnh than nhiễm qua đường tiêu hóa: Khó điều trị
|
134 |
+
vì bệnh nhân bị mất nước, mất điện giải, mất máu, nhiễm khuẩn huyết và thủng ruột.
|
135 |
+
Bệnh than nhiễm qua kim tiêm: Bệnh than nhiễm qua đường kim tiêm có thể lan ra
|
136 |
+
khắp cơ thể nhanh hơn và khó để nhận biết và điều trị hơn Bệnh Than nhiễm qua
|
137 |
+
da. Sử dụng thuốc điều trị: Thường sử dụng kháng sinh (đặc biệt kháng sinh Penicillin)
|
138 |
+
qua đường uống hoặc kết hợp với đường truyền tĩnh mạch để điều trị bệnh than.'
|
139 |
+
- source_sentence: "Chào bác sĩ,\r\n\r\nTôi 53 tuổi, gần đây hay đi đại tiện thấy\
|
140 |
+
\ phân có màu xám, nhưng cũng có lúc phân màu đen sẫm. Tôi từng bị viêm dạ dày,\
|
141 |
+
\ đã nội soi khoảng 4-5 lần. Gần đây nhất cách nay 6 tháng, nội soi bao tử và\
|
142 |
+
\ xét nghiệm máu không có vi trùng Hp, nhưng có bị viêm bao tử không nặng.\r\n\
|
143 |
+
\r\nTôi xin được hỏi là có khả năng tôi đang bị xuất huyết bao tử không? Nếu đúng\
|
144 |
+
\ thì điều trị như thế nào? Cám ơn bác sĩ nhiều."
|
145 |
+
sentences:
|
146 |
+
- "Mô tả ngắn:\nThuốc Katies 100 Davi là sản phẩm được sản xuất bởi Công ty TNHH\
|
147 |
+
\ Davipharm (Davipharm Co., Ltd). Thuốc có dược chất chính là Tiropramid HCl.\
|
148 |
+
\ Thuốc được chỉ định trong chống co thắt cơ trơn đường tiêu hóa, tiết niệu, hệ\
|
149 |
+
\ sinh dục. \n Thuốc Katies 100 Davi được bào chế dưới dạng viên nén tròn bao\
|
150 |
+
\ phim, mỗi viên chứa 100 mg Tiropramid HCl và được đóng gói theo quy cách hộp\
|
151 |
+
\ 3 vỉ x 10 viên.\nThành phần:\nTiropramide: 100mg\nChỉ định:\nThuốc Katies 100\
|
152 |
+
\ Davi được chỉ định dùng trong các trường hợp sau:\nCắt các cơn co thắt trương\
|
153 |
+
\ lực cơ trơn hệ tiêu hóa: Co thắt dạ dày ruột, hội chứng ruột bị kích thích cơn\
|
154 |
+
\ đau quặn bụng, sự kết dính sau phẫu thuật, điều trị hỗ trợ giảm co thắt và giảm\
|
155 |
+
\ đau trong soi, sinh thiết, đặt catheter. Cắt các cơn đau co thắt cấp tính: Co\
|
156 |
+
\ thắt đường mật do tắc mật, sỏi mật , sỏi thận và sỏi niệu quản, bệnh viêm túi\
|
157 |
+
\ mật hoặc sau phẫu thuật mật, viêm bể thận, viêm bàng quang, giảm các triệu chứng\
|
158 |
+
\ đau đái dắt, đái buốt trong viêm bàng quang và viêm tuyến tiền liệt. Các trường\
|
159 |
+
\ hợp co thắt tử cung như: Thống kinh, đau bụng kinh, dọa sảy thai, co thắt tử\
|
160 |
+
\ cung, đau vùng khung chậu, đau khi chuyển dạ."
|
161 |
+
- Cần lưu ý tình trạng đi ngoài có máu, nếu kéo dài bạn nên đến bệnh viện để được
|
162 |
+
thăm khám kịp thời Chào bạn, Chảy máu đường tiêu hoá dưới có nhiều nguyên nhân,
|
163 |
+
thường gặp do trĩ nội xuất huyết, nứt hậu môn, ngoài ra ít gặp hơn còn có nguyên
|
164 |
+
nhân viêm loét đại tràng, rối loạn đông máu, polyp hoặc ung thư trực tràng...
|
165 |
+
Các thuốc bạn đang sử dụng chủ yếu dành cho điều trị trĩ nội mức độ nhẹ, nếu đã
|
166 |
+
có biến chứng xuất huyết dai dẳng thì cần can thiệp tích cực hơn, nếu không sẽ
|
167 |
+
dẫn tới thiếu máu, mệt mỏi, ảnh hưởng chức năng tim mạch, khả năng tập trung...
|
168 |
+
Bạn nên sắp xếp tới bệnh viện khám chuyên khoa Ngoại tiêu hoá để bác sĩ thăm khám,
|
169 |
+
đánh giá, xem xét nội soi chẩn đoán và lên kế hoạch điều trị bạn nhé!
|
170 |
+
- Chào bạn Khám Vân, Khi có biểu hiện đi tiêu phân xám, màu đen sẫm thì đầu tiên
|
171 |
+
cần phải loại trừ do sử dụng những thuốc hoặc thực phẩm có màu đen. Xuất huyết
|
172 |
+
tiêu hóa cũng có triệu chứng đi tiêu phân đen, xuất huyết có thể xảy ra ở dạ dày,
|
173 |
+
ở ruột non hay ở đại tràng. Vì vậy, nội soi dạ dày nếu không thấy tình trạng xuất
|
174 |
+
huyết thì cũng không loại trừ xuất huyết tiêu hóa ở các vị trí khác, có thể cần
|
175 |
+
phải nội soi đại tràng, nội soi ruột non nếu nghi ngờ xuất huyết tiêu hóa. Chẩn
|
176 |
+
đoán xác định nhiễm vi trùng Hp hoạt động phải dựa vào các test được thực hiện
|
177 |
+
qua nội soi hoặc test hơi thở, xét nghiệm máu không có giá trị để chẩn đoán xác
|
178 |
+
định và điều trị. Vì vậy, chị phải đi khám và làm các kỹ thuật cận lâm sàng để
|
179 |
+
chẩn đoán xác định bệnh và điều trị hiệu quả. Trân trọng.
|
180 |
+
- source_sentence: Chào BS ạ,Bác sĩ ơi, cháu năm nay 14 tuổi. Cháu bị gãy cành tươi
|
181 |
+
đầu dưới xương quay ở cổ tay (gãy 1/3). Tay cháu hiện tại đã can được khoảng 2
|
182 |
+
tuần ạ. Cho cháu hỏi là bao lâu nữa thì cháu có thể chơi thể thao (hay bóng đá)
|
183 |
+
trở lại ạ? Cháu cảm ơn bác!
|
184 |
+
sentences:
|
185 |
+
- 'Phương pháp chẩn đoán & điều trị thoái hóa tiểu não Phương pháp chẩn đoán thoái
|
186 |
+
hóa tiểu não Nếu bác sĩ nghi ngờ bạn mắc thoái hóa tiểu não, họ sẽ thực hiện đánh
|
187 |
+
giá cẩn thận các triệu chứng của bạn. Họ cũng sẽ xem xét tiền sử mắc bệnh của
|
188 |
+
cá nhân và gia đình của bạn. Bác sĩ sẽ khám sức khỏe tổng quát, đặc biệt khám
|
189 |
+
các chức năng thần kinh để phát hiện các dấu hiệu bất thường khác. Để xác nhận
|
190 |
+
chẩn đoán, bác sĩ có thể sẽ đề xuất một số xét nghiệm sau: Chụp cộng hưởng từ
|
191 |
+
(MRI) hoặc chụp CT (chụp cắt lớp vi tính): Nếu bạn bị thoái hóa tiểu não, các
|
192 |
+
xét nghiệm hình ảnh học này có thể cho thấy tiểu não nhỏ đi so với bình thường.
|
193 |
+
Những xét nghiệm này cũng có thể phát hiện các tình trạng não khác, chẳng hạn
|
194 |
+
như khối u não hoặc bằng chứng về đột quỵ. Chọc dịch não tủy: Xét nghiệm này có
|
195 |
+
thể giúp chẩn đoán rối loạn cận ung thư hoặc chẩn đoán phân biệt với các nguyên
|
196 |
+
nhân nhiễm trùng thần kinh khác. Xét nghiệm máu: Trong một số trường hợp, những
|
197 |
+
người mắc bệnh ung thư và rối loạn cận ung thư có thể có lượng kháng thể đặc hiệu
|
198 |
+
cao trong máu. Xét nghiệm di truyền: Bác sĩ có thể đề nghị xét nghiệm di truyền
|
199 |
+
để xác định xem liệu đột biến gen có gây ra thoái hóa tiểu não di truyền hay không.
|
200 |
+
Chụp MRI ở bệnh nhân thoái hóa tiểu não có thể cho thấy hình ảnh tiểu não nhỏ
|
201 |
+
hơn bình thường Phương pháp điều trị thoái hóa tiểu não hiệu quả Việc điều trị
|
202 |
+
thường phụ thuộc vào nguyên nhân cơ bản gây ra rối loạn chức năng não của bạn.
|
203 |
+
Tuy nhiên, thuốc đôi khi có thể giúp kiểm soát một số triệu chứng nhất định, bao
|
204 |
+
gồm run hoặc các vấn đề về đi lại và chóng mặt. Điều trị thoái hóa tiểu não cận
|
205 |
+
ung thư có thể bao gồm: Hóa trị: Hóa trị là phương pháp điều trị bằng các hóa
|
206 |
+
chất mạnh để tiêu diệt các tế bào ung thư đang phát triển nhanh trong cơ thể bạn.
|
207 |
+
Xạ trị: Là một loại phương pháp điều trị ung thư. Phương pháp điều trị này sử
|
208 |
+
dụng chùm năng lượng mạnh để tiêu diệt tế bào ung thư. Xạ trị thường sử dụng tia
|
209 |
+
X. Thuốc ức chế miễn dịch: Glucocorticoid như Methylprednisolone giúp chống viêm,
|
210 |
+
kiểm soát triệu chứng. Liệu pháp miễn dịch: Các thuốc như Rituximab và Tacrolimus
|
211 |
+
đều có thể giúp kiểm soát triệu chứng ở những bệnh nhân bị thoái hóa tiểu não
|
212 |
+
cận ung thư. Sự kết hợp khác nhau của hóa trị, xạ trị và phẫu thuật để loại bỏ
|
213 |
+
khối u. Điều trị thoái hóa tiểu não liên quan đến rượu có thể bao gồm: Không uống
|
214 |
+
rượu. Bổ sung Vitamin: Bổ sung Thiamine, vitamin B hoặc E có thể điều trị thoái
|
215 |
+
hóa tiểu não do rượu hoặc do thiếu hụt dinh dưỡng. Những người mắc bất kỳ dạng
|
216 |
+
thoái hóa tiểu não nào cũng có thể cần liệu pháp vật lý trị liệu, trị liệu ngôn
|
217 |
+
ngữ. Những liệu pháp này có thể giúp bạn cải thiện: Kỹ năng vận động để bạn có
|
218 |
+
thể thực hiện các hoạt động hàng ngày. Sức mạnh cơ bắp và sự phối hợp thực hiện
|
219 |
+
các động tác. Kỹ năng nuốt, nói và ngôn ngữ.'
|
220 |
+
- Chào em, Nguyên tắc để gãy xương mau lành là cần cố định thật tốt, em bị gãy xương
|
221 |
+
vùng cổ tay, nếu cố gắng vận động quá nhiều khi xương chưa lành sẽ gây di lệch
|
222 |
+
và xương không thể lành lại. Ngoại trừ trường hợp có đặt dụng cụ kết hợp xương,
|
223 |
+
các trường hợp gãy xương khác nên tái khám để bác sĩ đánh giá mức độ lành trước
|
224 |
+
khi vận động ảnh hưởng tới vùng gãy. Em nên tái khám để bác sĩ điều trị kiểm tra
|
225 |
+
lại vị trí gãy em nhé! Thân mến.
|
226 |
+
- Gãy xương gây ảnh hưởng nhiều đến chất lượng sống Chào em, Thời gian liền xương
|
227 |
+
trung bình đối với gãy xương cành tươi ở trẻ là khoảng 3-4 tuần, tuy nhiên để
|
228 |
+
xương trở lại cấu trúc ban đầu (độc chắc, khỏe) thì phải mất thêm 1 thời gian
|
229 |
+
nữa. Có rất nhiều loại hình thể dục thể thao, với các môn thể thao không cần dùng
|
230 |
+
sức ở tay và ít nguy cơ té ngã như chạy bộ thì em có thể tham gia sớm ngay khi
|
231 |
+
vừa tháo bột/nẹp. Với các môn có tính cạnh tranh như đá bóng, thì mặc dù môn thể
|
232 |
+
thao này dùng chân là chủ yếu nhưng lại có tính va chạm cao, nguy cơ té ngã là
|
233 |
+
có, khi lỡ có sự cố ngoài ý muốn như ngã chống tay thì em có khả năng bị gãy xương
|
234 |
+
lại. Vì thế, dù là gãy xương ở cổ tay nhưng an toàn nhất vẫn là 3 tháng sau mới
|
235 |
+
chơi lại các môn thể thao mang tính cạnh tranh, va chạm như đá bóng. Với các môn
|
236 |
+
thể thao phải dùng lực của cổ tay (bóng rổ, bóng chuyền...) thì sau 3 tháng kể
|
237 |
+
từ lúc gãy tay, cần phối hợp tập luyện với huấn luyện viên, tùy mức độ hồi phục
|
238 |
+
khác nhau ở mỗi người mà huấn luyện viên quyết định có tham gia thi đấu được hay
|
239 |
+
không.
|
240 |
+
model-index:
|
241 |
+
- name: SentenceTransformer based on bkai-foundation-models/vietnamese-bi-encoder
|
242 |
+
results:
|
243 |
+
- task:
|
244 |
+
type: reranking
|
245 |
+
name: Reranking
|
246 |
+
dataset:
|
247 |
+
name: dev eval
|
248 |
+
type: dev-eval
|
249 |
+
metrics:
|
250 |
+
- type: map
|
251 |
+
value: 0.9754285714285714
|
252 |
+
name: Map
|
253 |
+
- type: mrr@1
|
254 |
+
value: 0.9508571428571428
|
255 |
+
name: Mrr@1
|
256 |
+
- type: ndcg@1
|
257 |
+
value: 0.9508571428571428
|
258 |
+
name: Ndcg@1
|
259 |
+
---
|
260 |
+
|
261 |
+
# SentenceTransformer based on bkai-foundation-models/vietnamese-bi-encoder
|
262 |
+
|
263 |
+
This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [bkai-foundation-models/vietnamese-bi-encoder](https://huggingface.co/bkai-foundation-models/vietnamese-bi-encoder). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
|
264 |
+
|
265 |
+
## Model Details
|
266 |
+
|
267 |
+
### Model Description
|
268 |
+
- **Model Type:** Sentence Transformer
|
269 |
+
- **Base model:** [bkai-foundation-models/vietnamese-bi-encoder](https://huggingface.co/bkai-foundation-models/vietnamese-bi-encoder) <!-- at revision 84f9d9ada0d1a3c37557398b9ae9fcedcdf40be0 -->
|
270 |
+
- **Maximum Sequence Length:** 256 tokens
|
271 |
+
- **Output Dimensionality:** 768 tokens
|
272 |
+
- **Similarity Function:** Cosine Similarity
|
273 |
+
<!-- - **Training Dataset:** Unknown -->
|
274 |
+
<!-- - **Language:** Unknown -->
|
275 |
+
<!-- - **License:** Unknown -->
|
276 |
+
|
277 |
+
### Model Sources
|
278 |
+
|
279 |
+
- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
|
280 |
+
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
|
281 |
+
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
|
282 |
+
|
283 |
+
### Full Model Architecture
|
284 |
+
|
285 |
+
```
|
286 |
+
SentenceTransformer(
|
287 |
+
(0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: RobertaModel
|
288 |
+
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
|
289 |
+
)
|
290 |
+
```
|
291 |
+
|
292 |
+
## Usage
|
293 |
+
|
294 |
+
### Direct Usage (Sentence Transformers)
|
295 |
+
|
296 |
+
First install the Sentence Transformers library:
|
297 |
+
|
298 |
+
```bash
|
299 |
+
pip install -U sentence-transformers
|
300 |
+
```
|
301 |
+
|
302 |
+
Then you can load this model and run inference.
|
303 |
+
```python
|
304 |
+
from sentence_transformers import SentenceTransformer
|
305 |
+
|
306 |
+
# Download from the 🤗 Hub
|
307 |
+
model = SentenceTransformer("meandyou200175/vn_bi_encoder_med")
|
308 |
+
# Run inference
|
309 |
+
sentences = [
|
310 |
+
'Chào BS ạ,Bác sĩ ơi, cháu năm nay 14 tuổi. Cháu bị gãy cành tươi đầu dưới xương quay ở cổ tay (gãy 1/3). Tay cháu hiện tại đã can được khoảng 2 tuần ạ. Cho cháu hỏi là bao lâu nữa thì cháu có thể chơi thể thao (hay bóng đá) trở lại ạ? Cháu cảm ơn bác!',
|
311 |
+
'Gãy xương gây ảnh hưởng nhiều đến chất lượng sống Chào em, Thời gian liền xương trung bình đối với gãy xương cành tươi ở trẻ là khoảng 3-4 tuần, tuy nhiên để xương trở lại cấu trúc ban đầu (độc chắc, khỏe) thì phải mất thêm 1 thời gian nữa. Có rất nhiều loại hình thể dục thể thao, với các môn thể thao không cần dùng sức ở tay và ít nguy cơ té ngã như chạy bộ thì em có thể tham gia sớm ngay khi vừa tháo bột/nẹp. Với các môn có tính cạnh tranh như đá bóng, thì mặc dù môn thể thao này dùng chân là chủ yếu nhưng lại có tính va chạm cao, nguy cơ té ngã là có, khi lỡ có sự cố ngoài ý muốn như ngã chống tay thì em có khả năng bị gãy xương lại. Vì thế, dù là gãy xương ở cổ tay nhưng an toàn nhất vẫn là 3 tháng sau mới chơi lại các môn thể thao mang tính cạnh tranh, va chạm như đá bóng. Với các môn thể thao phải dùng lực của cổ tay (bóng rổ, bóng chuyền...) thì sau 3 tháng kể từ lúc gãy tay, cần phối hợp tập luyện với huấn luyện viên, tùy mức độ hồi phục khác nhau ở mỗi người mà huấn luyện viên quyết định có tham gia thi đấu được hay không.',
|
312 |
+
'Chào em, Nguyên tắc để gãy xương mau lành là cần cố định thật tốt, em bị gãy xương vùng cổ tay, nếu cố gắng vận động quá nhiều khi xương chưa lành sẽ gây di lệch và xương không thể lành lại. Ngoại trừ trường hợp có đặt dụng cụ kết hợp xương, các trường hợp gãy xương khác nên tái khám để bác sĩ đánh giá mức độ lành trước khi vận động ảnh hưởng tới vùng gãy. Em nên tái khám để bác sĩ điều trị kiểm tra lại vị trí gãy em nhé! Thân mến.',
|
313 |
+
]
|
314 |
+
embeddings = model.encode(sentences)
|
315 |
+
print(embeddings.shape)
|
316 |
+
# [3, 768]
|
317 |
+
|
318 |
+
# Get the similarity scores for the embeddings
|
319 |
+
similarities = model.similarity(embeddings, embeddings)
|
320 |
+
print(similarities.shape)
|
321 |
+
# [3, 3]
|
322 |
+
```
|
323 |
+
|
324 |
+
<!--
|
325 |
+
### Direct Usage (Transformers)
|
326 |
+
|
327 |
+
<details><summary>Click to see the direct usage in Transformers</summary>
|
328 |
+
|
329 |
+
</details>
|
330 |
+
-->
|
331 |
+
|
332 |
+
<!--
|
333 |
+
### Downstream Usage (Sentence Transformers)
|
334 |
+
|
335 |
+
You can finetune this model on your own dataset.
|
336 |
+
|
337 |
+
<details><summary>Click to expand</summary>
|
338 |
+
|
339 |
+
</details>
|
340 |
+
-->
|
341 |
+
|
342 |
+
<!--
|
343 |
+
### Out-of-Scope Use
|
344 |
+
|
345 |
+
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
|
346 |
+
-->
|
347 |
+
|
348 |
+
## Evaluation
|
349 |
+
|
350 |
+
### Metrics
|
351 |
+
|
352 |
+
#### Reranking
|
353 |
+
* Dataset: `dev-eval`
|
354 |
+
* Evaluated with [<code>RerankingEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.RerankingEvaluator)
|
355 |
+
|
356 |
+
| Metric | Value |
|
357 |
+
|:--------|:-----------|
|
358 |
+
| **map** | **0.9754** |
|
359 |
+
| mrr@1 | 0.9509 |
|
360 |
+
| ndcg@1 | 0.9509 |
|
361 |
+
|
362 |
+
<!--
|
363 |
+
## Bias, Risks and Limitations
|
364 |
+
|
365 |
+
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
|
366 |
+
-->
|
367 |
+
|
368 |
+
<!--
|
369 |
+
### Recommendations
|
370 |
+
|
371 |
+
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
|
372 |
+
-->
|
373 |
+
|
374 |
+
## Training Details
|
375 |
+
|
376 |
+
### Training Dataset
|
377 |
+
|
378 |
+
#### Unnamed Dataset
|
379 |
+
|
380 |
+
|
381 |
+
* Size: 43,000 training samples
|
382 |
+
* Columns: <code>query</code>, <code>positive</code>, and <code>negative</code>
|
383 |
+
* Approximate statistics based on the first 1000 samples:
|
384 |
+
| | query | positive | negative |
|
385 |
+
|:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
|
386 |
+
| type | string | string | string |
|
387 |
+
| details | <ul><li>min: 5 tokens</li><li>mean: 75.27 tokens</li><li>max: 256 tokens</li></ul> | <ul><li>min: 36 tokens</li><li>mean: 190.17 tokens</li><li>max: 256 tokens</li></ul> | <ul><li>min: 39 tokens</li><li>mean: 181.03 tokens</li><li>max: 256 tokens</li></ul> |
|
388 |
+
* Samples:
|
389 |
+
| query | positive | negative |
|
390 |
+
|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
391 |
+
| <code>Chào bác sĩ,
|
392 |
<br>
|
393 |
<br>Em là nam nhưng vú to làm em rất mặc cảm. Em đã đi khám bệnh, sau khi làm các xét nghiệm và chiếu chụp, bác sĩ xác định em phì đại tuyến vú.
|
394 |
<br>
|
395 |
<br>Theo bác sĩ em nên dùng thuốc (nội khoa) hơn hay phẫu thuật (ngoại khoa) hơn? Mỗi phương pháp có lợi hay hại gì ạ? Em băn khoăn lắm, rất mong được bác sĩ tư vấn. Em cảm ơn bác sĩ!</code> | <code>Hùng thân mến, Vú to nam giới là tình trạng phì đại tuyến vú , thường không đối xứng hoặc một bên và có thể có mật độ mềm. Chẩn đoán phân biệt với ung thư vú và vú to nam giới giả, thường thấy ở nam giới béo phì và được đặc trưng bởi lắng đọng mô mỡ mà không có tăng sinh tuyến. Nguyên nhân là do tăng hoạt động của estrogen hoặc tăng tỷ số estrogen-androgen Điều trị phụ thuộc vào nguyên nhân gây vú to nam giới, phẫu thuật hay điều trị nội khoa phù hợp với các trường hợp khác nhau. Nội khoa điều trị hormon thay thế sẽ làm cải thiện vú to nam giới ở bệnh nhân nam suy sinh dục. Vú to nam giới do thuốc thì ngưng thuốc, vú to nam giới do dậy thì thì theo dõi. Phẫu thuật được chỉ định nếu có các vấn đề tâm lý, thẩm mỹ trường hợp nhu mô vú tiếp tục phát triển, ác tính. Trân trọng.</code> | <code>Chào em, Với kết quả giải phẫu bệnh của em, cho thấy bướu giáp này
|
396 |
<br>thuộc loại lành tính, nên không nhất thiết phải phẫu thuật ngay trong lúc này
|
397 |
<br>em à. Em có thể điều trị nội khoa vài tháng, để hạn chế sự phát triển của bướu, theo
|
398 |
<br>dõi bệnh có đáp ứng với thuốc không và độ lớn của bướu (được đánh giá qua siêu
|
399 |
<br>âm). Trường hợp bướu không đáp ứng với điều trị, hoặc kích thước bướu lớn nhanh, có
|
400 |
<br>dấu hiệu chèn ép, khó thở, khàn giọng, kèm nổi hạch cổ…thì cần tiến hành phẫu
|
401 |
<br>thuật. Thân mến!</code> |
|
402 |
+
| <code>Thuốc xịt mũi Thái Dương điều trị hắt hơi, sổ mũi, nghẹt mũi (20ml)</code> | <code>Mô tả ngắn:<br>Thuốc Xịt Mũi Thái Dương là sản phẩm được sản xuất bởi Công ty Cổ phần Sao Thái Dương, thuốc có thành phần chinh là Nghệ vàng ( Rhizoma Curcuma longae ), Menthol ( Mentholum ), Camphor ( Comphora ), được dùng trong các trường hợp: hắt hơi liên tục nhiều lần không dứt, sổ mũi, nghẹt mũi, ứ đọng dịch đờm nhầy trong xoang mũi, xoang trán...mỗi khi thay đổi thời tiết hay hít phải bụi nhà, phấn hoa, mùi lạ...; ngứa mũi, khô mũi, sổ mũi, cảm giác khó chịu ở mũi, viêm mũi do cảm cúm... <br> Thuốc Xịt Mũi Thái Dương được bào chế dưới dạng chất lỏng màu vàng, mùi thơm tinh dầu, pH 5-7. Hộp 1 lọ x 20 ml.<br>Thành phần:<br>Nghệ: 2<br>Menthol: 20<br>DL-camphor: 20mg<br>Chỉ định:<br>Thuốc Xịt Mũi Thái Dương được chỉ định dùng trong các trường hợp sau:<br>Hắt hơi liên tục nhiều lần không dứt, sổ mũi, nghẹt mũi, ứ đọng dịch đờm nhầy trong xoang mũi, xoang trán...mỗi khi thay đổi thời tiết hay hít phải bụi nhà, phấn hoa, mùi lạ...<br>Ngứa mũi, khô mũi, sổ mũi, cảm giác khó chịu ở mũi, viêm mũi do cảm cúm...</code> | <code>Mô tả ngắn:<br>Thuốc Xylogen là sản phẩm được sản xuất bởi Công ty Cổ phần Dược Khoa, thuốc có thành phần chính là xylometazoline hydroclorid. Xylogen là thuốc xịt thế hệ mới cho mũi nhanh thông thoáng, dễ chịu trong các trường hợp ngạt mũi, cảm cúm, viêm mũi, viêm xoang. <br> Thuốc Xylogen được bào chế dưới dạng dung dịch, mỗi ml dung dịch chứa 15mg xylometazoline hydroclorid. Thuốc được đóng gói theo quy cách hộp 1 lọ 15ml.<br>Thành phần:<br>Xylometazolin hydroclorid: 0.1%<br>Chỉ định:<br>Thuốc Xylogen Dược Khoa được chỉ định dùng trong các trường hợp sau:<br>Ðiều trị ngạt mũi, viêm mũi , viêm xoang , viêm mũi họng, cảm cúm.</code> |
|
403 |
+
| <code>Khoảng 1 tuần nay chân em bị nổi những mụn nhỏ li ti rất ngứa và lây lan, có mụn mềm, có mụn có mài ngay đầu mụn. 3 ngày đầu còn lây sang vùng cánh tay và bụng (nhưng không nhiều), ngay cả vết trầy xước nhỏ ở đầu gối cũng lâu lành.
|
404 |
<br>
|
405 |
<br>Em có đi nhà thuốc và được tư vấn thoa kem Mật Ong Madeleine Ritchie nhưng không thấy hiệu quả. Hiện tại em đang thoa kem Beprosone nhưng cũng không thấy cải thiện nhiều.
|
406 |
<br>
|
407 |
<br>Em không bị côn trùng đốt cũng nhưng không sử dụng mỹ phẩm gì cả, nên không hiểu sao lại bị như vậy. BS có thể tư vấn cho em thuốc thoa đồng thời trị thâm không ạ? Em sợ sẽ để lại thâm rất xấu nên lo lắng. Đây là những loại kem thoa em đã sử dụng nhưng không thấy hiệu quả. Chân thành cảm ơn BS.
|
408 |
<br>
|
409 |
<br>(Bạn đọc Nguyễn Lê Thanh Tâm)</code> | <code> Chào em, Em chụp hình những tuýp kem đã dùng nhưng không đưa kèm hình sang thương nên rất khó cho bác sĩ để chẩn đoán bệnh của em là gì và không thể kê toa cho em trong lúc này. Nếu được em vui lòng cung cấp hình ảnh cho chương trình. Em cũng không nên tự ý bôi thuốc vì có thể không điều trị được bệnh mà còn gây ra nhiều tác dụng phụ ảnh hưởng sức khỏe. Nếu quá lo lắng, em nên đến gặp bác sĩ chuyên khoa Da Liễu để được thăm khám trực tiếp và chỉ định xét nghiệm cần thiết để chẩn đoán bệnh em nhé! Thân mến! </code> | <code>Chào em, Hiện tượng nổi mụn nước kèm cảm giác đau và ngứa khi sử dụng thuốc trị sẹo cho thấy vết thương không hợp với thuốc này, có hiện tượng viêm da kích ứng. Em nên ngừng sử dụng loại thuốc trị sẹo này và đổi thử sang loại khác. An toàn nhất là em khám chuyên khoa da liễu để bác sĩ tìm loại thuốc phù hợp nhất cho em, em nhé.</code> |
|
410 |
+
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
|
411 |
+
```json
|
412 |
+
{
|
413 |
+
"scale": 20.0,
|
414 |
+
"similarity_fct": "cos_sim"
|
415 |
+
}
|
416 |
+
```
|
417 |
+
|
418 |
+
### Evaluation Dataset
|
419 |
+
|
420 |
+
#### Unnamed Dataset
|
421 |
+
|
422 |
+
|
423 |
+
* Size: 7,000 evaluation samples
|
424 |
+
* Columns: <code>query</code>, <code>positive</code>, and <code>negative</code>
|
425 |
+
* Approximate statistics based on the first 1000 samples:
|
426 |
+
| | query | positive | negative |
|
427 |
+
|:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|
|
428 |
+
| type | string | string | string |
|
429 |
+
| details | <ul><li>min: 5 tokens</li><li>mean: 73.91 tokens</li><li>max: 256 tokens</li></ul> | <ul><li>min: 43 tokens</li><li>mean: 184.28 tokens</li><li>max: 256 tokens</li></ul> | <ul><li>min: 40 tokens</li><li>mean: 185.34 tokens</li><li>max: 256 tokens</li></ul> |
|
430 |
+
* Samples:
|
431 |
+
| query | positive | negative |
|
432 |
+
|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
|
433 |
+
| <code>Thuốc Esseil-10 Davipharm điều trị tăng huyết áp (10 vỉ x 10 viên)</code> | <code>Mô tả ngắn:<br>Thuốc Esseil-10 là sản phẩm được sản xuất bởi Công ty Cổ phần Dược phẩm Đạt Vi Phú. Thuốc có thành phần chính là cilnidipin, được chỉ định để điều trị tăng huyết áp. <br> Thuốc Esseil-10 được bào chế dưới dạng viên nén tròn, bao phim màu vàng, một mặt có dập logo, mặt kia có dập gạch ngang và được đóng gói theo quy cách hộp 10 vỉ x 10 viên.<br>Thành phần:<br>Cilnidipine: 10mg<br>Chỉ định:<br>Thuốc Esseil-10 được chỉ định dùng trong các trường hợp sau: Cilnidipin được chỉ định để điều trị tăng huyết áp.</code> | <code>Mô tả ngắn:<br>Rossuwell 10 là sản phẩm của Công ty Agio Pharmaceuticals Ltd., với thành phần chính là Rosuvastatin, được dùng để điều trị tăng cholesterol máu nguyên phát và rối loạn lipid máu hỗn hợp không đáp ứng với các chế độ ăn kiêng, hỗ trợ các biện pháp điều trị giảm lipid khác trong điều trị tăng cholesterol máu gia đình kiểu đồng hợp tử.<br>Thành phần:<br>Rosuvastatin: 10mg<br>Chỉ định:<br>Rossuwell 10 được chỉ định dùng trong các trường hợp:<br>Điều trị tăng cholesterol máu nguyên phát và rối loạn lipid máu hỗn hợp không đáp ứng với các chế độ ăn kiêng. Hỗ trợ các biện pháp điều trị giảm lipid khác trong điều trị tăng cholesterol máu gia đình kiểu đồng hợp tử.</code> |
|
434 |
+
| <code>Thưa BS,
|
435 |
<br>
|
436 |
<br>Con là nữ, năm nay 14 tuổi. Dạo gần đây do uống thuốc nhiều con hay bị táo bón. Con có tìm hiểu sơ về bệnh trĩ, nhưng khi đi đại tiện con không bị chảy máu gì cả. Gần đây con có cảm giác hơi vướng ở hậu môn, không hẳn là ở hậu môn, cứ như ở ngoài phía 2 bên mép thôi.
|
437 |
<br>
|
438 |
<br>Cứ thi thoảng là bị rồi hình như tự hết thì phải, có cảm giác khi đi ngoài chưa đi hết và thi thoảng thấy như có vật gì nhỏ lòi ra ngoài nhưng tự cơ thể có thể đẩy vô được bình thường. Dấu hiệu như vậy giống với bệnh nào nhất vậy BS? Con cảm ơn BS.</code> | <code> Chào em, Theo thông tin em cung cấp, nhiều khả năng em có , nhưng ở mức độ nhẹ khoảng trĩ độ 1 mà thôi. Cảm giác đi cầu chưa hết thường là do khối phân tròn nhỏ sót lại, khó xuất ra do mô xung quanh hậu môn đã phù nề kèm với búi trĩ sau khi em đã cố rặn một lúc lâu, cũng có thể đó chính là búi trĩ nội. Vì thế em không cần và không nên ráng rặn tiếp để xuất hết khối phân này, ở lần đi tiêu tiếp theo sẽ tự khắc thải ra được. Tình trạng này thì không cần dùng thuốc, chỉ cần thay đổi lối sống bằng cách ăn nhiều rau xanh, trái cây, hạn chế thực phẩm cay, nhiều dầu mỡ, uống nhiều nước, tối thiểu phải 2-3 lít nước mỗi ngày, không ngồi lâu trên 5 phút khi đi vệ sinh, tập thể dục đều đặn sẽ giúp em cải thiện tình trạng này, em nhé. Thân mến!</code> | <code> Chào em, Chỉ thông qua mô tả của em BS chưa thể xác định được em bị bệnh gì. Triệu chứng em mô tả có thể xuất hiện khi , polyp hậu môn, rối loạn thần kinh chi phối cảm giác… Em cần đến khám chuyên khoa tiêu hóa (khám hậu môn) để BS trực tiếp thăm khám và tìm nguyên nhân. Tại TPHCM em có thể đến khám tại BV Đại học Y Dược TPHCM, BV Bình Dân, BV Nhân dân Gia Định, BV Nhân dân 115… Thân mến! </code> |
|
439 |
+
| <code>Thuốc Fexet Getz điều trị viêm mũi dị ứng, mày đay tự phát mãn tính (2 vỉ x 5 viên)</code> | <code>Mô tả ngắn:<br>Fexet 120 mg có thành phần chính fexofenadine, do công ty Getzpharma sản xuất, được dùng để điều trị làm giảm các triệu chứng có liên quan đến bệnh viêm mũi dị ứng theo mùa và nổi mề đay tự phát mãn tính.<br>Thành phần:<br>Fexofenadine: 120mg<br>Chỉ định:<br>Thuốc Fexet 120 mg được chỉ định dùng trong các trường hợp sau:<br>Ðiều trị làm giảm các triệu chứng có liên quan đến bệnh:<br>Viêm mũi dị ứng theo mùa bao gồm hắt hơi, sổ mũi , ngứa mũi, miệng, cổ họng, chảy nước mắt, đỏ mắt. Nổi mề đay tự phát mãn tính.</code> | <code>Mô tả ngắn:<br>Cetirizin 10mg Domesco được sản xuất bởi công ty cổ phần xuất nhập khẩu y tế Domesco, với thành phần chính cetirizine hydrochloride, là thuốc dùng để điều trị triệu chứng viêm mũi dị ứng dai dẳng, viêm mũi dị ứng theo mùa, mày đay mạn tính vô căn ở người lớn và trẻ em trên 12 tuổi, viêm mũi dị ứng theo mùa ở trẻ em trên 12 tuổi, viêm kết mạc dị ứng.<br>Thành phần:<br>Cetirizin dihydrochlorid: 10mg<br>Chỉ định:<br>Thuốc Cetirizin 10mg Domesco được chỉ định dùng trong các trường hợp sau:<br>Viêm mũi dị ứng dai dẳng, viêm mũi dị ứng theo mùa ở người lớn và trẻ em trên 12 tuổi. Mày đay mạn tính vô căn ở người lớn và trẻ em trên 12 tuổi. Viêm kết mạc dị ứng .</code> |
|
440 |
+
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
|
441 |
+
```json
|
442 |
+
{
|
443 |
+
"scale": 20.0,
|
444 |
+
"similarity_fct": "cos_sim"
|
445 |
+
}
|
446 |
+
```
|
447 |
+
|
448 |
+
### Training Hyperparameters
|
449 |
+
#### Non-Default Hyperparameters
|
450 |
+
|
451 |
+
- `eval_strategy`: steps
|
452 |
+
- `per_device_train_batch_size`: 16
|
453 |
+
- `per_device_eval_batch_size`: 16
|
454 |
+
- `learning_rate`: 2e-05
|
455 |
+
- `num_train_epochs`: 5
|
456 |
+
- `warmup_ratio`: 0.1
|
457 |
+
- `fp16`: True
|
458 |
+
- `batch_sampler`: no_duplicates
|
459 |
+
|
460 |
+
#### All Hyperparameters
|
461 |
+
<details><summary>Click to expand</summary>
|
462 |
+
|
463 |
+
- `overwrite_output_dir`: False
|
464 |
+
- `do_predict`: False
|
465 |
+
- `eval_strategy`: steps
|
466 |
+
- `prediction_loss_only`: True
|
467 |
+
- `per_device_train_batch_size`: 16
|
468 |
+
- `per_device_eval_batch_size`: 16
|
469 |
+
- `per_gpu_train_batch_size`: None
|
470 |
+
- `per_gpu_eval_batch_size`: None
|
471 |
+
- `gradient_accumulation_steps`: 1
|
472 |
+
- `eval_accumulation_steps`: None
|
473 |
+
- `torch_empty_cache_steps`: None
|
474 |
+
- `learning_rate`: 2e-05
|
475 |
+
- `weight_decay`: 0.0
|
476 |
+
- `adam_beta1`: 0.9
|
477 |
+
- `adam_beta2`: 0.999
|
478 |
+
- `adam_epsilon`: 1e-08
|
479 |
+
- `max_grad_norm`: 1.0
|
480 |
+
- `num_train_epochs`: 5
|
481 |
+
- `max_steps`: -1
|
482 |
+
- `lr_scheduler_type`: linear
|
483 |
+
- `lr_scheduler_kwargs`: {}
|
484 |
+
- `warmup_ratio`: 0.1
|
485 |
+
- `warmup_steps`: 0
|
486 |
+
- `log_level`: passive
|
487 |
+
- `log_level_replica`: warning
|
488 |
+
- `log_on_each_node`: True
|
489 |
+
- `logging_nan_inf_filter`: True
|
490 |
+
- `save_safetensors`: True
|
491 |
+
- `save_on_each_node`: False
|
492 |
+
- `save_only_model`: False
|
493 |
+
- `restore_callback_states_from_checkpoint`: False
|
494 |
+
- `no_cuda`: False
|
495 |
+
- `use_cpu`: False
|
496 |
+
- `use_mps_device`: False
|
497 |
+
- `seed`: 42
|
498 |
+
- `data_seed`: None
|
499 |
+
- `jit_mode_eval`: False
|
500 |
+
- `use_ipex`: False
|
501 |
+
- `bf16`: False
|
502 |
+
- `fp16`: True
|
503 |
+
- `fp16_opt_level`: O1
|
504 |
+
- `half_precision_backend`: auto
|
505 |
+
- `bf16_full_eval`: False
|
506 |
+
- `fp16_full_eval`: False
|
507 |
+
- `tf32`: None
|
508 |
+
- `local_rank`: 0
|
509 |
+
- `ddp_backend`: None
|
510 |
+
- `tpu_num_cores`: None
|
511 |
+
- `tpu_metrics_debug`: False
|
512 |
+
- `debug`: []
|
513 |
+
- `dataloader_drop_last`: False
|
514 |
+
- `dataloader_num_workers`: 0
|
515 |
+
- `dataloader_prefetch_factor`: None
|
516 |
+
- `past_index`: -1
|
517 |
+
- `disable_tqdm`: False
|
518 |
+
- `remove_unused_columns`: True
|
519 |
+
- `label_names`: None
|
520 |
+
- `load_best_model_at_end`: False
|
521 |
+
- `ignore_data_skip`: False
|
522 |
+
- `fsdp`: []
|
523 |
+
- `fsdp_min_num_params`: 0
|
524 |
+
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
|
525 |
+
- `fsdp_transformer_layer_cls_to_wrap`: None
|
526 |
+
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
|
527 |
+
- `deepspeed`: None
|
528 |
+
- `label_smoothing_factor`: 0.0
|
529 |
+
- `optim`: adamw_torch
|
530 |
+
- `optim_args`: None
|
531 |
+
- `adafactor`: False
|
532 |
+
- `group_by_length`: False
|
533 |
+
- `length_column_name`: length
|
534 |
+
- `ddp_find_unused_parameters`: None
|
535 |
+
- `ddp_bucket_cap_mb`: None
|
536 |
+
- `ddp_broadcast_buffers`: False
|
537 |
+
- `dataloader_pin_memory`: True
|
538 |
+
- `dataloader_persistent_workers`: False
|
539 |
+
- `skip_memory_metrics`: True
|
540 |
+
- `use_legacy_prediction_loop`: False
|
541 |
+
- `push_to_hub`: False
|
542 |
+
- `resume_from_checkpoint`: None
|
543 |
+
- `hub_model_id`: None
|
544 |
+
- `hub_strategy`: every_save
|
545 |
+
- `hub_private_repo`: False
|
546 |
+
- `hub_always_push`: False
|
547 |
+
- `gradient_checkpointing`: False
|
548 |
+
- `gradient_checkpointing_kwargs`: None
|
549 |
+
- `include_inputs_for_metrics`: False
|
550 |
+
- `eval_do_concat_batches`: True
|
551 |
+
- `fp16_backend`: auto
|
552 |
+
- `push_to_hub_model_id`: None
|
553 |
+
- `push_to_hub_organization`: None
|
554 |
+
- `mp_parameters`:
|
555 |
+
- `auto_find_batch_size`: False
|
556 |
+
- `full_determinism`: False
|
557 |
+
- `torchdynamo`: None
|
558 |
+
- `ray_scope`: last
|
559 |
+
- `ddp_timeout`: 1800
|
560 |
+
- `torch_compile`: False
|
561 |
+
- `torch_compile_backend`: None
|
562 |
+
- `torch_compile_mode`: None
|
563 |
+
- `dispatch_batches`: None
|
564 |
+
- `split_batches`: None
|
565 |
+
- `include_tokens_per_second`: False
|
566 |
+
- `include_num_input_tokens_seen`: False
|
567 |
+
- `neftune_noise_alpha`: None
|
568 |
+
- `optim_target_modules`: None
|
569 |
+
- `batch_eval_metrics`: False
|
570 |
+
- `eval_on_start`: False
|
571 |
+
- `use_liger_kernel`: False
|
572 |
+
- `eval_use_gather_object`: False
|
573 |
+
- `batch_sampler`: no_duplicates
|
574 |
+
- `multi_dataset_batch_sampler`: proportional
|
575 |
+
|
576 |
+
</details>
|
577 |
+
|
578 |
+
### Training Logs
|
579 |
+
<details><summary>Click to expand</summary>
|
580 |
+
|
581 |
+
| Epoch | Step | Training Loss | Validation Loss | dev-eval_map |
|
582 |
+
|:------:|:-----:|:-------------:|:---------------:|:------------:|
|
583 |
+
| 0 | 0 | - | - | 0.9191 |
|
584 |
+
| 0.0372 | 100 | 0.6965 | - | - |
|
585 |
+
| 0.0744 | 200 | 0.5554 | - | - |
|
586 |
+
| 0.1116 | 300 | 0.4662 | - | - |
|
587 |
+
| 0.1488 | 400 | 0.4581 | - | - |
|
588 |
+
| 0.1860 | 500 | 0.4082 | - | - |
|
589 |
+
| 0.2232 | 600 | 0.3579 | - | - |
|
590 |
+
| 0.2604 | 700 | 0.3695 | - | - |
|
591 |
+
| 0.2976 | 800 | 0.3804 | - | - |
|
592 |
+
| 0.3348 | 900 | 0.354 | - | - |
|
593 |
+
| 0.3720 | 1000 | 0.3455 | 0.3055 | 0.9551 |
|
594 |
+
| 0.4092 | 1100 | 0.3501 | - | - |
|
595 |
+
| 0.4464 | 1200 | 0.3036 | - | - |
|
596 |
+
| 0.4836 | 1300 | 0.3487 | - | - |
|
597 |
+
| 0.5208 | 1400 | 0.2959 | - | - |
|
598 |
+
| 0.5580 | 1500 | 0.2895 | - | - |
|
599 |
+
| 0.5952 | 1600 | 0.2986 | - | - |
|
600 |
+
| 0.6324 | 1700 | 0.3008 | - | - |
|
601 |
+
| 0.6696 | 1800 | 0.2798 | - | - |
|
602 |
+
| 0.7068 | 1900 | 0.2771 | - | - |
|
603 |
+
| 0.7440 | 2000 | 0.2963 | 0.2546 | 0.9616 |
|
604 |
+
| 0.7812 | 2100 | 0.2646 | - | - |
|
605 |
+
| 0.8185 | 2200 | 0.3007 | - | - |
|
606 |
+
| 0.8557 | 2300 | 0.2672 | - | - |
|
607 |
+
| 0.8929 | 2400 | 0.2597 | - | - |
|
608 |
+
| 0.9301 | 2500 | 0.2621 | - | - |
|
609 |
+
| 0.9673 | 2600 | 0.2349 | - | - |
|
610 |
+
| 1.0045 | 2700 | 0.2548 | - | - |
|
611 |
+
| 1.0417 | 2800 | 0.2257 | - | - |
|
612 |
+
| 1.0789 | 2900 | 0.2133 | - | - |
|
613 |
+
| 1.1161 | 3000 | 0.2034 | 0.2212 | 0.9674 |
|
614 |
+
| 1.1533 | 3100 | 0.2275 | - | - |
|
615 |
+
| 1.1905 | 3200 | 0.1724 | - | - |
|
616 |
+
| 1.2277 | 3300 | 0.1564 | - | - |
|
617 |
+
| 1.2649 | 3400 | 0.1708 | - | - |
|
618 |
+
| 1.3021 | 3500 | 0.1664 | - | - |
|
619 |
+
| 1.3393 | 3600 | 0.1324 | - | - |
|
620 |
+
| 1.3765 | 3700 | 0.1291 | - | - |
|
621 |
+
| 1.4137 | 3800 | 0.1119 | - | - |
|
622 |
+
| 1.4509 | 3900 | 0.1073 | - | - |
|
623 |
+
| 1.4881 | 4000 | 0.1066 | 0.2152 | 0.9688 |
|
624 |
+
| 1.5253 | 4100 | 0.0776 | - | - |
|
625 |
+
| 1.5625 | 4200 | 0.0826 | - | - |
|
626 |
+
| 1.5997 | 4300 | 0.0872 | - | - |
|
627 |
+
| 1.6369 | 4400 | 0.0882 | - | - |
|
628 |
+
| 1.6741 | 4500 | 0.077 | - | - |
|
629 |
+
| 1.7113 | 4600 | 0.0928 | - | - |
|
630 |
+
| 1.7485 | 4700 | 0.0818 | - | - |
|
631 |
+
| 1.7857 | 4800 | 0.0743 | - | - |
|
632 |
+
| 1.8229 | 4900 | 0.095 | - | - |
|
633 |
+
| 1.8601 | 5000 | 0.0823 | 0.2062 | 0.969 |
|
634 |
+
| 1.8973 | 5100 | 0.0825 | - | - |
|
635 |
+
| 1.9345 | 5200 | 0.0752 | - | - |
|
636 |
+
| 1.9717 | 5300 | 0.083 | - | - |
|
637 |
+
| 2.0089 | 5400 | 0.0732 | - | - |
|
638 |
+
| 2.0461 | 5500 | 0.0651 | - | - |
|
639 |
+
| 2.0833 | 5600 | 0.0625 | - | - |
|
640 |
+
| 2.1205 | 5700 | 0.0703 | - | - |
|
641 |
+
| 2.1577 | 5800 | 0.0686 | - | - |
|
642 |
+
| 2.1949 | 5900 | 0.0575 | - | - |
|
643 |
+
| 2.2321 | 6000 | 0.0501 | 0.2003 | 0.9717 |
|
644 |
+
| 2.2693 | 6100 | 0.0608 | - | - |
|
645 |
+
| 2.3065 | 6200 | 0.057 | - | - |
|
646 |
+
| 2.3438 | 6300 | 0.0362 | - | - |
|
647 |
+
| 2.3810 | 6400 | 0.0401 | - | - |
|
648 |
+
| 2.4182 | 6500 | 0.0324 | - | - |
|
649 |
+
| 2.4554 | 6600 | 0.0317 | - | - |
|
650 |
+
| 2.4926 | 6700 | 0.0312 | - | - |
|
651 |
+
| 2.5298 | 6800 | 0.0251 | - | - |
|
652 |
+
| 2.5670 | 6900 | 0.0249 | - | - |
|
653 |
+
| 2.6042 | 7000 | 0.0297 | 0.1894 | 0.9734 |
|
654 |
+
| 2.6414 | 7100 | 0.027 | - | - |
|
655 |
+
| 2.6786 | 7200 | 0.0252 | - | - |
|
656 |
+
| 2.7158 | 7300 | 0.0348 | - | - |
|
657 |
+
| 2.7530 | 7400 | 0.025 | - | - |
|
658 |
+
| 2.7902 | 7500 | 0.0268 | - | - |
|
659 |
+
| 2.8274 | 7600 | 0.0322 | - | - |
|
660 |
+
| 2.8646 | 7700 | 0.0279 | - | - |
|
661 |
+
| 2.9018 | 7800 | 0.0329 | - | - |
|
662 |
+
| 2.9390 | 7900 | 0.0303 | - | - |
|
663 |
+
| 2.9762 | 8000 | 0.0287 | 0.1955 | 0.9734 |
|
664 |
+
| 3.0134 | 8100 | 0.0273 | - | - |
|
665 |
+
| 3.0506 | 8200 | 0.0249 | - | - |
|
666 |
+
| 3.0878 | 8300 | 0.0246 | - | - |
|
667 |
+
| 3.125 | 8400 | 0.0211 | - | - |
|
668 |
+
| 3.1622 | 8500 | 0.0253 | - | - |
|
669 |
+
| 3.1994 | 8600 | 0.0217 | - | - |
|
670 |
+
| 3.2366 | 8700 | 0.0191 | - | - |
|
671 |
+
| 3.2738 | 8800 | 0.0172 | - | - |
|
672 |
+
| 3.3110 | 8900 | 0.0232 | - | - |
|
673 |
+
| 3.3482 | 9000 | 0.0143 | 0.1849 | 0.9736 |
|
674 |
+
| 3.3854 | 9100 | 0.0134 | - | - |
|
675 |
+
| 3.4226 | 9200 | 0.0118 | - | - |
|
676 |
+
| 3.4598 | 9300 | 0.0131 | - | - |
|
677 |
+
| 3.4970 | 9400 | 0.0121 | - | - |
|
678 |
+
| 3.5342 | 9500 | 0.01 | - | - |
|
679 |
+
| 3.5714 | 9600 | 0.0126 | - | - |
|
680 |
+
| 3.6086 | 9700 | 0.0105 | - | - |
|
681 |
+
| 3.6458 | 9800 | 0.0099 | - | - |
|
682 |
+
| 3.6830 | 9900 | 0.0097 | - | - |
|
683 |
+
| 3.7202 | 10000 | 0.016 | 0.1938 | 0.9739 |
|
684 |
+
| 3.7574 | 10100 | 0.0129 | - | - |
|
685 |
+
| 3.7946 | 10200 | 0.0124 | - | - |
|
686 |
+
| 3.8318 | 10300 | 0.0124 | - | - |
|
687 |
+
| 3.8690 | 10400 | 0.0109 | - | - |
|
688 |
+
| 3.9062 | 10500 | 0.0135 | - | - |
|
689 |
+
| 3.9435 | 10600 | 0.0106 | - | - |
|
690 |
+
| 3.9807 | 10700 | 0.0132 | - | - |
|
691 |
+
| 4.0179 | 10800 | 0.0131 | - | - |
|
692 |
+
| 4.0551 | 10900 | 0.0117 | - | - |
|
693 |
+
| 4.0923 | 11000 | 0.0103 | 0.1878 | 0.9748 |
|
694 |
+
| 4.1295 | 11100 | 0.0089 | - | - |
|
695 |
+
| 4.1667 | 11200 | 0.01 | - | - |
|
696 |
+
| 4.2039 | 11300 | 0.0097 | - | - |
|
697 |
+
| 4.2411 | 11400 | 0.0091 | - | - |
|
698 |
+
| 4.2783 | 11500 | 0.0091 | - | - |
|
699 |
+
| 4.3155 | 11600 | 0.0089 | - | - |
|
700 |
+
| 4.3527 | 11700 | 0.0071 | - | - |
|
701 |
+
| 4.3899 | 11800 | 0.007 | - | - |
|
702 |
+
| 4.4271 | 11900 | 0.0066 | - | - |
|
703 |
+
| 4.4643 | 12000 | 0.0063 | 0.1864 | 0.9742 |
|
704 |
+
| 4.5015 | 12100 | 0.0075 | - | - |
|
705 |
+
| 4.5387 | 12200 | 0.0057 | - | - |
|
706 |
+
| 4.5759 | 12300 | 0.0061 | - | - |
|
707 |
+
| 4.6131 | 12400 | 0.005 | - | - |
|
708 |
+
| 4.6503 | 12500 | 0.0061 | - | - |
|
709 |
+
| 4.6875 | 12600 | 0.0062 | - | - |
|
710 |
+
| 4.7247 | 12700 | 0.0081 | - | - |
|
711 |
+
| 4.7619 | 12800 | 0.0063 | - | - |
|
712 |
+
| 4.7991 | 12900 | 0.0072 | - | - |
|
713 |
+
| 4.8363 | 13000 | 0.0075 | 0.1868 | 0.9754 |
|
714 |
+
| 4.8735 | 13100 | 0.0069 | - | - |
|
715 |
+
| 4.9107 | 13200 | 0.009 | - | - |
|
716 |
+
| 4.9479 | 13300 | 0.0077 | - | - |
|
717 |
+
| 4.9851 | 13400 | 0.0076 | - | - |
|
718 |
+
|
719 |
+
</details>
|
720 |
+
|
721 |
+
### Framework Versions
|
722 |
+
- Python: 3.10.14
|
723 |
+
- Sentence Transformers: 3.2.0
|
724 |
+
- Transformers: 4.45.1
|
725 |
+
- PyTorch: 2.4.0
|
726 |
+
- Accelerate: 0.34.2
|
727 |
+
- Datasets: 3.0.1
|
728 |
+
- Tokenizers: 0.20.0
|
729 |
+
|
730 |
+
## Citation
|
731 |
+
|
732 |
+
### BibTeX
|
733 |
+
|
734 |
+
#### Sentence Transformers
|
735 |
+
```bibtex
|
736 |
+
@inproceedings{reimers-2019-sentence-bert,
|
737 |
+
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
|
738 |
+
author = "Reimers, Nils and Gurevych, Iryna",
|
739 |
+
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
|
740 |
+
month = "11",
|
741 |
+
year = "2019",
|
742 |
+
publisher = "Association for Computational Linguistics",
|
743 |
+
url = "https://arxiv.org/abs/1908.10084",
|
744 |
+
}
|
745 |
+
```
|
746 |
+
|
747 |
+
#### MultipleNegativesRankingLoss
|
748 |
+
```bibtex
|
749 |
+
@misc{henderson2017efficient,
|
750 |
+
title={Efficient Natural Language Response Suggestion for Smart Reply},
|
751 |
+
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
|
752 |
+
year={2017},
|
753 |
+
eprint={1705.00652},
|
754 |
+
archivePrefix={arXiv},
|
755 |
+
primaryClass={cs.CL}
|
756 |
+
}
|
757 |
+
```
|
758 |
+
|
759 |
+
<!--
|
760 |
+
## Glossary
|
761 |
+
|
762 |
+
*Clearly define terms in order to be accessible across audiences.*
|
763 |
+
-->
|
764 |
+
|
765 |
+
<!--
|
766 |
+
## Model Card Authors
|
767 |
+
|
768 |
+
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
|
769 |
+
-->
|
770 |
+
|
771 |
+
<!--
|
772 |
+
## Model Card Contact
|
773 |
+
|
774 |
+
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
|
775 |
+
-->
|
added_tokens.json
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"<mask>": 64000
|
3 |
+
}
|
bpe.codes
ADDED
The diff for this file is too large to render.
See raw diff
|
|
config.json
ADDED
@@ -0,0 +1,28 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"_name_or_path": "bkai-foundation-models/vietnamese-bi-encoder",
|
3 |
+
"architectures": [
|
4 |
+
"RobertaModel"
|
5 |
+
],
|
6 |
+
"attention_probs_dropout_prob": 0.1,
|
7 |
+
"bos_token_id": 0,
|
8 |
+
"classifier_dropout": null,
|
9 |
+
"eos_token_id": 2,
|
10 |
+
"hidden_act": "gelu",
|
11 |
+
"hidden_dropout_prob": 0.1,
|
12 |
+
"hidden_size": 768,
|
13 |
+
"initializer_range": 0.02,
|
14 |
+
"intermediate_size": 3072,
|
15 |
+
"layer_norm_eps": 1e-05,
|
16 |
+
"max_position_embeddings": 258,
|
17 |
+
"model_type": "roberta",
|
18 |
+
"num_attention_heads": 12,
|
19 |
+
"num_hidden_layers": 12,
|
20 |
+
"pad_token_id": 1,
|
21 |
+
"position_embedding_type": "absolute",
|
22 |
+
"tokenizer_class": "PhobertTokenizer",
|
23 |
+
"torch_dtype": "float32",
|
24 |
+
"transformers_version": "4.45.1",
|
25 |
+
"type_vocab_size": 1,
|
26 |
+
"use_cache": true,
|
27 |
+
"vocab_size": 64001
|
28 |
+
}
|
config_sentence_transformers.json
ADDED
@@ -0,0 +1,10 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"__version__": {
|
3 |
+
"sentence_transformers": "3.2.0",
|
4 |
+
"transformers": "4.45.1",
|
5 |
+
"pytorch": "2.4.0"
|
6 |
+
},
|
7 |
+
"prompts": {},
|
8 |
+
"default_prompt_name": null,
|
9 |
+
"similarity_fn_name": null
|
10 |
+
}
|
model.safetensors
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:0a239a104f293ef4db8dfea66e4e6eea4ea05ea1904b810028f33cfa2d12e281
|
3 |
+
size 540015464
|
modules.json
ADDED
@@ -0,0 +1,14 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
[
|
2 |
+
{
|
3 |
+
"idx": 0,
|
4 |
+
"name": "0",
|
5 |
+
"path": "",
|
6 |
+
"type": "sentence_transformers.models.Transformer"
|
7 |
+
},
|
8 |
+
{
|
9 |
+
"idx": 1,
|
10 |
+
"name": "1",
|
11 |
+
"path": "1_Pooling",
|
12 |
+
"type": "sentence_transformers.models.Pooling"
|
13 |
+
}
|
14 |
+
]
|
sentence_bert_config.json
ADDED
@@ -0,0 +1,4 @@
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"max_seq_length": 256,
|
3 |
+
"do_lower_case": false
|
4 |
+
}
|
special_tokens_map.json
ADDED
@@ -0,0 +1,51 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"bos_token": {
|
3 |
+
"content": "<s>",
|
4 |
+
"lstrip": false,
|
5 |
+
"normalized": false,
|
6 |
+
"rstrip": false,
|
7 |
+
"single_word": false
|
8 |
+
},
|
9 |
+
"cls_token": {
|
10 |
+
"content": "<s>",
|
11 |
+
"lstrip": false,
|
12 |
+
"normalized": false,
|
13 |
+
"rstrip": false,
|
14 |
+
"single_word": false
|
15 |
+
},
|
16 |
+
"eos_token": {
|
17 |
+
"content": "</s>",
|
18 |
+
"lstrip": false,
|
19 |
+
"normalized": false,
|
20 |
+
"rstrip": false,
|
21 |
+
"single_word": false
|
22 |
+
},
|
23 |
+
"mask_token": {
|
24 |
+
"content": "<mask>",
|
25 |
+
"lstrip": false,
|
26 |
+
"normalized": false,
|
27 |
+
"rstrip": false,
|
28 |
+
"single_word": false
|
29 |
+
},
|
30 |
+
"pad_token": {
|
31 |
+
"content": "<pad>",
|
32 |
+
"lstrip": false,
|
33 |
+
"normalized": false,
|
34 |
+
"rstrip": false,
|
35 |
+
"single_word": false
|
36 |
+
},
|
37 |
+
"sep_token": {
|
38 |
+
"content": "</s>",
|
39 |
+
"lstrip": false,
|
40 |
+
"normalized": false,
|
41 |
+
"rstrip": false,
|
42 |
+
"single_word": false
|
43 |
+
},
|
44 |
+
"unk_token": {
|
45 |
+
"content": "<unk>",
|
46 |
+
"lstrip": false,
|
47 |
+
"normalized": false,
|
48 |
+
"rstrip": false,
|
49 |
+
"single_word": false
|
50 |
+
}
|
51 |
+
}
|
tokenizer_config.json
ADDED
@@ -0,0 +1,54 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"added_tokens_decoder": {
|
3 |
+
"0": {
|
4 |
+
"content": "<s>",
|
5 |
+
"lstrip": false,
|
6 |
+
"normalized": false,
|
7 |
+
"rstrip": false,
|
8 |
+
"single_word": false,
|
9 |
+
"special": true
|
10 |
+
},
|
11 |
+
"1": {
|
12 |
+
"content": "<pad>",
|
13 |
+
"lstrip": false,
|
14 |
+
"normalized": false,
|
15 |
+
"rstrip": false,
|
16 |
+
"single_word": false,
|
17 |
+
"special": true
|
18 |
+
},
|
19 |
+
"2": {
|
20 |
+
"content": "</s>",
|
21 |
+
"lstrip": false,
|
22 |
+
"normalized": false,
|
23 |
+
"rstrip": false,
|
24 |
+
"single_word": false,
|
25 |
+
"special": true
|
26 |
+
},
|
27 |
+
"3": {
|
28 |
+
"content": "<unk>",
|
29 |
+
"lstrip": false,
|
30 |
+
"normalized": false,
|
31 |
+
"rstrip": false,
|
32 |
+
"single_word": false,
|
33 |
+
"special": true
|
34 |
+
},
|
35 |
+
"64000": {
|
36 |
+
"content": "<mask>",
|
37 |
+
"lstrip": false,
|
38 |
+
"normalized": false,
|
39 |
+
"rstrip": false,
|
40 |
+
"single_word": false,
|
41 |
+
"special": true
|
42 |
+
}
|
43 |
+
},
|
44 |
+
"bos_token": "<s>",
|
45 |
+
"clean_up_tokenization_spaces": true,
|
46 |
+
"cls_token": "<s>",
|
47 |
+
"eos_token": "</s>",
|
48 |
+
"mask_token": "<mask>",
|
49 |
+
"model_max_length": 256,
|
50 |
+
"pad_token": "<pad>",
|
51 |
+
"sep_token": "</s>",
|
52 |
+
"tokenizer_class": "PhobertTokenizer",
|
53 |
+
"unk_token": "<unk>"
|
54 |
+
}
|
vocab.txt
ADDED
The diff for this file is too large to render.
See raw diff
|
|