SentenceTransformer based on sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
This is a sentence-transformers model finetuned from sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2. It maps sentences & paragraphs to a 384-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
- Maximum Sequence Length: 128 tokens
- Output Dimensionality: 384 tokens
- Similarity Function: Cosine Similarity
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 128, 'do_lower_case': False}) with Transformer model: BertModel
(1): Pooling({'word_embedding_dimension': 384, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("meandyou200175/paraphrase-multilingual-MiniLM-L12-v2_finetune")
# Run inference
sentences = [
'Chào bác sĩ. Em đi khám ở bệnh viện đa khoa bác sĩ kết luận là em bị đa nhân 2 thùy tuyến giáp tirads 3 kém đồng nhất 2 thùy tuyến giáp. Nang thùy trái tuyến giáp vậy có nguy hiểm không ạ? Em hoang mang quá ạ.',
'Chào em, Phân loại Ti-rads là phân loại tiên lượng ác tính của nhân giáp trên siêu âm. + TI-RADS-1: Mô giáp lành. + TI-RADS-2: Các tổn thương lành tính (0% nguy cơ ác tính). + TI-RADS-3: Các tổn thương nhiều khả năng lành tính (1,7% ác tính). + TI-RADS-4: 4a: Tổn thương có 1 dấu hiệu siêu âm nghi ngờ (3,3% ác tính). 4b: Tổn thương có 2 dấu hiệu siêu âm nghi ngờ (9,2% ác tính). 4c: Tổn thương có 3-4 dấu hiệu siêu âm nghi ngờ (44,4-72,4% ác tính). + TI-RADS-5: có từ 5 trở lên dấu hiệu siêu âm nghi ngờ (87,5% ác tính). + TI-RADS-6: Biết chắc chắn bướu ác tính trước đó. Theo kết quả mô tả siêu âm tuyến giáp của em thì hai nhân giáp thùy phải và thùy trái của em được đánh giá là tirads 3 (phân độ nguy cơ ác tính của nhân giáp), tức là nhiều khả năng lành tính và có 1,7% nguy cơ ác tính mà thôi. Đối với nhân giáp tirads 3, nguy cơ ác tính thấp, thì việc quyết định nên sinh thiết hay theo dõi sẽ cần dựa vào nhiều yếu tố khác, như nhân giáp này có làm rối loạn hormone tuyến giáp hay không, tiền căn gia đình có ai bị ung thư không, bản thân em có từng chiếu xạ vùng đầu mặt cổ không… Do đó, em cần khám chuyên khoa Giáp, thuộc chuyên khoa Nội tiết hoặc chuyên khoa Ung bướu để bác sĩ xem lại biên bản siêu âm, khai thác thêm những thông tin về bản thân và gia đình em, làm thêm xét nghiệm nếu chưa đủ (như xét nghiệm kiểm tra chức năng tuyến giáp) từ đó mới đưa ra kết luận về hướng xử trí phù hợp tiếp theo, em nhé.',
'Hình minh họa.\r\nNguồn Internet Chào bạn, Nếu như đã có\r\ný định đi thì bạn nên đến các phòng khám có bác sĩ chuyên khoa Da liễu để\r\nđược tư vấn cụ thể hơn về vấn đề chăm sóc da và điều trị dứt điểm mụn bạn nhé.\r\nTránh việc đến các cơ sở không uy tín dễ để lại di chứng sẹo xấu cho da mặt. Thân mến! AloBacsi.com Cổng thông tin tư vấn sức khỏe miễn phí',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 384]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Evaluation
Metrics
Reranking
- Dataset:
dev-eval
- Evaluated with
RerankingEvaluator
Metric | Value |
---|---|
map | 0.9982 |
mrr@1 | 0.9964 |
ndcg@1 | 0.9964 |
Training Details
Training Dataset
Unnamed Dataset
- Size: 43,000 training samples
- Columns:
query
,positive
, andnegative
- Approximate statistics based on the first 1000 samples:
query positive negative type string string string details - min: 6 tokens
- mean: 66.63 tokens
- max: 128 tokens
- min: 32 tokens
- mean: 120.11 tokens
- max: 128 tokens
- min: 31 tokens
- mean: 119.58 tokens
- max: 128 tokens
- Samples:
query positive negative Chào bác sĩ,
Em là nam nhưng vú to làm em rất mặc cảm. Em đã đi khám bệnh, sau khi làm các xét nghiệm và chiếu chụp, bác sĩ xác định em phì đại tuyến vú.
Theo bác sĩ em nên dùng thuốc (nội khoa) hơn hay phẫu thuật (ngoại khoa) hơn? Mỗi phương pháp có lợi hay hại gì ạ? Em băn khoăn lắm, rất mong được bác sĩ tư vấn. Em cảm ơn bác sĩ!Hùng thân mến, Vú to nam giới là tình trạng phì đại tuyến vú , thường không đối xứng hoặc một bên và có thể có mật độ mềm. Chẩn đoán phân biệt với ung thư vú và vú to nam giới giả, thường thấy ở nam giới béo phì và được đặc trưng bởi lắng đọng mô mỡ mà không có tăng sinh tuyến. Nguyên nhân là do tăng hoạt động của estrogen hoặc tăng tỷ số estrogen-androgen Điều trị phụ thuộc vào nguyên nhân gây vú to nam giới, phẫu thuật hay điều trị nội khoa phù hợp với các trường hợp khác nhau. Nội khoa điều trị hormon thay thế sẽ làm cải thiện vú to nam giới ở bệnh nhân nam suy sinh dục. Vú to nam giới do thuốc thì ngưng thuốc, vú to nam giới do dậy thì thì theo dõi. Phẫu thuật được chỉ định nếu có các vấn đề tâm lý, thẩm mỹ trường hợp nhu mô vú tiếp tục phát triển, ác tính. Trân trọng.
Tại Việt Nam, chưa ban hành tiêm vắc xin mũi 3 cho người dân. Chào em, Hiện tại ở nước ta chưa có ban hành chỉ thị tiêm mũi thứ 3 vắc xin phòng COVID, vì còn rất nhiều người dân trên cả nước chưa được tiêm chủng mũi vắc xin phòng COVID nào cả, vì chúng ta đang thiếu vắc xin. Vắc xin phòng COVID cho đến hiện nay toàn bộ là miễn phí và phân đồng đều cho tất cả người dân theo chỉ thị của bộ y tế, chưa có cơ sở y tế nào được phép mua bán tiêm vắc xin theo yêu cầu riêng của khách hàng. Vì thế, việc kê khai gian dối tìm cách tiêm mũi thứ 3 vắc xin phòng COVID nếu bị phát hiện có thể bị truy tố pháp luật sau này. Ở các nước phát triển, nguồn vắc xin dự trữ đầy đủ thì họ đã triển khai tiêm mũi thứ 3 vắc xin phòng COVID cho tất cả người dân sau 6-9 tháng từ thời điểm tiêm mũi 2. Cách phối trộn vắc xin mũi thứ 2 cũng tương tự như mũi thứ 3, đó là Astra mũi đầu thì có thể theo sau là Astra hoặc Moderna hoặc Pfizer. Thân mến!
Thuốc xịt mũi Thái Dương điều trị hắt hơi, sổ mũi, nghẹt mũi (20ml)
Mô tả ngắn:
Thuốc Xịt Mũi Thái Dương là sản phẩm được sản xuất bởi Công ty Cổ phần Sao Thái Dương, thuốc có thành phần chinh là Nghệ vàng ( Rhizoma Curcuma longae ), Menthol ( Mentholum ), Camphor ( Comphora ), được dùng trong các trường hợp: hắt hơi liên tục nhiều lần không dứt, sổ mũi, nghẹt mũi, ứ đọng dịch đờm nhầy trong xoang mũi, xoang trán...mỗi khi thay đổi thời tiết hay hít phải bụi nhà, phấn hoa, mùi lạ...; ngứa mũi, khô mũi, sổ mũi, cảm giác khó chịu ở mũi, viêm mũi do cảm cúm...
Thuốc Xịt Mũi Thái Dương được bào chế dưới dạng chất lỏng màu vàng, mùi thơm tinh dầu, pH 5-7. Hộp 1 lọ x 20 ml.
Thành phần:
Nghệ: 2
Menthol: 20
DL-camphor: 20mg
Chỉ định:
Thuốc Xịt Mũi Thái Dương được chỉ định dùng trong các trường hợp sau:
Hắt hơi liên tục nhiều lần không dứt, sổ mũi, nghẹt mũi, ứ đọng dịch đờm nhầy trong xoang mũi, xoang trán...mỗi khi thay đổi thời tiết hay hít phải bụi nhà, phấn hoa, mùi lạ...
Ngứa mũi, khô mũi, sổ mũi, cảm giác khó chịu ở mũi, viêm mũi do cảm cúm...Mô tả ngắn:
Triplixam của Công ty Servier, Ireland, thành phần chính perindopril, indapamid và amlodipin; là nhóm thuốc điều trị tăng huyết áp, có các dụng hạ huyết áp; được sử dụng trong điều trị thay thế cho bệnh nhân đã được kiểm soát huyết áp khi kết hợp perindopril/indapamid và amlodipin có cùng hàm lượng.
Thuốc được bào chế dưới dạng viên nén bao phim, màu trắng, đựng trong hộp chứa 30 viên.
Thành phần:
Amlodipine: 10mg
Indapamide: 2.5mg
Perindopril: 5mg
Chỉ định:
Thuốc Triplixam được chỉ định dùng trong các trường hợp sau: Điều trị thay thế trong điều trị tăng huyết áp cho bệnh nhân đã được kiểm soát huyết áp khi kết hợp perindopril/indapamid và amlodipin có cùng hàm lượng.Khoảng 1 tuần nay chân em bị nổi những mụn nhỏ li ti rất ngứa và lây lan, có mụn mềm, có mụn có mài ngay đầu mụn. 3 ngày đầu còn lây sang vùng cánh tay và bụng (nhưng không nhiều), ngay cả vết trầy xước nhỏ ở đầu gối cũng lâu lành.
Em có đi nhà thuốc và được tư vấn thoa kem Mật Ong Madeleine Ritchie nhưng không thấy hiệu quả. Hiện tại em đang thoa kem Beprosone nhưng cũng không thấy cải thiện nhiều.
Em không bị côn trùng đốt cũng nhưng không sử dụng mỹ phẩm gì cả, nên không hiểu sao lại bị như vậy. BS có thể tư vấn cho em thuốc thoa đồng thời trị thâm không ạ? Em sợ sẽ để lại thâm rất xấu nên lo lắng. Đây là những loại kem thoa em đã sử dụng nhưng không thấy hiệu quả. Chân thành cảm ơn BS.
(Bạn đọc Nguyễn Lê Thanh Tâm)Chào em, Em chụp hình những tuýp kem đã dùng nhưng không đưa kèm hình sang thương nên rất khó cho bác sĩ để chẩn đoán bệnh của em là gì và không thể kê toa cho em trong lúc này. Nếu được em vui lòng cung cấp hình ảnh cho chương trình. Em cũng không nên tự ý bôi thuốc vì có thể không điều trị được bệnh mà còn gây ra nhiều tác dụng phụ ảnh hưởng sức khỏe. Nếu quá lo lắng, em nên đến gặp bác sĩ chuyên khoa Da Liễu để được thăm khám trực tiếp và chỉ định xét nghiệm cần thiết để chẩn đoán bệnh em nhé! Thân mến!
Chào em, Khi bệnh ung thư gan giai đoạn cuối hay các bệnh ung thư giai đoạn cuối khác thì khả năng sống tiếp là rất thấp. Những thống kê tại bệnh viện cho thấy, bệnh nhân ung thư giai đoạn cuối chỉ sống được khoảng 6 đến 8 tháng, nhanh chỉ trong 1 tháng. Thường các phương pháp điều trị ung thư gan chủ yếu là hóa trị, xạ trị hoặc phẫu thuật cắt bỏ khối u, tiêm Ethanol hoặc nhiệt RFA. Tuy nhiên, đối với ung thư giai đoạn cuối thường không có một phương pháp nào trong y học có thể chữa khỏi bệnh, bởi bệnh đã di căn và lây sang các cơ quan khác của cơ thể như mạch máu, phổi, thận… Thường bác sĩ sẽ cố gắng kiểm soát khối u và kéo dài sự sống cho người bệnh bằng hóa trị và xạ trị, đồng thời cải thiện sức khỏe và động viên tinh thần cho bệnh nhân. Thân mến.
- Loss:
MultipleNegativesRankingLoss
with these parameters:{ "scale": 20.0, "similarity_fct": "cos_sim" }
Evaluation Dataset
Unnamed Dataset
- Size: 7,000 evaluation samples
- Columns:
query
,positive
, andnegative
- Approximate statistics based on the first 1000 samples:
query positive negative type string string string details - min: 5 tokens
- mean: 65.65 tokens
- max: 128 tokens
- min: 41 tokens
- mean: 119.4 tokens
- max: 128 tokens
- min: 31 tokens
- mean: 119.51 tokens
- max: 128 tokens
- Samples:
query positive negative Thuốc Esseil-10 Davipharm điều trị tăng huyết áp (10 vỉ x 10 viên)
Mô tả ngắn:
Thuốc Esseil-10 là sản phẩm được sản xuất bởi Công ty Cổ phần Dược phẩm Đạt Vi Phú. Thuốc có thành phần chính là cilnidipin, được chỉ định để điều trị tăng huyết áp.
Thuốc Esseil-10 được bào chế dưới dạng viên nén tròn, bao phim màu vàng, một mặt có dập logo, mặt kia có dập gạch ngang và được đóng gói theo quy cách hộp 10 vỉ x 10 viên.
Thành phần:
Cilnidipine: 10mg
Chỉ định:
Thuốc Esseil-10 được chỉ định dùng trong các trường hợp sau: Cilnidipin được chỉ định để điều trị tăng huyết áp.Mô tả ngắn:
Thuốc Althax là sản phẩm của Mediplantex chứa hoạt chất Thymomodulin có tác dụng hỗ trợ dự phòng tái phát nhiễm khuẩn hô hấp ở trẻ em và người lớn; viêm mũi dị ứng, dự phòng tái phát dị ứng thức ăn; cải thiện các triệu chứng lâm sàng ở bệnh nhân HIV/AIDS và tăng cường hệ miễn dịch đã suy giảm ở người cao tuổi.
Thành phần:
Thymomodulin: 120mg
Chỉ định:
Thuốc Althax được chỉ định dùng trong các trường hợp sau:
Hỗ trợ dự phòng tái phát nhiễm khuẩn hô hấp ở trẻ em và người lớn. Hỗ trợ điều trị viêm mũi dị ứng , dự phòng tái phát dị ứng thức ăn. Hỗ trợ cải thiện các triệu chứng lâm sàng ở bệnh nhân HIV/AIDS . Hỗ trợ tăng cường hệ miễn dịch đã suy giảm ở người cao tuổi.Thưa BS,
Con là nữ, năm nay 14 tuổi. Dạo gần đây do uống thuốc nhiều con hay bị táo bón. Con có tìm hiểu sơ về bệnh trĩ, nhưng khi đi đại tiện con không bị chảy máu gì cả. Gần đây con có cảm giác hơi vướng ở hậu môn, không hẳn là ở hậu môn, cứ như ở ngoài phía 2 bên mép thôi.
Cứ thi thoảng là bị rồi hình như tự hết thì phải, có cảm giác khi đi ngoài chưa đi hết và thi thoảng thấy như có vật gì nhỏ lòi ra ngoài nhưng tự cơ thể có thể đẩy vô được bình thường. Dấu hiệu như vậy giống với bệnh nào nhất vậy BS? Con cảm ơn BS.Chào em, Theo thông tin em cung cấp, nhiều khả năng em có , nhưng ở mức độ nhẹ khoảng trĩ độ 1 mà thôi. Cảm giác đi cầu chưa hết thường là do khối phân tròn nhỏ sót lại, khó xuất ra do mô xung quanh hậu môn đã phù nề kèm với búi trĩ sau khi em đã cố rặn một lúc lâu, cũng có thể đó chính là búi trĩ nội. Vì thế em không cần và không nên ráng rặn tiếp để xuất hết khối phân này, ở lần đi tiêu tiếp theo sẽ tự khắc thải ra được. Tình trạng này thì không cần dùng thuốc, chỉ cần thay đổi lối sống bằng cách ăn nhiều rau xanh, trái cây, hạn chế thực phẩm cay, nhiều dầu mỡ, uống nhiều nước, tối thiểu phải 2-3 lít nước mỗi ngày, không ngồi lâu trên 5 phút khi đi vệ sinh, tập thể dục đều đặn sẽ giúp em cải thiện tình trạng này, em nhé. Thân mến!
Nếu bạn là phụ nữ nhiễm virus viêm gan B, khi có thai bạn nên đi khám đúng chuyên khoa Trong bệnh nhiễm virus viêm gan B thì có những thể lâm sàng sau: Nhiễm virus viêm gan B thể không hoạt động: tế bào gan không bị tổn thương, men gan không tăng, không cần điều trị, chỉ theo dõi định kỳ men gan, tầm sóat ung thư gan (AFP, siêu âm bụng) và sống lối sống lành mạnh, hạn chế các chất độc gan (bia rượu, thuốc uống bừa bãi, thuốc đông nam không rõ loại). Viêm gan B, tức là vừa nhiễm virus viêm gan B và virus này đang làm tổn thương gan, men gan sẽ tăng. Viêm gan B được chia thành viêm gan B cấp và viêm gan B mạn tính. Viêm gan B cấp tính là tổn thương tế bào gan cấp do nhiễm HBV, hiện tượng tế bào gan bị phá hủy không phải do virus mà do chính cơ thể chống lại virus gây ra, và trong vòng 6 tháng là cơ thể sẽ thải toàn bộ virus và tạo miễn dịch bảo vệ suốt đời. Viêm gan B mạn là cơ thể không thể tự thải trừ HBV ra khỏi cơ thể sau 6 tháng. BS không rõ em thuộc thể nào, có đang dùng thuốc đặc trị viêm gan B hay không, nhưng nhìn chung bây giờ bệnh này nước ta kiểm soát lây truyền từ mẹ sang con rất là tốt, có nhiều chiến lược cho từng trường hợp khác nhau: mẹ nhiễm virus viêm gan B thể không hoạt động hay mẹ viêm gan B mạn đang dùng thuốc dự định có con, mẹ viêm gan B mạn đang dùng thuốc và vô tình phát hiện co con. Do đó, vợ chồng em nay muốn có em bé thì nên đến khám tại chuyên khoa gan mật trước, trình bày ý định này của mình để bs kiểm tra lại tổng quát cho em, tùy tình huống mà sẽ có hướng dẫn cụ thể riêng, em nhé.
Thuốc Fexet Getz điều trị viêm mũi dị ứng, mày đay tự phát mãn tính (2 vỉ x 5 viên)
Mô tả ngắn:
Fexet 120 mg có thành phần chính fexofenadine, do công ty Getzpharma sản xuất, được dùng để điều trị làm giảm các triệu chứng có liên quan đến bệnh viêm mũi dị ứng theo mùa và nổi mề đay tự phát mãn tính.
Thành phần:
Fexofenadine: 120mg
Chỉ định:
Thuốc Fexet 120 mg được chỉ định dùng trong các trường hợp sau:
Ðiều trị làm giảm các triệu chứng có liên quan đến bệnh:
Viêm mũi dị ứng theo mùa bao gồm hắt hơi, sổ mũi , ngứa mũi, miệng, cổ họng, chảy nước mắt, đỏ mắt. Nổi mề đay tự phát mãn tính.Mô tả ngắn:
Hoạt Huyết Dưỡng Não được phân phối bởi Công ty cổ phần dược phẩm Xanh, thành phần chính là cao khô lá bạch quả, cao khô rễ đinh lăng, là thuốc dùng trong trường hợp đau đầu, chóng mặt, giảm trí nhớ; thiểu năng tuần hoàn não, ù tai, giảm thính lực. Ngoài ra, thuốc còn được dùng trong chứng đau cách hồi do tắc động mạch chi dưới mãn tính, hội chứng Raynaud và chứng nhược dương.
Thành phần:
Bạch quả: 80mg
Đinh lăng: 75mg
Chỉ định:
Thuốc Hoạt Huyết Dưỡng Não được chỉ định dùng trong các trường hợp sau:
Đau đầu , chóng mặt, giảm trí nhớ. Thiểu năng tuần hoàn não, ù tai , giảm thính lực. Dùng trong chứng đau cách hồi do tắc động mạch chi dưới mãn tính, hội chứng Raynaud và chứng nhược dương. - Loss:
MultipleNegativesRankingLoss
with these parameters:{ "scale": 20.0, "similarity_fct": "cos_sim" }
Training Hyperparameters
Non-Default Hyperparameters
eval_strategy
: stepsper_device_train_batch_size
: 16per_device_eval_batch_size
: 16learning_rate
: 2e-05num_train_epochs
: 5warmup_ratio
: 0.1fp16
: Truebatch_sampler
: no_duplicates
All Hyperparameters
Click to expand
overwrite_output_dir
: Falsedo_predict
: Falseeval_strategy
: stepsprediction_loss_only
: Trueper_device_train_batch_size
: 16per_device_eval_batch_size
: 16per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 1eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 2e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1.0num_train_epochs
: 5max_steps
: -1lr_scheduler_type
: linearlr_scheduler_kwargs
: {}warmup_ratio
: 0.1warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Falsefp16
: Truefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Nonelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Falseignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torchoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Falsehub_always_push
: Falsegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseeval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Nonedispatch_batches
: Nonesplit_batches
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseuse_liger_kernel
: Falseeval_use_gather_object
: Falsebatch_sampler
: no_duplicatesmulti_dataset_batch_sampler
: proportional
Training Logs
Click to expand
Epoch | Step | Training Loss | Validation Loss | dev-eval_map |
---|---|---|---|---|
0 | 0 | - | - | 0.9784 |
0.0372 | 100 | 1.102 | - | - |
0.0744 | 200 | 0.7679 | - | - |
0.1116 | 300 | 0.5825 | - | - |
0.1488 | 400 | 0.5424 | - | - |
0.1860 | 500 | 0.5088 | - | - |
0.2232 | 600 | 0.4052 | - | - |
0.2604 | 700 | 0.4012 | - | - |
0.2976 | 800 | 0.3834 | - | - |
0.3348 | 900 | 0.3688 | - | - |
0.3720 | 1000 | 0.3395 | 0.3014 | 0.9954 |
0.4092 | 1100 | 0.3401 | - | - |
0.4464 | 1200 | 0.3096 | - | - |
0.4836 | 1300 | 0.3438 | - | - |
0.5208 | 1400 | 0.2635 | - | - |
0.5580 | 1500 | 0.3225 | - | - |
0.5952 | 1600 | 0.3069 | - | - |
0.6324 | 1700 | 0.2943 | - | - |
0.6696 | 1800 | 0.2819 | - | - |
0.7068 | 1900 | 0.2679 | - | - |
0.7440 | 2000 | 0.2646 | 0.2357 | 0.9964 |
0.7812 | 2100 | 0.2487 | - | - |
0.8185 | 2200 | 0.2254 | - | - |
0.8557 | 2300 | 0.2623 | - | - |
0.8929 | 2400 | 0.2399 | - | - |
0.9301 | 2500 | 0.2206 | - | - |
0.9673 | 2600 | 0.2299 | - | - |
1.0045 | 2700 | 0.2218 | - | - |
1.0417 | 2800 | 0.2163 | - | - |
1.0789 | 2900 | 0.206 | - | - |
1.1161 | 3000 | 0.2099 | 0.1937 | 0.9976 |
1.1533 | 3100 | 0.2116 | - | - |
1.1905 | 3200 | 0.2027 | - | - |
1.2277 | 3300 | 0.1779 | - | - |
1.2649 | 3400 | 0.1686 | - | - |
1.3021 | 3500 | 0.1675 | - | - |
1.3393 | 3600 | 0.1487 | - | - |
1.3765 | 3700 | 0.141 | - | - |
1.4137 | 3800 | 0.1363 | - | - |
1.4509 | 3900 | 0.133 | - | - |
1.4881 | 4000 | 0.1357 | 0.1823 | 0.9977 |
1.5253 | 4100 | 0.1008 | - | - |
1.5625 | 4200 | 0.1249 | - | - |
1.5997 | 4300 | 0.1258 | - | - |
1.6369 | 4400 | 0.121 | - | - |
1.6741 | 4500 | 0.108 | - | - |
1.7113 | 4600 | 0.112 | - | - |
1.7485 | 4700 | 0.0988 | - | - |
1.7857 | 4800 | 0.0998 | - | - |
1.8229 | 4900 | 0.1031 | - | - |
1.8601 | 5000 | 0.1097 | 0.1697 | 0.9981 |
1.8973 | 5100 | 0.1025 | - | - |
1.9345 | 5200 | 0.0877 | - | - |
1.9717 | 5300 | 0.101 | - | - |
2.0089 | 5400 | 0.0963 | - | - |
2.0461 | 5500 | 0.083 | - | - |
2.0833 | 5600 | 0.0842 | - | - |
2.1205 | 5700 | 0.0861 | - | - |
2.1577 | 5800 | 0.0999 | - | - |
2.1949 | 5900 | 0.0972 | - | - |
2.2321 | 6000 | 0.0859 | 0.1635 | 0.998 |
2.2693 | 6100 | 0.0769 | - | - |
2.3065 | 6200 | 0.0778 | - | - |
2.3438 | 6300 | 0.0684 | - | - |
2.3810 | 6400 | 0.0623 | - | - |
2.4182 | 6500 | 0.0636 | - | - |
2.4554 | 6600 | 0.0647 | - | - |
2.4926 | 6700 | 0.0586 | - | - |
2.5298 | 6800 | 0.0464 | - | - |
2.5670 | 6900 | 0.0587 | - | - |
2.6042 | 7000 | 0.0617 | 0.1560 | 0.9984 |
2.6414 | 7100 | 0.0618 | - | - |
2.6786 | 7200 | 0.0453 | - | - |
2.7158 | 7300 | 0.0687 | - | - |
2.7530 | 7400 | 0.0434 | - | - |
2.7902 | 7500 | 0.0447 | - | - |
2.8274 | 7600 | 0.0508 | - | - |
2.8646 | 7700 | 0.0554 | - | - |
2.9018 | 7800 | 0.0459 | - | - |
2.9390 | 7900 | 0.0478 | - | - |
2.9762 | 8000 | 0.0449 | 0.1494 | 0.9981 |
3.0134 | 8100 | 0.0505 | - | - |
3.0506 | 8200 | 0.0484 | - | - |
3.0878 | 8300 | 0.0382 | - | - |
3.125 | 8400 | 0.0496 | - | - |
3.1622 | 8500 | 0.0513 | - | - |
3.1994 | 8600 | 0.051 | - | - |
3.2366 | 8700 | 0.0474 | - | - |
3.2738 | 8800 | 0.0382 | - | - |
3.3110 | 8900 | 0.0412 | - | - |
3.3482 | 9000 | 0.0294 | 0.1493 | 0.9983 |
3.3854 | 9100 | 0.0325 | - | - |
3.4226 | 9200 | 0.036 | - | - |
3.4598 | 9300 | 0.0371 | - | - |
3.4970 | 9400 | 0.0357 | - | - |
3.5342 | 9500 | 0.0285 | - | - |
3.5714 | 9600 | 0.0289 | - | - |
3.6086 | 9700 | 0.0331 | - | - |
3.6458 | 9800 | 0.0378 | - | - |
3.6830 | 9900 | 0.0249 | - | - |
3.7202 | 10000 | 0.0402 | 0.1478 | 0.9981 |
3.7574 | 10100 | 0.0298 | - | - |
3.7946 | 10200 | 0.0281 | - | - |
3.8318 | 10300 | 0.0271 | - | - |
3.8690 | 10400 | 0.0301 | - | - |
3.9062 | 10500 | 0.0274 | - | - |
3.9435 | 10600 | 0.023 | - | - |
3.9807 | 10700 | 0.0239 | - | - |
4.0179 | 10800 | 0.0259 | - | - |
4.0551 | 10900 | 0.0294 | - | - |
4.0923 | 11000 | 0.0233 | 0.1483 | 0.9983 |
4.1295 | 11100 | 0.033 | - | - |
4.1667 | 11200 | 0.0337 | - | - |
4.2039 | 11300 | 0.027 | - | - |
4.2411 | 11400 | 0.0262 | - | - |
4.2783 | 11500 | 0.0243 | - | - |
4.3155 | 11600 | 0.028 | - | - |
4.3527 | 11700 | 0.019 | - | - |
4.3899 | 11800 | 0.0187 | - | - |
4.4271 | 11900 | 0.0222 | - | - |
4.4643 | 12000 | 0.0227 | 0.1416 | 0.9981 |
4.5015 | 12100 | 0.0213 | - | - |
4.5387 | 12200 | 0.0183 | - | - |
4.5759 | 12300 | 0.0223 | - | - |
4.6131 | 12400 | 0.0205 | - | - |
4.6503 | 12500 | 0.0229 | - | - |
4.6875 | 12600 | 0.0172 | - | - |
4.7247 | 12700 | 0.0272 | - | - |
4.7619 | 12800 | 0.0157 | - | - |
4.7991 | 12900 | 0.0161 | - | - |
4.8363 | 13000 | 0.015 | 0.1414 | 0.9982 |
4.8735 | 13100 | 0.0196 | - | - |
4.9107 | 13200 | 0.0179 | - | - |
4.9479 | 13300 | 0.0196 | - | - |
4.9851 | 13400 | 0.015 | - | - |
Framework Versions
- Python: 3.10.14
- Sentence Transformers: 3.2.0
- Transformers: 4.45.1
- PyTorch: 2.4.0
- Accelerate: 0.34.2
- Datasets: 3.0.1
- Tokenizers: 0.20.0
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
MultipleNegativesRankingLoss
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
- Downloads last month
- 9
Inference Providers
NEW
This model is not currently available via any of the supported third-party Inference Providers, and
the model is not deployed on the HF Inference API.
Model tree for meandyou200175/paraphrase-multilingual-MiniLM-L12-v2_finetune
Evaluation results
- Map on dev evalself-reported0.998
- Mrr@1 on dev evalself-reported0.996
- Ndcg@1 on dev evalself-reported0.996