SentenceTransformer based on tanbinh2210/phobert-st
This is a sentence-transformers model finetuned from tanbinh2210/phobert-st on the json dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: tanbinh2210/phobert-st
- Maximum Sequence Length: 256 tokens
- Output Dimensionality: 768 tokens
- Similarity Function: Cosine Similarity
- Training Dataset:
- json
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: RobertaModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("tanbinh2210/phobert-hackathon-no-neg")
# Run inference
sentences = [
'nội_dung khám sức_khỏe cho nhân_viên bếp ăn trong doanh_nghiệp được quy_định thế_nào ?',
'nội_dung khám sức khỏe 1 . đối_với ksk cho người từ đủ 18 ( mười_tám ) tuổi trở lên nhưng không thuộc trường_hợp ksk định_kỳ : khám theo nội_dung ghi trong giấy ksk quy_định tại phụ_lục 1 ban_hành kèm theo thông_tư này . 2 . đối_với ksk cho người chưa đủ 18 ( mười_tám ) tuổi nhưng không thuộc trường_hợp ksk định_kỳ : khám theo nội_dung ghi trong giấy ksk quy_định tại phụ_lục 2 ban_hành kèm theo thông_tư này . 3 . đối_với trường_hợp khám sức khỏe định_kỳ : khám theo nội_dung ghi trong sổ khám sức khỏe_định_kỳ quy_định tại phụ_lục 3 a ban_hành kèm theo thông_tư này . đối_với lao_động nữ , khi khám sức khỏe_định_kỳ được khám chuyên_khoa phụ_sản theo danh_mục quy_định tại phụ_lục 3 b ban_hành kèm theo thông_tư này . 4 . đối_với trường_hợp ksk theo bộ tiêu_chuẩn sức khỏe chuyên_ngành : khám theo nội_dung ghi trong giấy ksk quy_định tại mẫu giấy ksk của chuyên_ngành đó . 5 . đối_với những trường_hợp khám sức khỏe theo yêu_cầu : khám theo nội_dung mà đối_tượng ksk yêu_cầu .',
'3 . trong quá_trình điều_tra , truy_tố , xét_xử , cơ_quan , người có thẩm_quyền quy_định tại khoản 1 điều này có quyền : a ) trả lại ngay tài_sản đã thu_giữ , tạm giữ nhưng không phải là vật_chứng cho chủ_sở_hữu hoặc người_quản_lý hợp_pháp tài_sản đó ; b ) trả lại ngay vật_chứng cho chủ_sở_hữu hoặc người_quản_lý hợp_pháp nếu xét thấy không ảnh_hưởng đến việc xử_lý vụ án và thi_hành án ; c ) vật_chứng thuộc loại mau hỏng hoặc khó bảo_quản thì có_thể được bán theo quy_định của pháp_luật ; trường_hợp không bán được thì tiêu_hủy ; d ) vật_chứng là động_vật hoang_dã và thực_vật ngoại_lai thì ngay sau khi có kết_luận giám_định phải giao cho cơ_quan quản_lý chuyên_ngành có thẩm_quyền xử_lý theo quy_định của pháp_luật . 4 . trường_hợp có tranh_chấp về quyền_sở_hữu đối_với vật_chứng thì giải_quyết theo quy_định của pháp_luật về tố_tụng_dân_sự . "',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Training Details
Training Dataset
json
- Dataset: json
- Size: 147,585 training samples
- Columns:
query
andanswer
- Approximate statistics based on the first 1000 samples:
query answer type string string details - min: 5 tokens
- mean: 17.07 tokens
- max: 35 tokens
- min: 17 tokens
- mean: 151.88 tokens
- max: 256 tokens
- Samples:
query answer sau khi công_dân nộp hồ_sơ bao_lâu thì sẽ được xóa đăng_ký tạm_trú ?
điều 7 . hồ_sơ , thủ_tục xóa đăng_ký thường_trú 1 . trong thời_hạn 01 ngày kể từ ngày nhận được quyết_định hủy bỏ đăng_ký thường_trú của thủ_trưởng cấp trên trực_tiếp hoặc ngay sau khi ra quyết_định hủy bỏ đăng_ký thường_trú đối_với công_dân , cơ_quan đăng_ký cư_trú thực_hiện việc xóa đăng_ký thường_trú đối_với công_dân và cập_nhật việc xóa đăng_ký thường_trú vào cơ_sở_dữ_liệu quốc_gia về dân_cư , cơ_sở_dữ_liệu về cư_trú . 2 . trừ trường_hợp quy_định tại khoản 1 điều này , trong thời_hạn 07 ngày kể từ ngày hộ gia_đình có người thuộc diện xóa đăng_ký thường_trú thì người thuộc diện xóa đăng_ký thường_trú hoặc đại_diện hộ gia_đình có trách_nhiệm nộp hồ_sơ làm thủ_tục xóa đăng_ký thường_trú đến cơ_quan đăng_ký cư_trú . hồ_sơ xóa đăng_ký thường_trú gồm : tờ khai thay_đổi thông_tin cư_trú và giấy_tờ , tài_liệu chứng_minh thuộc một trong các trường_hợp xóa đăng_ký thường_trú .
có_thể thực_hiện ủy_thác cho vay tại ngân_hàng thương_mại hay không ?
phạm_vi điều_chỉnh 1 . tổ_chức tín_dụng , chi_nhánh ngân_hàng nước_ngoài chỉ được thực_hiện ủy_thác , nhận ủy_thác theo quy_định tại thông_tư này đối_với các hoạt_động sau đây : a ) cho vay ; b ) cho thuê tài_chính ; c ) góp vốn , mua cổ_phần ; d ) đầu_tư vào dự_án sản_xuất , kinh_doanh ; đ ) mua trái_phiếu doanh_nghiệp . 2 . việc tổ_chức tín_dụng , chi_nhánh ngân_hàng nước_ngoài nhận ủy_thác của chính_phủ thực_hiện theo quy_định của chính_phủ .
ai có thẩm_quyền ra_lệnh phong_tỏa tài_khoản ?
phong_tỏa tài_khoản 1 . phong_tỏa tài_khoản chỉ áp_dụng đối_với người bị buộc_tội về tội mà bộ_luật_hình_sự quy_định hình_phạt tiền , bị tịch_thu tài_sản hoặc để bảo_đảm bồi_thường thiệt_hại khi có căn_cứ xác_định người đó có tài_khoản tại tổ_chức tín_dụng hoặc kho_bạc nhà_nước . phong_tỏa tài_khoản cũng được áp_dụng đối_với tài_khoản của người khác nếu có căn_cứ cho rằng số tiền trong tài_khoản đó liên_quan đến hành_vi phạm_tội của người bị buộc_tội . 2 . những người có thẩm_quyền quy_định tại khoản 1 điều 113 của bộ_luật này , thẩm_phán chủ tọa phiên tòa có quyền ra_lệnh phong_tỏa tài_khoản . lệnh phong_tỏa tài_khoản của những người được quy_định tại điểm a_khoản 1 điều 113 của bộ_luật này phải được thông_báo ngay cho viện_kiểm_sát cùng cấp trước khi thi_hành . 3 . chỉ phong_tỏa số tiền trong tài_khoản tương_ứng với mức có_thể bị phạt tiền , bị tịch_thu tài_sản hoặc bồi_thường thiệt_hại . người được giao thực_hiện lệnh phong_tỏa , quản_lý tài_khoản bị phong_tỏa mà giải_tỏa việc phong_tỏa tài_khoản thì phải chịu trách_nhiệm hình_sự theo quy_định của bộ_luật_hình_sự .
- Loss:
MultipleNegativesRankingLoss
with these parameters:{ "scale": 20.0, "similarity_fct": "cos_sim" }
Evaluation Dataset
json
- Dataset: json
- Size: 147,585 evaluation samples
- Columns:
query
andanswer
- Approximate statistics based on the first 1000 samples:
query answer type string string details - min: 6 tokens
- mean: 17.34 tokens
- max: 57 tokens
- min: 10 tokens
- mean: 152.54 tokens
- max: 256 tokens
- Samples:
query answer công_bố những thông_tin nào về xếp_hạng tín_nhiệm ?
2 . định_kỳ sáu ( 06 ) tháng một ( 01 ) lần , doanh_nghiệp xếp_hạng tín_nhiệm phải công_bố trên trang thông_tin điện_tử của doanh_nghiệp những số_liệu thống_kê cơ_bản sau : a ) kết_quả bậc xếp_hạng tín_nhiệm của mỗi tổ_chức được xếp_hạng tín_nhiệm kể từ lần đầu được xếp_hạng tín_nhiệm ; b ) tỷ_lệ bình_quân về việc thực_hiện đầy_đủ , đúng hạn nghĩa_vụ nợ của các tổ_chức được xếp_hạng tín_nhiệm theo từng bậc xếp_hạng . 3 . trước ngày 01 tháng 05 hàng năm , doanh_nghiệp xếp_hạng tín_nhiệm phải công_bố trên trang thông_tin điện_tử của doanh_nghiệp danh_sách các tổ_chức được xếp_hạng tín_nhiệm có mức chi_phí dịch_vụ xếp_hạng tín_nhiệm chiếm trên 5 % tổng doanh_thu từ hoạt_động xếp_hạng tín_nhiệm của doanh_nghiệp trong năm tài_chính liền kề trước thời_điểm công_bố thông_tin . 4 . thông_tin quy_định tại khoản 1 , khoản 2 và khoản 3 điều này phải được duy_trì , lưu_trữ tại trang thông_tin điện_tử của doanh_nghiệp xếp_hạng tín_nhiệm trong thời_hạn năm ( 05 ) năm kể từ thời_điểm công_bố .
việc định_giá tài_sản góp vốn được thực_hiện theo nguyên_tắc nào ?
điều 36 . định_giá tài_sản góp vốn 1 . tài_sản góp vốn không phải là đồng việt_nam , ngoại_tệ tự_do chuyển_đổi , vàng phải được các thành_viên , cổ_đông sáng_lập hoặc tổ_chức thẩm_định giá định_giá và được thể_hiện thành_đồng việt_nam . 2 . tài_sản góp vốn khi thành_lập doanh_nghiệp phải được các thành_viên , cổ_đông sáng_lập định_giá theo nguyên_tắc đồng_thuận hoặc do một tổ_chức thẩm_định giá định_giá . trường_hợp tổ_chức thẩm_định giá định_giá thì giá_trị tài_sản góp vốn phải được trên 50 % số thành_viên , cổ_đông sáng_lập chấp_thuận . trường_hợp tài_sản góp vốn được định_giá cao hơn so với giá_trị thực_tế của tài_sản đó tại thời_điểm góp vốn thì các thành_viên , cổ_đông sáng_lập cùng liên_đới góp thêm bằng số chênh_lệch giữa giá_trị được định_giá và giá_trị thực_tế của tài_sản góp vốn tại thời_điểm kết_thúc định_giá ; đồng_thời liên_đới chịu trách_nhiệm đối_với thiệt_hại do cố_ý định_giá tài_sản góp vốn cao hơn giá_trị thực_tế .
nếu đăng_ký kết_hôn có yếu_tố nước_ngoài thì thời_hạn thực_hiện như_thế_nào ?
điều 38 . thủ_tục đăng_ký kết_hôn 1 . hai bên nam , nữ nộp tờ khai theo mẫu quy_định và giấy xác_nhận của tổ_chức y_tế có thẩm_quyền của việt_nam hoặc nước_ngoài xác_nhận người đó không mắc bệnh_tâm_thần hoặc bệnh khác mà không có khả_năng nhận_thức , làm_chủ được hành_vi của mình cho cơ_quan đăng_ký hộ_tịch . người nước_ngoài , công_dân việt_nam định_cư ở nước_ngoài phải nộp thêm giấy_tờ chứng_minh tình_trạng hôn_nhân , bản_sao hộ_chiếu hoặc giấy_tờ có giá_trị thay hộ_chiếu . 2 . trong thời_hạn 15 ngày kể từ ngày nhận đủ giấy_tờ theo quy_định tại khoản 1 điều này , công_chức làm công_tác hộ_tịch có trách_nhiệm xác_minh , nếu thấy đủ điều_kiện kết_hôn theo quy_định của pháp_luật thì phòng tư_pháp báo_cáo chủ_tịch ủy ban_nhân_dân cấp huyện giải_quyết .
- Loss:
MultipleNegativesRankingLoss
with these parameters:{ "scale": 20.0, "similarity_fct": "cos_sim" }
Training Hyperparameters
Non-Default Hyperparameters
overwrite_output_dir
: Trueper_device_train_batch_size
: 12per_device_eval_batch_size
: 12learning_rate
: 1e-05num_train_epochs
: 4warmup_ratio
: 0.1fp16
: Truebatch_sampler
: no_duplicates
All Hyperparameters
Click to expand
overwrite_output_dir
: Truedo_predict
: Falseeval_strategy
: noprediction_loss_only
: Trueper_device_train_batch_size
: 12per_device_eval_batch_size
: 12per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 1eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 1e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1.0num_train_epochs
: 4max_steps
: -1lr_scheduler_type
: linearlr_scheduler_kwargs
: {}warmup_ratio
: 0.1warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Falsefp16
: Truefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Nonelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Falseignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torchoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Falsehub_always_push
: Falsegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseeval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Nonedispatch_batches
: Nonesplit_batches
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseuse_liger_kernel
: Falseeval_use_gather_object
: Falsebatch_sampler
: no_duplicatesmulti_dataset_batch_sampler
: proportional
Training Logs
Click to expand
Epoch | Step | Training Loss |
---|---|---|
0.0102 | 100 | 1.0637 |
0.0203 | 200 | 0.7743 |
0.0305 | 300 | 0.3647 |
0.0407 | 400 | 0.1425 |
0.0508 | 500 | 0.0887 |
0.0610 | 600 | 0.0783 |
0.0711 | 700 | 0.059 |
0.0813 | 800 | 0.0563 |
0.0915 | 900 | 0.0474 |
0.1016 | 1000 | 0.0506 |
0.1118 | 1100 | 0.0398 |
0.1220 | 1200 | 0.0546 |
0.1321 | 1300 | 0.0346 |
0.1423 | 1400 | 0.0252 |
0.1525 | 1500 | 0.0245 |
0.1626 | 1600 | 0.023 |
0.1728 | 1700 | 0.0245 |
0.1829 | 1800 | 0.0326 |
0.1931 | 1900 | 0.0224 |
0.2033 | 2000 | 0.0168 |
0.2134 | 2100 | 0.0188 |
0.2236 | 2200 | 0.0385 |
0.2338 | 2300 | 0.0211 |
0.2439 | 2400 | 0.0162 |
0.2541 | 2500 | 0.0201 |
0.2643 | 2600 | 0.0165 |
0.2744 | 2700 | 0.0178 |
0.2846 | 2800 | 0.0244 |
0.2947 | 2900 | 0.0229 |
0.3049 | 3000 | 0.0159 |
0.3151 | 3100 | 0.0162 |
0.3252 | 3200 | 0.034 |
0.3354 | 3300 | 0.0197 |
0.3456 | 3400 | 0.026 |
0.3557 | 3500 | 0.0257 |
0.3659 | 3600 | 0.0139 |
0.3761 | 3700 | 0.0144 |
0.3862 | 3800 | 0.025 |
0.3964 | 3900 | 0.0128 |
0.4065 | 4000 | 0.0092 |
0.4167 | 4100 | 0.015 |
0.4269 | 4200 | 0.0167 |
0.4370 | 4300 | 0.0239 |
0.4472 | 4400 | 0.0139 |
0.4574 | 4500 | 0.0161 |
0.4675 | 4600 | 0.0143 |
0.4777 | 4700 | 0.0152 |
0.4879 | 4800 | 0.0125 |
0.4980 | 4900 | 0.0164 |
0.5082 | 5000 | 0.0214 |
0.5183 | 5100 | 0.0197 |
0.5285 | 5200 | 0.0174 |
0.5387 | 5300 | 0.0118 |
0.5488 | 5400 | 0.0147 |
0.5590 | 5500 | 0.0178 |
0.5692 | 5600 | 0.0109 |
0.5793 | 5700 | 0.0171 |
0.5895 | 5800 | 0.0223 |
0.5997 | 5900 | 0.0162 |
0.6098 | 6000 | 0.0222 |
0.6200 | 6100 | 0.0265 |
0.6301 | 6200 | 0.0126 |
0.6403 | 6300 | 0.0169 |
0.6505 | 6400 | 0.0172 |
0.6606 | 6500 | 0.0114 |
0.6708 | 6600 | 0.0177 |
0.6810 | 6700 | 0.0085 |
0.6911 | 6800 | 0.017 |
0.7013 | 6900 | 0.0217 |
0.7115 | 7000 | 0.012 |
0.7216 | 7100 | 0.0148 |
0.7318 | 7200 | 0.008 |
0.7419 | 7300 | 0.0147 |
0.7521 | 7400 | 0.0166 |
0.7623 | 7500 | 0.0089 |
0.7724 | 7600 | 0.0127 |
0.7826 | 7700 | 0.0193 |
0.7928 | 7800 | 0.0058 |
0.8029 | 7900 | 0.0104 |
0.8131 | 8000 | 0.0102 |
0.8233 | 8100 | 0.0172 |
0.8334 | 8200 | 0.015 |
0.8436 | 8300 | 0.0189 |
0.8537 | 8400 | 0.0092 |
0.8639 | 8500 | 0.0163 |
0.8741 | 8600 | 0.0081 |
0.8842 | 8700 | 0.0143 |
0.8944 | 8800 | 0.0129 |
0.9046 | 8900 | 0.0155 |
0.9147 | 9000 | 0.0052 |
0.9249 | 9100 | 0.0191 |
0.9351 | 9200 | 0.0098 |
0.9452 | 9300 | 0.0135 |
0.9554 | 9400 | 0.0122 |
0.9655 | 9500 | 0.0058 |
0.9757 | 9600 | 0.021 |
0.9859 | 9700 | 0.0164 |
0.9960 | 9800 | 0.0103 |
1.0062 | 9900 | 0.0073 |
1.0164 | 10000 | 0.0039 |
1.0265 | 10100 | 0.0103 |
1.0367 | 10200 | 0.0117 |
1.0469 | 10300 | 0.0085 |
1.0570 | 10400 | 0.0128 |
1.0672 | 10500 | 0.0112 |
1.0773 | 10600 | 0.0064 |
1.0875 | 10700 | 0.0142 |
1.0977 | 10800 | 0.0109 |
1.1078 | 10900 | 0.0143 |
1.1180 | 11000 | 0.0079 |
1.1282 | 11100 | 0.0231 |
1.1383 | 11200 | 0.006 |
1.1485 | 11300 | 0.0063 |
1.1587 | 11400 | 0.0094 |
1.1688 | 11500 | 0.0046 |
1.1790 | 11600 | 0.0147 |
1.1891 | 11700 | 0.0083 |
1.1993 | 11800 | 0.0044 |
1.2095 | 11900 | 0.0065 |
1.2196 | 12000 | 0.0072 |
1.2298 | 12100 | 0.0128 |
1.2400 | 12200 | 0.0067 |
1.2501 | 12300 | 0.0089 |
1.2603 | 12400 | 0.0044 |
1.2705 | 12500 | 0.0042 |
1.2806 | 12600 | 0.0045 |
1.2908 | 12700 | 0.0075 |
1.3009 | 12800 | 0.0054 |
1.3111 | 12900 | 0.0048 |
1.3213 | 13000 | 0.0178 |
1.3314 | 13100 | 0.0051 |
1.3416 | 13200 | 0.0063 |
1.3518 | 13300 | 0.0066 |
1.3619 | 13400 | 0.0051 |
1.3721 | 13500 | 0.0031 |
1.3823 | 13600 | 0.01 |
1.3924 | 13700 | 0.0037 |
1.4026 | 13800 | 0.0016 |
1.4127 | 13900 | 0.0062 |
1.4229 | 14000 | 0.0034 |
1.4331 | 14100 | 0.0067 |
1.4432 | 14200 | 0.0043 |
1.4534 | 14300 | 0.0014 |
1.4636 | 14400 | 0.0068 |
1.4737 | 14500 | 0.0021 |
1.4839 | 14600 | 0.0106 |
1.4941 | 14700 | 0.0035 |
1.5042 | 14800 | 0.0072 |
1.5144 | 14900 | 0.0041 |
1.5245 | 15000 | 0.0061 |
1.5347 | 15100 | 0.007 |
1.5449 | 15200 | 0.0044 |
1.5550 | 15300 | 0.0062 |
1.5652 | 15400 | 0.0061 |
1.5754 | 15500 | 0.0013 |
1.5855 | 15600 | 0.0063 |
1.5957 | 15700 | 0.0078 |
1.6059 | 15800 | 0.0016 |
1.6160 | 15900 | 0.0135 |
1.6262 | 16000 | 0.0063 |
1.6363 | 16100 | 0.0083 |
1.6465 | 16200 | 0.0034 |
1.6567 | 16300 | 0.0016 |
1.6668 | 16400 | 0.0063 |
1.6770 | 16500 | 0.0025 |
1.6872 | 16600 | 0.0022 |
1.6973 | 16700 | 0.0035 |
1.7075 | 16800 | 0.0053 |
1.7177 | 16900 | 0.0024 |
1.7278 | 17000 | 0.0045 |
1.7380 | 17100 | 0.0032 |
1.7481 | 17200 | 0.0076 |
1.7583 | 17300 | 0.0045 |
1.7685 | 17400 | 0.0029 |
1.7786 | 17500 | 0.004 |
1.7888 | 17600 | 0.0023 |
1.7990 | 17700 | 0.002 |
1.8091 | 17800 | 0.0033 |
1.8193 | 17900 | 0.0053 |
1.8295 | 18000 | 0.0028 |
1.8396 | 18100 | 0.0047 |
1.8498 | 18200 | 0.003 |
1.8599 | 18300 | 0.0062 |
1.8701 | 18400 | 0.0021 |
1.8803 | 18500 | 0.002 |
1.8904 | 18600 | 0.0062 |
1.9006 | 18700 | 0.0028 |
1.9108 | 18800 | 0.0016 |
1.9209 | 18900 | 0.0032 |
1.9311 | 19000 | 0.0027 |
1.9413 | 19100 | 0.0026 |
1.9514 | 19200 | 0.0036 |
1.9616 | 19300 | 0.0022 |
1.9717 | 19400 | 0.0035 |
1.9819 | 19500 | 0.0055 |
1.9921 | 19600 | 0.0013 |
2.0022 | 19700 | 0.0028 |
2.0124 | 19800 | 0.0015 |
2.0226 | 19900 | 0.0043 |
2.0327 | 20000 | 0.0017 |
2.0429 | 20100 | 0.0038 |
2.0531 | 20200 | 0.0034 |
2.0632 | 20300 | 0.0033 |
2.0734 | 20400 | 0.0009 |
2.0835 | 20500 | 0.004 |
2.0937 | 20600 | 0.0035 |
2.1039 | 20700 | 0.0054 |
2.1140 | 20800 | 0.0019 |
2.1242 | 20900 | 0.008 |
2.1344 | 21000 | 0.0032 |
2.1445 | 21100 | 0.0009 |
2.1547 | 21200 | 0.0015 |
2.1649 | 21300 | 0.0024 |
2.1750 | 21400 | 0.0035 |
2.1852 | 21500 | 0.0016 |
2.1953 | 21600 | 0.002 |
2.2055 | 21700 | 0.0009 |
2.2157 | 21800 | 0.0013 |
2.2258 | 21900 | 0.0046 |
2.2360 | 22000 | 0.0015 |
2.2462 | 22100 | 0.0015 |
2.2563 | 22200 | 0.0019 |
2.2665 | 22300 | 0.0009 |
2.2767 | 22400 | 0.0019 |
2.2868 | 22500 | 0.0027 |
2.2970 | 22600 | 0.0016 |
2.3071 | 22700 | 0.0013 |
2.3173 | 22800 | 0.0058 |
2.3275 | 22900 | 0.0096 |
2.3376 | 23000 | 0.0016 |
2.3478 | 23100 | 0.0024 |
2.3580 | 23200 | 0.0021 |
2.3681 | 23300 | 0.001 |
2.3783 | 23400 | 0.0041 |
2.3885 | 23500 | 0.0015 |
2.3986 | 23600 | 0.0014 |
2.4088 | 23700 | 0.0006 |
2.4189 | 23800 | 0.0025 |
2.4291 | 23900 | 0.0011 |
2.4393 | 24000 | 0.0013 |
2.4494 | 24100 | 0.0008 |
2.4596 | 24200 | 0.0024 |
2.4698 | 24300 | 0.0025 |
2.4799 | 24400 | 0.0044 |
2.4901 | 24500 | 0.0011 |
2.5003 | 24600 | 0.0014 |
2.5104 | 24700 | 0.0021 |
2.5206 | 24800 | 0.0011 |
2.5307 | 24900 | 0.001 |
2.5409 | 25000 | 0.0009 |
2.5511 | 25100 | 0.0011 |
2.5612 | 25200 | 0.0011 |
2.5714 | 25300 | 0.0013 |
2.5816 | 25400 | 0.0014 |
2.5917 | 25500 | 0.0028 |
2.6019 | 25600 | 0.0006 |
2.6121 | 25700 | 0.0064 |
2.6222 | 25800 | 0.0019 |
2.6324 | 25900 | 0.0009 |
2.6425 | 26000 | 0.0017 |
2.6527 | 26100 | 0.001 |
2.6629 | 26200 | 0.0012 |
2.6730 | 26300 | 0.0014 |
2.6832 | 26400 | 0.0007 |
2.6934 | 26500 | 0.0012 |
2.7035 | 26600 | 0.0023 |
2.7137 | 26700 | 0.0007 |
2.7239 | 26800 | 0.0013 |
2.7340 | 26900 | 0.0006 |
2.7442 | 27000 | 0.0036 |
2.7543 | 27100 | 0.0012 |
2.7645 | 27200 | 0.0008 |
2.7747 | 27300 | 0.0011 |
2.7848 | 27400 | 0.0018 |
2.7950 | 27500 | 0.0008 |
2.8052 | 27600 | 0.001 |
2.8153 | 27700 | 0.0023 |
2.8255 | 27800 | 0.0008 |
2.8357 | 27900 | 0.0015 |
2.8458 | 28000 | 0.0008 |
2.8560 | 28100 | 0.0016 |
2.8661 | 28200 | 0.0019 |
2.8763 | 28300 | 0.0014 |
2.8865 | 28400 | 0.0015 |
2.8966 | 28500 | 0.0009 |
2.9068 | 28600 | 0.0008 |
2.9170 | 28700 | 0.0006 |
2.9271 | 28800 | 0.001 |
2.9373 | 28900 | 0.0021 |
2.9475 | 29000 | 0.0016 |
2.9576 | 29100 | 0.0004 |
2.9678 | 29200 | 0.0006 |
2.9779 | 29300 | 0.0013 |
2.9881 | 29400 | 0.0008 |
2.9983 | 29500 | 0.0018 |
3.0084 | 29600 | 0.0006 |
3.0186 | 29700 | 0.0009 |
3.0288 | 29800 | 0.0007 |
3.0389 | 29900 | 0.0016 |
3.0491 | 30000 | 0.0006 |
3.0593 | 30100 | 0.0009 |
3.0694 | 30200 | 0.0005 |
3.0796 | 30300 | 0.0008 |
3.0897 | 30400 | 0.0026 |
3.0999 | 30500 | 0.0007 |
3.1101 | 30600 | 0.0011 |
3.1202 | 30700 | 0.0024 |
3.1304 | 30800 | 0.0029 |
3.1406 | 30900 | 0.0009 |
3.1507 | 31000 | 0.0006 |
3.1609 | 31100 | 0.0011 |
3.1711 | 31200 | 0.0007 |
3.1812 | 31300 | 0.001 |
3.1914 | 31400 | 0.001 |
3.2015 | 31500 | 0.0008 |
3.2117 | 31600 | 0.0004 |
3.2219 | 31700 | 0.0007 |
3.2320 | 31800 | 0.0007 |
3.2422 | 31900 | 0.0006 |
3.2524 | 32000 | 0.0006 |
3.2625 | 32100 | 0.0007 |
3.2727 | 32200 | 0.0012 |
3.2829 | 32300 | 0.0006 |
3.2930 | 32400 | 0.0006 |
3.3032 | 32500 | 0.0006 |
3.3133 | 32600 | 0.0022 |
3.3235 | 32700 | 0.0067 |
3.3337 | 32800 | 0.0008 |
3.3438 | 32900 | 0.0011 |
3.3540 | 33000 | 0.0015 |
3.3642 | 33100 | 0.0005 |
3.3743 | 33200 | 0.0005 |
3.3845 | 33300 | 0.0072 |
3.3947 | 33400 | 0.0005 |
3.4048 | 33500 | 0.0003 |
3.4150 | 33600 | 0.0013 |
3.4251 | 33700 | 0.0004 |
3.4353 | 33800 | 0.0009 |
3.4455 | 33900 | 0.0004 |
3.4556 | 34000 | 0.0005 |
3.4658 | 34100 | 0.0012 |
3.4760 | 34200 | 0.0004 |
3.4861 | 34300 | 0.0021 |
3.4963 | 34400 | 0.0006 |
3.5065 | 34500 | 0.0013 |
3.5166 | 34600 | 0.0003 |
3.5268 | 34700 | 0.0006 |
3.5369 | 34800 | 0.0005 |
3.5471 | 34900 | 0.0006 |
3.5573 | 35000 | 0.0005 |
3.5674 | 35100 | 0.0008 |
3.5776 | 35200 | 0.0004 |
3.5878 | 35300 | 0.0008 |
3.5979 | 35400 | 0.0006 |
3.6081 | 35500 | 0.0031 |
3.6183 | 35600 | 0.0008 |
3.6284 | 35700 | 0.0006 |
3.6386 | 35800 | 0.0005 |
3.6487 | 35900 | 0.0005 |
3.6589 | 36000 | 0.0005 |
3.6691 | 36100 | 0.0008 |
3.6792 | 36200 | 0.0003 |
3.6894 | 36300 | 0.0004 |
3.6996 | 36400 | 0.0005 |
3.7097 | 36500 | 0.0011 |
3.7199 | 36600 | 0.0005 |
3.7301 | 36700 | 0.0004 |
3.7402 | 36800 | 0.0008 |
3.7504 | 36900 | 0.0005 |
3.7605 | 37000 | 0.0011 |
3.7707 | 37100 | 0.0005 |
3.7809 | 37200 | 0.0009 |
3.7910 | 37300 | 0.0005 |
3.8012 | 37400 | 0.0005 |
3.8114 | 37500 | 0.0004 |
3.8215 | 37600 | 0.0006 |
3.8317 | 37700 | 0.0007 |
3.8419 | 37800 | 0.0005 |
3.8520 | 37900 | 0.0012 |
3.8622 | 38000 | 0.0012 |
3.8723 | 38100 | 0.0005 |
3.8825 | 38200 | 0.0004 |
3.8927 | 38300 | 0.0004 |
3.9028 | 38400 | 0.0006 |
3.9130 | 38500 | 0.0004 |
3.9232 | 38600 | 0.0007 |
3.9333 | 38700 | 0.0006 |
3.9435 | 38800 | 0.0009 |
3.9537 | 38900 | 0.0004 |
3.9638 | 39000 | 0.0003 |
3.9740 | 39100 | 0.0004 |
3.9841 | 39200 | 0.0004 |
3.9943 | 39300 | 0.0004 |
Framework Versions
- Python: 3.10.14
- Sentence Transformers: 3.2.1
- Transformers: 4.45.1
- PyTorch: 2.4.0
- Accelerate: 0.34.2
- Datasets: 3.0.1
- Tokenizers: 0.20.0
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
MultipleNegativesRankingLoss
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}
- Downloads last month
- 3
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social
visibility and check back later, or deploy to Inference Endpoints (dedicated)
instead.