SentenceTransformer based on tanbinh2210/phobert-st

This is a sentence-transformers model finetuned from tanbinh2210/phobert-st on the json dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: tanbinh2210/phobert-st
  • Maximum Sequence Length: 256 tokens
  • Output Dimensionality: 768 tokens
  • Similarity Function: Cosine Similarity
  • Training Dataset:
    • json

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: RobertaModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("tanbinh2210/phobert-hackathon-no-neg")
# Run inference
sentences = [
    'nội_dung khám sức_khỏe cho nhân_viên bếp ăn trong doanh_nghiệp được quy_định thế_nào ?',
    'nội_dung khám sức khỏe 1 . đối_với ksk cho người từ đủ 18 ( mười_tám ) tuổi trở lên nhưng không thuộc trường_hợp ksk định_kỳ : khám theo nội_dung ghi trong giấy ksk quy_định tại phụ_lục 1 ban_hành kèm theo thông_tư này . 2 . đối_với ksk cho người chưa đủ 18 ( mười_tám ) tuổi nhưng không thuộc trường_hợp ksk định_kỳ : khám theo nội_dung ghi trong giấy ksk quy_định tại phụ_lục 2 ban_hành kèm theo thông_tư này . 3 . đối_với trường_hợp khám sức khỏe định_kỳ : khám theo nội_dung ghi trong sổ khám sức khỏe_định_kỳ quy_định tại phụ_lục 3 a ban_hành kèm theo thông_tư này . đối_với lao_động nữ , khi khám sức khỏe_định_kỳ được khám chuyên_khoa phụ_sản theo danh_mục quy_định tại phụ_lục 3 b ban_hành kèm theo thông_tư này . 4 . đối_với trường_hợp ksk theo bộ tiêu_chuẩn sức khỏe chuyên_ngành : khám theo nội_dung ghi trong giấy ksk quy_định tại mẫu giấy ksk của chuyên_ngành đó . 5 . đối_với những trường_hợp khám sức khỏe theo yêu_cầu : khám theo nội_dung mà đối_tượng ksk yêu_cầu .',
    '3 . trong quá_trình điều_tra , truy_tố , xét_xử , cơ_quan , người có thẩm_quyền quy_định tại khoản 1 điều này có quyền : a ) trả lại ngay tài_sản đã thu_giữ , tạm giữ nhưng không phải là vật_chứng cho chủ_sở_hữu hoặc người_quản_lý hợp_pháp tài_sản đó ; b ) trả lại ngay vật_chứng cho chủ_sở_hữu hoặc người_quản_lý hợp_pháp nếu xét thấy không ảnh_hưởng đến việc xử_lý vụ án và thi_hành án ; c ) vật_chứng thuộc loại mau hỏng hoặc khó bảo_quản thì có_thể được bán theo quy_định của pháp_luật ; trường_hợp không bán được thì tiêu_hủy ; d ) vật_chứng là động_vật hoang_dã và thực_vật ngoại_lai thì ngay sau khi có kết_luận giám_định phải giao cho cơ_quan quản_lý chuyên_ngành có thẩm_quyền xử_lý theo quy_định của pháp_luật . 4 . trường_hợp có tranh_chấp về quyền_sở_hữu đối_với vật_chứng thì giải_quyết theo quy_định của pháp_luật về tố_tụng_dân_sự . "',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Training Details

Training Dataset

json

  • Dataset: json
  • Size: 147,585 training samples
  • Columns: query and answer
  • Approximate statistics based on the first 1000 samples:
    query answer
    type string string
    details
    • min: 5 tokens
    • mean: 17.07 tokens
    • max: 35 tokens
    • min: 17 tokens
    • mean: 151.88 tokens
    • max: 256 tokens
  • Samples:
    query answer
    sau khi công_dân nộp hồ_sơ bao_lâu thì sẽ được xóa đăng_ký tạm_trú ? điều 7 . hồ_sơ , thủ_tục xóa đăng_ký thường_trú 1 . trong thời_hạn 01 ngày kể từ ngày nhận được quyết_định hủy bỏ đăng_ký thường_trú của thủ_trưởng cấp trên trực_tiếp hoặc ngay sau khi ra quyết_định hủy bỏ đăng_ký thường_trú đối_với công_dân , cơ_quan đăng_ký cư_trú thực_hiện việc xóa đăng_ký thường_trú đối_với công_dân và cập_nhật việc xóa đăng_ký thường_trú vào cơ_sở_dữ_liệu quốc_gia về dân_cư , cơ_sở_dữ_liệu về cư_trú . 2 . trừ trường_hợp quy_định tại khoản 1 điều này , trong thời_hạn 07 ngày kể từ ngày hộ gia_đình có người thuộc diện xóa đăng_ký thường_trú thì người thuộc diện xóa đăng_ký thường_trú hoặc đại_diện hộ gia_đình có trách_nhiệm nộp hồ_sơ làm thủ_tục xóa đăng_ký thường_trú đến cơ_quan đăng_ký cư_trú . hồ_sơ xóa đăng_ký thường_trú gồm : tờ khai thay_đổi thông_tin cư_trú và giấy_tờ , tài_liệu chứng_minh thuộc một trong các trường_hợp xóa đăng_ký thường_trú .
    có_thể thực_hiện ủy_thác cho vay tại ngân_hàng thương_mại hay không ? phạm_vi điều_chỉnh 1 . tổ_chức tín_dụng , chi_nhánh ngân_hàng nước_ngoài chỉ được thực_hiện ủy_thác , nhận ủy_thác theo quy_định tại thông_tư này đối_với các hoạt_động sau đây : a ) cho vay ; b ) cho thuê tài_chính ; c ) góp vốn , mua cổ_phần ; d ) đầu_tư vào dự_án sản_xuất , kinh_doanh ; đ ) mua trái_phiếu doanh_nghiệp . 2 . việc tổ_chức tín_dụng , chi_nhánh ngân_hàng nước_ngoài nhận ủy_thác của chính_phủ thực_hiện theo quy_định của chính_phủ .
    ai có thẩm_quyền ra_lệnh phong_tỏa tài_khoản ? phong_tỏa tài_khoản 1 . phong_tỏa tài_khoản chỉ áp_dụng đối_với người bị buộc_tội về tội mà bộ_luật_hình_sự quy_định hình_phạt tiền , bị tịch_thu tài_sản hoặc để bảo_đảm bồi_thường thiệt_hại khi có căn_cứ xác_định người đó có tài_khoản tại tổ_chức tín_dụng hoặc kho_bạc nhà_nước . phong_tỏa tài_khoản cũng được áp_dụng đối_với tài_khoản của người khác nếu có căn_cứ cho rằng số tiền trong tài_khoản đó liên_quan đến hành_vi phạm_tội của người bị buộc_tội . 2 . những người có thẩm_quyền quy_định tại khoản 1 điều 113 của bộ_luật này , thẩm_phán chủ tọa phiên tòa có quyền ra_lệnh phong_tỏa tài_khoản . lệnh phong_tỏa tài_khoản của những người được quy_định tại điểm a_khoản 1 điều 113 của bộ_luật này phải được thông_báo ngay cho viện_kiểm_sát cùng cấp trước khi thi_hành . 3 . chỉ phong_tỏa số tiền trong tài_khoản tương_ứng với mức có_thể bị phạt tiền , bị tịch_thu tài_sản hoặc bồi_thường thiệt_hại . người được giao thực_hiện lệnh phong_tỏa , quản_lý tài_khoản bị phong_tỏa mà giải_tỏa việc phong_tỏa tài_khoản thì phải chịu trách_nhiệm hình_sự theo quy_định của bộ_luật_hình_sự .
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Evaluation Dataset

json

  • Dataset: json
  • Size: 147,585 evaluation samples
  • Columns: query and answer
  • Approximate statistics based on the first 1000 samples:
    query answer
    type string string
    details
    • min: 6 tokens
    • mean: 17.34 tokens
    • max: 57 tokens
    • min: 10 tokens
    • mean: 152.54 tokens
    • max: 256 tokens
  • Samples:
    query answer
    công_bố những thông_tin nào về xếp_hạng tín_nhiệm ? 2 . định_kỳ sáu ( 06 ) tháng một ( 01 ) lần , doanh_nghiệp xếp_hạng tín_nhiệm phải công_bố trên trang thông_tin điện_tử của doanh_nghiệp những số_liệu thống_kê cơ_bản sau : a ) kết_quả bậc xếp_hạng tín_nhiệm của mỗi tổ_chức được xếp_hạng tín_nhiệm kể từ lần đầu được xếp_hạng tín_nhiệm ; b ) tỷ_lệ bình_quân về việc thực_hiện đầy_đủ , đúng hạn nghĩa_vụ nợ của các tổ_chức được xếp_hạng tín_nhiệm theo từng bậc xếp_hạng . 3 . trước ngày 01 tháng 05 hàng năm , doanh_nghiệp xếp_hạng tín_nhiệm phải công_bố trên trang thông_tin điện_tử của doanh_nghiệp danh_sách các tổ_chức được xếp_hạng tín_nhiệm có mức chi_phí dịch_vụ xếp_hạng tín_nhiệm chiếm trên 5 % tổng doanh_thu từ hoạt_động xếp_hạng tín_nhiệm của doanh_nghiệp trong năm tài_chính liền kề trước thời_điểm công_bố thông_tin . 4 . thông_tin quy_định tại khoản 1 , khoản 2 và khoản 3 điều này phải được duy_trì , lưu_trữ tại trang thông_tin điện_tử của doanh_nghiệp xếp_hạng tín_nhiệm trong thời_hạn năm ( 05 ) năm kể từ thời_điểm công_bố .
    việc định_giá tài_sản góp vốn được thực_hiện theo nguyên_tắc nào ? điều 36 . định_giá tài_sản góp vốn 1 . tài_sản góp vốn không phải là đồng việt_nam , ngoại_tệ tự_do chuyển_đổi , vàng phải được các thành_viên , cổ_đông sáng_lập hoặc tổ_chức thẩm_định giá định_giá và được thể_hiện thành_đồng việt_nam . 2 . tài_sản góp vốn khi thành_lập doanh_nghiệp phải được các thành_viên , cổ_đông sáng_lập định_giá theo nguyên_tắc đồng_thuận hoặc do một tổ_chức thẩm_định giá định_giá . trường_hợp tổ_chức thẩm_định giá định_giá thì giá_trị tài_sản góp vốn phải được trên 50 % số thành_viên , cổ_đông sáng_lập chấp_thuận . trường_hợp tài_sản góp vốn được định_giá cao hơn so với giá_trị thực_tế của tài_sản đó tại thời_điểm góp vốn thì các thành_viên , cổ_đông sáng_lập cùng liên_đới góp thêm bằng số chênh_lệch giữa giá_trị được định_giá và giá_trị thực_tế của tài_sản góp vốn tại thời_điểm kết_thúc định_giá ; đồng_thời liên_đới chịu trách_nhiệm đối_với thiệt_hại do cố_ý định_giá tài_sản góp vốn cao hơn giá_trị thực_tế .
    nếu đăng_ký kết_hôn có yếu_tố nước_ngoài thì thời_hạn thực_hiện như_thế_nào ? điều 38 . thủ_tục đăng_ký kết_hôn 1 . hai bên nam , nữ nộp tờ khai theo mẫu quy_định và giấy xác_nhận của tổ_chức y_tế có thẩm_quyền của việt_nam hoặc nước_ngoài xác_nhận người đó không mắc bệnh_tâm_thần hoặc bệnh khác mà không có khả_năng nhận_thức , làm_chủ được hành_vi của mình cho cơ_quan đăng_ký hộ_tịch . người nước_ngoài , công_dân việt_nam định_cư ở nước_ngoài phải nộp thêm giấy_tờ chứng_minh tình_trạng hôn_nhân , bản_sao hộ_chiếu hoặc giấy_tờ có giá_trị thay hộ_chiếu . 2 . trong thời_hạn 15 ngày kể từ ngày nhận đủ giấy_tờ theo quy_định tại khoản 1 điều này , công_chức làm công_tác hộ_tịch có trách_nhiệm xác_minh , nếu thấy đủ điều_kiện kết_hôn theo quy_định của pháp_luật thì phòng tư_pháp báo_cáo chủ_tịch ủy ban_nhân_dân cấp huyện giải_quyết .
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • overwrite_output_dir: True
  • per_device_train_batch_size: 12
  • per_device_eval_batch_size: 12
  • learning_rate: 1e-05
  • num_train_epochs: 4
  • warmup_ratio: 0.1
  • fp16: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: True
  • do_predict: False
  • eval_strategy: no
  • prediction_loss_only: True
  • per_device_train_batch_size: 12
  • per_device_eval_batch_size: 12
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 1e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 4
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.1
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: True
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Click to expand
Epoch Step Training Loss
0.0102 100 1.0637
0.0203 200 0.7743
0.0305 300 0.3647
0.0407 400 0.1425
0.0508 500 0.0887
0.0610 600 0.0783
0.0711 700 0.059
0.0813 800 0.0563
0.0915 900 0.0474
0.1016 1000 0.0506
0.1118 1100 0.0398
0.1220 1200 0.0546
0.1321 1300 0.0346
0.1423 1400 0.0252
0.1525 1500 0.0245
0.1626 1600 0.023
0.1728 1700 0.0245
0.1829 1800 0.0326
0.1931 1900 0.0224
0.2033 2000 0.0168
0.2134 2100 0.0188
0.2236 2200 0.0385
0.2338 2300 0.0211
0.2439 2400 0.0162
0.2541 2500 0.0201
0.2643 2600 0.0165
0.2744 2700 0.0178
0.2846 2800 0.0244
0.2947 2900 0.0229
0.3049 3000 0.0159
0.3151 3100 0.0162
0.3252 3200 0.034
0.3354 3300 0.0197
0.3456 3400 0.026
0.3557 3500 0.0257
0.3659 3600 0.0139
0.3761 3700 0.0144
0.3862 3800 0.025
0.3964 3900 0.0128
0.4065 4000 0.0092
0.4167 4100 0.015
0.4269 4200 0.0167
0.4370 4300 0.0239
0.4472 4400 0.0139
0.4574 4500 0.0161
0.4675 4600 0.0143
0.4777 4700 0.0152
0.4879 4800 0.0125
0.4980 4900 0.0164
0.5082 5000 0.0214
0.5183 5100 0.0197
0.5285 5200 0.0174
0.5387 5300 0.0118
0.5488 5400 0.0147
0.5590 5500 0.0178
0.5692 5600 0.0109
0.5793 5700 0.0171
0.5895 5800 0.0223
0.5997 5900 0.0162
0.6098 6000 0.0222
0.6200 6100 0.0265
0.6301 6200 0.0126
0.6403 6300 0.0169
0.6505 6400 0.0172
0.6606 6500 0.0114
0.6708 6600 0.0177
0.6810 6700 0.0085
0.6911 6800 0.017
0.7013 6900 0.0217
0.7115 7000 0.012
0.7216 7100 0.0148
0.7318 7200 0.008
0.7419 7300 0.0147
0.7521 7400 0.0166
0.7623 7500 0.0089
0.7724 7600 0.0127
0.7826 7700 0.0193
0.7928 7800 0.0058
0.8029 7900 0.0104
0.8131 8000 0.0102
0.8233 8100 0.0172
0.8334 8200 0.015
0.8436 8300 0.0189
0.8537 8400 0.0092
0.8639 8500 0.0163
0.8741 8600 0.0081
0.8842 8700 0.0143
0.8944 8800 0.0129
0.9046 8900 0.0155
0.9147 9000 0.0052
0.9249 9100 0.0191
0.9351 9200 0.0098
0.9452 9300 0.0135
0.9554 9400 0.0122
0.9655 9500 0.0058
0.9757 9600 0.021
0.9859 9700 0.0164
0.9960 9800 0.0103
1.0062 9900 0.0073
1.0164 10000 0.0039
1.0265 10100 0.0103
1.0367 10200 0.0117
1.0469 10300 0.0085
1.0570 10400 0.0128
1.0672 10500 0.0112
1.0773 10600 0.0064
1.0875 10700 0.0142
1.0977 10800 0.0109
1.1078 10900 0.0143
1.1180 11000 0.0079
1.1282 11100 0.0231
1.1383 11200 0.006
1.1485 11300 0.0063
1.1587 11400 0.0094
1.1688 11500 0.0046
1.1790 11600 0.0147
1.1891 11700 0.0083
1.1993 11800 0.0044
1.2095 11900 0.0065
1.2196 12000 0.0072
1.2298 12100 0.0128
1.2400 12200 0.0067
1.2501 12300 0.0089
1.2603 12400 0.0044
1.2705 12500 0.0042
1.2806 12600 0.0045
1.2908 12700 0.0075
1.3009 12800 0.0054
1.3111 12900 0.0048
1.3213 13000 0.0178
1.3314 13100 0.0051
1.3416 13200 0.0063
1.3518 13300 0.0066
1.3619 13400 0.0051
1.3721 13500 0.0031
1.3823 13600 0.01
1.3924 13700 0.0037
1.4026 13800 0.0016
1.4127 13900 0.0062
1.4229 14000 0.0034
1.4331 14100 0.0067
1.4432 14200 0.0043
1.4534 14300 0.0014
1.4636 14400 0.0068
1.4737 14500 0.0021
1.4839 14600 0.0106
1.4941 14700 0.0035
1.5042 14800 0.0072
1.5144 14900 0.0041
1.5245 15000 0.0061
1.5347 15100 0.007
1.5449 15200 0.0044
1.5550 15300 0.0062
1.5652 15400 0.0061
1.5754 15500 0.0013
1.5855 15600 0.0063
1.5957 15700 0.0078
1.6059 15800 0.0016
1.6160 15900 0.0135
1.6262 16000 0.0063
1.6363 16100 0.0083
1.6465 16200 0.0034
1.6567 16300 0.0016
1.6668 16400 0.0063
1.6770 16500 0.0025
1.6872 16600 0.0022
1.6973 16700 0.0035
1.7075 16800 0.0053
1.7177 16900 0.0024
1.7278 17000 0.0045
1.7380 17100 0.0032
1.7481 17200 0.0076
1.7583 17300 0.0045
1.7685 17400 0.0029
1.7786 17500 0.004
1.7888 17600 0.0023
1.7990 17700 0.002
1.8091 17800 0.0033
1.8193 17900 0.0053
1.8295 18000 0.0028
1.8396 18100 0.0047
1.8498 18200 0.003
1.8599 18300 0.0062
1.8701 18400 0.0021
1.8803 18500 0.002
1.8904 18600 0.0062
1.9006 18700 0.0028
1.9108 18800 0.0016
1.9209 18900 0.0032
1.9311 19000 0.0027
1.9413 19100 0.0026
1.9514 19200 0.0036
1.9616 19300 0.0022
1.9717 19400 0.0035
1.9819 19500 0.0055
1.9921 19600 0.0013
2.0022 19700 0.0028
2.0124 19800 0.0015
2.0226 19900 0.0043
2.0327 20000 0.0017
2.0429 20100 0.0038
2.0531 20200 0.0034
2.0632 20300 0.0033
2.0734 20400 0.0009
2.0835 20500 0.004
2.0937 20600 0.0035
2.1039 20700 0.0054
2.1140 20800 0.0019
2.1242 20900 0.008
2.1344 21000 0.0032
2.1445 21100 0.0009
2.1547 21200 0.0015
2.1649 21300 0.0024
2.1750 21400 0.0035
2.1852 21500 0.0016
2.1953 21600 0.002
2.2055 21700 0.0009
2.2157 21800 0.0013
2.2258 21900 0.0046
2.2360 22000 0.0015
2.2462 22100 0.0015
2.2563 22200 0.0019
2.2665 22300 0.0009
2.2767 22400 0.0019
2.2868 22500 0.0027
2.2970 22600 0.0016
2.3071 22700 0.0013
2.3173 22800 0.0058
2.3275 22900 0.0096
2.3376 23000 0.0016
2.3478 23100 0.0024
2.3580 23200 0.0021
2.3681 23300 0.001
2.3783 23400 0.0041
2.3885 23500 0.0015
2.3986 23600 0.0014
2.4088 23700 0.0006
2.4189 23800 0.0025
2.4291 23900 0.0011
2.4393 24000 0.0013
2.4494 24100 0.0008
2.4596 24200 0.0024
2.4698 24300 0.0025
2.4799 24400 0.0044
2.4901 24500 0.0011
2.5003 24600 0.0014
2.5104 24700 0.0021
2.5206 24800 0.0011
2.5307 24900 0.001
2.5409 25000 0.0009
2.5511 25100 0.0011
2.5612 25200 0.0011
2.5714 25300 0.0013
2.5816 25400 0.0014
2.5917 25500 0.0028
2.6019 25600 0.0006
2.6121 25700 0.0064
2.6222 25800 0.0019
2.6324 25900 0.0009
2.6425 26000 0.0017
2.6527 26100 0.001
2.6629 26200 0.0012
2.6730 26300 0.0014
2.6832 26400 0.0007
2.6934 26500 0.0012
2.7035 26600 0.0023
2.7137 26700 0.0007
2.7239 26800 0.0013
2.7340 26900 0.0006
2.7442 27000 0.0036
2.7543 27100 0.0012
2.7645 27200 0.0008
2.7747 27300 0.0011
2.7848 27400 0.0018
2.7950 27500 0.0008
2.8052 27600 0.001
2.8153 27700 0.0023
2.8255 27800 0.0008
2.8357 27900 0.0015
2.8458 28000 0.0008
2.8560 28100 0.0016
2.8661 28200 0.0019
2.8763 28300 0.0014
2.8865 28400 0.0015
2.8966 28500 0.0009
2.9068 28600 0.0008
2.9170 28700 0.0006
2.9271 28800 0.001
2.9373 28900 0.0021
2.9475 29000 0.0016
2.9576 29100 0.0004
2.9678 29200 0.0006
2.9779 29300 0.0013
2.9881 29400 0.0008
2.9983 29500 0.0018
3.0084 29600 0.0006
3.0186 29700 0.0009
3.0288 29800 0.0007
3.0389 29900 0.0016
3.0491 30000 0.0006
3.0593 30100 0.0009
3.0694 30200 0.0005
3.0796 30300 0.0008
3.0897 30400 0.0026
3.0999 30500 0.0007
3.1101 30600 0.0011
3.1202 30700 0.0024
3.1304 30800 0.0029
3.1406 30900 0.0009
3.1507 31000 0.0006
3.1609 31100 0.0011
3.1711 31200 0.0007
3.1812 31300 0.001
3.1914 31400 0.001
3.2015 31500 0.0008
3.2117 31600 0.0004
3.2219 31700 0.0007
3.2320 31800 0.0007
3.2422 31900 0.0006
3.2524 32000 0.0006
3.2625 32100 0.0007
3.2727 32200 0.0012
3.2829 32300 0.0006
3.2930 32400 0.0006
3.3032 32500 0.0006
3.3133 32600 0.0022
3.3235 32700 0.0067
3.3337 32800 0.0008
3.3438 32900 0.0011
3.3540 33000 0.0015
3.3642 33100 0.0005
3.3743 33200 0.0005
3.3845 33300 0.0072
3.3947 33400 0.0005
3.4048 33500 0.0003
3.4150 33600 0.0013
3.4251 33700 0.0004
3.4353 33800 0.0009
3.4455 33900 0.0004
3.4556 34000 0.0005
3.4658 34100 0.0012
3.4760 34200 0.0004
3.4861 34300 0.0021
3.4963 34400 0.0006
3.5065 34500 0.0013
3.5166 34600 0.0003
3.5268 34700 0.0006
3.5369 34800 0.0005
3.5471 34900 0.0006
3.5573 35000 0.0005
3.5674 35100 0.0008
3.5776 35200 0.0004
3.5878 35300 0.0008
3.5979 35400 0.0006
3.6081 35500 0.0031
3.6183 35600 0.0008
3.6284 35700 0.0006
3.6386 35800 0.0005
3.6487 35900 0.0005
3.6589 36000 0.0005
3.6691 36100 0.0008
3.6792 36200 0.0003
3.6894 36300 0.0004
3.6996 36400 0.0005
3.7097 36500 0.0011
3.7199 36600 0.0005
3.7301 36700 0.0004
3.7402 36800 0.0008
3.7504 36900 0.0005
3.7605 37000 0.0011
3.7707 37100 0.0005
3.7809 37200 0.0009
3.7910 37300 0.0005
3.8012 37400 0.0005
3.8114 37500 0.0004
3.8215 37600 0.0006
3.8317 37700 0.0007
3.8419 37800 0.0005
3.8520 37900 0.0012
3.8622 38000 0.0012
3.8723 38100 0.0005
3.8825 38200 0.0004
3.8927 38300 0.0004
3.9028 38400 0.0006
3.9130 38500 0.0004
3.9232 38600 0.0007
3.9333 38700 0.0006
3.9435 38800 0.0009
3.9537 38900 0.0004
3.9638 39000 0.0003
3.9740 39100 0.0004
3.9841 39200 0.0004
3.9943 39300 0.0004

Framework Versions

  • Python: 3.10.14
  • Sentence Transformers: 3.2.1
  • Transformers: 4.45.1
  • PyTorch: 2.4.0
  • Accelerate: 0.34.2
  • Datasets: 3.0.1
  • Tokenizers: 0.20.0

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}
Downloads last month
3
Safetensors
Model size
135M params
Tensor type
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Model tree for tanbinh2210/phobert-hackathon-no-neg

Finetuned
(1)
this model