--- library_name: setfit tags: - setfit - sentence-transformers - text-classification - generated_from_setfit_trainer base_model: jhgan/ko-sbert-multitask metrics: - accuracy widget: - text: 제습기 전기세가 어느 정도 나오는지 궁금합니다. 요즘 비가 계속 오기도 했고 집 안의 습도가 너무 높아서 거의 하루 종일 제습기를 틀어놓고는 하는데 인터넷에서 제습기 전기세가 꽤나 많이 나온다는 내용의 글응 보았습니다. 제습기 전기세가 다른 가전제품에 비해서 어느 정도 나오는지 궁금합니다. - text: '우주선에 사용하는 전선은 일상생활에 사용하는것과 같은 재질인가요? 궁금한데요. 영화같은데보면 일반전선이랑 같은거같은데 실제로 그러진않겠죠? 지구대기랑 다른 악조건에 견디게 만들거같은데 어떨런지요? ' - text: 부산 바다가 보이는 카페는 어떤 곳이 있나요? 다음달에 부산 여행을 갈 생각인데요. 부산 바다가 좀 보이는 카페를 가보고 싶어요. 하지만 너무 사람들이 많이 오는곳은 제외 하구요. 1층이 아니라 고층이면 더 좋습니다! - text: 경희대학교 토목공학과 전망 괜찮을까요? 경희대학교 토목공학과 전망 괜찮은지 궁금합니다.토목공학 자체가 지금 그렇게 좋은 느낌은 아닌 것 같은데..ㅠㅠ우스갯 소리로 잘되려면 통일이 되어야 토목공학과가 살아날 수 있다고 하던데ㅋ....그래도 학교 네임 밸류가 좋아서.. 괜찮을 것 같기도하고전망 어떤가요!? - text: 치아관리 치아가잇몸이올라가 치아뿌리분이조금보여요 제목그대로 치아뿌리가보이고 잇몸이 올라가있는거같아요 잇몸에좋은치료방법이있나요. 잇몸치약을쓰고있는데. 다른방법이있으면알려주세요 pipeline_tag: text-classification inference: true model-index: - name: SetFit with jhgan/ko-sbert-multitask results: - task: type: text-classification name: Text Classification dataset: name: Unknown type: unknown split: test metrics: - type: accuracy value: 0.5897435897435898 name: Accuracy --- # SetFit with jhgan/ko-sbert-multitask This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. This SetFit model uses [jhgan/ko-sbert-multitask](https://huggingface.co/jhgan/ko-sbert-multitask) as the Sentence Transformer embedding model. A [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance is used for classification. The model has been trained using an efficient few-shot learning technique that involves: 1. Fine-tuning a [Sentence Transformer](https://www.sbert.net) with contrastive learning. 2. Training a classification head with features from the fine-tuned Sentence Transformer. ## Model Details ### Model Description - **Model Type:** SetFit - **Sentence Transformer body:** [jhgan/ko-sbert-multitask](https://huggingface.co/jhgan/ko-sbert-multitask) - **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance - **Maximum Sequence Length:** 128 tokens - **Number of Classes:** 208 classes ### Model Sources - **Repository:** [SetFit on GitHub](https://github.com/huggingface/setfit) - **Paper:** [Efficient Few-Shot Learning Without Prompts](https://arxiv.org/abs/2209.11055) - **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit) ### Model Labels | Label | Examples | |:----------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | 가족·이혼 | | | 형사 | | | 폭행·협박 | | | 명예훼손·모욕 | | | 재산범죄 | | | 교통사고 | | | 성범죄 | | | 민사 | | | 부동산·임대차 | | | 가압류·가처분 | | | 회생·파산 | | | 금융 | | | 의료 | | | 기업·회사 | | | 기타 법률상담 | | | 지식재산권·IT | | | 양도소득세 | | | 증여세 | | | 상속세 | | | 종합소득세 | | | 부가가치세 | | | 종합부동산세 | | | 법인세 | | | 연말정산 | | | 취득세·등록세 | | | 세무조사·불복 | | | 기타 세금상담 | | | 회계자문 | | | 근로계약 | | | 휴일·휴가 | | | 구조조정 | | | 해고·징계 | | | 산업재해 | | | 직장내괴롭힘 | | | 임금체불 | | | 임금·급여 | | | 기타 노무상담 | | | 내과 | | | 이비인후과 | | | 안과 | | | 소아청소년과 | | | 피부과 | | | 성형외과 | | | 비뇨의학과 | | | 산부인과 | | | 정형외과 | | | 신경외과 | | | 치과 | | | 치아 관리 | | | 한의학 | | | 재활·물리치료 | | | 기타 의료상담 | | | 식습관·식이요법 | | | 다이어트 식단 | | | 영유아·아동 식단 | | | 환자 식단 | | | 기타 영양상담 | | | 약 복용 | | | 영양제 | | | 기타 약료상담 | | | 한약 | | | 대인관계 | | | 자아·자기이해 | | | 연애·이성 | | | 정신건강 | | | 기타 심리상담 | | | 반려동물 건강 | | | 반려동물 훈련 | | | 반려동물 미용 | | | 양육·훈육 | | | 놀이 | | | 유아교육 | | | 기타 육아상담 | | | 경제정책 | | | 경제동향 | | | 경제용어 | | | 예금·적금 | | | 주식·가상화폐 | | | 대출 | | | 자산관리 | | | 부동산 | | | 무역 | | | 의료 보험 | | | 상해 보험 | | | 저축성 보험 | | | 재산 보험 | | | 교통사고 과실 | | | 자동차 수리 | | | 물리 | | | 화학 | | | 생물·생명 | | | 지구과학·천문우주 | | | 전기·전자 | | | 기계공학 | | | 토목공학 | | | 화학공학 | | | 역사 | | | 문학 | | | 미술 | | | 음악 | | | 철학 | | | 삼성 | | | SK | | | 현대자동차 | | | LG | | | 롯데 | | | 한화 | | | 현대중공업 | | | 네이버 | | | 서울대학교 | | | 연세대학교 | | | 고려대학교 | | | KAIST | | | 포항공과대학교 | | | 성균관대학교 | | | 한양대학교 | | | 서강대학교 | | | UNIST | | | GIST | | | 경희대학교 | | | 중앙대학교 | | | 한국외국어대학교 | | | 서울시립대학교 | | | 의과대학 | | | 치과대학 | | | 로스쿨 | | | 한의대학 | | | 변호사 자격증 | | | 변리사 자격증 | | | 공인회계사 자격증 | | | 세무사 자격증 | | | 손해사정사 자격증 | | | 관세사 자격증 | | | 공인노무사 자격증 | | | 간호조무사 자격증 | | | 사회복지사 자격증 | | | 행정사 자격증 | | | 정보처리기사 | | | 산업안전산업기사 | | | 전기기사·기능사 | | | 지게차운전기능사 | | | 보험설계사 자격증 | | | 공인중개사 자격증 | | | 중학교 생활 | | | 고등학교 생활 | | | 대학교 생활 | | | 회사 생활 | | | 군대 생활 | | | 연애·결혼 | | | 기타 고민상담 | | | PC·노트북 | | | PC 주변기기 | | | 스마트폰·태블릿 | | | 음향기기 | | | 웨어러블 기기 | | | 기타 장치 | | | 주방가전 | | | 생활·미용가전 | | | 영상가전 | | | 세탁기·건조기 | | | 청소기 | | | 계절가전 | | | 기타가전 | | | 축구·풋살 | | | 야구 | | | 농구 | | | 골프 | | | 테니스 | | | 헬스 | | | 요가·필라테스 | | | 크로스핏 | | | 스키·보드 | | | 스케이트 | | | 수영 | | | 런닝 | | | 기타 스포츠 | | | 서울·수도권 | | | 강원 | | | 충청 | | | 경상 | | | 부산 | | | 전라 | | | 제주 | | | 일본 | | | 중국 | | | 동남아 | | | 유럽·아프리카 | | | 미주·중남미 | | | 오세아니아 | | | 하이킹 | | | 등산·클라이밍 | | | 낚시 | | | 캠핑 | | | 책·독서 | | | 사진·영상 | | | 음악 | | | 가드닝 | | | 드라마 | | | 예능 | | | 영화·애니 | | | 웹툰·웹소설 | | | 뮤지컬·연극 | | | 인테리어 | | | 청소 | | | 세탁수선 | | | 자동차 | | | 환경·에너지 | | | 재료공학 | | ## Evaluation ### Metrics | Label | Accuracy | |:--------|:---------| | **all** | 0.5897 | ## Uses ### Direct Use for Inference First install the SetFit library: ```bash pip install setfit ``` Then you can load this model and run inference. ```python from setfit import SetFitModel # Download from the 🤗 Hub model = SetFitModel.from_pretrained("djsull/setfit_classifier") # Run inference preds = model("치아관리 치아가잇몸이올라가 치아뿌리분이조금보여요 제목그대로 치아뿌리가보이고 잇몸이 올라가있는거같아요 잇몸에좋은치료방법이있나요. 잇몸치약을쓰고있는데. 다른방법이있으면알려주세요") ``` ## Training Details ### Training Set Metrics | Training set | Min | Median | Max | |:-------------|:----|:--------|:----| | Word count | 10 | 35.1894 | 468 | | Label | Training Sample Count | |:----------|:----------------------| | 가족·이혼 | 25 | | 형사 | 28 | | 폭행·협박 | 28 | | 명예훼손·모욕 | 28 | | 재산범죄 | 28 | | 교통사고 | 28 | | 성범죄 | 28 | | 민사 | 28 | | 부동산·임대차 | 28 | | 가압류·가처분 | 25 | | 회생·파산 | 28 | | 금융 | 28 | | 의료 | 28 | | 기업·회사 | 25 | | 기타 법률상담 | 25 | | 지식재산권·IT | 28 | | 양도소득세 | 28 | | 증여세 | 28 | | 상속세 | 28 | | 종합소득세 | 28 | | 부가가치세 | 28 | | 종합부동산세 | 28 | | 법인세 | 28 | | 연말정산 | 28 | | 취득세·등록세 | 28 | | 세무조사·불복 | 28 | | 기타 세금상담 | 28 | | 회계자문 | 28 | | 근로계약 | 28 | | 휴일·휴가 | 28 | | 구조조정 | 28 | | 해고·징계 | 28 | | 산업재해 | 28 | | 직장내괴롭힘 | 25 | | 임금체불 | 28 | | 임금·급여 | 28 | | 기타 노무상담 | 28 | | 내과 | 28 | | 이비인후과 | 28 | | 안과 | 28 | | 소아청소년과 | 28 | | 피부과 | 28 | | 성형외과 | 28 | | 비뇨의학과 | 28 | | 산부인과 | 28 | | 정형외과 | 28 | | 신경외과 | 28 | | 치과 | 28 | | 치아 관리 | 28 | | 한의학 | 28 | | 재활·물리치료 | 28 | | 기타 의료상담 | 28 | | 식습관·식이요법 | 28 | | 다이어트 식단 | 28 | | 영유아·아동 식단 | 28 | | 환자 식단 | 28 | | 기타 영양상담 | 28 | | 약 복용 | 28 | | 영양제 | 28 | | 기타 약료상담 | 28 | | 한약 | 28 | | 대인관계 | 25 | | 자아·자기이해 | 28 | | 연애·이성 | 28 | | 정신건강 | 28 | | 기타 심리상담 | 28 | | 반려동물 건강 | 28 | | 반려동물 훈련 | 28 | | 반려동물 미용 | 28 | | 양육·훈육 | 28 | | 놀이 | 28 | | 유아교육 | 28 | | 기타 육아상담 | 25 | | 경제정책 | 28 | | 경제동향 | 28 | | 경제용어 | 28 | | 예금·적금 | 28 | | 주식·가상화폐 | 28 | | 대출 | 28 | | 자산관리 | 28 | | 부동산 | 28 | | 무역 | 28 | | 의료 보험 | 28 | | 상해 보험 | 28 | | 저축성 보험 | 28 | | 재산 보험 | 28 | | 교통사고 과실 | 28 | | 자동차 수리 | 28 | | 물리 | 28 | | 화학 | 28 | | 생물·생명 | 28 | | 지구과학·천문우주 | 28 | | 전기·전자 | 28 | | 기계공학 | 28 | | 토목공학 | 28 | | 화학공학 | 28 | | 역사 | 28 | | 문학 | 28 | | 미술 | 28 | | 음악 | 28 | | 철학 | 28 | | 삼성 | 28 | | SK | 28 | | 현대자동차 | 28 | | LG | 28 | | 롯데 | 28 | | 한화 | 28 | | 현대중공업 | 28 | | 네이버 | 28 | | 서울대학교 | 28 | | 연세대학교 | 28 | | 고려대학교 | 28 | | KAIST | 28 | | 포항공과대학교 | 28 | | 성균관대학교 | 28 | | 한양대학교 | 28 | | 서강대학교 | 28 | | UNIST | 28 | | GIST | 28 | | 경희대학교 | 28 | | 중앙대학교 | 28 | | 한국외국어대학교 | 28 | | 서울시립대학교 | 28 | | 의과대학 | 28 | | 치과대학 | 28 | | 로스쿨 | 28 | | 한의대학 | 28 | | 변호사 자격증 | 28 | | 변리사 자격증 | 28 | | 공인회계사 자격증 | 28 | | 세무사 자격증 | 28 | | 손해사정사 자격증 | 28 | | 관세사 자격증 | 28 | | 공인노무사 자격증 | 28 | | 간호조무사 자격증 | 28 | | 사회복지사 자격증 | 28 | | 행정사 자격증 | 28 | | 정보처리기사 | 28 | | 산업안전산업기사 | 28 | | 전기기사·기능사 | 28 | | 지게차운전기능사 | 28 | | 보험설계사 자격증 | 28 | | 공인중개사 자격증 | 28 | | 중학교 생활 | 28 | | 고등학교 생활 | 28 | | 대학교 생활 | 28 | | 회사 생활 | 28 | | 군대 생활 | 28 | | 연애·결혼 | 28 | | 기타 고민상담 | 28 | | PC·노트북 | 28 | | PC 주변기기 | 28 | | 스마트폰·태블릿 | 28 | | 음향기기 | 28 | | 웨어러블 기기 | 28 | | 기타 장치 | 28 | | 주방가전 | 28 | | 생활·미용가전 | 28 | | 영상가전 | 28 | | 세탁기·건조기 | 28 | | 청소기 | 28 | | 계절가전 | 28 | | 기타가전 | 28 | | 축구·풋살 | 28 | | 야구 | 28 | | 농구 | 28 | | 골프 | 28 | | 테니스 | 28 | | 헬스 | 28 | | 요가·필라테스 | 28 | | 크로스핏 | 28 | | 스키·보드 | 28 | | 스케이트 | 28 | | 수영 | 28 | | 런닝 | 28 | | 기타 스포츠 | 28 | | 서울·수도권 | 28 | | 강원 | 28 | | 충청 | 28 | | 경상 | 28 | | 부산 | 28 | | 전라 | 28 | | 제주 | 28 | | 일본 | 28 | | 중국 | 28 | | 동남아 | 28 | | 유럽·아프리카 | 28 | | 미주·중남미 | 28 | | 오세아니아 | 28 | | 하이킹 | 28 | | 등산·클라이밍 | 28 | | 낚시 | 28 | | 캠핑 | 28 | | 책·독서 | 28 | | 사진·영상 | 28 | | 음악 | 28 | | 가드닝 | 28 | | 드라마 | 28 | | 예능 | 28 | | 영화·애니 | 28 | | 웹툰·웹소설 | 28 | | 뮤지컬·연극 | 28 | | 인테리어 | 28 | | 청소 | 28 | | 세탁수선 | 28 | | 자동차 | 28 | | 환경·에너지 | 28 | | 재료공학 | 28 | ### Training Hyperparameters - batch_size: (128, 128) - num_epochs: (2, 2) - max_steps: -1 - sampling_strategy: oversampling - num_iterations: 40 - body_learning_rate: (2e-05, 1e-05) - head_learning_rate: 0.01 - loss: CosineSimilarityLoss - distance_metric: cosine_distance - margin: 0.25 - end_to_end: False - use_amp: False - warmup_proportion: 0.1 - seed: 42 - eval_max_steps: -1 - load_best_model_at_end: True ### Training Results | Epoch | Step | Training Loss | Validation Loss | |:-------:|:--------:|:-------------:|:---------------:| | 0.0003 | 1 | 0.1474 | - | | 0.0138 | 50 | 0.1568 | - | | 0.0276 | 100 | 0.1114 | - | | 0.0414 | 150 | 0.0917 | - | | 0.0551 | 200 | 0.0674 | - | | 0.0689 | 250 | 0.0508 | - | | 0.0827 | 300 | 0.0355 | - | | 0.0965 | 350 | 0.0534 | - | | 0.1103 | 400 | 0.032 | - | | 0.1241 | 450 | 0.0276 | - | | 0.1379 | 500 | 0.0262 | - | | 0.1516 | 550 | 0.0247 | - | | 0.1654 | 600 | 0.0157 | - | | 0.1792 | 650 | 0.0118 | - | | 0.1930 | 700 | 0.0133 | - | | 0.2068 | 750 | 0.0126 | - | | 0.2206 | 800 | 0.0142 | - | | 0.2344 | 850 | 0.0053 | - | | 0.2481 | 900 | 0.0072 | - | | 0.2619 | 950 | 0.0143 | - | | 0.2757 | 1000 | 0.0088 | - | | 0.2895 | 1050 | 0.021 | - | | 0.3033 | 1100 | 0.0051 | - | | 0.3171 | 1150 | 0.0142 | - | | 0.3309 | 1200 | 0.0091 | - | | 0.3446 | 1250 | 0.013 | - | | 0.3584 | 1300 | 0.0039 | - | | 0.3722 | 1350 | 0.0033 | - | | 0.3860 | 1400 | 0.0033 | - | | 0.3998 | 1450 | 0.0113 | - | | 0.4136 | 1500 | 0.0055 | - | | 0.4274 | 1550 | 0.0109 | - | | 0.4411 | 1600 | 0.0119 | - | | 0.4549 | 1650 | 0.0078 | - | | 0.4687 | 1700 | 0.0018 | - | | 0.4825 | 1750 | 0.0112 | - | | 0.4963 | 1800 | 0.0085 | - | | 0.5101 | 1850 | 0.0144 | - | | 0.5238 | 1900 | 0.0021 | - | | 0.5376 | 1950 | 0.0089 | - | | 0.5514 | 2000 | 0.0038 | - | | 0.5652 | 2050 | 0.0039 | - | | 0.5790 | 2100 | 0.0027 | - | | 0.5928 | 2150 | 0.0012 | - | | 0.6066 | 2200 | 0.0072 | - | | 0.6203 | 2250 | 0.0027 | - | | 0.6341 | 2300 | 0.0062 | - | | 0.6479 | 2350 | 0.0053 | - | | 0.6617 | 2400 | 0.0019 | - | | 0.6755 | 2450 | 0.005 | - | | 0.6893 | 2500 | 0.0186 | - | | 0.7031 | 2550 | 0.0151 | - | | 0.7168 | 2600 | 0.0042 | - | | 0.7306 | 2650 | 0.0014 | - | | 0.7444 | 2700 | 0.0014 | - | | 0.7582 | 2750 | 0.0018 | - | | 0.7720 | 2800 | 0.0057 | - | | 0.7858 | 2850 | 0.0012 | - | | 0.7996 | 2900 | 0.0046 | - | | 0.8133 | 2950 | 0.002 | - | | 0.8271 | 3000 | 0.003 | - | | 0.8409 | 3050 | 0.001 | - | | 0.8547 | 3100 | 0.0013 | - | | 0.8685 | 3150 | 0.0069 | - | | 0.8823 | 3200 | 0.0021 | - | | 0.8961 | 3250 | 0.0008 | - | | 0.9098 | 3300 | 0.0023 | - | | 0.9236 | 3350 | 0.0017 | - | | 0.9374 | 3400 | 0.0056 | - | | 0.9512 | 3450 | 0.0008 | - | | 0.9650 | 3500 | 0.0074 | - | | 0.9788 | 3550 | 0.0007 | - | | 0.9926 | 3600 | 0.0049 | - | | **1.0** | **3627** | **-** | **0.0758** | | 1.0063 | 3650 | 0.0017 | - | | 1.0201 | 3700 | 0.0011 | - | | 1.0339 | 3750 | 0.0081 | - | | 1.0477 | 3800 | 0.0027 | - | | 1.0615 | 3850 | 0.0107 | - | | 1.0753 | 3900 | 0.008 | - | | 1.0891 | 3950 | 0.0012 | - | | 1.1028 | 4000 | 0.0013 | - | | 1.1166 | 4050 | 0.0012 | - | | 1.1304 | 4100 | 0.0011 | - | | 1.1442 | 4150 | 0.0023 | - | | 1.1580 | 4200 | 0.0008 | - | | 1.1718 | 4250 | 0.007 | - | | 1.1856 | 4300 | 0.0009 | - | | 1.1993 | 4350 | 0.001 | - | | 1.2131 | 4400 | 0.0009 | - | | 1.2269 | 4450 | 0.0078 | - | | 1.2407 | 4500 | 0.0011 | - | | 1.2545 | 4550 | 0.009 | - | | 1.2683 | 4600 | 0.0014 | - | | 1.2821 | 4650 | 0.0059 | - | | 1.2958 | 4700 | 0.0009 | - | | 1.3096 | 4750 | 0.0009 | - | | 1.3234 | 4800 | 0.0008 | - | | 1.3372 | 4850 | 0.0008 | - | | 1.3510 | 4900 | 0.0059 | - | | 1.3648 | 4950 | 0.001 | - | | 1.3785 | 5000 | 0.0045 | - | | 1.3923 | 5050 | 0.0009 | - | | 1.4061 | 5100 | 0.0008 | - | | 1.4199 | 5150 | 0.0073 | - | | 1.4337 | 5200 | 0.0016 | - | | 1.4475 | 5250 | 0.001 | - | | 1.4613 | 5300 | 0.0006 | - | | 1.4750 | 5350 | 0.0023 | - | | 1.4888 | 5400 | 0.0006 | - | | 1.5026 | 5450 | 0.0008 | - | | 1.5164 | 5500 | 0.001 | - | | 1.5302 | 5550 | 0.0019 | - | | 1.5440 | 5600 | 0.0069 | - | | 1.5578 | 5650 | 0.0007 | - | | 1.5715 | 5700 | 0.0006 | - | | 1.5853 | 5750 | 0.0006 | - | | 1.5991 | 5800 | 0.0006 | - | | 1.6129 | 5850 | 0.0084 | - | | 1.6267 | 5900 | 0.0006 | - | | 1.6405 | 5950 | 0.0035 | - | | 1.6543 | 6000 | 0.0005 | - | | 1.6680 | 6050 | 0.0016 | - | | 1.6818 | 6100 | 0.0058 | - | | 1.6956 | 6150 | 0.0066 | - | | 1.7094 | 6200 | 0.0007 | - | | 1.7232 | 6250 | 0.001 | - | | 1.7370 | 6300 | 0.0007 | - | | 1.7508 | 6350 | 0.0005 | - | | 1.7645 | 6400 | 0.0004 | - | | 1.7783 | 6450 | 0.005 | - | | 1.7921 | 6500 | 0.0006 | - | | 1.8059 | 6550 | 0.0007 | - | | 1.8197 | 6600 | 0.0008 | - | | 1.8335 | 6650 | 0.0012 | - | | 1.8473 | 6700 | 0.0025 | - | | 1.8610 | 6750 | 0.0072 | - | | 1.8748 | 6800 | 0.005 | - | | 1.8886 | 6850 | 0.0004 | - | | 1.9024 | 6900 | 0.0085 | - | | 1.9162 | 6950 | 0.0014 | - | | 1.9300 | 7000 | 0.0007 | - | | 1.9438 | 7050 | 0.0006 | - | | 1.9575 | 7100 | 0.0015 | - | | 1.9713 | 7150 | 0.0006 | - | | 1.9851 | 7200 | 0.0004 | - | | 1.9989 | 7250 | 0.0037 | - | | 2.0 | 7254 | - | 0.0844 | * The bold row denotes the saved checkpoint. ### Framework Versions - Python: 3.10.12 - SetFit: 1.0.3 - Sentence Transformers: 2.7.0 - Transformers: 4.40.2 - PyTorch: 2.0.1 - Datasets: 2.19.1 - Tokenizers: 0.19.1 ## Citation ### BibTeX ```bibtex @article{https://doi.org/10.48550/arxiv.2209.11055, doi = {10.48550/ARXIV.2209.11055}, url = {https://arxiv.org/abs/2209.11055}, author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren}, keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences}, title = {Efficient Few-Shot Learning Without Prompts}, publisher = {arXiv}, year = {2022}, copyright = {Creative Commons Attribution 4.0 International} } ```