File size: 19,321 Bytes
b4c2760 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 |
---
base_model: mini1013/master_domain
library_name: setfit
metrics:
- metric
pipeline_tag: text-classification
tags:
- setfit
- sentence-transformers
- text-classification
- generated_from_setfit_trainer
widget:
- text: 전기 스팀해빙기 수도 배관 동파방지 고온 공구 스팀 고성능 고압 2500W 디지털 7점 세트 2500W 산업용 온도조절 7종 세트+수납함
하니빌리지
- text: 스텐 나사못 목재 피스 목공 철판 나사 직결 와샤머리 4-13(25개) 11. 스텐 트라스머리 볼트_M5-40 (5개) 리더화스너
- text: 안전봉투 택배 포장 뽁뽁이 0호 100X100+40 10매 소량 주황 [비접착] 투명 에어캡 봉투 - 0.2T_18호 250x350
10매 주식회사 이고다(IGODA CO. ,Ltd.)
- text: 토네이도 다이아몬드 융착코어비트 폴리싱 대리석 천공 TQ5 57_TTC 17 주식회사 투엑스
- text: 킹토니 핸드소켓 복스알 233504M 2. 롱핸드소켓(육각)_2-21 323513M 3/8x13mm 제로나인
inference: true
model-index:
- name: SetFit with mini1013/master_domain
results:
- task:
type: text-classification
name: Text Classification
dataset:
name: Unknown
type: unknown
split: test
metrics:
- type: metric
value: 0.6113686482182797
name: Metric
---
# SetFit with mini1013/master_domain
This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. This SetFit model uses [mini1013/master_domain](https://huggingface.co/mini1013/master_domain) as the Sentence Transformer embedding model. A [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance is used for classification.
The model has been trained using an efficient few-shot learning technique that involves:
1. Fine-tuning a [Sentence Transformer](https://www.sbert.net) with contrastive learning.
2. Training a classification head with features from the fine-tuned Sentence Transformer.
## Model Details
### Model Description
- **Model Type:** SetFit
- **Sentence Transformer body:** [mini1013/master_domain](https://huggingface.co/mini1013/master_domain)
- **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
- **Maximum Sequence Length:** 512 tokens
- **Number of Classes:** 19 classes
<!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->
### Model Sources
- **Repository:** [SetFit on GitHub](https://github.com/huggingface/setfit)
- **Paper:** [Efficient Few-Shot Learning Without Prompts](https://arxiv.org/abs/2209.11055)
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
### Model Labels
| Label | Examples |
|:------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 1.0 | <ul><li>'장인들의도구들 오토피드 동관커터기 4분의1 (빨강) 엘디에스컴퍼니(LDS Company)'</li><li>'농막 물탱크 대용량 플라스틱 우수 물저장 배럴 탱크 25kg (내부 커버 포함) 미들페이지'</li><li>'인서트 비트 세트, 9개 에스엠샵'</li></ul> |
| 18.0 | <ul><li>'[다이소박스] 오픈형 이사박스 단프라 이삿짐 플라스틱 이사용 15. (고급형) 중형박스_(고급형) 중형 청색 주식회사 아성솔루션'</li><li>'PE 롤비닐 통비닐 0.03mm 12cm x 457m 0.1mm_선택29. (폭100cm x 길이91m) 주식회사 제일재단'</li><li>'통샵 공단보자기 45cm 10장묶음 65×65 -10장 묶음_연노랑 통샵'</li></ul> |
| 5.0 | <ul><li>'마끼다 충전직소 DJV184Z 본체 18V 속도조절 브러쉬리스 충전직쏘 디유니마켓'</li><li>'[UDT] 에어 해머 함마 치즐4개 포함 UD-1042 선택3. 에어해머 (UD-1043) 주식회사 마이크로엠알오'</li><li>'탈포기 기포제거 레진 공예 실리콘 몰드 진공 화장품 19L 지름30Cm 높이 30Cm 토마톡'</li></ul> |
| 4.0 | <ul><li>'침대 난간 어르신 환자 기상 보조 프레임 A. 탄소강 좁은 팔걸이 시엘로'</li><li>'청소중 주차금지 입간판 A형표지판 공사중 미끄럼주의 주차금지 사위탁'</li><li>'오토스 고글 투명 보안경 618A 넓은 시야확보 긁힘방지 무게 48.4g 가벼운 보호안경 OTOS 보안경 B-618ASF 지엠트리 (GMTree)'</li></ul> |
| 14.0 | <ul><li>'평 와셔 스텐 M6 1개 낱개 판매 제이원커머스'</li><li>'플랜지 후렌지 스텐 후렌치너트 m3 (10개) 5/16인치 (5개) 일진금속'</li><li>'포니 스프링클램프 집게 핸디 요르젠센 조명고정 3201-HT 베세이 XM3 주식회사 종원툴링'</li></ul> |
| 8.0 | <ul><li>'프로펠 미니윈치 단상 220V 호박 와이어윈치 PW160 2홀_160kg_PW160 주식회사 다보인터내셔널(DAVOInternational Co.,Ltd.)'</li><li>'디월트 잭 리프트 DWHT83550 만능 지랫대 옮기기 냉장고 가구 소형 핸드 01.디월트잭리프트(실재고X 입고시 출고) 주식회사 동성툴 (dongsungtool)'</li><li>'사다리 접이식 가정용 5단 a형 안전 광폭 작업발판 노랑 NLS05 경량사다리_NLL02 2단 공구 제트(Z)'</li></ul> |
| 0.0 | <ul><li>'3M 스폰지 페파 7136270 02601(600~800방) (주)한메소프트'</li><li>'장판 홈파기 수동 칼 나이프 컷터 커팅기 PVC 바닥 단일 상품 나인포리세븐'</li><li>'스마토 롱라쳇렌치 한쪽롱 L 13x17L 스마토 롱라쳇렌치 (한쪽롱)L 13x17L 디와이스토어'</li></ul> |
| 6.0 | <ul><li>'그린웍스 무선 전정기 40V GMAX 본체 01. 본체 네이스'</li><li>'D&D PowerDrive BP78 V 벨트 134247 트리니티 에덴 로우'</li><li>'혼다 4행정 예초기 셀러리픽 배낭 행정 벌초기 제초기 세트 배낭형 2 GX35 백팩 18.8KW 대행몰A'</li></ul> |
| 12.0 | <ul><li>'디월트 충전원형톱 DCS573N 184mm (18V/20V) 본체만 디월트 충전원형톱 DCS573N 184mm ( 최저가유통몰'</li><li>'디월트 DCG405P2 20V 브러쉬리스 충전 그라인더 (5.0Ahx2) 풀세트 주식회사 부일툴릭스'</li><li>'충전직소 DJV184Z 본체 18V 속도조절 브러쉬리스 충전직쏘 마끼다 리씨유통'</li></ul> |
| 11.0 | <ul><li>'주피터 쥬피터 무선 송풍기 낙엽청소기 JUB-18DE 에어 충전식 18V 디월트 배터리호환 이에스툴'</li><li>'타이탄드릴맨 스키비디토일렛 업타티맨 업그레이드 스피커맨 활동타이탄클락킹황금대검-536입자 아이엠117'</li><li>'핫드릴 보석 큐빅 붙이는 펜 방법 건 옷 다림질 포인트 수리 철 헤드 패션 원단 꾸미기 06 핑크 원형헤드 7개인두헤드 없음 삼각 공주&파티'</li></ul> |
| 2.0 | <ul><li>'보일러 온수 순환 펌프 모터 윌로 엘지 PH 045M 니더스몰'</li><li>'영주태양광 3k주택용 지와이(GY)산업'</li><li>'워터펌프 물펌프 다이아프램 소형 미니 수중 고열 고온 DC 12V 30W 04 워터펌프(고급형-너트) 80W 12V 주식회사 세인티에프'</li></ul> |
| 15.0 | <ul><li>'휴대용 수동 카운터기 인원체크 운동량 체크 계수기 강성녕'</li><li>'티피링크 TP-LINK Tapo T315 스마트 온습도 센서 디스플레이형 Wi-Fi 허브 이 아이티 커머스'</li><li>'휴대용 디지털 음주측정기 오영이네'</li></ul> |
| 16.0 | <ul><li>'노루페인트 슈퍼에나멜 플러스 1L 목재용 철재용 에나멜 유성 페인트 적갈색 유광 특녹색_유광(Gloss) 세계상사'</li><li>'pieke 실내 인테리어용 프리미엄 수성 페인트 피크 페인트(1kg) abyss green (주)해광'</li><li>'[몬타나] 몬타나 골드 그래비티 대용량 다용도 도색용 아크릴 캔스프레이 400ml GOLD 5110_HIMALAYA 대림데칼스토어'</li></ul> |
| 3.0 | <ul><li>'무선 인슐린냉장고 휴대 충전 소형 차량 약품 보관함 단일 배터리(대기시간 약 10시간) 유어스토어'</li><li>'지넥스 정밀드라이버 세트 Y자 별나사 육각 Y 시계 안경 삼각 자석 십자 24in1 아이폰 전용수리공구 001339 주식회사 원빈다이어리'</li><li>'디월트 프리미엄 수공구세트 184PCS 코스트코 소켓 라쳇 공구세트 108PCS 시크릿카트'</li></ul> |
| 7.0 | <ul><li>'고온 고압 스팀 세척기 세차기 청소기 소독 에어컨 2600W 홈 업그레이드 직접 분사 모델 검정 구루미컴퍼니'</li><li>'크레토스 산소게이지 가스레귤레이터 감압기 조정기 EX-701 LPG-EX-705 알통공구'</li><li>'크레토스 산소게이지 가스레귤레이터 감압기 조정기 EX-701 CO2-EX-702B 220V-22 알통공구'</li></ul> |
| 17.0 | <ul><li>'페인트붓 건축도장기능사준비물 납작붓15mm 막붓 빽붓 문자 도형 평붓 유성수성 미술붓 페인트 붓 폭70mm(11호) 비케이(B.K)코리아'</li><li>'인터그레인 울트라데크 팀버스테인 10L 리치 초콜렛 (주)나무와사람들 던에드워드 페인트'</li><li>'수성 금속 방청페인트 속건형 친환경 무취 스테인리스/알루미늄합금 컬러 블루x2_350g 주식회사 플레이산'</li></ul> |
| 9.0 | <ul><li>'백마 양손가위 A-3000(180mm) 동아상사'</li><li>'토종벌 박스 꿀수확 벌꿀 야생벌통 밀랍판 채집 5단 건조 5단 격자 상자 1창 왁스 5단 격자 상자 5창 감동산글로벌'</li><li>'파종기 모종 다기능 심기 시금치 기계 종자 심는 무 양배추 파종 6줄(줄간격 7.5~9) 셀러리픽몰'</li></ul> |
| 10.0 | <ul><li>'진흥 주택용 가정용 누전 차단기 30A 소형 차단기교체 주택용(가정용) 누전차단기_01)2P 30A 소형 그린전기조명'</li><li>'국산 필수전공 요비선 1선 빨강 5m 낚시대요비선_6.0MM_10EA/SET 피에스툴즈'</li><li>'캠핑 릴선 15m 4구 밀리터리 캠핑 오토캠핑 니드선 전기선 연장선 2구_카키_15m 롱캠'</li></ul> |
| 13.0 | <ul><li>'다우실 707 바이오 방수 실리콘 투명 박스 25개입 주방 싱크대 욕실 욕조 코킹 방화용_다우 1199S 흑색 모멘트리 (MOMENTREE)'</li><li>'벡스 WD-40 낱개 360ml 신형 스마트 스트로우 SS형 WD40 벡스 WD-40 360ml(일반형) 모멘트리 (MOMENTREE)'</li><li>'철물팩토리 백색 줄눈 백시멘트 욕실 화장실 변기 보수 메지 크랙 접착제 D형 고무헤라 선진하드웨어'</li></ul> |
## Evaluation
### Metrics
| Label | Metric |
|:--------|:-------|
| **all** | 0.6114 |
## Uses
### Direct Use for Inference
First install the SetFit library:
```bash
pip install setfit
```
Then you can load this model and run inference.
```python
from setfit import SetFitModel
# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_lh2")
# Run inference
preds = model("토네이도 다이아몬드 융착코어비트 폴리싱 대리석 천공 TQ5 57_TTC 17 주식회사 투엑스")
```
<!--
### Downstream Use
*List how someone could finetune this model on their own dataset.*
-->
<!--
### Out-of-Scope Use
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->
<!--
## Bias, Risks and Limitations
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->
<!--
### Recommendations
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->
## Training Details
### Training Set Metrics
| Training set | Min | Median | Max |
|:-------------|:----|:--------|:----|
| Word count | 3 | 10.7474 | 27 |
| Label | Training Sample Count |
|:------|:----------------------|
| 0.0 | 50 |
| 1.0 | 50 |
| 2.0 | 50 |
| 3.0 | 50 |
| 4.0 | 50 |
| 5.0 | 50 |
| 6.0 | 50 |
| 7.0 | 50 |
| 8.0 | 50 |
| 9.0 | 50 |
| 10.0 | 50 |
| 11.0 | 50 |
| 12.0 | 50 |
| 13.0 | 50 |
| 14.0 | 50 |
| 15.0 | 50 |
| 16.0 | 50 |
| 17.0 | 50 |
| 18.0 | 50 |
### Training Hyperparameters
- batch_size: (512, 512)
- num_epochs: (20, 20)
- max_steps: -1
- sampling_strategy: oversampling
- num_iterations: 40
- body_learning_rate: (2e-05, 2e-05)
- head_learning_rate: 2e-05
- loss: CosineSimilarityLoss
- distance_metric: cosine_distance
- margin: 0.25
- end_to_end: False
- use_amp: False
- warmup_proportion: 0.1
- seed: 42
- eval_max_steps: -1
- load_best_model_at_end: False
### Training Results
| Epoch | Step | Training Loss | Validation Loss |
|:-------:|:----:|:-------------:|:---------------:|
| 0.0067 | 1 | 0.3954 | - |
| 0.3356 | 50 | 0.3839 | - |
| 0.6711 | 100 | 0.2913 | - |
| 1.0067 | 150 | 0.2101 | - |
| 1.3423 | 200 | 0.1066 | - |
| 1.6779 | 250 | 0.0475 | - |
| 2.0134 | 300 | 0.0342 | - |
| 2.3490 | 350 | 0.0274 | - |
| 2.6846 | 400 | 0.028 | - |
| 3.0201 | 450 | 0.029 | - |
| 3.3557 | 500 | 0.0291 | - |
| 3.6913 | 550 | 0.0258 | - |
| 4.0268 | 600 | 0.0202 | - |
| 4.3624 | 650 | 0.0085 | - |
| 4.6980 | 700 | 0.0124 | - |
| 5.0336 | 750 | 0.0039 | - |
| 5.3691 | 800 | 0.0089 | - |
| 5.7047 | 850 | 0.0063 | - |
| 6.0403 | 900 | 0.0034 | - |
| 6.3758 | 950 | 0.0046 | - |
| 6.7114 | 1000 | 0.008 | - |
| 7.0470 | 1050 | 0.0048 | - |
| 7.3826 | 1100 | 0.0028 | - |
| 7.7181 | 1150 | 0.0042 | - |
| 8.0537 | 1200 | 0.0019 | - |
| 8.3893 | 1250 | 0.0008 | - |
| 8.7248 | 1300 | 0.0004 | - |
| 9.0604 | 1350 | 0.0003 | - |
| 9.3960 | 1400 | 0.0003 | - |
| 9.7315 | 1450 | 0.0002 | - |
| 10.0671 | 1500 | 0.0003 | - |
| 10.4027 | 1550 | 0.0002 | - |
| 10.7383 | 1600 | 0.0001 | - |
| 11.0738 | 1650 | 0.0002 | - |
| 11.4094 | 1700 | 0.0001 | - |
| 11.7450 | 1750 | 0.0001 | - |
| 12.0805 | 1800 | 0.0001 | - |
| 12.4161 | 1850 | 0.0001 | - |
| 12.7517 | 1900 | 0.0001 | - |
| 13.0872 | 1950 | 0.0001 | - |
| 13.4228 | 2000 | 0.0001 | - |
| 13.7584 | 2050 | 0.0001 | - |
| 14.0940 | 2100 | 0.0001 | - |
| 14.4295 | 2150 | 0.0001 | - |
| 14.7651 | 2200 | 0.0001 | - |
| 15.1007 | 2250 | 0.0001 | - |
| 15.4362 | 2300 | 0.0001 | - |
| 15.7718 | 2350 | 0.0001 | - |
| 16.1074 | 2400 | 0.0001 | - |
| 16.4430 | 2450 | 0.0001 | - |
| 16.7785 | 2500 | 0.0001 | - |
| 17.1141 | 2550 | 0.0001 | - |
| 17.4497 | 2600 | 0.0001 | - |
| 17.7852 | 2650 | 0.0001 | - |
| 18.1208 | 2700 | 0.0001 | - |
| 18.4564 | 2750 | 0.0001 | - |
| 18.7919 | 2800 | 0.0001 | - |
| 19.1275 | 2850 | 0.0001 | - |
| 19.4631 | 2900 | 0.0001 | - |
| 19.7987 | 2950 | 0.0001 | - |
### Framework Versions
- Python: 3.10.12
- SetFit: 1.1.0.dev0
- Sentence Transformers: 3.1.1
- Transformers: 4.46.1
- PyTorch: 2.4.0+cu121
- Datasets: 2.20.0
- Tokenizers: 0.20.0
## Citation
### BibTeX
```bibtex
@article{https://doi.org/10.48550/arxiv.2209.11055,
doi = {10.48550/ARXIV.2209.11055},
url = {https://arxiv.org/abs/2209.11055},
author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {Efficient Few-Shot Learning Without Prompts},
publisher = {arXiv},
year = {2022},
copyright = {Creative Commons Attribution 4.0 International}
}
```
<!--
## Glossary
*Clearly define terms in order to be accessible across audiences.*
-->
<!--
## Model Card Authors
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->
<!--
## Model Card Contact
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
--> |