denis-gordeev commited on
Commit
3921fd8
·
verified ·
1 Parent(s): 1fd5c91

Add new SentenceTransformer model

Browse files
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 312,
3
+ "pooling_mode_cls_token": true,
4
+ "pooling_mode_mean_tokens": false,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,609 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:3136
8
+ - loss:ContrastiveLoss
9
+ base_model: sergeyzh/rubert-tiny-turbo
10
+ widget:
11
+ - source_sentence: Здравствуйте! Я ищу узкую посудомоечную машину шириной 45 см. Какие
12
+ модели вы можете порекомендовать?
13
+ sentences:
14
+ - '{''long_web_name'': ''Cactus Экран Cactus 150x150см Wallscreen CS-PSW-150X150-SG
15
+ 1:1 настенно-потолочный рулонны'', ''price'': 4915.0, ''url'': ''https://megamarket.ru/catalog/details/cactus-ekran-cactus-150x150sm-wallscreen-cs-psw-150x150-sg-11-nastenno-potolochnyy-rulonny-100035844664/'',
16
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-21/334/577/171/024/226/100035844664b0.jpg'',
17
+ ''id'': ''100035844664'', ''description'': '''', ''rating'': 4.75, ''review_count'':
18
+ 8}'
19
+ - '{''long_web_name'': ''Напальчники ForAll Wasp Feelers, игровые, для игр на смартфоне'',
20
+ ''price'': 200.0, ''url'': ''https://megamarket.ru/catalog/details/napalchniki-forall-wasp-feelers-igrovye-dlya-igr-na-smartfone-600008773480/'',
21
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-14/858/871/102/521/0/600008773480b0.jpg'',
22
+ ''id'': ''600008773480'', ''description'': ''Игровые напальчники ForAll.Напальчники
23
+ ForAll были созданы специально для мобильных игр. Благодаря использованию инновационных
24
+ материалов, они заметно улучшают показатели скольжения пальца по экрану телефона,
25
+ даже при отсутствии не нём олеофобного покрытия. Высокая проводимость материалов
26
+ напальчников позволяет увеличить чувствительность и точность каждого движения
27
+ ваших пальцев по экрану вашего гаджета. Компактные, очень тонкие и при этом прочные,
28
+ напальчники Sarafox не создают дискомфорта при использовании и не оставляют следов
29
+ на экране вашего смартфона. В сочетании с низкой ценой, - это идеальный инструмент
30
+ для того, чтобы повысить ваше мастерство на полях сражений мобильных игр. Для
31
+ любых игр на мобильном телефоне или планшете (Fortnite, PUBG, FreeFire, Call of
32
+ Duty, CoD, Boom beach, Rulеs оf Survivаl, Кnivеs Оut, Survivоr Rоyаlе, Сritiсаl
33
+ Орs, Моbilе Lеgеnds, Stаndоff 2, Brawl Stars, Among US).2 шутки (1 пара) в комплекте.
34
+ Состав: нейлон, спандекс, нано-углеродное волокно.'', ''rating'': 4.92, ''review_count'':
35
+ 12}'
36
+ - '{''long_web_name'': ''Пылесос Deerma VC55 белый'', ''price'': 11500.0, ''url'':
37
+ ''https://megamarket.ru/catalog/details/pylesos-deerma-vacuum-cleaner-vc55-belyy-600009446716/'',
38
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-10/348/655/451/191/140/600009446716b0.png'',
39
+ ''id'': ''600009446716'', ''description'': ''Мощные вертикальные пылесосы давно
40
+ не уступают по эффективности классическим. В сравнении с обычными бытовыми пылесосами
41
+ у них есть ряд преимуществ: — меньше весят; — более маневренные; — занимают меньше
42
+ места при хранении. Если нужен пылесос для уборки в небольшом помещении, маленькой
43
+ квартире без ковров, то вертикальный пылесос подойдет вам лучше любого другого.
44
+ Маневренный вертикальный пылесос для дома — также незаменимый помощник при уборке
45
+ в труднодоступных местах: под мебелью, на ступеньках. Пылесос вертикальный беспроводной,
46
+ имеющий в комплекте половую щетку, щетку с круглым носиком и тонкую насадку поможет
47
+ навести чистоту в любом месте, убирая пыль с пола, поверхности мебели и даже из
48
+ узких щелей. Ручной пылесос, моющий вертикальный пылесос, пылесос вертикальный
49
+ беспроводной — выбирайте технику, исходя из ваших пожеланий, и наслаждайтесь комфортной
50
+ уборкой.'', ''rating'': 4.82, ''review_count'': 11}'
51
+ - source_sentence: Здравствуйте! Мне нужны редукторы для моего блендера. Это те детали,
52
+ которые помогают передавать вращение от мотора к ножам. Не подскажете, есть ли
53
+ у вас такие в наличии?
54
+ sentences:
55
+ - '{''long_web_name'': ''Набор насадок для кухонного комбайна CASO Pasta Maker for
56
+ KM 1800'', ''price'': 20160.0, ''url'': ''https://megamarket.ru/catalog/details/nabor-nasadok-dlya-kuhonnogo-kombayna-caso-pasta-maker-for-km-1800-600013894198/'',
57
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-51/528/818/510/270/36/600013894198b0.jpeg'',
58
+ ''id'': ''600013894198'', ''description'': ''<p><strong>Набор CASO «Паста» для
59
+ KM 1800 </strong>используется совместно с кухонным совместно с кухонными комбайнами
60
+ KM 1800 Black для производства пасты в частных домах и квартирах. Замесите тесто
61
+ для пасты с помощью кухонного комбайна, а затем обработайте его с помощью насадки
62
+ для пасты. Насадки изготовлены из нержавеющей стали.</p><p></p><p><strong>ОСОБЕННОСТИ
63
+ УСТРОЙСТВА: </strong></p><ul><li><p>Совместимость: к кухонному комбайну CASO KM
64
+ 1800 Black</p></li><li><p>Материал: нержавеющая сталь</p></li><li><p>Простая установка
65
+ насадок</p></li><li><p>Насадка для листов лазаньи: до 140 мм</p></li><li><p>Насадка
66
+ для спагетти: 2 мм</p></li><li><p>Насадка для тальятелле: 6.5 мм</p></li></ul>'',
67
+ ''rating'': 5.0, ''review_count'': 1}'
68
+ - '{''long_web_name'': ''Нож к 616 0000 1/100 OSTER 0.25мм (914-81)'', ''price'':
69
+ 5090.0, ''url'': ''https://megamarket.ru/catalog/details/nozh-k-616-0000-1-100-oster-025mm-914-81-600004748731/'',
70
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/403/248/966/102/503/1/600004748731b0.jpg'',
71
+ ''id'': ''600004748731'', ''description'': ''Описание: Нож Oster 0,1мм №0000?
72
+ арт. 76914-816 (окантовочный) для машинки Oster 616-91, Oster 616 Soft Touch,
73
+ Oster 616 SILVER Limited Edition. Ножи Oster производятся в США из лучшей высокоуглеродистой
74
+ стали ручной обработки, обеспечивая таким образом непревзойденную точность и производительность
75
+ лезвия. Ножи закалены до 62-65Rc (по шкале С значения твердости метода Роквелла)
76
+ и дополнительно криогенно обработаны, для большего усиления твердости стали. Лезвия
77
+ режущих поверхностей заточены, окончательно обработаны, протестированы и проверены
78
+ с помощью патентованной технологии Oster®. Таким образом получаются ультра-острые
79
+ ножи готовые выдержать длительное испытание временем.'', ''rating'': 5.0, ''review_count'':
80
+ 4}'
81
+ - '{''long_web_name'': ''Электрокексница GALAXY LINE GL2983 белый'', ''price'':
82
+ 1540.0, ''url'': ''https://megamarket.ru/catalog/details/elektrokeksnica-galaxy-line-gl2983-belyy-600017137396/'',
83
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/134/807/194/057/203/600017137396b0.png'',
84
+ ''id'': ''600017137396_139561'', ''description'': ''<p>Прибор для выпечки пончиков
85
+ GALAXY LINE поможет вам приготовить пышные и вкусные пончики для всей семьи или
86
+ друзей, не тратя много времени и усилий.</p><p>Рабочая поверхность позволяет приготовить
87
+ сразу 4 пончика, а компактные размеры и стильный дизайн позволяет легко разместить
88
+ его на любой кухне.</p><p>Прибор оснащен специальным антипригарным покрытием высокого
89
+ качества, которое исключает прилипание продуктов и не требует использования большого
90
+ количества масла.</p><p>Поверхность легко чистится, обладает высокой стойкостью
91
+ к температурным перепадам и механическим воздействиям.</p><p></p><p>Корпус прибора
92
+ выполнен из термоустойчивого пластика, который не нагревается в процессе работы,
93
+ обеспечивая безопасное использование и позволяет избежать ожогов.</p><p>Модель
94
+ станет идеальным выбором для людей, любящих ароматные десерты. </p><p><br></p>'',
95
+ ''rating'': 5.0, ''review_count'': 4}'
96
+ - source_sentence: Здравствуйте! Мне нужно купить карты памяти MicroSD, чтобы использовать
97
+ их в моём телефоне и планшете. Хотелось бы что-то надёжное и с хорошей скоростью
98
+ записи. Можете помочь выбрать?
99
+ sentences:
100
+ - '{''long_web_name'': ''Сетевое зарядное устройство Apple MHJE3ZM/A 20W Power Adapter,
101
+ 1xUSB Type-C, 2.2A, white'', ''price'': 990.0, ''description'': ''<div><p>Сетевое
102
+ зарядное устройство Apple MHJE3ZM/A 20W Power Adapter, 1xUSB Type-C, 2.2A, white
103
+ — универсальная модель, совместимая со всеми современными гаджетами.</p>\n<h2>Продуманная
104
+ конструкция</h2>\n<p>Корпус выполнен из качественного пластика — прочный материал,
105
+ устойчивый к механическим повреждениям. Дополнительные технические параметры:</p>\n<ul>\n<li>Подходит
106
+ для зарядки смартфонов, планшетов, ноутбуков, наушников и других устройств.</li>\n<li>Стандарт
107
+ быстрой зарядки Power Delivery обеспечивает высокую скорость передачи энергии.</li>\n<li>Защита
108
+ от короткого замыкания и перегрева продлевают срок службы.</li>\n</ul>\n<p>Мощность
109
+ 20 Вт позволяет быстро зарядить аккумулятор практически любого современного гаджета.
110
+ Для удобства использования предусмотрен съемный кабель.</p></div>'', ''rating'':
111
+ 4.8, ''review_count'': 8132}'
112
+ - '{''long_web_name'': ''Чайная машина Rommelsbacher TA 1200 1 л черный'', ''price'':
113
+ 0.0, ''url'': ''https://megamarket.ru/catalog/details/termopot-rommelsbacher-ta-1200-100000566245/'',
114
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-20/153/022/951/418/59/100000566245b0.png'',
115
+ ''id'': ''100000566245_41866'', ''description'': ''В современном ритме жизни,
116
+ когда каждая минута на вес золота, ждать, пока вскипит чайник – порой, непозволительная
117
+ роскошь. С чайным автоматом Rommelsbacher у вас всегда под рукой будет вода подходящей
118
+ температуры. В семьях с маленькими детьми такой прибор просто незаменим, когда
119
+ необходимо приготовить детскую смесь.Горячий чай будет готов в любую секунду<ul><li>Объем
120
+ в 1 литр подходит для использования в небольших семьях, не расходует лишнюю энергию
121
+ на поддержание температуры.</li><li>Мощность 1200 Вт достаточно для достаточно
122
+ быстрого нагрева и поддержания заданной температуры.</li><li>Термопот работает
123
+ в четырех температурных режимах: 80 и 85 С, 90 и 100 С.</li><li>Безопасность работы
124
+ обеспечивает автоматическое отключение при закипании и при отсутствии воды.</li><li>Долгую
125
+ службу прибору обеспечит фильтр от накипи из нержавеющей стали.</li><li>Вы почувствуете
126
+ настоящий вкус воды, а не пластика: внутренняя колба (бак для воды) выполнена
127
+ из прочной нержавеющей стали.</li><li>Термопот комфортен в использовании: он оборудован
128
+ дисплеем, индикаторами включения, температуры и уровня воды, имеется внутренняя
129
+ подсветка.</li></ul>Покупая для дома или рабочего места чайный автомат Rommelsbacher
130
+ TA 1200, вы получаете надежность, качество и комфорт от немецкого производителя
131
+ по выгодной цене.'', ''rating'': 0.0, ''review_count'': 0}'
132
+ - '{''long_web_name'': ''Моноблок iRU Office 23IH5P Black (1864652)'', ''price'':
133
+ 61474.0, ''url'': ''https://megamarket.ru/catalog/details/monoblok-iru-23ih5p-chernyy-1864652-100046661983/'',
134
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-16/361/299/661/213/124/5/100046661983b0.png'',
135
+ ''id'': ''100046661983'', ''description'': ''<p>Моноблок iRU Office 23IH5P (1864652)
136
+ — это современный компьютер, который отличается компактностью и производительностью.</p>\n<h2>Комфортная
137
+ работа</h2>\n<p>Мощный процессор Intel Core i3 обеспечивает высокую скорость обработки
138
+ данных. Монитор с диагональю 23,8 дюймов имеет разрешение Full HD. Благодаря этому
139
+ изображение получается четким и детализированным. Другие технические параметры:</p>\n<ul>\n<li>оперативная
140
+ память объемом 8 Гб позволяет быстро загружать программы;</li>\n<li>внутренний
141
+ жесткий диск SSD на 120 Гб дает возможность хранить большое количество информации;</li>\n<li>видеокарта
142
+ Intel UHD Graphics 630 поддерживает воспроизведение видео в высоком качестве.</li>\n</ul>\n<p>На
143
+ передней панели расположены два динамика мощностью 2 Вт. Они обеспечивают качественное
144
+ звучание. На задней панели находятся разъемы для подключения внешних устройств.
145
+ Есть встроенный микрофон и веб-камера. Установлена операционная система Windows
146
+ 10 Pro.</p>'', ''rating'': 5.0, ''review_count'': 3}'
147
+ - source_sentence: Здравствуйте! Я хочу купить пылесос, который небольшой и удобный,
148
+ чтобы им можно было быстро убирать мусор с пола. Подскажите, пожалуйста, у вас
149
+ есть такие вертикальные пылесосы?
150
+ sentences:
151
+ - '{''long_web_name'': ''Пылесос Gorenje SVC252FMWT белый'', ''price'': 17099.0,
152
+ ''description'': '''', ''rating'': 4.61, ''review_count'': 23}'
153
+ - '{''long_web_name'': ''Полка для DVD-плеера Novigo NV-360 B'', ''price'': 129.0,
154
+ ''url'': ''https://megamarket.ru/catalog/details/novigo-nv-360-b-100025351075/'',
155
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/16925241112/100025351075b0.jpg'',
156
+ ''id'': ''100025351075'', ''description'': '''', ''rating'': 4.83, ''review_count'':
157
+ 69}'
158
+ - '{''long_web_name'': ''Аксессуар для принтеров Konica Minolta (9961026723)'',
159
+ ''price'': 10.0, ''url'': ''https://megamarket.ru/catalog/details/aksessuar-dlya-printerov-konica-minolta-9961026723-600008281362/'',
160
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/690/288/244/717/209/600008281362b0.jpeg'',
161
+ ''id'': ''600008281362_76846'', ''description'': ''Инструкция Konica Minolta для
162
+ bizhub С257i (9961026723)'', ''rating'': 0.0, ''review_count'': 0}'
163
+ - source_sentence: Здравствуйте! Я хочу купить внешний диск для хранения данных, желательно
164
+ SSD. Нужно, чтобы он был надёжным и быстрым, для переноса больших файлов. Можете
165
+ помочь подобрать подходящий?
166
+ sentences:
167
+ - '{''long_web_name'': ''Сумка унисекс K&F Concept Storage Bag черная, 26х16х10
168
+ см'', ''price'': 3259.0, ''description'': ''<p>Поместится все <p>В сумке предусмотрено
169
+ 23 отделения для хранения самых разных вещей: смартфон, зарядное устройство, кабели
170
+ для передачи данных, usb-накопители, ключи от машины, банковские карты и прочие
171
+ ценности </p> Полный или частичный доступ <p>Удобная функция открытия и закрытия
172
+ на 120° позволяе�� использовать несколько комбинаций внутренних отсеков, обеспечивая
173
+ высокую степень свободы в адаптации к различным сценариям использования, делая
174
+ организацию вещей еще более удобной </p> Для путешествий и работы <p>Компактная
175
+ и легкая сумка весом всего 250 г - идеальный выбор для деловых встреч или путешествий.
176
+ Она не занимает много места в чемодане или рюкзаке, но при этом обладает внушительной
177
+ вместимостью </p> Прочные и надежные материалы изготовления <p>Модель изготовлена
178
+ из водонепроницаемого нейлона, с высокопрочной строчкой и противоугонной молнией,
179
+ гарантирующей износостойкость и долговечность. Она надежно защищает хранящиеся
180
+ внутри вещи от каких либо повреждений </p> Водонепроницаемый нейлон <p>Благодаря
181
+ водонепроницаемому нейлону сумка не пропускает влагу внутрь, а также обеспечивает
182
+ легкий уход за внешней поверхностью. Внутри модель оснащена эластичной тканью,
183
+ отличающейся особой мягкостью и безопасностью для хрупких предметов или гаджетов
184
+ </p></p>'', ''rating'': 0.0, ''review_count'': 0}'
185
+ - '{''long_web_name'': ''Внешний SSD диск KingSpec 240 ГБ Z3-240'', ''price'': 4129.0,
186
+ ''description'': '''', ''rating'': 0.0, ''review_count'': 0}'
187
+ - '{''long_web_name'': ''Чайная машина Cooleq JD-12 12 л серебристый'', ''price'':
188
+ 54095.0, ''url'': ''https://megamarket.ru/catalog/details/sokoohladitel-cooleq-jd-12-100042900979/'',
189
+ ''image_link'': ''https://main-cdn.sbermegamarket.ru/mid9/hlr-system/117/347/633/386/112/1/100042900979b0.png'',
190
+ ''id'': ''100042900979_126197'', ''description'': '''', ''rating'': 0.0, ''review_count'':
191
+ 0}'
192
+ pipeline_tag: sentence-similarity
193
+ library_name: sentence-transformers
194
+ metrics:
195
+ - cosine_accuracy
196
+ - cosine_accuracy_threshold
197
+ - cosine_f1
198
+ - cosine_f1_threshold
199
+ - cosine_precision
200
+ - cosine_recall
201
+ - cosine_ap
202
+ model-index:
203
+ - name: SentenceTransformer based on sergeyzh/rubert-tiny-turbo
204
+ results:
205
+ - task:
206
+ type: binary-classification
207
+ name: Binary Classification
208
+ dataset:
209
+ name: item classification
210
+ type: item-classification
211
+ metrics:
212
+ - type: cosine_accuracy
213
+ value: 0.9260204081632653
214
+ name: Cosine Accuracy
215
+ - type: cosine_accuracy_threshold
216
+ value: 0.7458415031433105
217
+ name: Cosine Accuracy Threshold
218
+ - type: cosine_f1
219
+ value: 0.7972027972027971
220
+ name: Cosine F1
221
+ - type: cosine_f1_threshold
222
+ value: 0.7458415031433105
223
+ name: Cosine F1 Threshold
224
+ - type: cosine_precision
225
+ value: 0.7037037037037037
226
+ name: Cosine Precision
227
+ - type: cosine_recall
228
+ value: 0.9193548387096774
229
+ name: Cosine Recall
230
+ - type: cosine_ap
231
+ value: 0.7692186034218071
232
+ name: Cosine Ap
233
+ ---
234
+
235
+ # SentenceTransformer based on sergeyzh/rubert-tiny-turbo
236
+
237
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [sergeyzh/rubert-tiny-turbo](https://huggingface.co/sergeyzh/rubert-tiny-turbo). It maps sentences & paragraphs to a 312-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
238
+
239
+ ## Model Details
240
+
241
+ ### Model Description
242
+ - **Model Type:** Sentence Transformer
243
+ - **Base model:** [sergeyzh/rubert-tiny-turbo](https://huggingface.co/sergeyzh/rubert-tiny-turbo) <!-- at revision 93769a3baad2b037e5c2e4312fccf6bcfe082bf1 -->
244
+ - **Maximum Sequence Length:** 2048 tokens
245
+ - **Output Dimensionality:** 312 dimensions
246
+ - **Similarity Function:** Cosine Similarity
247
+ <!-- - **Training Dataset:** Unknown -->
248
+ <!-- - **Language:** Unknown -->
249
+ <!-- - **License:** Unknown -->
250
+
251
+ ### Model Sources
252
+
253
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
254
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
255
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
256
+
257
+ ### Full Model Architecture
258
+
259
+ ```
260
+ SentenceTransformer(
261
+ (0): Transformer({'max_seq_length': 2048, 'do_lower_case': False}) with Transformer model: BertModel
262
+ (1): Pooling({'word_embedding_dimension': 312, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
263
+ (2): Normalize()
264
+ )
265
+ ```
266
+
267
+ ## Usage
268
+
269
+ ### Direct Usage (Sentence Transformers)
270
+
271
+ First install the Sentence Transformers library:
272
+
273
+ ```bash
274
+ pip install -U sentence-transformers
275
+ ```
276
+
277
+ Then you can load this model and run inference.
278
+ ```python
279
+ from sentence_transformers import SentenceTransformer
280
+
281
+ # Download from the 🤗 Hub
282
+ model = SentenceTransformer("denis-gordeev/reranker_dialog_items_biencoder_rubert-tiny-turbo-3")
283
+ # Run inference
284
+ sentences = [
285
+ 'Здравствуйте! Я хочу купить внешний диск для хранения данных, желательно SSD. Нужно, чтобы он был надёжным и быстрым, для переноса больших файлов. Можете помочь подобрать подходящий?',
286
+ "{'long_web_name': 'Внешний SSD диск KingSpec 240 ГБ Z3-240', 'price': 4129.0, 'description': '', 'rating': 0.0, 'review_count': 0}",
287
+ "{'long_web_name': 'Чайная машина Cooleq JD-12 12 л серебристый', 'price': 54095.0, 'url': 'https://megamarket.ru/catalog/details/sokoohladitel-cooleq-jd-12-100042900979/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/117/347/633/386/112/1/100042900979b0.png', 'id': '100042900979_126197', 'description': '', 'rating': 0.0, 'review_count': 0}",
288
+ ]
289
+ embeddings = model.encode(sentences)
290
+ print(embeddings.shape)
291
+ # [3, 312]
292
+
293
+ # Get the similarity scores for the embeddings
294
+ similarities = model.similarity(embeddings, embeddings)
295
+ print(similarities.shape)
296
+ # [3, 3]
297
+ ```
298
+
299
+ <!--
300
+ ### Direct Usage (Transformers)
301
+
302
+ <details><summary>Click to see the direct usage in Transformers</summary>
303
+
304
+ </details>
305
+ -->
306
+
307
+ <!--
308
+ ### Downstream Usage (Sentence Transformers)
309
+
310
+ You can finetune this model on your own dataset.
311
+
312
+ <details><summary>Click to expand</summary>
313
+
314
+ </details>
315
+ -->
316
+
317
+ <!--
318
+ ### Out-of-Scope Use
319
+
320
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
321
+ -->
322
+
323
+ ## Evaluation
324
+
325
+ ### Metrics
326
+
327
+ #### Binary Classification
328
+
329
+ * Dataset: `item-classification`
330
+ * Evaluated with [<code>BinaryClassificationEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.BinaryClassificationEvaluator)
331
+
332
+ | Metric | Value |
333
+ |:--------------------------|:-----------|
334
+ | cosine_accuracy | 0.926 |
335
+ | cosine_accuracy_threshold | 0.7458 |
336
+ | cosine_f1 | 0.7972 |
337
+ | cosine_f1_threshold | 0.7458 |
338
+ | cosine_precision | 0.7037 |
339
+ | cosine_recall | 0.9194 |
340
+ | **cosine_ap** | **0.7692** |
341
+
342
+ <!--
343
+ ## Bias, Risks and Limitations
344
+
345
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
346
+ -->
347
+
348
+ <!--
349
+ ### Recommendations
350
+
351
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
352
+ -->
353
+
354
+ ## Training Details
355
+
356
+ ### Training Dataset
357
+
358
+ #### Unnamed Dataset
359
+
360
+
361
+ * Size: 3,136 training samples
362
+ * Columns: <code>anchor</code>, <code>text</code>, and <code>label</code>
363
+ * Approximate statistics based on the first 1000 samples:
364
+ | | anchor | text | label |
365
+ |:--------|:-----------------------------------------------------------------------------------|:-------------------------------------------------------------------------------------|:------------------------------------------------|
366
+ | type | string | string | int |
367
+ | details | <ul><li>min: 23 tokens</li><li>mean: 43.03 tokens</li><li>max: 91 tokens</li></ul> | <ul><li>min: 52 tokens</li><li>mean: 310.0 tokens</li><li>max: 1009 tokens</li></ul> | <ul><li>0: ~81.90%</li><li>1: ~18.10%</li></ul> |
368
+ * Samples:
369
+ | anchor | text | label |
370
+ |:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
371
+ | <code>Привет! Подскажите, пожалуйста, у вас есть средства для чистки и ухода за холодильником? Ищу что-то недорогое, но эффективное.</code> | <code>{'long_web_name': 'ТЭН для водонагревателя ИТАТЭН ITA-30047', 'price': 1243.0, 'url': 'https://megamarket.ru/catalog/details/ten-dlya-vodonagrevatelya-itaten-ita-30047-600005611737/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-17/149/578/704/111/611/600005611737b0.jpeg', 'id': '600005611737', 'description': 'Нагревательный элемент для плоского водонагревателя Термекс: RZB 30F, 50F, 80F, 100F ; RZB 30L, 50L, 80L, 100L ; RZB 30FV, 50FV, 80FV, 100FV; IF 30V, 50V, 80V, 100V; ID 30V, 50V, 80V, 100V, Термекс IQ 30 V, Термекс IQ 50 V, Термекс IQ 80 V, Термекс IQ 100 V.Характеристики: Длина: 310 мм;Артикул: 30047;Применение: Для водонагревателей;Совместимость: Garanterm, Thermex;Тип ТЭНа: RF;Мощность: 1300 Вт;Материал: Нержавеющая сталь;Диаметр фланца: 64 мм;Трубка под термостат: Есть;Объем бака: 30 л, 50 л, 80 л, 100 л, 120 л, 150 л;Тип контактов: Клеммы под разъем;Производитель: Китай;Место под анод: М4;Напряжение: 220;Тип водонагревателя: Плоский;Размещение бака: Вер...</code> | <code>0</code> |
372
+ | <code>Здравствуйте! Я Андрей, мне 38 лет, я покупаю у вас товары для своего бизнеса по ремонту бытовой техники в Воронеже. Мне нужны моноблоки — это такие настольные компьютеры, где всё встроено в монитор. Интересуют недорогие модели для тестирования программного обеспечения и проведения диагностики. Можете порекомендовать что-то подходящее?</code> | <code>{'long_web_name': 'Моноблок MSI PRO AP242 12M-450RU белый', 'price': 78299.0, 'description': '<p>Моноблок MSI Pro AP242 12M-450RU — это производительная рабочая станция для офисных задач.</p>\n<h2>Комфортная работа</h2>\n<p>Корпус выполнен в белом цвете. Матовое покрытие дисплея защищает от бликов. Другие технические параметры:</p>\n<ul>\n<li>мощный процессор Intel Core i5 12400;</li>\n<li>графический чип UHD Graphics 730;</li>\n<li>оперативная память объемом 16 Гб с возможностью расширения до 64 Гб;</li>\n<li>встроенная веб-камера для общения через Skype и Zoom;</li>\n<li>внутренний накопитель SSD на 512 Гб обеспечивает быстрый доступ к файлам;</li>\n<li>поддерживается беспроводная сеть стандарта 802.11ax.</li>\n</ul>\n<p>Предусмотрены два порта USB 3.2 Type-C и два USB 2.0 Type-A. Есть выход HDMI для подключения монитора или телевизора. Для воспроизведения звука есть встроенные динамики и микрофон.</p>', 'rating': 5.0, 'review_count': 18}</code> | <code>0</code> |
373
+ | <code>Здравствуйте! Мне нужно купить карты памяти MicroSD, чтобы использовать их в моём телефоне и планшете. Хотелось бы что-то надёжное и с хорошей скоростью записи. Можете помочь выбрать?</code> | <code>{'long_web_name': 'Флэш карта Kingston Canvas Select Plus SDCS2/32GB microSDHC Class10, 32 Gb, adapter', 'price': 740.0, 'description': '', 'rating': 4.93, 'review_count': 587}</code> | <code>1</code> |
374
+ * Loss: [<code>ContrastiveLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#contrastiveloss) with these parameters:
375
+ ```json
376
+ {
377
+ "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
378
+ "margin": 0.5,
379
+ "size_average": true
380
+ }
381
+ ```
382
+
383
+ ### Evaluation Dataset
384
+
385
+ #### Unnamed Dataset
386
+
387
+
388
+ * Size: 392 evaluation samples
389
+ * Columns: <code>anchor</code>, <code>text</code>, and <code>label</code>
390
+ * Approximate statistics based on the first 392 samples:
391
+ | | anchor | text | label |
392
+ |:--------|:-----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|:------------------------------------------------|
393
+ | type | string | string | int |
394
+ | details | <ul><li>min: 23 tokens</li><li>mean: 42.23 tokens</li><li>max: 91 tokens</li></ul> | <ul><li>min: 53 tokens</li><li>mean: 312.93 tokens</li><li>max: 1058 tokens</li></ul> | <ul><li>0: ~84.18%</li><li>1: ~15.82%</li></ul> |
395
+ * Samples:
396
+ | anchor | text | label |
397
+ |:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|:---------------|
398
+ | <code>Здравствуйте! Мне нужны магнитные кабели для зарядки моих устройств в походах. Хочу заказать несколько штук, можно с разными разъёмами (USB-C, Micro USB, и Lightning). Желательно, чтобы они были качественными и прочными. Можете помочь с этим?</code> | <code>{'long_web_name': 'ТЭН для водонагревателя ИТАТЭН ITA-30047', 'price': 1243.0, 'url': 'https://megamarket.ru/catalog/details/ten-dlya-vodonagrevatelya-itaten-ita-30047-600005611737/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/-17/149/578/704/111/611/600005611737b0.jpeg', 'id': '600005611737', 'description': 'Нагревательный элемент для плоского водонагревателя Термекс: RZB 30F, 50F, 80F, 100F ; RZB 30L, 50L, 80L, 100L ; RZB 30FV, 50FV, 80FV, 100FV; IF 30V, 50V, 80V, 100V; ID 30V, 50V, 80V, 100V, Термекс IQ 30 V, Термекс IQ 50 V, Термекс IQ 80 V, Термекс IQ 100 V.Характеристики: Длина: 310 мм;Артикул: 30047;Применение: Для водонагревателей;Совместимость: Garanterm, Thermex;Тип ТЭНа: RF;Мощность: 1300 Вт;Материал: Нержавеющая сталь;Диаметр фланца: 64 мм;Трубка под термостат: Есть;Объем бака: 30 л, 50 л, 80 л, 100 л, 120 л, 150 л;Тип контактов: Клеммы под разъем;Производитель: Китай;Место под анод: М4;Напряжение: 220;Тип водонагревателя: Плоский;Размещение бака: Вер...</code> | <code>0</code> |
399
+ | <code>Здравствуйте! Мне нужны сумки и рюкзаки для фототехники. Что-то удобное и вместительное, чтобы можно было безопасно носить зеркальный фотоаппарат и несколько объективов. Можно посмотреть варианты?</code> | <code>{'long_web_name': 'Аксессуар для принтеров Konica Minolta (9961026723)', 'price': 10.0, 'url': 'https://megamarket.ru/catalog/details/aksessuar-dlya-printerov-konica-minolta-9961026723-600008281362/', 'image_link': 'https://main-cdn.sbermegamarket.ru/mid9/hlr-system/690/288/244/717/209/600008281362b0.jpeg', 'id': '600008281362_76846', 'description': 'Инструкция Konica Minolta для bizhub С257i (9961026723)', 'rating': 0.0, 'review_count': 0}</code> | <code>0</code> |
400
+ | <code>Здравствуйте! Ищу умные часы Apple Watch Series 2. Скажите, пожалуйста, есть ли у вас в наличии?</code> | <code>{'long_web_name': 'Смарт-часы Apple Watch Series 9 45 мм Midnight размер ML', 'price': 58373.0, 'description': 'Смарт-часы Apple Watch. Материал корпуса — алюминий. Время работы в активном режиме — до 18 часов. Функция Double Tap активируется посредством двух быстрых касаний указательного и большого пальцев — можно ответить на звонок, выключить будильник и управлять воспроизведением музыки. Объем встроенной памяти — 64 Гб. В комплекте — кабель USB?C с магнитным креплением для быстрой зарядки', 'rating': 4.97, 'review_count': 114}</code> | <code>0</code> |
401
+ * Loss: [<code>ContrastiveLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#contrastiveloss) with these parameters:
402
+ ```json
403
+ {
404
+ "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE",
405
+ "margin": 0.5,
406
+ "size_average": true
407
+ }
408
+ ```
409
+
410
+ ### Training Hyperparameters
411
+ #### Non-Default Hyperparameters
412
+
413
+ - `eval_strategy`: steps
414
+ - `num_train_epochs`: 1
415
+ - `warmup_ratio`: 0.1
416
+ - `fp16`: True
417
+ - `load_best_model_at_end`: True
418
+ - `batch_sampler`: no_duplicates
419
+
420
+ #### All Hyperparameters
421
+ <details><summary>Click to expand</summary>
422
+
423
+ - `overwrite_output_dir`: False
424
+ - `do_predict`: False
425
+ - `eval_strategy`: steps
426
+ - `prediction_loss_only`: True
427
+ - `per_device_train_batch_size`: 8
428
+ - `per_device_eval_batch_size`: 8
429
+ - `per_gpu_train_batch_size`: None
430
+ - `per_gpu_eval_batch_size`: None
431
+ - `gradient_accumulation_steps`: 1
432
+ - `eval_accumulation_steps`: None
433
+ - `torch_empty_cache_steps`: None
434
+ - `learning_rate`: 5e-05
435
+ - `weight_decay`: 0.0
436
+ - `adam_beta1`: 0.9
437
+ - `adam_beta2`: 0.999
438
+ - `adam_epsilon`: 1e-08
439
+ - `max_grad_norm`: 1.0
440
+ - `num_train_epochs`: 1
441
+ - `max_steps`: -1
442
+ - `lr_scheduler_type`: linear
443
+ - `lr_scheduler_kwargs`: {}
444
+ - `warmup_ratio`: 0.1
445
+ - `warmup_steps`: 0
446
+ - `log_level`: passive
447
+ - `log_level_replica`: warning
448
+ - `log_on_each_node`: True
449
+ - `logging_nan_inf_filter`: True
450
+ - `save_safetensors`: True
451
+ - `save_on_each_node`: False
452
+ - `save_only_model`: False
453
+ - `restore_callback_states_from_checkpoint`: False
454
+ - `no_cuda`: False
455
+ - `use_cpu`: False
456
+ - `use_mps_device`: False
457
+ - `seed`: 42
458
+ - `data_seed`: None
459
+ - `jit_mode_eval`: False
460
+ - `use_ipex`: False
461
+ - `bf16`: False
462
+ - `fp16`: True
463
+ - `fp16_opt_level`: O1
464
+ - `half_precision_backend`: auto
465
+ - `bf16_full_eval`: False
466
+ - `fp16_full_eval`: False
467
+ - `tf32`: None
468
+ - `local_rank`: 0
469
+ - `ddp_backend`: None
470
+ - `tpu_num_cores`: None
471
+ - `tpu_metrics_debug`: False
472
+ - `debug`: []
473
+ - `dataloader_drop_last`: False
474
+ - `dataloader_num_workers`: 0
475
+ - `dataloader_prefetch_factor`: None
476
+ - `past_index`: -1
477
+ - `disable_tqdm`: False
478
+ - `remove_unused_columns`: True
479
+ - `label_names`: None
480
+ - `load_best_model_at_end`: True
481
+ - `ignore_data_skip`: False
482
+ - `fsdp`: []
483
+ - `fsdp_min_num_params`: 0
484
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
485
+ - `fsdp_transformer_layer_cls_to_wrap`: None
486
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
487
+ - `deepspeed`: None
488
+ - `label_smoothing_factor`: 0.0
489
+ - `optim`: adamw_torch
490
+ - `optim_args`: None
491
+ - `adafactor`: False
492
+ - `group_by_length`: False
493
+ - `length_column_name`: length
494
+ - `ddp_find_unused_parameters`: None
495
+ - `ddp_bucket_cap_mb`: None
496
+ - `ddp_broadcast_buffers`: False
497
+ - `dataloader_pin_memory`: True
498
+ - `dataloader_persistent_workers`: False
499
+ - `skip_memory_metrics`: True
500
+ - `use_legacy_prediction_loop`: False
501
+ - `push_to_hub`: False
502
+ - `resume_from_checkpoint`: None
503
+ - `hub_model_id`: None
504
+ - `hub_strategy`: every_save
505
+ - `hub_private_repo`: None
506
+ - `hub_always_push`: False
507
+ - `gradient_checkpointing`: False
508
+ - `gradient_checkpointing_kwargs`: None
509
+ - `include_inputs_for_metrics`: False
510
+ - `include_for_metrics`: []
511
+ - `eval_do_concat_batches`: True
512
+ - `fp16_backend`: auto
513
+ - `push_to_hub_model_id`: None
514
+ - `push_to_hub_organization`: None
515
+ - `mp_parameters`:
516
+ - `auto_find_batch_size`: False
517
+ - `full_determinism`: False
518
+ - `torchdynamo`: None
519
+ - `ray_scope`: last
520
+ - `ddp_timeout`: 1800
521
+ - `torch_compile`: False
522
+ - `torch_compile_backend`: None
523
+ - `torch_compile_mode`: None
524
+ - `dispatch_batches`: None
525
+ - `split_batches`: None
526
+ - `include_tokens_per_second`: False
527
+ - `include_num_input_tokens_seen`: False
528
+ - `neftune_noise_alpha`: None
529
+ - `optim_target_modules`: None
530
+ - `batch_eval_metrics`: False
531
+ - `eval_on_start`: False
532
+ - `use_liger_kernel`: False
533
+ - `eval_use_gather_object`: False
534
+ - `average_tokens_across_devices`: False
535
+ - `prompts`: None
536
+ - `batch_sampler`: no_duplicates
537
+ - `multi_dataset_batch_sampler`: proportional
538
+
539
+ </details>
540
+
541
+ ### Training Logs
542
+ | Epoch | Step | Training Loss | Validation Loss | item-classification_cosine_ap |
543
+ |:----------:|:-------:|:-------------:|:---------------:|:-----------------------------:|
544
+ | 0 | 0 | - | 0.0302 | 0.3988 |
545
+ | 0.2551 | 100 | 0.0129 | - | - |
546
+ | 0.5102 | 200 | 0.0065 | - | - |
547
+ | **0.6378** | **250** | **-** | **0.0065** | **0.7692** |
548
+ | 0.7653 | 300 | 0.0058 | - | - |
549
+ | 1.0 | 392 | - | 0.0065 | 0.7692 |
550
+
551
+ * The bold row denotes the saved checkpoint.
552
+
553
+ ### Framework Versions
554
+ - Python: 3.10.13
555
+ - Sentence Transformers: 3.3.1
556
+ - Transformers: 4.47.1
557
+ - PyTorch: 2.2.1
558
+ - Accelerate: 1.2.1
559
+ - Datasets: 3.2.0
560
+ - Tokenizers: 0.21.0
561
+
562
+ ## Citation
563
+
564
+ ### BibTeX
565
+
566
+ #### Sentence Transformers
567
+ ```bibtex
568
+ @inproceedings{reimers-2019-sentence-bert,
569
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
570
+ author = "Reimers, Nils and Gurevych, Iryna",
571
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
572
+ month = "11",
573
+ year = "2019",
574
+ publisher = "Association for Computational Linguistics",
575
+ url = "https://arxiv.org/abs/1908.10084",
576
+ }
577
+ ```
578
+
579
+ #### ContrastiveLoss
580
+ ```bibtex
581
+ @inproceedings{hadsell2006dimensionality,
582
+ author={Hadsell, R. and Chopra, S. and LeCun, Y.},
583
+ booktitle={2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06)},
584
+ title={Dimensionality Reduction by Learning an Invariant Mapping},
585
+ year={2006},
586
+ volume={2},
587
+ number={},
588
+ pages={1735-1742},
589
+ doi={10.1109/CVPR.2006.100}
590
+ }
591
+ ```
592
+
593
+ <!--
594
+ ## Glossary
595
+
596
+ *Clearly define terms in order to be accessible across audiences.*
597
+ -->
598
+
599
+ <!--
600
+ ## Model Card Authors
601
+
602
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
603
+ -->
604
+
605
+ <!--
606
+ ## Model Card Contact
607
+
608
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
609
+ -->
config.json ADDED
@@ -0,0 +1,27 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "sergeyzh/rubert-tiny-turbo",
3
+ "architectures": [
4
+ "BertModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "classifier_dropout": null,
8
+ "emb_size": 312,
9
+ "gradient_checkpointing": false,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 312,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 600,
15
+ "layer_norm_eps": 1e-12,
16
+ "max_position_embeddings": 2048,
17
+ "model_type": "bert",
18
+ "num_attention_heads": 12,
19
+ "num_hidden_layers": 3,
20
+ "pad_token_id": 0,
21
+ "position_embedding_type": "absolute",
22
+ "torch_dtype": "float32",
23
+ "transformers_version": "4.47.1",
24
+ "type_vocab_size": 2,
25
+ "use_cache": true,
26
+ "vocab_size": 83828
27
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.3.1",
4
+ "transformers": "4.47.1",
5
+ "pytorch": "2.2.1"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": "cosine"
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:8a7827ed1e8dcad510f7342cbe185c4f2e21e2778cb2866ff6de57527b2cf316
3
+ size 116781184
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 2048,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,37 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "cls_token": {
3
+ "content": "[CLS]",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "mask_token": {
10
+ "content": "[MASK]",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "pad_token": {
17
+ "content": "[PAD]",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "sep_token": {
24
+ "content": "[SEP]",
25
+ "lstrip": false,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "unk_token": {
31
+ "content": "[UNK]",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ }
37
+ }
tokenizer.json ADDED
The diff for this file is too large to render. See raw diff
 
tokenizer_config.json ADDED
@@ -0,0 +1,65 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "[PAD]",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "[UNK]",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "[CLS]",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "[SEP]",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "4": {
36
+ "content": "[MASK]",
37
+ "lstrip": false,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "clean_up_tokenization_spaces": true,
45
+ "cls_token": "[CLS]",
46
+ "do_basic_tokenize": true,
47
+ "do_lower_case": false,
48
+ "extra_special_tokens": {},
49
+ "mask_token": "[MASK]",
50
+ "max_length": 512,
51
+ "model_max_length": 2048,
52
+ "never_split": null,
53
+ "pad_to_multiple_of": null,
54
+ "pad_token": "[PAD]",
55
+ "pad_token_type_id": 0,
56
+ "padding_side": "right",
57
+ "sep_token": "[SEP]",
58
+ "stride": 0,
59
+ "strip_accents": null,
60
+ "tokenize_chinese_chars": true,
61
+ "tokenizer_class": "BertTokenizer",
62
+ "truncation_side": "right",
63
+ "truncation_strategy": "longest_first",
64
+ "unk_token": "[UNK]"
65
+ }
vocab.txt ADDED
The diff for this file is too large to render. See raw diff