metadata
base_model: hiiamsid/sentence_similarity_spanish_es
library_name: sentence-transformers
metrics:
- cosine_accuracy@1
- cosine_accuracy@3
- cosine_accuracy@5
- cosine_accuracy@10
- cosine_precision@1
- cosine_precision@3
- cosine_precision@5
- cosine_precision@10
- cosine_recall@1
- cosine_recall@3
- cosine_recall@5
- cosine_recall@10
- cosine_ndcg@10
- cosine_mrr@10
- cosine_map@100
- dot_accuracy@1
- dot_accuracy@3
- dot_accuracy@5
- dot_accuracy@10
- dot_precision@1
- dot_precision@3
- dot_precision@5
- dot_precision@10
- dot_recall@1
- dot_recall@3
- dot_recall@5
- dot_recall@10
- dot_ndcg@10
- dot_mrr@10
- dot_map@100
pipeline_tag: sentence-similarity
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:2748
- loss:MultipleNegativesRankingLoss
widget:
- source_sentence: >-
¿cual caracterist morfolog distint solanum chrysotrichum inclu detall hoj
inflorescent frut ?
sentences:
- >-
frut subglob cerc 5 9 mm diametr blanc cicl anual distribu regional sur
mexic suramer fenolog floracion registr marz septiembr frecuent juli
usos 3462 nombr cientif solanum chrysotrichum nombr comun descripcion
arbust 3 m alto escas armad tall toment tricom multiangul pedicul larg
grues braz central vec alarg acule cort rect incurv 2 5 mm larg hoj
solitari ampli ovad 40 cm larg apic agud bas trunc cord enter lobul
salient afelp toment frecuent ferrugine haz hirsut tricom estrell sesil
braz central larg enves suavement toment tricom multiangul pedicul grues
nervi principal vec armad peciol 15 cm larg toment vec armad
inflorescent simpl cim poc ram cad ram racem vari flor lateral peduncul
ramific vec primari obsolet 15 cm larg cerdosohisp pedicel casi 5 mm
larg tricom braz central larg inerm caliz casi 5 mm larg toment tricom
multiangul lobul 13 longitud lobul angost triangular corol 30 50 mm
diametr blanc lob 13 longitud lobul ovad pubescent medi anter 6 10 mmde
larg frut tip bay globos 1 15 cm diametr glabr verd pedicel fructifer
grues alarg erect semill aplan 22 26 mm diametr cicl anual distribu
regional mexic panam fenolog fertil año usos 3243 nombr cientif
forchhammeri pall nombr comun siemprev aceitun blanc descripcion arbol
arbust 4 10 m altur ramit glabr hoj simpl altern obovadooblong 25104 082
cm apic redond emargin obtus cortomucron glabr lustrosasinflorescent rac
axilar comprim 4 6 cm larg flor pard crem pequeñ bisexual frut tip bay 2
cm diametr esfer amarilloanaranj madur rellen pulp suav jugos sabor
desagradablel mader amarill paj dens present anatom comun pose floem
incluidodiagnost especi dificil ubic famili caracteriz hoj pequeñ obov
glabr lustr arbol cop dens redond plantul brinzal hoj bastant linear
contrast individu adult cicl anual distribu regional mexic fenolog flor
observ ener marz noviembr diciembr
- >-
peciol aproxim 4 6 mm larg toment jov flor sesil espig subcapit peduncul
15 7 cm larg frut drup elipsoid 1 3 08 22 cm endocarp 5 surc cicl anual
distribu regional cost ric bolivi antill fenolog flor sid observ moment
frut recolect setiembr octubr usos 173 nombr cientif cyathe microdont
nombr comun rab mic helech arborescent descripcion tronc 15 m alto 58 cm
diametr hoj 1217 m larg peciol pard espin espin 38 mm escam peciol 1020
153 mm angost lanceol pard concolor lev marg clar caspill ausent lamin
2pinnadopinnatif apic gradual atenu raquis pard pard clar espin espin 25
mm glabr pinn pedicul pedicul 02212 cm pinn medi 3050 1520 cm cost pajiz
pard clar lis espin basal espin 13 mm glabr puberulent pel 0102 mm
pardoamarillent pinnul 710 1525 cm sesil costul glabr puberulent pel
0102 mm pardoamarillent escam escas ausent diminut aplan segment pinnul
medi 1725 par 1525 mm ancho serr crenul obtus nervadur 913 par segment
1bifurc glabr pel tej lamin nervadur glabr sor medi parafis tan larg
esporangi conspicu pardoamarillent blanc panam indusi ausent cicl anual
distribu regional mexic mesoamer colombi venezuel ecuador peru bolivi
brasil guyan fenolog usos raic utiliz cultiv orquid fabric artesan 2099
nombr cientif rhadinae serperast nombr comun hojarasquer rayadaingles
strip littersnak descripcion miembr gener especi serpient pequeñ median
dificil sobrepas 300 mm longitud total cuy col represent aproxim 40
cient longitud present 11 2 14 2 dient maxilar aument gradual tamañ haci
part posterior boc ultim dos grand separ rest interespaci pequefi dient
mandibular desigual hemipen simpl vari espin ganch proximal grand detras
cual zon espin porcion distal organ calic form estructur capit sulcus
spermaticus bifurc cabez apen disting cuell ojo bien pequeñ ia pupil
redond cuerp cilindr col median larg
- >-
larg glabr inflorescent rac subumbel cort 10 15 flor opuest hoj
principal cerc extrem ram glabrescent peduncul ramific 03 1 cm larg
pedicel 10 20 mm larg caliz 2 3 mm larg profund lobul lobul deltoid
apical tricom simpl basal glabr corol 9 12 mm diametr blanc frecuent
tint purpure sec profund lobul lobul oblong glabr anter casi3 mm larg
frut tip bay globos casi 13 cm diametr glabr verdeamarill pedicel
fructifer acrescent aun delg patent deflex semill aplan 3 mm diametr
cicl anual distribu regional mexic bolivi fenolog fertil año usos 729
nombr cientif dermanur aztec nombr comun murcielag descripcion longitud
cabez cuerp 5975 mm longitud col 0 mm longitud pie 1114 mm longitud orej
1520 mm longitud antebraz 4149 mm pes 1533 ges tamañ median part dorsal
color caf carbon negruzc part ventral liger pal punt pel tenuement
escarch pelaj larg 910 mm bland lin facial estrech blancuzc clar escarch
orej hoj nasal color caf oscur herradur hoj nasal total libr uropatagi
pequeñ cerc 6 mm form v superfici dorsal pelud bord dens franj pat pies
pelud cicl anual distribu regional distribu mexic oest panam localiz 600
3000 msnm fenolog usos 1226 nombr cientif pelecanus occidentalis nombr
comun alcatraz buchon pelican pard descripcion mid 109 cm pes 3 kg
inconfund unic pelican comun cost adult pos cuerp caf grisace oscur plum
part superior present lustr plat cabez cuell blanc pic parduzc bols piel
car grisac pat negr epoc reproduct cuell principal negr crest nucal
castañ present tint amarill cabez piel alrededor ojo rojiz pic ostent
tint rosace especimen inmadur cabez cuell part superior caf abdom blanc
alcanz plumaj definit adult despues 3 años cicl anual especi resident
aunqu individu pued ser migratori neartic distribu regional encuentr
cost pacif washington nort peru cost islas atlant golf mexic carib
carolin nort venezuel fenolog usos 2900 nombr cientif aulaxin quadrangul
nombr comun liqu
- source_sentence: ¿cual caracterist distint plumaj mosquer agu adult juvenil ?
sentences:
- >-
nombr comun mosquer agu descripcion mid 155 cm pes 21 grs negruzc tamañ
median rar ocasion encuentr lej agu adult muestr cabez cuell mayor part
region inferior negr opac negr pizarr centr abdom blanc flanc coberter
infracaudal gris tizn rest region superior pizarr negruzc present 2 barr
alar gris secundari tercial bord grisace col negruzc vexil extern
timoner extern bord blanc pic pat negruzc especimen juvenil present
plumaj negr parduzc apag abdom barr alar caf canel opac caf ante plum
espald rabadill flec caf pal cicl anual efectu migracion altitudinal
distribu regional encuentr suroest eua noroest argentin fenolog usos
1029 nombr cientif cheilanth brachypus nombr comun descripcion helech
terrestr epipetr rizom cort ascendent compact escam 8 15 01 03 mm linear
pardoamarillent pardorojiz concolor liger bicolor enter marg dispers
dentadofrond 10 35 cm larg peciol 1 5 cm larg 18 15 tamañ frond pard
oscur cilindr dens escam pelos escam 1 5 05 1 mm lanceol linear pard
pardorojiz tricom 1 2 mm blanquecin tortuos lamin 8 30 25 5 cm oblanceol
1 pinnadopinnatif haz dens pelos tricom casi 1 mm hialin lax patent
enves dens escam pelos superfici visibl tricom escam anaranjadorojiz
pinn 10 21 par 12 25 06 13 cm equilater delt lanceol raquis negr ocult
dens cubiert tricom escam nervadur ocult visibl indusi reflex escari
enter decurrentecheilanth brachypus caracteriz lamin 1 pinnadopinnatif
oblanceol dens escam enves mesoamer especi c bonariensis unic especi
cheilanth lamin 1 pinnadopinnatif cicl anual distribu regional mexic
mesoamer fenolog usos 2778 nombr cientif caripi montagnei nombr comun
descripcion cuerp fructifer 05 25 cm alto form cop alarg extrem superior
aplan 05 15 cm diametr blanc beig rellen context sol color blanc pose
olor sabor distint
- >-
orej casi desnud unid band pequeñ cruz superfici cabez car desnud hoj
nasal pequeñ herradur complet fusion labi superior barbill acanal bord
hiler diminut verrug col cort mid men mit longitud uropatagi antebraz
desnud alas cort anchas unid pat cerc bas ded pat desnud calcane larg
pat cicl anual distribu regional hondur bolivi norest argentin guyan
brasil localiz tierr baj 600 msnm fenolog usos 420 nombr cientif aechme
angustifoli nombr comun piñuel epifit parasit descripcion epifitahoj 19
685 cm lamin 12 35 4 cm agud acumin escap 225 58 63 cm erect bract
superior larg entrenud inferior cort espinososerradasinflorescent 45 235
cm unipinn bipinn basal bract primari espinososerr distal espig 4 9 flor
distic bract floral 04 06 cm larg igual longitud entrenud flor sesil
sepal 5 9 mm mucron petal amarilloss reconoc tamañ flor inflorescent
cicl anual distribu regional nicaragu ecuador peru bolivi fenolog
floracion observ ener febrer noviembr frut observ marz octubr usos 682
nombr cientif centronycteris centralis nombr comun murcielag descripcion
longitud cabez cuerp 4959 mm longitud col 2024 mm longitud pie 79 mm
longitud orej 1719 mm longitud antebraz 4349 mm pes 56 gcuerp color
amarill sombr caf parduzc part inferior cuart traser uropatagi color caf
anaranj pelaj larg espes orej larg form hoz punt piel car ros membran
negruzc uropatagi larg pelud bas calcane larg alas lig pat bas ded sac
aere cicl anual distribu regional mexic peru guyan brasil tierr baj sol
fenolog usos 1980 nombr cientif ctenosaur quinquecarinat nombr comun
garrob ingles spiny tail iguan descripcion lagartij grand alcanz 350 mm
hc hembr pequeñ adult col alcanz casi dobl larg rest cuerp cabez disting
cuell miembr robust muscul escam region dorsal pequeñ apen imbric debil
quill except aquell part dorsal miembr grand fuertement quill escam
ventral lis
- >-
sorali comun granular submarginal isidi pustul ausent apoteci rar observ
cicl anual distribu regional pantropical extend region templ adyacent
fenolog usos 25 nombr cientif tabebui ochrace nombr comun cortez amarill
cortez amarillapiuv tarum brasil descripcion arbol 25 m 50 cm med altur
pech dap fust cortez surc profund separ ram joven pubescent hoj digit 5
foliol aserr enter membranace pubescent glaucoamarillent enves
oblongoobov oblongoelipt abrupt acumin bas obtus trunc foliol terminal
522 18144 cm par intermedi 42198 14132 cm pubescent estrell
ferrugineoamarillent ambas superfici peciol 618 cm larg lanos pubescent
peciolul 0258 cm larg inflorescent panicul terminal pubescent flor dulc
fraganci caliz campanul 5 lobul gran cantid pubescent lanos amarillent
corol tubul amarill lin rojiz cuell tub usual parduzc 483 cm larg frut
capsul lin cilindr delg extrem 1135 118 cm lanos pubescent semill 0408
1829 cm alad especi comun dentr gener reconoc pos hoj sol 5 foliol dens
pubescent estrell principal enves asi peciol ram joven enves ademas
glauc amarillent cicl anual distribu regional centroamer hondur guatemal
nort suramer brasil ytrinid fenolog flor observ ener juni produc anual
gran cantid plantul usos mader pard oscur parec tabebui guayac pes dur
cort alta resistent mecan larg durabil aun baj condicion favor pudricion
mader propi usos extern post durmient ferrocarril acab construccion
civil bol bolich asim bell floracion sid plant ornamental pais distribu
natural especi adapt siti sec util preservavion mejor are degrad altas
pendient lorenzi 1949 2608 nombr cientif tabanus unistriatus nombr comun
taban descripcion hind tibia without apical spurs basicost with strong
seta as dens as thos on the adjoining cost vertex without tubercl
scutellum and posterior margin of the mesoscutum without black velvety
spot body not wholly black subcallus bar and shiny abdom black or dark
brown with singl prominent pal middorsal strip covering tergit 16 frons
over 6 tim as high as the basal width wing somewhat smoky along the
forebord and apex cicl anual distribu regional guatemal to ecuador ?
guyan ? peru fenolog usos
- source_sentence: >-
explic distribu geograf especi mencion context import control serpient
venen viper
sentences:
- >-
cuerp cilindr col median larg escam cefal comprend rostral dos
internasal dos prefrontal frontal dos parietal loreal nasal preocul dos
postocular present 22 6 23 temporal 8 o 9 supralabial 8 infralabial
present dos par geneial 19 hiler escam dorsal diferent import congener c
scytalin reduccion lis foset apical ventral redond ia plac anal present
enter subcaudal divid color uniform band transversal cefal nucal juvenil
color complet diferent cons color fond roj cuerp band nucal amarill clar
cabez negr cicl anual distribu regional yucatan mexic nort argentin
fenolog usos sistem inmunolog capaz soport vari cc venen bothrops hac
potencial interes medic especi sirv control serpient venen viper 2687
nombr cientif euphori candezei nombr comun escarabaj frut descripcion
cuerp 175 232 mm longitud 92 122 mm ancho color dorsal ventral cuerp
inclu pigidi pat verd vidrios rar aparec individu tonal rojiz bastant
llamat pronot elitr lis present puntuacion llamat part superior mientr
part posterior elitr pigidi present rug ondul bastant caracterist
present sed blanquecin especial evident are ventral bord anterior clipe
present par dient dirig haci arrib dorsal cabez concav are
correspondient frent clipe lev elev longitudinal part central anten mach
present maz antenal volumin hembr pronot present carin lateral bien marc
complet bord posterior present escotadur correspondient bord anterior
escutel grand expuest tibi anterior present tres dient extern evident
tibi anterior mach tiend ser estiliz hembr femur medi posterior present
ventral carin longitudinal clar defin cerc bord posterior sal hiler sed
tibi medi posterior present evident hiler sed junt relat larg bord
intern dorsal cox medi bien separ tubercul mesosternal relat ancho form
pentagonal vist ventral fig propleur quill pronunci cercan paralel sutur
sep preproestern diferenci sex mach present anten maz volumin hembr figs
abdom vist perfil tiend ser concav mientr hembr tiend ser rect convex
ademas tibi anterior mach tiend ser estiliz hembr cicl anual distribu
regional especi distribu ampli haci nort mientr sur sol sid hall panam
- >-
larg apic agud acumin bas obtus redond enter vec afelp haz dispers
tricom porrect subsesil enves suavement toment tricom multiangul pedicul
nervi principal vec armad peciol 3 cm larg toment mayor armad
inflorescent rac amonton 4 12 flor lateral toment tricom estrell sesil
cort pedicel inerm menud inconspicu armad peduncul 1 cm larg vec bifurc
pedicel 10 mm larg caliz casi 3 mm larg lobul cerc mit longitud lobul
angost sen redond toment tricom multiangul corol 15 mm diametr blanc
azul profund lobul lobul angost pubescent asi distal anter 5 mm larg
frut tip bay globos 08 s 1 cm diametr glabr anaranj lustros madur
pedicel fructifer acrescent delg expand distal erect semill aplan casi 3
mm diametr cicl anual distribu regional mexic panam ecuador fenolog
fertil may setiembr usos 3284 nombr cientif sagittari lancifoli nombr
comun descripcion hierb perenn emergent provenient rizom monoic hoj
distint distic erect peciol cerc 100 cm larg lamin 83550 0441521 cm lin
ovad elipt atenu baseinflorescent bisexual emergent 6 13 verticil simpl
ramific cad 3 flor flor 20 o estambr flor estamin estambr esteril flor
pistil pistil esteril ausent flor estamin cabez frutal 811 1115 mm
pedicel ascendent sepal reflex papil aqueni 16 25 mm larg car lateral 1
glandul pic erect 03 07 mm larg cicl anual distribu regional surest unid
ecuador brasil antill fenolog floracion año usos 2498 nombr cientif
hyperbaen leptobotry nombr comun descripcion arbust arbol 3 6 mhoj
coriac lustr glabr elipticooblong ovadolanceol mid 7 205 35 87 cm 5 8
par nervi secundari venacion terciari irregular reticul marg enteroondul
apic acumin bas estrech redond
- >-
zanthoxylum fag l sarg var culantrill crec fald cordiller guanac til
elev 600 1300 m pose mayor aparient arbol poc aguijon fust aguijon ram
raquis levement alad panicul 11 cm standley 1937 trat zanthoxylum
insular cicl anual distribu regional mexic sur amer antill fenolog
floracion observ febrer usos 697 nombr cientif glyphonycteris daviesi
nombr comun murcielag descripcion longitud cabez cuerp 6384 mm longitud
col 511 mm longitud pie 1720 mm longitud orej 2731 mm longitud antebraz
5458 mm pes 1930 ges especi mayor tamañ dentr gener sol par incis grand
tan larg canin part dorsal color caf parduzc oscur part ventral liger
pal pelaj larg lanud orej larg extrem punt labi barbill bastant pelud
barbill acanal bord cojincill lis form v col cort mid cerc mit longitud
uropatagi calcane pequeñ pat pat larg moder pelud cicl anual distribu
regional hondur peru guyan brasil bolivi localiz sol tierr baj fenolog
usos 1583 nombr cientif sclerurus albigularis nombr comun tirahoj
gargantigr descripcion mid 17 cm pes 38 grs sclerurus grand muestr contr
distint gris gargant pech ruf adult muestr pile caf oscur lev escam
grues negruzc espald coberter alar caf castañ oscur torn caf oscur remer
castañ rabadill coberter supracaudal col negruzc lad cabez oliv grisace
oscur cost flanc region infracaudal color caf castañ oscur maxil negr
mandibul color cuern punt negruzc pat negr cafecin ejemplar juvenil
similar pech opac oscur gargant oscur escam fusc cicl anual distribu
regional encuentr cost ric nort bolivi guyan trinid tobag fenolog usos
210 nombr cientif cyathe squarros
- source_sentence: >-
describ caracterist morfolog werauhi kathya inclu detall hoj inflorescent
flor
sentences:
- >-
color cuerp negr pard oscur aparient pul levisim brill verd casi
impercept mayor especimen especimen lad pacif cost ric aparient levement
opac lad atlant general cuerp lis dorsal carent set bord anterior cabez
dos dient relat junt ver figur abaj are dorsal ojos bastant ampli
relacion especi gener cost ric ver figur abaj fov lateral pronot
circular alarg form surc escutel visibl cad elitr present 9 estri visibl
inclu supraepipleural carec carin lateral elitr supraepipleural pigidi
muestr carin basal bien marc denticul ventral bord anterolateral
protorax ausent ver figur abaj carin proepimeral protorax present
complet ver figur abaj tibi anterior muestr 3 dient bord extern bord
intern rect ver figur abaj espolon apical tibi bif diferent hembr simpl
ver figur abaj tars anterior present tod especi gener ver figur abaj
tibi medi posterior delg curv escas expand haci extrem ver figur abaj
prim tars pat posterior longitud normal larg segund form triangul ver
figur abaj ventral femur posterior present carin longitudinal cerc bord
anterior carin cerc bord posterior ver figur abaj diagnosis hembr semej
mach except espolon apical tibi anterior simpl bif ver figur abaj ademas
ultim segment abdominal ancho medial mach cicl anual colect mes año are
distribu lad atlant pacif distribu regional encuentr ademas belic
nicaragu panam colombi brasil ecuador fenolog usos 3283 nombr cientif
echinodorus bolivianus nombr comun descripcion hierb anual rizomat plant
fertil emergent mayor frecuenci crec var riber humed cerc 30 cm altur
hoj sumerg emergent peciol 1 725 cm larg lamin 13 722 cm larg lin
linearlanceol atenu bas marc peluc inflorescent 1 o 23 verticil simpl
cad 4 11 flor pedicel 08 355 cm larg flor sepal 28 43 mm larg 89 estambr
pistil cerc 20 cabez frutal 153 254 mm simil anill encerr total sepal
aqueni 1 17 mm larg usual 2 o 3 costill bien desarroll car vec ausent
cicl anual distribu regional unid nort argentin trinid antill fenolog
flor ener may usos
- >-
bract floral 04 07 cm cort casi igual entrenud flor sesil sepal 5 8 mm
mucron petal blanc bay 1 2 cm negrasmuy simil especi gener ronnbergi
cual pued ser dificil distingu veget autor inclus suger posibil unir
nuev ambos gener cicl anual distribu regional cost ric panam fenolog
fructif observ agost ener usos 680 nombr cientif cormur brevirostris
nombr comun murcielag descripcion longitud cabez cuerp 4658mm longitud
col 1016mm longitud pie 58mm longitud orej 1316mm longitud antebraz
4550mm pes 711gpart dorsal ric color caf castañ negruzc juvenil subadult
part ventral liger pal pelaj espes brillant piel car orej negruzc trag
ancho nariz cort pel casi punt membran negr alas unid pat bas ded sac
aere grand abertur extiend bord ala cicl anual distribu regional
nicaragu peru brasil tierr baj 1000msnm fenolog usos 1078 nombr cientif
kogi sim nombr comun cachalot enan dwarf sperm whal descripcion signific
menor kogi breviceps pues promedi 28 m longitud 260 kg pes dors gris
oscur vientr blanc cost color blanc grisace alet pectoral gris oscur
alet dorsal proporcional cuerp tamañ sol liger posterior mit cuerp igual
k breviceps present hocic fuertement trunc ojo alet pectoral plieg piel
semej agall abertur branquial fals natural ningun relacion pec cicl
anual especi ocasional aunqu divers epoc año anterior situacion pued
trat especi resident rar escas distribu regional agu tropical templ
planet aunqu falt mediterrane mar negr mar roj golf persic fenolog usos
japon isla san vicent antill menor caz carn 1637 nombr cientif
myiodynast hemichrysus nombr comun pech amarill mosquer ventridor
descripcion mid 20 cm pes 41 grs difier mosquer tip pitangus sulphuratus
list mal oscur adult muestr coronill gris oscur fin list negr manch
amarill brillant ocult rest region oliv verdos oscur alas col fusc bord
tercial amarill pal remer coberter alar angost color canel present list
negruzc grues are loreal auricular bord cej list blanc mejill list mal
fusc grues barbill blanc rest region inferior amarill brillant pic pat
negr
- >-
maxim 24 dient n richardi abdom larg 607 % longitud estand vs 493568 %
color clar miembr atenu generotien pat traser angost 41 % longitud
estand vs 445o % especi cost ric ded pat traser cort 3er ded 0917 % pat
delanter traser sindactil 4 ded pat delanter 5 ded pat traser ded pat
traser extern sol perfil extern surc punt digit libr punt
redondeadastien fos nasal larg ancho cabez 40 vec diametr fos nasal
compar tamañ n richardi grand miembr gener cost ric cicl anual distribu
regional fenolog usos 1894 nombr cientif pselliophorus tibialis nombr
comun salton musl amarill descripcion 185 cm 31 g oscur delg col larg
musl amarill esponj pic bien larg delg aspect atlapet adult pile part
atras nuc negr rest part arrib negr pizarr gargant negruzc pas pizarr
negruzc rest region inferior pech abdom teñ verd oliv iris castañ pic
negr pat fusc individu present pequeñ manch amarill bord hombr juvenil
parec opac encim color negr tizn debaj present fuert tint cafecin musl
caf oliv pal cicl anual distribu regional encuentr cost ric oest panam
fenolog usos 44 nombr cientif werauhi kathya nombr comun piñuel parasit
epifit descripcion epifit terrestr caulescent hoj 15 45 cm larg atenu
cartac papel quebradiz vain 24 39 cm caf oscur lepidot lamin 10 19 cm
glabr lepidot lin longitudinal oscur escap 22 37 cm larg erect
curvadoerect bract verdecrem larg entrenudosinflorescent erect 2 5 cm
larg 1pinn bract primari larg ram lateral estos sesil casi sesil dos
tres flor colateral bract floral 13 18 cm larg verdecrem ovad oblong
carin glabr lepidot membranac cartaceasflor sesil sepal 06 10 cm larg
coriace petal crem verdecrem 17 20 cm largocapsul 17 25 cm larg com
semill canel cicl anual distribu regional
- source_sentence: >-
¿qu aspect morfolog plumaj charran embrid permit diferenci especi similar
stern fuscat especial epoc cri ?
sentences:
- >-
nombr comun sinsont tropical descripcion dors cuerp color gris opac
brillant part cabez part ventral blancuzc alas caf negruzc barr angost
blanc col delg caf negruzc punt blanc list ocul negr cej blanc pat pic
negr rand traylor 1961 sanchez 2003 cicl anual distribu regional sur
mexic colombi andes sur brasil peterson chalf 1973 fenolog usos 2509
nombr cientif zanthoxylum melanostictum nombr comun lagart color
lagartill descripcion arbol arbust 2 15 m fust poc aguijon ram joven
rojiz glabr aguijon escas lenticeladashoj imparipinn 3 7 par foliol
opuest elipt ovad 2 102142 08 5268 cm glabr lustros coriace apic cort
acumin redond ocasion levement emargin bas obtus bord general enter
peciol peciolul rojizosinflorescent panicul terminal 13 cmflor blanc 5
petal frut folicul verruc rojiz obovoid 4 8 mm diametr semill negr 3 6
mmse disting color mor rojiz peciol raquis peciolul fust general carec
aguijon escas principal bas cicl anual distribu regional mexic centr
amer fenolog floracion observ ener abril agost usos 3117 nombr cientif
campnosperm panamens nombr comun descripcion arbol 12 30 m altur rmit
ferrugineopuberulent hoj simpl altern cortopeciol oblongoobov 1435 5515
cm apic obtus redond cartac pubescent dens tricom estrell pequeñ escam
pelt pard rojiz enves nervadur secundari evidenteinflorescent panicul
general axil 40 cm larg flor amarillent pequeñ frut drup triangularovoid
115 0712 cmdiagnost caracteriz hoj agrup final ramit cuy aparient
recuerd arbol espavel zapot carenci savi lechos habitat suel aneg permit
distingu ademas present ramif simpodial tipic hoj viej torn rojoanaranj
ramit hoj enves pubescent dor diminut pel escam particul cicl anual
distribu regional hondur panam fenolog flor observ agost octubr frut
setiembr octubr usos 2396 nombr cientif micrurus mipartitus
- >-
larg lamin 22 45 65 05 1 2 25 cm linearelipt lin atenu ambos extrem
coriace lustros marg comun revolut raquis pajiz pard ven lateral evident
sor redond 1 3 4 seri cost marg cicl anual distribu regional cost ric
panam colombi venezuel ecuador peru bolivi fenolog usos 144 nombr
cientif croton ortholobus nombr comun targu descripcion arbust 3 m altur
hoj elipt ovad lanceol 3 10 cm larg 15 7 cm ancho peciol 2 glandul apic
marg levement aserr inflorescent bisexual racem espig 4 7 cm larg frut 4
6 mm longituds reconoc hoj levement aserr peciol glandular estipul
linear inflorescent flor solitari sosten bract linear cicl anual
distribu regional hondur nicaragu fenolog usos 3017 nombr cientif
gymnospori haberian nombr comun descripcion arbol 5 30 m altur ramit
verd pal verd amarillent estipul diminut rojiz hoj simpl altern 812 46
cm elipt apic acumin agud glabr bord enteroinflorescent cim axilar 20
flor flor verd 45 7 mm ancho frut tip capsul 1 115 cm amarillent glob 2
4 lobul semill pard aril blancos caracteriz hoj sec adquier ton verd
amarillent bas general redond bord levement revolut rasg taxonom recuerd
gener maytenus dificil separ rasp cortez tronc ramit raic epidermis
amarillent amarill encend mayor especi famili g haberian caracterist vec
not direct bas tronc hab rasp cortez cicl anual distribu regional mexic
estacion biolog tuxtl veracruz fenolog flor observ febrer juli frut ener
marz diciembr usos 321 nombr cientif vriese marnierlapostollei nombr
comun piñuel epifit parasit descripcion epifitashoj 8 15 21 cm acumin
agud apicul membranac subcartac vain 2 4 cm canelacrem esparcid lepidot
lamin 13 26 cm esparcid lepidot lin longitudinal mor escap 16 22 26 cm
erect curvadoerect
- >-
pes 12 grs empidonax pequeñ caf alas cort redond anill ocul opac adult
oliv cafecin encim anill ocul ante angost bien defin barr alar opac caf
pal gargant blanc pech present tint parduzc abdom ante amarillent forr
alas general coberter infracaudal encend maxil negr mandibul color
anaranjadocarn forr boc anaranj pat negruzc especimen juvenil caf tizn
opac encim barr alar contrast color ante canel cicl anual especi
migratori neartic ver distribu cost ric distribu regional reproduc local
nort mexic oest panam inviern part central mexic part central panam
fenolog usos 1746 nombr cientif vire philadelphicus nombr comun vire
amarillent descripcion mid 115 cm pes 115 grs vire pequeñ marc alar
color parec vermivor peregrin asoci frecuenci cabez relat grand redond
pic grues list facial anchas coberter infracaudal amarill adult pile
gris tint oliv rest region superior verd oliv grisace cej are baj ojo
color blanc separ mediant list ocul fusc mejill teñ oliv region inferior
var principal amarill bastant brillant gargant abdom pal principal
blancuzc amarill bien defin sol pech coberter infracaudal maxil color
cuern fusc mandibul color cuern pal pat gris individu inmadur parec
adult ocasion present coberter alar mayor cort opac punt pal reten
plumaj juvenil cicl anual especi migratori neartic ver distribu cost ric
distribu regional reproduc canad extrem nort eua inviern peninsul
yucatan guatemal part central panam rar ocasion nort guatemal fenolog
usos 1446 nombr cientif onychoprion anaethetus nombr comun charran
embrid descripcion mid 36 cm pes 100 grs tamañ median espald oscur col
profund ahorquill disting stern fuscat coll nucal clar manch blanc delg
frent extiend form list supercili cort epoc cri adult present coronill
list loreal negr coll nucal gris clar rest region superior gris parduzc
oscur tod region inferior rectric extern blanc tint gris pech cost pic
pat negr epoc cri ve rar ocasion cost ric coronill eminent blanc list
negr part posterior
model-index:
- name: SentenceTransformer based on hiiamsid/sentence_similarity_spanish_es
results:
- task:
type: information-retrieval
name: Information Retrieval
dataset:
name: Unknown
type: unknown
metrics:
- type: cosine_accuracy@1
value: 0.7784256559766763
name: Cosine Accuracy@1
- type: cosine_accuracy@3
value: 0.89067055393586
name: Cosine Accuracy@3
- type: cosine_accuracy@5
value: 0.922740524781341
name: Cosine Accuracy@5
- type: cosine_accuracy@10
value: 0.9533527696793003
name: Cosine Accuracy@10
- type: cosine_precision@1
value: 0.7784256559766763
name: Cosine Precision@1
- type: cosine_precision@3
value: 0.2968901846452867
name: Cosine Precision@3
- type: cosine_precision@5
value: 0.18454810495626817
name: Cosine Precision@5
- type: cosine_precision@10
value: 0.09533527696793001
name: Cosine Precision@10
- type: cosine_recall@1
value: 0.7784256559766763
name: Cosine Recall@1
- type: cosine_recall@3
value: 0.89067055393586
name: Cosine Recall@3
- type: cosine_recall@5
value: 0.922740524781341
name: Cosine Recall@5
- type: cosine_recall@10
value: 0.9533527696793003
name: Cosine Recall@10
- type: cosine_ndcg@10
value: 0.8696617098665955
name: Cosine Ndcg@10
- type: cosine_mrr@10
value: 0.8424909759822294
name: Cosine Mrr@10
- type: cosine_map@100
value: 0.8440024185539007
name: Cosine Map@100
- type: dot_accuracy@1
value: 0.7201166180758017
name: Dot Accuracy@1
- type: dot_accuracy@3
value: 0.8790087463556852
name: Dot Accuracy@3
- type: dot_accuracy@5
value: 0.9154518950437318
name: Dot Accuracy@5
- type: dot_accuracy@10
value: 0.9446064139941691
name: Dot Accuracy@10
- type: dot_precision@1
value: 0.7201166180758017
name: Dot Precision@1
- type: dot_precision@3
value: 0.29300291545189505
name: Dot Precision@3
- type: dot_precision@5
value: 0.18309037900874633
name: Dot Precision@5
- type: dot_precision@10
value: 0.09446064139941689
name: Dot Precision@10
- type: dot_recall@1
value: 0.7201166180758017
name: Dot Recall@1
- type: dot_recall@3
value: 0.8790087463556852
name: Dot Recall@3
- type: dot_recall@5
value: 0.9154518950437318
name: Dot Recall@5
- type: dot_recall@10
value: 0.9446064139941691
name: Dot Recall@10
- type: dot_ndcg@10
value: 0.8406159912422888
name: Dot Ndcg@10
- type: dot_mrr@10
value: 0.80640589569161
name: Dot Mrr@10
- type: dot_map@100
value: 0.8085654600526095
name: Dot Map@100
SentenceTransformer based on hiiamsid/sentence_similarity_spanish_es
This is a sentence-transformers model finetuned from hiiamsid/sentence_similarity_spanish_es. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: hiiamsid/sentence_similarity_spanish_es
- Maximum Sequence Length: 512 tokens
- Output Dimensionality: 768 tokens
- Similarity Function: Cosine Similarity
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("igmochang/CR-biodiversity-preprocessed-sentence-similarity-es")
# Run inference
sentences = [
'¿qu aspect morfolog plumaj charran embrid permit diferenci especi similar stern fuscat especial epoc cri ?',
'pes 12 grs empidonax pequeñ caf alas cort redond anill ocul opac adult oliv cafecin encim anill ocul ante angost bien defin barr alar opac caf pal gargant blanc pech present tint parduzc abdom ante amarillent forr alas general coberter infracaudal encend maxil negr mandibul color anaranjadocarn forr boc anaranj pat negruzc especimen juvenil caf tizn opac encim barr alar contrast color ante canel cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc local nort mexic oest panam inviern part central mexic part central panam fenolog usos 1746 nombr cientif vire philadelphicus nombr comun vire amarillent descripcion mid 115 cm pes 115 grs vire pequeñ marc alar color parec vermivor peregrin asoci frecuenci cabez relat grand redond pic grues list facial anchas coberter infracaudal amarill adult pile gris tint oliv rest region superior verd oliv grisace cej are baj ojo color blanc separ mediant list ocul fusc mejill teñ oliv region inferior var principal amarill bastant brillant gargant abdom pal principal blancuzc amarill bien defin sol pech coberter infracaudal maxil color cuern fusc mandibul color cuern pal pat gris individu inmadur parec adult ocasion present coberter alar mayor cort opac punt pal reten plumaj juvenil cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc canad extrem nort eua inviern peninsul yucatan guatemal part central panam rar ocasion nort guatemal fenolog usos 1446 nombr cientif onychoprion anaethetus nombr comun charran embrid descripcion mid 36 cm pes 100 grs tamañ median espald oscur col profund ahorquill disting stern fuscat coll nucal clar manch blanc delg frent extiend form list supercili cort epoc cri adult present coronill list loreal negr coll nucal gris clar rest region superior gris parduzc oscur tod region inferior rectric extern blanc tint gris pech cost pic pat negr epoc cri ve rar ocasion cost ric coronill eminent blanc list negr part posterior',
'nombr comun sinsont tropical descripcion dors cuerp color gris opac brillant part cabez part ventral blancuzc alas caf negruzc barr angost blanc col delg caf negruzc punt blanc list ocul negr cej blanc pat pic negr rand traylor 1961 sanchez 2003 cicl anual distribu regional sur mexic colombi andes sur brasil peterson chalf 1973 fenolog usos 2509 nombr cientif zanthoxylum melanostictum nombr comun lagart color lagartill descripcion arbol arbust 2 15 m fust poc aguijon ram joven rojiz glabr aguijon escas lenticeladashoj imparipinn 3 7 par foliol opuest elipt ovad 2 102142 08 5268 cm glabr lustros coriace apic cort acumin redond ocasion levement emargin bas obtus bord general enter peciol peciolul rojizosinflorescent panicul terminal 13 cmflor blanc 5 petal frut folicul verruc rojiz obovoid 4 8 mm diametr semill negr 3 6 mmse disting color mor rojiz peciol raquis peciolul fust general carec aguijon escas principal bas cicl anual distribu regional mexic centr amer fenolog floracion observ ener abril agost usos 3117 nombr cientif campnosperm panamens nombr comun descripcion arbol 12 30 m altur rmit ferrugineopuberulent hoj simpl altern cortopeciol oblongoobov 1435 5515 cm apic obtus redond cartac pubescent dens tricom estrell pequeñ escam pelt pard rojiz enves nervadur secundari evidenteinflorescent panicul general axil 40 cm larg flor amarillent pequeñ frut drup triangularovoid 115 0712 cmdiagnost caracteriz hoj agrup final ramit cuy aparient recuerd arbol espavel zapot carenci savi lechos habitat suel aneg permit distingu ademas present ramif simpodial tipic hoj viej torn rojoanaranj ramit hoj enves pubescent dor diminut pel escam particul cicl anual distribu regional hondur panam fenolog flor observ agost octubr frut setiembr octubr usos 2396 nombr cientif micrurus mipartitus',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Preprocess function:
import re
import nltk
from nltk.corpus import stopwords
from nltk.stem import SnowballStemmer
from nltk.tokenize import word_tokenize
# Initialize Spanish stemmer and stopwords
nltk.download('punkt')
nltk.download('stopwords')
spanish_stopwords = set(stopwords.words('spanish'))
stemmer = SnowballStemmer('spanish')
# Function for preprocessing text (lowercase, remove punctuation, stopwords, and apply stemming)
def preprocess_text(text):
# Convert to lowercase
text = text.lower()
# Remove punctuation and special characters
text = re.sub(r'[^\w\s¿?%]', '', text)
# Tokenize
words = word_tokenize(text)
# Remove stopwords and apply stemming
words = [stemmer.stem(word) for word in words if word not in spanish_stopwords]
# Rejoin the words
return ' '.join(words)
Evaluation
Metrics
Information Retrieval
- Evaluated with
InformationRetrievalEvaluator
Metric | Value |
---|---|
cosine_accuracy@1 | 0.7784 |
cosine_accuracy@3 | 0.8907 |
cosine_accuracy@5 | 0.9227 |
cosine_accuracy@10 | 0.9534 |
cosine_precision@1 | 0.7784 |
cosine_precision@3 | 0.2969 |
cosine_precision@5 | 0.1845 |
cosine_precision@10 | 0.0953 |
cosine_recall@1 | 0.7784 |
cosine_recall@3 | 0.8907 |
cosine_recall@5 | 0.9227 |
cosine_recall@10 | 0.9534 |
cosine_ndcg@10 | 0.8697 |
cosine_mrr@10 | 0.8425 |
cosine_map@100 | 0.844 |
dot_accuracy@1 | 0.7201 |
dot_accuracy@3 | 0.879 |
dot_accuracy@5 | 0.9155 |
dot_accuracy@10 | 0.9446 |
dot_precision@1 | 0.7201 |
dot_precision@3 | 0.293 |
dot_precision@5 | 0.1831 |
dot_precision@10 | 0.0945 |
dot_recall@1 | 0.7201 |
dot_recall@3 | 0.879 |
dot_recall@5 | 0.9155 |
dot_recall@10 | 0.9446 |
dot_ndcg@10 | 0.8406 |
dot_mrr@10 | 0.8064 |
dot_map@100 | 0.8086 |
Training Details
Training Dataset
Unnamed Dataset
- Size: 2,748 training samples
- Columns:
sentence_0
andsentence_1
- Approximate statistics based on the first 1000 samples:
sentence_0 sentence_1 type string string details - min: 14 tokens
- mean: 24.86 tokens
- max: 43 tokens
- min: 323 tokens
- mean: 508.41 tokens
- max: 512 tokens
- Samples:
sentence_0 sentence_1 ¿cual caracterist fisic distint esmerejon inclu diferent mach hembr ?
1407 nombr cientif falc columbarius nombr comun esmerejon descripcion mach mid 265 cm pes 160 grs hembr 33 cm 215 grs pequeñ constitu fuert alas puntiagud adult encim gris pizarr mach caf oscur hembr debaj ante list caf oscur profus cabez fin list cuent cej clar traz barr ocul oscur col negruzc 2 o 3 band clar gris mach hembr especimen inmadur parec hembr iris caf oscur cer pat amarill exhib ruf klisklis falc sparverius difier tamañ form accipit joven cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc nort alask canad extrem nort eua inviern sur part central alask sur canad nort amer sur antill especi ampli distribu viej mund fenolog usos 411 nombr cientif tillandsi subulifer nombr comun piñuel parasit descripcion epifitashoj 5 20 cm roset bulbos vain canel lamin 04 08 cm linearsubul involut escap 65 125 cm erect bract larg entrenudosinflorescent erect 5 105 cm simpl terminal 5 9 flor bract floral 18 3 cm verd cort sepal imbric ecarin conspicu nerv sepal 21 26 cm petal rojiz proximal amarill distal bord rojiz capsul 5 73 cmse reconoc facil roset tubul hoj espiral bract floral pequeñ sepal lamin foliar menor 1 cm ancho cicl anual distribu regional nicaragu venezuel trinid fenolog floracion abril juni frut octubr usos 802 nombr cientif liomys salvini nombr comun raton mont descripcion longitud cabez cuerp 103140mm longitud col 97143mm longitud pie 2630mm longitud orej 1216mm pes 3065gtamañ pequeñ median color caf parduzc pal part dorsal siempr gris sombr caf parduzc pel riz color caf amarillent crem tenuement interpuest espin oscur line anaranj cost part ventral pat color crem blanc col bicolor casi igual tamañ longitud cabez cuerp lc liger pelud ningun mechon pel 24mm punt plant pat traser vellud talon cojincill basal cicl anual
describ morfolog tillandsi subulifer inclu detall hoj inflorescent bract
1407 nombr cientif falc columbarius nombr comun esmerejon descripcion mach mid 265 cm pes 160 grs hembr 33 cm 215 grs pequeñ constitu fuert alas puntiagud adult encim gris pizarr mach caf oscur hembr debaj ante list caf oscur profus cabez fin list cuent cej clar traz barr ocul oscur col negruzc 2 o 3 band clar gris mach hembr especimen inmadur parec hembr iris caf oscur cer pat amarill exhib ruf klisklis falc sparverius difier tamañ form accipit joven cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc nort alask canad extrem nort eua inviern sur part central alask sur canad nort amer sur antill especi ampli distribu viej mund fenolog usos 411 nombr cientif tillandsi subulifer nombr comun piñuel parasit descripcion epifitashoj 5 20 cm roset bulbos vain canel lamin 04 08 cm linearsubul involut escap 65 125 cm erect bract larg entrenudosinflorescent erect 5 105 cm simpl terminal 5 9 flor bract floral 18 3 cm verd cort sepal imbric ecarin conspicu nerv sepal 21 26 cm petal rojiz proximal amarill distal bord rojiz capsul 5 73 cmse reconoc facil roset tubul hoj espiral bract floral pequeñ sepal lamin foliar menor 1 cm ancho cicl anual distribu regional nicaragu venezuel trinid fenolog floracion abril juni frut octubr usos 802 nombr cientif liomys salvini nombr comun raton mont descripcion longitud cabez cuerp 103140mm longitud col 97143mm longitud pie 2630mm longitud orej 1216mm pes 3065gtamañ pequeñ median color caf parduzc pal part dorsal siempr gris sombr caf parduzc pel riz color caf amarillent crem tenuement interpuest espin oscur line anaranj cost part ventral pat color crem blanc col bicolor casi igual tamañ longitud cabez cuerp lc liger pelud ningun mechon pel 24mm punt plant pat traser vellud talon cojincill basal cicl anual
¿cual caracterist distint ramif hoj alzate verticillat permit identif ?
color caf parduzc pal part dorsal siempr gris sombr caf parduzc pel riz color caf amarillent crem tenuement interpuest espin oscur line anaranj cost part ventral pat color crem blanc col bicolor casi igual tamañ longitud cabez cuerp lc liger pelud ningun mechon pel 24mm punt plant pat traser vellud talon cojincill basal cicl anual distribu regional mexic part central cost ric vertient pacif principal localiz tierr baj 1500msnm fenolog usos 3032 nombr cientif alzate verticillat nombr comun descripcion arbol arbust 4 15 m altur ramit cuadrangular pard rojiz exfoli hoj simpl opuest decus obovadoelipt 915 610 cm apic redond retus sesil subsesil coriac glabrasinflorescent panicul terminal 25 cm larg flor petal lil ros frut tip capsul aplan verd pal 5 8 mm largodiagnost reconoc ramif verticil fust pard exfoli escam hoj coriac semej clusi clusiacea secrecion lechos glabr sesil nervadur secundari evident ramit joven cuadrangular hoj torn anaranj rojiz viej cicl anual distribu regional cost ric suramer fenolog flor observ octubr diciembr frut febrer marz usos siti fald cordiller volcan central utiliz ornamental deb foment pues atract follaj arquitectur 1546 nombr cientif eubucc bourcierii nombr comun barbud cabecirroj descripcion mid 15 cm pes 35 grs robust cabezon dos sex present color llamat pic grues conspicu color amarill mach adult are loreal frent barbill negr rest cabez gargant pech roj profund desvanec form abrupt anaranj pech amarill list verd opac profus region posterior region superior alas col color verd opac separ roj cabez lad cuell mediant barr vertical blanc azul iris roj ladrill pic amarill verdos pat verd oliv hembr muestr gargant verd pal part anterior coronill lad cuell anaranj profund continu faj traves part superior pech rest coronill verd ocrace oscur tint anaranj mejill list cort ojo azul clar part baj pech verd oliv clar
- Loss:
MultipleNegativesRankingLoss
with these parameters:{ "scale": 20.0, "similarity_fct": "cos_sim" }
Training Hyperparameters
Non-Default Hyperparameters
eval_strategy
: stepsper_device_train_batch_size
: 10per_device_eval_batch_size
: 10num_train_epochs
: 2multi_dataset_batch_sampler
: round_robin
All Hyperparameters
Click to expand
overwrite_output_dir
: Falsedo_predict
: Falseeval_strategy
: stepsprediction_loss_only
: Trueper_device_train_batch_size
: 10per_device_eval_batch_size
: 10per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 1eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 5e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1num_train_epochs
: 2max_steps
: -1lr_scheduler_type
: linearlr_scheduler_kwargs
: {}warmup_ratio
: 0.0warmup_steps
: 0log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Falsefp16
: Falsefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Nonelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Falseignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torchoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Falsehub_always_push
: Falsegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseeval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Nonedispatch_batches
: Nonesplit_batches
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseeval_use_gather_object
: Falsebatch_sampler
: batch_samplermulti_dataset_batch_sampler
: round_robin
Training Logs
Epoch | Step | Training Loss | cosine_map@100 |
---|---|---|---|
0.1818 | 50 | - | 0.6806 |
0.3636 | 100 | - | 0.7391 |
0.5455 | 150 | - | 0.7742 |
0.7273 | 200 | - | 0.7927 |
0.9091 | 250 | - | 0.8211 |
1.0 | 275 | - | 0.8162 |
1.0909 | 300 | - | 0.8241 |
1.2727 | 350 | - | 0.8137 |
1.4545 | 400 | - | 0.8318 |
1.6364 | 450 | - | 0.8342 |
1.8182 | 500 | 0.4916 | 0.8432 |
2.0 | 550 | - | 0.8440 |
Framework Versions
- Python: 3.10.12
- Sentence Transformers: 3.1.1
- Transformers: 4.44.2
- PyTorch: 2.4.1+cu121
- Accelerate: 0.34.2
- Datasets: 3.0.1
- Tokenizers: 0.19.1
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
MultipleNegativesRankingLoss
@misc{henderson2017efficient,
title={Efficient Natural Language Response Suggestion for Smart Reply},
author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
year={2017},
eprint={1705.00652},
archivePrefix={arXiv},
primaryClass={cs.CL}
}