base_model: hiiamsid/sentence_similarity_spanish_es
library_name: sentence-transformers
- cosine_accuracy@1
- cosine_accuracy@3
- cosine_accuracy@5
- cosine_accuracy@10
- cosine_precision@1
- cosine_precision@3
- cosine_precision@5
- cosine_precision@10
- cosine_recall@1
- cosine_recall@3
- cosine_recall@5
- cosine_recall@10
- cosine_ndcg@10
- cosine_mrr@10
- cosine_map@100
- dot_accuracy@1
- dot_accuracy@3
- dot_accuracy@5
- dot_accuracy@10
- dot_precision@1
- dot_precision@3
- dot_precision@5
- dot_precision@10
- dot_recall@1
- dot_recall@3
- dot_recall@5
- dot_recall@10
- dot_ndcg@10
- dot_mrr@10
- dot_map@100
pipeline_tag: sentence-similarity
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:2748
- loss:MultipleNegativesRankingLoss
- source_sentence: ¿cual caracterist morfolog distint solanum chrysotrichum inclu
detall hoj inflorescent frut ?
- frut subglob cerc 5 9 mm diametr blanc cicl anual distribu regional sur mexic
suramer fenolog floracion registr marz septiembr frecuent juli usos 3462 nombr
cientif solanum chrysotrichum nombr comun descripcion arbust 3 m alto escas armad
tall toment tricom multiangul pedicul larg grues braz central vec alarg acule
cort rect incurv 2 5 mm larg hoj solitari ampli ovad 40 cm larg apic agud bas
trunc cord enter lobul salient afelp toment frecuent ferrugine haz hirsut tricom
estrell sesil braz central larg enves suavement toment tricom multiangul pedicul
grues nervi principal vec armad peciol 15 cm larg toment vec armad inflorescent
simpl cim poc ram cad ram racem vari flor lateral peduncul ramific vec primari
obsolet 15 cm larg cerdosohisp pedicel casi 5 mm larg tricom braz central larg
inerm caliz casi 5 mm larg toment tricom multiangul lobul 13 longitud lobul angost
triangular corol 30 50 mm diametr blanc lob 13 longitud lobul ovad pubescent medi
anter 6 10 mmde larg frut tip bay globos 1 15 cm diametr glabr verd pedicel fructifer
grues alarg erect semill aplan 22 26 mm diametr cicl anual distribu regional mexic
panam fenolog fertil año usos 3243 nombr cientif forchhammeri pall nombr comun
siemprev aceitun blanc descripcion arbol arbust 4 10 m altur ramit glabr hoj simpl
altern obovadooblong 25104 082 cm apic redond emargin obtus cortomucron glabr
lustrosasinflorescent rac axilar comprim 4 6 cm larg flor pard crem pequeñ bisexual
frut tip bay 2 cm diametr esfer amarilloanaranj madur rellen pulp suav jugos sabor
desagradablel mader amarill paj dens present anatom comun pose floem incluidodiagnost
especi dificil ubic famili caracteriz hoj pequeñ obov glabr lustr arbol cop dens
redond plantul brinzal hoj bastant linear contrast individu adult cicl anual distribu
regional mexic fenolog flor observ ener marz noviembr diciembr
- peciol aproxim 4 6 mm larg toment jov flor sesil espig subcapit peduncul 15 7
cm larg frut drup elipsoid 1 3 08 22 cm endocarp 5 surc cicl anual distribu regional
cost ric bolivi antill fenolog flor sid observ moment frut recolect setiembr octubr
usos 173 nombr cientif cyathe microdont nombr comun rab mic helech arborescent
descripcion tronc 15 m alto 58 cm diametr hoj 1217 m larg peciol pard espin espin
38 mm escam peciol 1020 153 mm angost lanceol pard concolor lev marg clar caspill
ausent lamin 2pinnadopinnatif apic gradual atenu raquis pard pard clar espin espin
25 mm glabr pinn pedicul pedicul 02212 cm pinn medi 3050 1520 cm cost pajiz pard
clar lis espin basal espin 13 mm glabr puberulent pel 0102 mm pardoamarillent
pinnul 710 1525 cm sesil costul glabr puberulent pel 0102 mm pardoamarillent escam
escas ausent diminut aplan segment pinnul medi 1725 par 1525 mm ancho serr crenul
obtus nervadur 913 par segment 1bifurc glabr pel tej lamin nervadur glabr sor
medi parafis tan larg esporangi conspicu pardoamarillent blanc panam indusi ausent
cicl anual distribu regional mexic mesoamer colombi venezuel ecuador peru bolivi
brasil guyan fenolog usos raic utiliz cultiv orquid fabric artesan 2099 nombr
cientif rhadinae serperast nombr comun hojarasquer rayadaingles strip littersnak
descripcion miembr gener especi serpient pequeñ median dificil sobrepas 300 mm
longitud total cuy col represent aproxim 40 cient longitud present 11 2 14 2 dient
maxilar aument gradual tamañ haci part posterior boc ultim dos grand separ rest
interespaci pequefi dient mandibular desigual hemipen simpl vari espin ganch proximal
grand detras cual zon espin porcion distal organ calic form estructur capit sulcus
spermaticus bifurc cabez apen disting cuell ojo bien pequeñ ia pupil redond cuerp
cilindr col median larg
- larg glabr inflorescent rac subumbel cort 10 15 flor opuest hoj principal cerc
extrem ram glabrescent peduncul ramific 03 1 cm larg pedicel 10 20 mm larg caliz
2 3 mm larg profund lobul lobul deltoid apical tricom simpl basal glabr corol
9 12 mm diametr blanc frecuent tint purpure sec profund lobul lobul oblong glabr
anter casi3 mm larg frut tip bay globos casi 13 cm diametr glabr verdeamarill
pedicel fructifer acrescent aun delg patent deflex semill aplan 3 mm diametr cicl
anual distribu regional mexic bolivi fenolog fertil año usos 729 nombr cientif
dermanur aztec nombr comun murcielag descripcion longitud cabez cuerp 5975 mm
longitud col 0 mm longitud pie 1114 mm longitud orej 1520 mm longitud antebraz
4149 mm pes 1533 ges tamañ median part dorsal color caf carbon negruzc part ventral
liger pal punt pel tenuement escarch pelaj larg 910 mm bland lin facial estrech
blancuzc clar escarch orej hoj nasal color caf oscur herradur hoj nasal total
libr uropatagi pequeñ cerc 6 mm form v superfici dorsal pelud bord dens franj
pat pies pelud cicl anual distribu regional distribu mexic oest panam localiz
600 3000 msnm fenolog usos 1226 nombr cientif pelecanus occidentalis nombr comun
alcatraz buchon pelican pard descripcion mid 109 cm pes 3 kg inconfund unic pelican
comun cost adult pos cuerp caf grisace oscur plum part superior present lustr
plat cabez cuell blanc pic parduzc bols piel car grisac pat negr epoc reproduct
cuell principal negr crest nucal castañ present tint amarill cabez piel alrededor
ojo rojiz pic ostent tint rosace especimen inmadur cabez cuell part superior caf
abdom blanc alcanz plumaj definit adult despues 3 años cicl anual especi resident
aunqu individu pued ser migratori neartic distribu regional encuentr cost pacif
washington nort peru cost islas atlant golf mexic carib carolin nort venezuel
fenolog usos 2900 nombr cientif aulaxin quadrangul nombr comun liqu
- source_sentence: ¿cual caracterist distint plumaj mosquer agu adult juvenil ?
- nombr comun mosquer agu descripcion mid 155 cm pes 21 grs negruzc tamañ median
rar ocasion encuentr lej agu adult muestr cabez cuell mayor part region inferior
negr opac negr pizarr centr abdom blanc flanc coberter infracaudal gris tizn rest
region superior pizarr negruzc present 2 barr alar gris secundari tercial bord
grisace col negruzc vexil extern timoner extern bord blanc pic pat negruzc especimen
juvenil present plumaj negr parduzc apag abdom barr alar caf canel opac caf ante
plum espald rabadill flec caf pal cicl anual efectu migracion altitudinal distribu
regional encuentr suroest eua noroest argentin fenolog usos 1029 nombr cientif
cheilanth brachypus nombr comun descripcion helech terrestr epipetr rizom cort
ascendent compact escam 8 15 01 03 mm linear pardoamarillent pardorojiz concolor
liger bicolor enter marg dispers dentadofrond 10 35 cm larg peciol 1 5 cm larg
18 15 tamañ frond pard oscur cilindr dens escam pelos escam 1 5 05 1 mm lanceol
linear pard pardorojiz tricom 1 2 mm blanquecin tortuos lamin 8 30 25 5 cm oblanceol
1 pinnadopinnatif haz dens pelos tricom casi 1 mm hialin lax patent enves dens
escam pelos superfici visibl tricom escam anaranjadorojiz pinn 10 21 par 12 25
06 13 cm equilater delt lanceol raquis negr ocult dens cubiert tricom escam nervadur
ocult visibl indusi reflex escari enter decurrentecheilanth brachypus caracteriz
lamin 1 pinnadopinnatif oblanceol dens escam enves mesoamer especi c bonariensis
unic especi cheilanth lamin 1 pinnadopinnatif cicl anual distribu regional mexic
mesoamer fenolog usos 2778 nombr cientif caripi montagnei nombr comun descripcion
cuerp fructifer 05 25 cm alto form cop alarg extrem superior aplan 05 15 cm diametr
blanc beig rellen context sol color blanc pose olor sabor distint
- orej casi desnud unid band pequeñ cruz superfici cabez car desnud hoj nasal pequeñ
herradur complet fusion labi superior barbill acanal bord hiler diminut verrug
col cort mid men mit longitud uropatagi antebraz desnud alas cort anchas unid
pat cerc bas ded pat desnud calcane larg pat cicl anual distribu regional hondur
bolivi norest argentin guyan brasil localiz tierr baj 600 msnm fenolog usos 420
nombr cientif aechme angustifoli nombr comun piñuel epifit parasit descripcion
epifitahoj 19 685 cm lamin 12 35 4 cm agud acumin escap 225 58 63 cm erect bract
superior larg entrenud inferior cort espinososerradasinflorescent 45 235 cm unipinn
bipinn basal bract primari espinososerr distal espig 4 9 flor distic bract floral
04 06 cm larg igual longitud entrenud flor sesil sepal 5 9 mm mucron petal amarilloss
reconoc tamañ flor inflorescent cicl anual distribu regional nicaragu ecuador
peru bolivi fenolog floracion observ ener febrer noviembr frut observ marz octubr
usos 682 nombr cientif centronycteris centralis nombr comun murcielag descripcion
longitud cabez cuerp 4959 mm longitud col 2024 mm longitud pie 79 mm longitud
orej 1719 mm longitud antebraz 4349 mm pes 56 gcuerp color amarill sombr caf parduzc
part inferior cuart traser uropatagi color caf anaranj pelaj larg espes orej larg
form hoz punt piel car ros membran negruzc uropatagi larg pelud bas calcane larg
alas lig pat bas ded sac aere cicl anual distribu regional mexic peru guyan brasil
tierr baj sol fenolog usos 1980 nombr cientif ctenosaur quinquecarinat nombr comun
garrob ingles spiny tail iguan descripcion lagartij grand alcanz 350 mm hc hembr
pequeñ adult col alcanz casi dobl larg rest cuerp cabez disting cuell miembr robust
muscul escam region dorsal pequeñ apen imbric debil quill except aquell part dorsal
miembr grand fuertement quill escam ventral lis
- sorali comun granular submarginal isidi pustul ausent apoteci rar observ cicl
anual distribu regional pantropical extend region templ adyacent fenolog usos
25 nombr cientif tabebui ochrace nombr comun cortez amarill cortez amarillapiuv
tarum brasil descripcion arbol 25 m 50 cm med altur pech dap fust cortez surc
profund separ ram joven pubescent hoj digit 5 foliol aserr enter membranace pubescent
glaucoamarillent enves oblongoobov oblongoelipt abrupt acumin bas obtus trunc
foliol terminal 522 18144 cm par intermedi 42198 14132 cm pubescent estrell ferrugineoamarillent
ambas superfici peciol 618 cm larg lanos pubescent peciolul 0258 cm larg inflorescent
panicul terminal pubescent flor dulc fraganci caliz campanul 5 lobul gran cantid
pubescent lanos amarillent corol tubul amarill lin rojiz cuell tub usual parduzc
483 cm larg frut capsul lin cilindr delg extrem 1135 118 cm lanos pubescent semill
0408 1829 cm alad especi comun dentr gener reconoc pos hoj sol 5 foliol dens pubescent
estrell principal enves asi peciol ram joven enves ademas glauc amarillent cicl
anual distribu regional centroamer hondur guatemal nort suramer brasil ytrinid
fenolog flor observ ener juni produc anual gran cantid plantul usos mader pard
oscur parec tabebui guayac pes dur cort alta resistent mecan larg durabil aun
baj condicion favor pudricion mader propi usos extern post durmient ferrocarril
acab construccion civil bol bolich asim bell floracion sid plant ornamental pais
distribu natural especi adapt siti sec util preservavion mejor are degrad altas
pendient lorenzi 1949 2608 nombr cientif tabanus unistriatus nombr comun taban
descripcion hind tibia without apical spurs basicost with strong seta as dens
as thos on the adjoining cost vertex without tubercl scutellum and posterior margin
of the mesoscutum without black velvety spot body not wholly black subcallus bar
and shiny abdom black or dark brown with singl prominent pal middorsal strip covering
tergit 16 frons over 6 tim as high as the basal width wing somewhat smoky along
the forebord and apex cicl anual distribu regional guatemal to ecuador ? guyan
? peru fenolog usos
- source_sentence: explic distribu geograf especi mencion context import control serpient
venen viper
- cuerp cilindr col median larg escam cefal comprend rostral dos internasal dos
prefrontal frontal dos parietal loreal nasal preocul dos postocular present 22
6 23 temporal 8 o 9 supralabial 8 infralabial present dos par geneial 19 hiler
escam dorsal diferent import congener c scytalin reduccion lis foset apical ventral
redond ia plac anal present enter subcaudal divid color uniform band transversal
cefal nucal juvenil color complet diferent cons color fond roj cuerp band nucal
amarill clar cabez negr cicl anual distribu regional yucatan mexic nort argentin
fenolog usos sistem inmunolog capaz soport vari cc venen bothrops hac potencial
interes medic especi sirv control serpient venen viper 2687 nombr cientif euphori
candezei nombr comun escarabaj frut descripcion cuerp 175 232 mm longitud 92 122
mm ancho color dorsal ventral cuerp inclu pigidi pat verd vidrios rar aparec individu
tonal rojiz bastant llamat pronot elitr lis present puntuacion llamat part superior
mientr part posterior elitr pigidi present rug ondul bastant caracterist present
sed blanquecin especial evident are ventral bord anterior clipe present par dient
dirig haci arrib dorsal cabez concav are correspondient frent clipe lev elev longitudinal
part central anten mach present maz antenal volumin hembr pronot present carin
lateral bien marc complet bord posterior present escotadur correspondient bord
anterior escutel grand expuest tibi anterior present tres dient extern evident
tibi anterior mach tiend ser estiliz hembr femur medi posterior present ventral
carin longitudinal clar defin cerc bord posterior sal hiler sed tibi medi posterior
present evident hiler sed junt relat larg bord intern dorsal cox medi bien separ
tubercul mesosternal relat ancho form pentagonal vist ventral fig propleur quill
pronunci cercan paralel sutur sep preproestern diferenci sex mach present anten
maz volumin hembr figs abdom vist perfil tiend ser concav mientr hembr tiend ser
rect convex ademas tibi anterior mach tiend ser estiliz hembr cicl anual distribu
regional especi distribu ampli haci nort mientr sur sol sid hall panam
- larg apic agud acumin bas obtus redond enter vec afelp haz dispers tricom porrect
subsesil enves suavement toment tricom multiangul pedicul nervi principal vec
armad peciol 3 cm larg toment mayor armad inflorescent rac amonton 4 12 flor lateral
toment tricom estrell sesil cort pedicel inerm menud inconspicu armad peduncul
1 cm larg vec bifurc pedicel 10 mm larg caliz casi 3 mm larg lobul cerc mit longitud
lobul angost sen redond toment tricom multiangul corol 15 mm diametr blanc azul
profund lobul lobul angost pubescent asi distal anter 5 mm larg frut tip bay globos
08 s 1 cm diametr glabr anaranj lustros madur pedicel fructifer acrescent delg
expand distal erect semill aplan casi 3 mm diametr cicl anual distribu regional
mexic panam ecuador fenolog fertil may setiembr usos 3284 nombr cientif sagittari
lancifoli nombr comun descripcion hierb perenn emergent provenient rizom monoic
hoj distint distic erect peciol cerc 100 cm larg lamin 83550 0441521 cm lin ovad
elipt atenu baseinflorescent bisexual emergent 6 13 verticil simpl ramific cad
3 flor flor 20 o estambr flor estamin estambr esteril flor pistil pistil esteril
ausent flor estamin cabez frutal 811 1115 mm pedicel ascendent sepal reflex papil
aqueni 16 25 mm larg car lateral 1 glandul pic erect 03 07 mm larg cicl anual
distribu regional surest unid ecuador brasil antill fenolog floracion año usos
2498 nombr cientif hyperbaen leptobotry nombr comun descripcion arbust arbol 3
6 mhoj coriac lustr glabr elipticooblong ovadolanceol mid 7 205 35 87 cm 5 8 par
nervi secundari venacion terciari irregular reticul marg enteroondul apic acumin
bas estrech redond
- zanthoxylum fag l sarg var culantrill crec fald cordiller guanac til elev 600
1300 m pose mayor aparient arbol poc aguijon fust aguijon ram raquis levement
alad panicul 11 cm standley 1937 trat zanthoxylum insular cicl anual distribu
regional mexic sur amer antill fenolog floracion observ febrer usos 697 nombr
cientif glyphonycteris daviesi nombr comun murcielag descripcion longitud cabez
cuerp 6384 mm longitud col 511 mm longitud pie 1720 mm longitud orej 2731 mm longitud
antebraz 5458 mm pes 1930 ges especi mayor tamañ dentr gener sol par incis grand
tan larg canin part dorsal color caf parduzc oscur part ventral liger pal pelaj
larg lanud orej larg extrem punt labi barbill bastant pelud barbill acanal bord
cojincill lis form v col cort mid cerc mit longitud uropatagi calcane pequeñ pat
pat larg moder pelud cicl anual distribu regional hondur peru guyan brasil bolivi
localiz sol tierr baj fenolog usos 1583 nombr cientif sclerurus albigularis nombr
comun tirahoj gargantigr descripcion mid 17 cm pes 38 grs sclerurus grand muestr
contr distint gris gargant pech ruf adult muestr pile caf oscur lev escam grues
negruzc espald coberter alar caf castañ oscur torn caf oscur remer castañ rabadill
coberter supracaudal col negruzc lad cabez oliv grisace oscur cost flanc region
infracaudal color caf castañ oscur maxil negr mandibul color cuern punt negruzc
pat negr cafecin ejemplar juvenil similar pech opac oscur gargant oscur escam
fusc cicl anual distribu regional encuentr cost ric nort bolivi guyan trinid tobag
fenolog usos 210 nombr cientif cyathe squarros
- source_sentence: describ caracterist morfolog werauhi kathya inclu detall hoj inflorescent
- color cuerp negr pard oscur aparient pul levisim brill verd casi impercept mayor
especimen especimen lad pacif cost ric aparient levement opac lad atlant general
cuerp lis dorsal carent set bord anterior cabez dos dient relat junt ver figur
abaj are dorsal ojos bastant ampli relacion especi gener cost ric ver figur abaj
fov lateral pronot circular alarg form surc escutel visibl cad elitr present 9
estri visibl inclu supraepipleural carec carin lateral elitr supraepipleural pigidi
muestr carin basal bien marc denticul ventral bord anterolateral protorax ausent
ver figur abaj carin proepimeral protorax present complet ver figur abaj tibi
anterior muestr 3 dient bord extern bord intern rect ver figur abaj espolon apical
tibi bif diferent hembr simpl ver figur abaj tars anterior present tod especi
gener ver figur abaj tibi medi posterior delg curv escas expand haci extrem ver
figur abaj prim tars pat posterior longitud normal larg segund form triangul ver
figur abaj ventral femur posterior present carin longitudinal cerc bord anterior
carin cerc bord posterior ver figur abaj diagnosis hembr semej mach except espolon
apical tibi anterior simpl bif ver figur abaj ademas ultim segment abdominal ancho
medial mach cicl anual colect mes año are distribu lad atlant pacif distribu regional
encuentr ademas belic nicaragu panam colombi brasil ecuador fenolog usos 3283
nombr cientif echinodorus bolivianus nombr comun descripcion hierb anual rizomat
plant fertil emergent mayor frecuenci crec var riber humed cerc 30 cm altur hoj
sumerg emergent peciol 1 725 cm larg lamin 13 722 cm larg lin linearlanceol atenu
bas marc peluc inflorescent 1 o 23 verticil simpl cad 4 11 flor pedicel 08 355
cm larg flor sepal 28 43 mm larg 89 estambr pistil cerc 20 cabez frutal 153 254
mm simil anill encerr total sepal aqueni 1 17 mm larg usual 2 o 3 costill bien
desarroll car vec ausent cicl anual distribu regional unid nort argentin trinid
antill fenolog flor ener may usos
- bract floral 04 07 cm cort casi igual entrenud flor sesil sepal 5 8 mm mucron
petal blanc bay 1 2 cm negrasmuy simil especi gener ronnbergi cual pued ser dificil
distingu veget autor inclus suger posibil unir nuev ambos gener cicl anual distribu
regional cost ric panam fenolog fructif observ agost ener usos 680 nombr cientif
cormur brevirostris nombr comun murcielag descripcion longitud cabez cuerp 4658mm
longitud col 1016mm longitud pie 58mm longitud orej 1316mm longitud antebraz 4550mm
pes 711gpart dorsal ric color caf castañ negruzc juvenil subadult part ventral
liger pal pelaj espes brillant piel car orej negruzc trag ancho nariz cort pel
casi punt membran negr alas unid pat bas ded sac aere grand abertur extiend bord
ala cicl anual distribu regional nicaragu peru brasil tierr baj 1000msnm fenolog
usos 1078 nombr cientif kogi sim nombr comun cachalot enan dwarf sperm whal descripcion
signific menor kogi breviceps pues promedi 28 m longitud 260 kg pes dors gris
oscur vientr blanc cost color blanc grisace alet pectoral gris oscur alet dorsal
proporcional cuerp tamañ sol liger posterior mit cuerp igual k breviceps present
hocic fuertement trunc ojo alet pectoral plieg piel semej agall abertur branquial
fals natural ningun relacion pec cicl anual especi ocasional aunqu divers epoc
año anterior situacion pued trat especi resident rar escas distribu regional agu
tropical templ planet aunqu falt mediterrane mar negr mar roj golf persic fenolog
usos japon isla san vicent antill menor caz carn 1637 nombr cientif myiodynast
hemichrysus nombr comun pech amarill mosquer ventridor descripcion mid 20 cm pes
41 grs difier mosquer tip pitangus sulphuratus list mal oscur adult muestr coronill
gris oscur fin list negr manch amarill brillant ocult rest region oliv verdos
oscur alas col fusc bord tercial amarill pal remer coberter alar angost color
canel present list negruzc grues are loreal auricular bord cej list blanc mejill
list mal fusc grues barbill blanc rest region inferior amarill brillant pic pat
- maxim 24 dient n richardi abdom larg 607 % longitud estand vs 493568 % color clar
miembr atenu generotien pat traser angost 41 % longitud estand vs 445o % especi
cost ric ded pat traser cort 3er ded 0917 % pat delanter traser sindactil 4 ded
pat delanter 5 ded pat traser ded pat traser extern sol perfil extern surc punt
digit libr punt redondeadastien fos nasal larg ancho cabez 40 vec diametr fos
nasal compar tamañ n richardi grand miembr gener cost ric cicl anual distribu
regional fenolog usos 1894 nombr cientif pselliophorus tibialis nombr comun salton
musl amarill descripcion 185 cm 31 g oscur delg col larg musl amarill esponj pic
bien larg delg aspect atlapet adult pile part atras nuc negr rest part arrib negr
pizarr gargant negruzc pas pizarr negruzc rest region inferior pech abdom teñ
verd oliv iris castañ pic negr pat fusc individu present pequeñ manch amarill
bord hombr juvenil parec opac encim color negr tizn debaj present fuert tint cafecin
musl caf oliv pal cicl anual distribu regional encuentr cost ric oest panam fenolog
usos 44 nombr cientif werauhi kathya nombr comun piñuel parasit epifit descripcion
epifit terrestr caulescent hoj 15 45 cm larg atenu cartac papel quebradiz vain
24 39 cm caf oscur lepidot lamin 10 19 cm glabr lepidot lin longitudinal oscur
escap 22 37 cm larg erect curvadoerect bract verdecrem larg entrenudosinflorescent
erect 2 5 cm larg 1pinn bract primari larg ram lateral estos sesil casi sesil
dos tres flor colateral bract floral 13 18 cm larg verdecrem ovad oblong carin
glabr lepidot membranac cartaceasflor sesil sepal 06 10 cm larg coriace petal
crem verdecrem 17 20 cm largocapsul 17 25 cm larg com semill canel cicl anual
distribu regional
- source_sentence: ¿qu aspect morfolog plumaj charran embrid permit diferenci especi
similar stern fuscat especial epoc cri ?
- nombr comun sinsont tropical descripcion dors cuerp color gris opac brillant part
cabez part ventral blancuzc alas caf negruzc barr angost blanc col delg caf negruzc
punt blanc list ocul negr cej blanc pat pic negr rand traylor 1961 sanchez 2003
cicl anual distribu regional sur mexic colombi andes sur brasil peterson chalf
1973 fenolog usos 2509 nombr cientif zanthoxylum melanostictum nombr comun lagart
color lagartill descripcion arbol arbust 2 15 m fust poc aguijon ram joven rojiz
glabr aguijon escas lenticeladashoj imparipinn 3 7 par foliol opuest elipt ovad
2 102142 08 5268 cm glabr lustros coriace apic cort acumin redond ocasion levement
emargin bas obtus bord general enter peciol peciolul rojizosinflorescent panicul
terminal 13 cmflor blanc 5 petal frut folicul verruc rojiz obovoid 4 8 mm diametr
semill negr 3 6 mmse disting color mor rojiz peciol raquis peciolul fust general
carec aguijon escas principal bas cicl anual distribu regional mexic centr amer
fenolog floracion observ ener abril agost usos 3117 nombr cientif campnosperm
panamens nombr comun descripcion arbol 12 30 m altur rmit ferrugineopuberulent
hoj simpl altern cortopeciol oblongoobov 1435 5515 cm apic obtus redond cartac
pubescent dens tricom estrell pequeñ escam pelt pard rojiz enves nervadur secundari
evidenteinflorescent panicul general axil 40 cm larg flor amarillent pequeñ frut
drup triangularovoid 115 0712 cmdiagnost caracteriz hoj agrup final ramit cuy
aparient recuerd arbol espavel zapot carenci savi lechos habitat suel aneg permit
distingu ademas present ramif simpodial tipic hoj viej torn rojoanaranj ramit
hoj enves pubescent dor diminut pel escam particul cicl anual distribu regional
hondur panam fenolog flor observ agost octubr frut setiembr octubr usos 2396 nombr
cientif micrurus mipartitus
- larg lamin 22 45 65 05 1 2 25 cm linearelipt lin atenu ambos extrem coriace lustros
marg comun revolut raquis pajiz pard ven lateral evident sor redond 1 3 4 seri
cost marg cicl anual distribu regional cost ric panam colombi venezuel ecuador
peru bolivi fenolog usos 144 nombr cientif croton ortholobus nombr comun targu
descripcion arbust 3 m altur hoj elipt ovad lanceol 3 10 cm larg 15 7 cm ancho
peciol 2 glandul apic marg levement aserr inflorescent bisexual racem espig 4
7 cm larg frut 4 6 mm longituds reconoc hoj levement aserr peciol glandular estipul
linear inflorescent flor solitari sosten bract linear cicl anual distribu regional
hondur nicaragu fenolog usos 3017 nombr cientif gymnospori haberian nombr comun
descripcion arbol 5 30 m altur ramit verd pal verd amarillent estipul diminut
rojiz hoj simpl altern 812 46 cm elipt apic acumin agud glabr bord enteroinflorescent
cim axilar 20 flor flor verd 45 7 mm ancho frut tip capsul 1 115 cm amarillent
glob 2 4 lobul semill pard aril blancos caracteriz hoj sec adquier ton verd amarillent
bas general redond bord levement revolut rasg taxonom recuerd gener maytenus dificil
separ rasp cortez tronc ramit raic epidermis amarillent amarill encend mayor especi
famili g haberian caracterist vec not direct bas tronc hab rasp cortez cicl anual
distribu regional mexic estacion biolog tuxtl veracruz fenolog flor observ febrer
juli frut ener marz diciembr usos 321 nombr cientif vriese marnierlapostollei
nombr comun piñuel epifit parasit descripcion epifitashoj 8 15 21 cm acumin agud
apicul membranac subcartac vain 2 4 cm canelacrem esparcid lepidot lamin 13 26
cm esparcid lepidot lin longitudinal mor escap 16 22 26 cm erect curvadoerect
- pes 12 grs empidonax pequeñ caf alas cort redond anill ocul opac adult oliv cafecin
encim anill ocul ante angost bien defin barr alar opac caf pal gargant blanc pech
present tint parduzc abdom ante amarillent forr alas general coberter infracaudal
encend maxil negr mandibul color anaranjadocarn forr boc anaranj pat negruzc especimen
juvenil caf tizn opac encim barr alar contrast color ante canel cicl anual especi
migratori neartic ver distribu cost ric distribu regional reproduc local nort
mexic oest panam inviern part central mexic part central panam fenolog usos 1746
nombr cientif vire philadelphicus nombr comun vire amarillent descripcion mid
115 cm pes 115 grs vire pequeñ marc alar color parec vermivor peregrin asoci frecuenci
cabez relat grand redond pic grues list facial anchas coberter infracaudal amarill
adult pile gris tint oliv rest region superior verd oliv grisace cej are baj ojo
color blanc separ mediant list ocul fusc mejill teñ oliv region inferior var principal
amarill bastant brillant gargant abdom pal principal blancuzc amarill bien defin
sol pech coberter infracaudal maxil color cuern fusc mandibul color cuern pal
pat gris individu inmadur parec adult ocasion present coberter alar mayor cort
opac punt pal reten plumaj juvenil cicl anual especi migratori neartic ver distribu
cost ric distribu regional reproduc canad extrem nort eua inviern peninsul yucatan
guatemal part central panam rar ocasion nort guatemal fenolog usos 1446 nombr
cientif onychoprion anaethetus nombr comun charran embrid descripcion mid 36 cm
pes 100 grs tamañ median espald oscur col profund ahorquill disting stern fuscat
coll nucal clar manch blanc delg frent extiend form list supercili cort epoc cri
adult present coronill list loreal negr coll nucal gris clar rest region superior
gris parduzc oscur tod region inferior rectric extern blanc tint gris pech cost
pic pat negr epoc cri ve rar ocasion cost ric coronill eminent blanc list negr
part posterior
- name: SentenceTransformer based on hiiamsid/sentence_similarity_spanish_es
- task:
type: information-retrieval
name: Information Retrieval
name: Unknown
type: unknown
- type: cosine_accuracy@1
value: 0.7784256559766763
name: Cosine Accuracy@1
- type: cosine_accuracy@3
value: 0.89067055393586
name: Cosine Accuracy@3
- type: cosine_accuracy@5
value: 0.922740524781341
name: Cosine Accuracy@5
- type: cosine_accuracy@10
value: 0.9533527696793003
name: Cosine Accuracy@10
- type: cosine_precision@1
value: 0.7784256559766763
name: Cosine Precision@1
- type: cosine_precision@3
value: 0.2968901846452867
name: Cosine Precision@3
- type: cosine_precision@5
value: 0.18454810495626817
name: Cosine Precision@5
- type: cosine_precision@10
value: 0.09533527696793001
name: Cosine Precision@10
- type: cosine_recall@1
value: 0.7784256559766763
name: Cosine Recall@1
- type: cosine_recall@3
value: 0.89067055393586
name: Cosine Recall@3
- type: cosine_recall@5
value: 0.922740524781341
name: Cosine Recall@5
- type: cosine_recall@10
value: 0.9533527696793003
name: Cosine Recall@10
- type: cosine_ndcg@10
value: 0.8696617098665955
name: Cosine Ndcg@10
- type: cosine_mrr@10
value: 0.8424909759822294
name: Cosine Mrr@10
- type: cosine_map@100
value: 0.8440024185539007
name: Cosine Map@100
- type: dot_accuracy@1
value: 0.7201166180758017
name: Dot Accuracy@1
- type: dot_accuracy@3
value: 0.8790087463556852
name: Dot Accuracy@3
- type: dot_accuracy@5
value: 0.9154518950437318
name: Dot Accuracy@5
- type: dot_accuracy@10
value: 0.9446064139941691
name: Dot Accuracy@10
- type: dot_precision@1
value: 0.7201166180758017
name: Dot Precision@1
- type: dot_precision@3
value: 0.29300291545189505
name: Dot Precision@3
- type: dot_precision@5
value: 0.18309037900874633
name: Dot Precision@5
- type: dot_precision@10
value: 0.09446064139941689
name: Dot Precision@10
- type: dot_recall@1
value: 0.7201166180758017
name: Dot Recall@1
- type: dot_recall@3
value: 0.8790087463556852
name: Dot Recall@3
- type: dot_recall@5
value: 0.9154518950437318
name: Dot Recall@5
- type: dot_recall@10
value: 0.9446064139941691
name: Dot Recall@10
- type: dot_ndcg@10
value: 0.8406159912422888
name: Dot Ndcg@10
- type: dot_mrr@10
value: 0.80640589569161
name: Dot Mrr@10
- type: dot_map@100
value: 0.8085654600526095
name: Dot Map@100
# SentenceTransformer based on hiiamsid/sentence_similarity_spanish_es
This is a [sentence-transformers]( model finetuned from [hiiamsid/sentence_similarity_spanish_es]( It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
## Model Details
### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [hiiamsid/sentence_similarity_spanish_es]( <!-- at revision 66ab46adac3910bb6ea6085b962a25e49513b981 -->
- **Maximum Sequence Length:** 512 tokens
- **Output Dimensionality:** 768 tokens
- **Similarity Function:** Cosine Similarity
<!-- - **Training Dataset:** Unknown -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->
### Model Sources
- **Documentation:** [Sentence Transformers Documentation](
- **Repository:** [Sentence Transformers on GitHub](
- **Hugging Face:** [Sentence Transformers on Hugging Face](
### Full Model Architecture
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
## Usage
### Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("igmochang/CR-biodiversity-preprocessed-sentence-similarity-es")
# Run inference
sentences = [
'¿qu aspect morfolog plumaj charran embrid permit diferenci especi similar stern fuscat especial epoc cri ?',
'pes 12 grs empidonax pequeñ caf alas cort redond anill ocul opac adult oliv cafecin encim anill ocul ante angost bien defin barr alar opac caf pal gargant blanc pech present tint parduzc abdom ante amarillent forr alas general coberter infracaudal encend maxil negr mandibul color anaranjadocarn forr boc anaranj pat negruzc especimen juvenil caf tizn opac encim barr alar contrast color ante canel cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc local nort mexic oest panam inviern part central mexic part central panam fenolog usos 1746 nombr cientif vire philadelphicus nombr comun vire amarillent descripcion mid 115 cm pes 115 grs vire pequeñ marc alar color parec vermivor peregrin asoci frecuenci cabez relat grand redond pic grues list facial anchas coberter infracaudal amarill adult pile gris tint oliv rest region superior verd oliv grisace cej are baj ojo color blanc separ mediant list ocul fusc mejill teñ oliv region inferior var principal amarill bastant brillant gargant abdom pal principal blancuzc amarill bien defin sol pech coberter infracaudal maxil color cuern fusc mandibul color cuern pal pat gris individu inmadur parec adult ocasion present coberter alar mayor cort opac punt pal reten plumaj juvenil cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc canad extrem nort eua inviern peninsul yucatan guatemal part central panam rar ocasion nort guatemal fenolog usos 1446 nombr cientif onychoprion anaethetus nombr comun charran embrid descripcion mid 36 cm pes 100 grs tamañ median espald oscur col profund ahorquill disting stern fuscat coll nucal clar manch blanc delg frent extiend form list supercili cort epoc cri adult present coronill list loreal negr coll nucal gris clar rest region superior gris parduzc oscur tod region inferior rectric extern blanc tint gris pech cost pic pat negr epoc cri ve rar ocasion cost ric coronill eminent blanc list negr part posterior',
'nombr comun sinsont tropical descripcion dors cuerp color gris opac brillant part cabez part ventral blancuzc alas caf negruzc barr angost blanc col delg caf negruzc punt blanc list ocul negr cej blanc pat pic negr rand traylor 1961 sanchez 2003 cicl anual distribu regional sur mexic colombi andes sur brasil peterson chalf 1973 fenolog usos 2509 nombr cientif zanthoxylum melanostictum nombr comun lagart color lagartill descripcion arbol arbust 2 15 m fust poc aguijon ram joven rojiz glabr aguijon escas lenticeladashoj imparipinn 3 7 par foliol opuest elipt ovad 2 102142 08 5268 cm glabr lustros coriace apic cort acumin redond ocasion levement emargin bas obtus bord general enter peciol peciolul rojizosinflorescent panicul terminal 13 cmflor blanc 5 petal frut folicul verruc rojiz obovoid 4 8 mm diametr semill negr 3 6 mmse disting color mor rojiz peciol raquis peciolul fust general carec aguijon escas principal bas cicl anual distribu regional mexic centr amer fenolog floracion observ ener abril agost usos 3117 nombr cientif campnosperm panamens nombr comun descripcion arbol 12 30 m altur rmit ferrugineopuberulent hoj simpl altern cortopeciol oblongoobov 1435 5515 cm apic obtus redond cartac pubescent dens tricom estrell pequeñ escam pelt pard rojiz enves nervadur secundari evidenteinflorescent panicul general axil 40 cm larg flor amarillent pequeñ frut drup triangularovoid 115 0712 cmdiagnost caracteriz hoj agrup final ramit cuy aparient recuerd arbol espavel zapot carenci savi lechos habitat suel aneg permit distingu ademas present ramif simpodial tipic hoj viej torn rojoanaranj ramit hoj enves pubescent dor diminut pel escam particul cicl anual distribu regional hondur panam fenolog flor observ agost octubr frut setiembr octubr usos 2396 nombr cientif micrurus mipartitus',
embeddings = model.encode(sentences)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
# [3, 3]
Preprocess function:
import re
import nltk
from nltk.corpus import stopwords
from nltk.stem import SnowballStemmer
from nltk.tokenize import word_tokenize
# Initialize Spanish stemmer and stopwords'punkt')'stopwords')
spanish_stopwords = set(stopwords.words('spanish'))
stemmer = SnowballStemmer('spanish')
# Function for preprocessing text (lowercase, remove punctuation, stopwords, and apply stemming)
def preprocess_text(text):
# Convert to lowercase
text = text.lower()
# Remove punctuation and special characters
text = re.sub(r'[^\w\s¿?%]', '', text)
# Tokenize
words = word_tokenize(text)
# Remove stopwords and apply stemming
words = [stemmer.stem(word) for word in words if word not in spanish_stopwords]
# Rejoin the words
return ' '.join(words)
### Direct Usage (Transformers)
<details><summary>Click to see the direct usage in Transformers</summary>
### Downstream Usage (Sentence Transformers)
You can finetune this model on your own dataset.
<details><summary>Click to expand</summary>
### Out-of-Scope Use
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
## Evaluation
### Metrics
#### Information Retrieval
* Evaluated with [<code>InformationRetrievalEvaluator</code>](
| Metric | Value |
| cosine_accuracy@1 | 0.7784 |
| cosine_accuracy@3 | 0.8907 |
| cosine_accuracy@5 | 0.9227 |
| cosine_accuracy@10 | 0.9534 |
| cosine_precision@1 | 0.7784 |
| cosine_precision@3 | 0.2969 |
| cosine_precision@5 | 0.1845 |
| cosine_precision@10 | 0.0953 |
| cosine_recall@1 | 0.7784 |
| cosine_recall@3 | 0.8907 |
| cosine_recall@5 | 0.9227 |
| cosine_recall@10 | 0.9534 |
| cosine_ndcg@10 | 0.8697 |
| cosine_mrr@10 | 0.8425 |
| **cosine_map@100** | **0.844** |
| dot_accuracy@1 | 0.7201 |
| dot_accuracy@3 | 0.879 |
| dot_accuracy@5 | 0.9155 |
| dot_accuracy@10 | 0.9446 |
| dot_precision@1 | 0.7201 |
| dot_precision@3 | 0.293 |
| dot_precision@5 | 0.1831 |
| dot_precision@10 | 0.0945 |
| dot_recall@1 | 0.7201 |
| dot_recall@3 | 0.879 |
| dot_recall@5 | 0.9155 |
| dot_recall@10 | 0.9446 |
| dot_ndcg@10 | 0.8406 |
| dot_mrr@10 | 0.8064 |
| dot_map@100 | 0.8086 |
## Bias, Risks and Limitations
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
### Recommendations
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
## Training Details
### Training Dataset
#### Unnamed Dataset
* Size: 2,748 training samples
* Columns: <code>sentence_0</code> and <code>sentence_1</code>
* Approximate statistics based on the first 1000 samples:
| | sentence_0 | sentence_1 |
| type | string | string |
| details | <ul><li>min: 14 tokens</li><li>mean: 24.86 tokens</li><li>max: 43 tokens</li></ul> | <ul><li>min: 323 tokens</li><li>mean: 508.41 tokens</li><li>max: 512 tokens</li></ul> |
* Samples:
| sentence_0 | sentence_1 |
| <code>¿cual caracterist fisic distint esmerejon inclu diferent mach hembr ?</code> | <code>1407 nombr cientif falc columbarius nombr comun esmerejon descripcion mach mid 265 cm pes 160 grs hembr 33 cm 215 grs pequeñ constitu fuert alas puntiagud adult encim gris pizarr mach caf oscur hembr debaj ante list caf oscur profus cabez fin list cuent cej clar traz barr ocul oscur col negruzc 2 o 3 band clar gris mach hembr especimen inmadur parec hembr iris caf oscur cer pat amarill exhib ruf klisklis falc sparverius difier tamañ form accipit joven cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc nort alask canad extrem nort eua inviern sur part central alask sur canad nort amer sur antill especi ampli distribu viej mund fenolog usos 411 nombr cientif tillandsi subulifer nombr comun piñuel parasit descripcion epifitashoj 5 20 cm roset bulbos vain canel lamin 04 08 cm linearsubul involut escap 65 125 cm erect bract larg entrenudosinflorescent erect 5 105 cm simpl terminal 5 9 flor bract floral 18 3 cm verd cort sepal imbric ecarin conspicu nerv sepal 21 26 cm petal rojiz proximal amarill distal bord rojiz capsul 5 73 cmse reconoc facil roset tubul hoj espiral bract floral pequeñ sepal lamin foliar menor 1 cm ancho cicl anual distribu regional nicaragu venezuel trinid fenolog floracion abril juni frut octubr usos 802 nombr cientif liomys salvini nombr comun raton mont descripcion longitud cabez cuerp 103140mm longitud col 97143mm longitud pie 2630mm longitud orej 1216mm pes 3065gtamañ pequeñ median color caf parduzc pal part dorsal siempr gris sombr caf parduzc pel riz color caf amarillent crem tenuement interpuest espin oscur line anaranj cost part ventral pat color crem blanc col bicolor casi igual tamañ longitud cabez cuerp lc liger pelud ningun mechon pel 24mm punt plant pat traser vellud talon cojincill basal cicl anual</code> |
| <code>describ morfolog tillandsi subulifer inclu detall hoj inflorescent bract</code> | <code>1407 nombr cientif falc columbarius nombr comun esmerejon descripcion mach mid 265 cm pes 160 grs hembr 33 cm 215 grs pequeñ constitu fuert alas puntiagud adult encim gris pizarr mach caf oscur hembr debaj ante list caf oscur profus cabez fin list cuent cej clar traz barr ocul oscur col negruzc 2 o 3 band clar gris mach hembr especimen inmadur parec hembr iris caf oscur cer pat amarill exhib ruf klisklis falc sparverius difier tamañ form accipit joven cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc nort alask canad extrem nort eua inviern sur part central alask sur canad nort amer sur antill especi ampli distribu viej mund fenolog usos 411 nombr cientif tillandsi subulifer nombr comun piñuel parasit descripcion epifitashoj 5 20 cm roset bulbos vain canel lamin 04 08 cm linearsubul involut escap 65 125 cm erect bract larg entrenudosinflorescent erect 5 105 cm simpl terminal 5 9 flor bract floral 18 3 cm verd cort sepal imbric ecarin conspicu nerv sepal 21 26 cm petal rojiz proximal amarill distal bord rojiz capsul 5 73 cmse reconoc facil roset tubul hoj espiral bract floral pequeñ sepal lamin foliar menor 1 cm ancho cicl anual distribu regional nicaragu venezuel trinid fenolog floracion abril juni frut octubr usos 802 nombr cientif liomys salvini nombr comun raton mont descripcion longitud cabez cuerp 103140mm longitud col 97143mm longitud pie 2630mm longitud orej 1216mm pes 3065gtamañ pequeñ median color caf parduzc pal part dorsal siempr gris sombr caf parduzc pel riz color caf amarillent crem tenuement interpuest espin oscur line anaranj cost part ventral pat color crem blanc col bicolor casi igual tamañ longitud cabez cuerp lc liger pelud ningun mechon pel 24mm punt plant pat traser vellud talon cojincill basal cicl anual</code> |
| <code>¿cual caracterist distint ramif hoj alzate verticillat permit identif ?</code> | <code>color caf parduzc pal part dorsal siempr gris sombr caf parduzc pel riz color caf amarillent crem tenuement interpuest espin oscur line anaranj cost part ventral pat color crem blanc col bicolor casi igual tamañ longitud cabez cuerp lc liger pelud ningun mechon pel 24mm punt plant pat traser vellud talon cojincill basal cicl anual distribu regional mexic part central cost ric vertient pacif principal localiz tierr baj 1500msnm fenolog usos 3032 nombr cientif alzate verticillat nombr comun descripcion arbol arbust 4 15 m altur ramit cuadrangular pard rojiz exfoli hoj simpl opuest decus obovadoelipt 915 610 cm apic redond retus sesil subsesil coriac glabrasinflorescent panicul terminal 25 cm larg flor petal lil ros frut tip capsul aplan verd pal 5 8 mm largodiagnost reconoc ramif verticil fust pard exfoli escam hoj coriac semej clusi clusiacea secrecion lechos glabr sesil nervadur secundari evident ramit joven cuadrangular hoj torn anaranj rojiz viej cicl anual distribu regional cost ric suramer fenolog flor observ octubr diciembr frut febrer marz usos siti fald cordiller volcan central utiliz ornamental deb foment pues atract follaj arquitectur 1546 nombr cientif eubucc bourcierii nombr comun barbud cabecirroj descripcion mid 15 cm pes 35 grs robust cabezon dos sex present color llamat pic grues conspicu color amarill mach adult are loreal frent barbill negr rest cabez gargant pech roj profund desvanec form abrupt anaranj pech amarill list verd opac profus region posterior region superior alas col color verd opac separ roj cabez lad cuell mediant barr vertical blanc azul iris roj ladrill pic amarill verdos pat verd oliv hembr muestr gargant verd pal part anterior coronill lad cuell anaranj profund continu faj traves part superior pech rest coronill verd ocrace oscur tint anaranj mejill list cort ojo azul clar part baj pech verd oliv clar</code> |
* Loss: [<code>MultipleNegativesRankingLoss</code>]( with these parameters:
"scale": 20.0,
"similarity_fct": "cos_sim"
### Training Hyperparameters
#### Non-Default Hyperparameters
- `eval_strategy`: steps
- `per_device_train_batch_size`: 10
- `per_device_eval_batch_size`: 10
- `num_train_epochs`: 2
- `multi_dataset_batch_sampler`: round_robin
#### All Hyperparameters
<details><summary>Click to expand</summary>
- `overwrite_output_dir`: False
- `do_predict`: False
- `eval_strategy`: steps
- `prediction_loss_only`: True
- `per_device_train_batch_size`: 10
- `per_device_eval_batch_size`: 10
- `per_gpu_train_batch_size`: None
- `per_gpu_eval_batch_size`: None
- `gradient_accumulation_steps`: 1
- `eval_accumulation_steps`: None
- `torch_empty_cache_steps`: None
- `learning_rate`: 5e-05
- `weight_decay`: 0.0
- `adam_beta1`: 0.9
- `adam_beta2`: 0.999
- `adam_epsilon`: 1e-08
- `max_grad_norm`: 1
- `num_train_epochs`: 2
- `max_steps`: -1
- `lr_scheduler_type`: linear
- `lr_scheduler_kwargs`: {}
- `warmup_ratio`: 0.0
- `warmup_steps`: 0
- `log_level`: passive
- `log_level_replica`: warning
- `log_on_each_node`: True
- `logging_nan_inf_filter`: True
- `save_safetensors`: True
- `save_on_each_node`: False
- `save_only_model`: False
- `restore_callback_states_from_checkpoint`: False
- `no_cuda`: False
- `use_cpu`: False
- `use_mps_device`: False
- `seed`: 42
- `data_seed`: None
- `jit_mode_eval`: False
- `use_ipex`: False
- `bf16`: False
- `fp16`: False
- `fp16_opt_level`: O1
- `half_precision_backend`: auto
- `bf16_full_eval`: False
- `fp16_full_eval`: False
- `tf32`: None
- `local_rank`: 0
- `ddp_backend`: None
- `tpu_num_cores`: None
- `tpu_metrics_debug`: False
- `debug`: []
- `dataloader_drop_last`: False
- `dataloader_num_workers`: 0
- `dataloader_prefetch_factor`: None
- `past_index`: -1
- `disable_tqdm`: False
- `remove_unused_columns`: True
- `label_names`: None
- `load_best_model_at_end`: False
- `ignore_data_skip`: False
- `fsdp`: []
- `fsdp_min_num_params`: 0
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
- `fsdp_transformer_layer_cls_to_wrap`: None
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
- `deepspeed`: None
- `label_smoothing_factor`: 0.0
- `optim`: adamw_torch
- `optim_args`: None
- `adafactor`: False
- `group_by_length`: False
- `length_column_name`: length
- `ddp_find_unused_parameters`: None
- `ddp_bucket_cap_mb`: None
- `ddp_broadcast_buffers`: False
- `dataloader_pin_memory`: True
- `dataloader_persistent_workers`: False
- `skip_memory_metrics`: True
- `use_legacy_prediction_loop`: False
- `push_to_hub`: False
- `resume_from_checkpoint`: None
- `hub_model_id`: None
- `hub_strategy`: every_save
- `hub_private_repo`: False
- `hub_always_push`: False
- `gradient_checkpointing`: False
- `gradient_checkpointing_kwargs`: None
- `include_inputs_for_metrics`: False
- `eval_do_concat_batches`: True
- `fp16_backend`: auto
- `push_to_hub_model_id`: None
- `push_to_hub_organization`: None
- `mp_parameters`:
- `auto_find_batch_size`: False
- `full_determinism`: False
- `torchdynamo`: None
- `ray_scope`: last
- `ddp_timeout`: 1800
- `torch_compile`: False
- `torch_compile_backend`: None
- `torch_compile_mode`: None
- `dispatch_batches`: None
- `split_batches`: None
- `include_tokens_per_second`: False
- `include_num_input_tokens_seen`: False
- `neftune_noise_alpha`: None
- `optim_target_modules`: None
- `batch_eval_metrics`: False
- `eval_on_start`: False
- `eval_use_gather_object`: False
- `batch_sampler`: batch_sampler
- `multi_dataset_batch_sampler`: round_robin
### Training Logs
| Epoch | Step | Training Loss | cosine_map@100 |
| 0.1818 | 50 | - | 0.6806 |
| 0.3636 | 100 | - | 0.7391 |
| 0.5455 | 150 | - | 0.7742 |
| 0.7273 | 200 | - | 0.7927 |
| 0.9091 | 250 | - | 0.8211 |
| 1.0 | 275 | - | 0.8162 |
| 1.0909 | 300 | - | 0.8241 |
| 1.2727 | 350 | - | 0.8137 |
| 1.4545 | 400 | - | 0.8318 |
| 1.6364 | 450 | - | 0.8342 |
| 1.8182 | 500 | 0.4916 | 0.8432 |
| 2.0 | 550 | - | 0.8440 |
### Framework Versions
- Python: 3.10.12
- Sentence Transformers: 3.1.1
- Transformers: 4.44.2
- PyTorch: 2.4.1+cu121
- Accelerate: 0.34.2
- Datasets: 3.0.1
- Tokenizers: 0.19.1
--> |