--- base_model: hiiamsid/sentence_similarity_spanish_es library_name: sentence-transformers metrics: - cosine_accuracy@1 - cosine_accuracy@3 - cosine_accuracy@5 - cosine_accuracy@10 - cosine_precision@1 - cosine_precision@3 - cosine_precision@5 - cosine_precision@10 - cosine_recall@1 - cosine_recall@3 - cosine_recall@5 - cosine_recall@10 - cosine_ndcg@10 - cosine_mrr@10 - cosine_map@100 - dot_accuracy@1 - dot_accuracy@3 - dot_accuracy@5 - dot_accuracy@10 - dot_precision@1 - dot_precision@3 - dot_precision@5 - dot_precision@10 - dot_recall@1 - dot_recall@3 - dot_recall@5 - dot_recall@10 - dot_ndcg@10 - dot_mrr@10 - dot_map@100 pipeline_tag: sentence-similarity tags: - sentence-transformers - sentence-similarity - feature-extraction - generated_from_trainer - dataset_size:2748 - loss:MultipleNegativesRankingLoss widget: - source_sentence: ¿cual caracterist morfolog distint solanum chrysotrichum inclu detall hoj inflorescent frut ? sentences: - frut subglob cerc 5 9 mm diametr blanc cicl anual distribu regional sur mexic suramer fenolog floracion registr marz septiembr frecuent juli usos 3462 nombr cientif solanum chrysotrichum nombr comun descripcion arbust 3 m alto escas armad tall toment tricom multiangul pedicul larg grues braz central vec alarg acule cort rect incurv 2 5 mm larg hoj solitari ampli ovad 40 cm larg apic agud bas trunc cord enter lobul salient afelp toment frecuent ferrugine haz hirsut tricom estrell sesil braz central larg enves suavement toment tricom multiangul pedicul grues nervi principal vec armad peciol 15 cm larg toment vec armad inflorescent simpl cim poc ram cad ram racem vari flor lateral peduncul ramific vec primari obsolet 15 cm larg cerdosohisp pedicel casi 5 mm larg tricom braz central larg inerm caliz casi 5 mm larg toment tricom multiangul lobul 13 longitud lobul angost triangular corol 30 50 mm diametr blanc lob 13 longitud lobul ovad pubescent medi anter 6 10 mmde larg frut tip bay globos 1 15 cm diametr glabr verd pedicel fructifer grues alarg erect semill aplan 22 26 mm diametr cicl anual distribu regional mexic panam fenolog fertil año usos 3243 nombr cientif forchhammeri pall nombr comun siemprev aceitun blanc descripcion arbol arbust 4 10 m altur ramit glabr hoj simpl altern obovadooblong 25104 082 cm apic redond emargin obtus cortomucron glabr lustrosasinflorescent rac axilar comprim 4 6 cm larg flor pard crem pequeñ bisexual frut tip bay 2 cm diametr esfer amarilloanaranj madur rellen pulp suav jugos sabor desagradablel mader amarill paj dens present anatom comun pose floem incluidodiagnost especi dificil ubic famili caracteriz hoj pequeñ obov glabr lustr arbol cop dens redond plantul brinzal hoj bastant linear contrast individu adult cicl anual distribu regional mexic fenolog flor observ ener marz noviembr diciembr - peciol aproxim 4 6 mm larg toment jov flor sesil espig subcapit peduncul 15 7 cm larg frut drup elipsoid 1 3 08 22 cm endocarp 5 surc cicl anual distribu regional cost ric bolivi antill fenolog flor sid observ moment frut recolect setiembr octubr usos 173 nombr cientif cyathe microdont nombr comun rab mic helech arborescent descripcion tronc 15 m alto 58 cm diametr hoj 1217 m larg peciol pard espin espin 38 mm escam peciol 1020 153 mm angost lanceol pard concolor lev marg clar caspill ausent lamin 2pinnadopinnatif apic gradual atenu raquis pard pard clar espin espin 25 mm glabr pinn pedicul pedicul 02212 cm pinn medi 3050 1520 cm cost pajiz pard clar lis espin basal espin 13 mm glabr puberulent pel 0102 mm pardoamarillent pinnul 710 1525 cm sesil costul glabr puberulent pel 0102 mm pardoamarillent escam escas ausent diminut aplan segment pinnul medi 1725 par 1525 mm ancho serr crenul obtus nervadur 913 par segment 1bifurc glabr pel tej lamin nervadur glabr sor medi parafis tan larg esporangi conspicu pardoamarillent blanc panam indusi ausent cicl anual distribu regional mexic mesoamer colombi venezuel ecuador peru bolivi brasil guyan fenolog usos raic utiliz cultiv orquid fabric artesan 2099 nombr cientif rhadinae serperast nombr comun hojarasquer rayadaingles strip littersnak descripcion miembr gener especi serpient pequeñ median dificil sobrepas 300 mm longitud total cuy col represent aproxim 40 cient longitud present 11 2 14 2 dient maxilar aument gradual tamañ haci part posterior boc ultim dos grand separ rest interespaci pequefi dient mandibular desigual hemipen simpl vari espin ganch proximal grand detras cual zon espin porcion distal organ calic form estructur capit sulcus spermaticus bifurc cabez apen disting cuell ojo bien pequeñ ia pupil redond cuerp cilindr col median larg - larg glabr inflorescent rac subumbel cort 10 15 flor opuest hoj principal cerc extrem ram glabrescent peduncul ramific 03 1 cm larg pedicel 10 20 mm larg caliz 2 3 mm larg profund lobul lobul deltoid apical tricom simpl basal glabr corol 9 12 mm diametr blanc frecuent tint purpure sec profund lobul lobul oblong glabr anter casi3 mm larg frut tip bay globos casi 13 cm diametr glabr verdeamarill pedicel fructifer acrescent aun delg patent deflex semill aplan 3 mm diametr cicl anual distribu regional mexic bolivi fenolog fertil año usos 729 nombr cientif dermanur aztec nombr comun murcielag descripcion longitud cabez cuerp 5975 mm longitud col 0 mm longitud pie 1114 mm longitud orej 1520 mm longitud antebraz 4149 mm pes 1533 ges tamañ median part dorsal color caf carbon negruzc part ventral liger pal punt pel tenuement escarch pelaj larg 910 mm bland lin facial estrech blancuzc clar escarch orej hoj nasal color caf oscur herradur hoj nasal total libr uropatagi pequeñ cerc 6 mm form v superfici dorsal pelud bord dens franj pat pies pelud cicl anual distribu regional distribu mexic oest panam localiz 600 3000 msnm fenolog usos 1226 nombr cientif pelecanus occidentalis nombr comun alcatraz buchon pelican pard descripcion mid 109 cm pes 3 kg inconfund unic pelican comun cost adult pos cuerp caf grisace oscur plum part superior present lustr plat cabez cuell blanc pic parduzc bols piel car grisac pat negr epoc reproduct cuell principal negr crest nucal castañ present tint amarill cabez piel alrededor ojo rojiz pic ostent tint rosace especimen inmadur cabez cuell part superior caf abdom blanc alcanz plumaj definit adult despues 3 años cicl anual especi resident aunqu individu pued ser migratori neartic distribu regional encuentr cost pacif washington nort peru cost islas atlant golf mexic carib carolin nort venezuel fenolog usos 2900 nombr cientif aulaxin quadrangul nombr comun liqu - source_sentence: ¿cual caracterist distint plumaj mosquer agu adult juvenil ? sentences: - nombr comun mosquer agu descripcion mid 155 cm pes 21 grs negruzc tamañ median rar ocasion encuentr lej agu adult muestr cabez cuell mayor part region inferior negr opac negr pizarr centr abdom blanc flanc coberter infracaudal gris tizn rest region superior pizarr negruzc present 2 barr alar gris secundari tercial bord grisace col negruzc vexil extern timoner extern bord blanc pic pat negruzc especimen juvenil present plumaj negr parduzc apag abdom barr alar caf canel opac caf ante plum espald rabadill flec caf pal cicl anual efectu migracion altitudinal distribu regional encuentr suroest eua noroest argentin fenolog usos 1029 nombr cientif cheilanth brachypus nombr comun descripcion helech terrestr epipetr rizom cort ascendent compact escam 8 15 01 03 mm linear pardoamarillent pardorojiz concolor liger bicolor enter marg dispers dentadofrond 10 35 cm larg peciol 1 5 cm larg 18 15 tamañ frond pard oscur cilindr dens escam pelos escam 1 5 05 1 mm lanceol linear pard pardorojiz tricom 1 2 mm blanquecin tortuos lamin 8 30 25 5 cm oblanceol 1 pinnadopinnatif haz dens pelos tricom casi 1 mm hialin lax patent enves dens escam pelos superfici visibl tricom escam anaranjadorojiz pinn 10 21 par 12 25 06 13 cm equilater delt lanceol raquis negr ocult dens cubiert tricom escam nervadur ocult visibl indusi reflex escari enter decurrentecheilanth brachypus caracteriz lamin 1 pinnadopinnatif oblanceol dens escam enves mesoamer especi c bonariensis unic especi cheilanth lamin 1 pinnadopinnatif cicl anual distribu regional mexic mesoamer fenolog usos 2778 nombr cientif caripi montagnei nombr comun descripcion cuerp fructifer 05 25 cm alto form cop alarg extrem superior aplan 05 15 cm diametr blanc beig rellen context sol color blanc pose olor sabor distint - orej casi desnud unid band pequeñ cruz superfici cabez car desnud hoj nasal pequeñ herradur complet fusion labi superior barbill acanal bord hiler diminut verrug col cort mid men mit longitud uropatagi antebraz desnud alas cort anchas unid pat cerc bas ded pat desnud calcane larg pat cicl anual distribu regional hondur bolivi norest argentin guyan brasil localiz tierr baj 600 msnm fenolog usos 420 nombr cientif aechme angustifoli nombr comun piñuel epifit parasit descripcion epifitahoj 19 685 cm lamin 12 35 4 cm agud acumin escap 225 58 63 cm erect bract superior larg entrenud inferior cort espinososerradasinflorescent 45 235 cm unipinn bipinn basal bract primari espinososerr distal espig 4 9 flor distic bract floral 04 06 cm larg igual longitud entrenud flor sesil sepal 5 9 mm mucron petal amarilloss reconoc tamañ flor inflorescent cicl anual distribu regional nicaragu ecuador peru bolivi fenolog floracion observ ener febrer noviembr frut observ marz octubr usos 682 nombr cientif centronycteris centralis nombr comun murcielag descripcion longitud cabez cuerp 4959 mm longitud col 2024 mm longitud pie 79 mm longitud orej 1719 mm longitud antebraz 4349 mm pes 56 gcuerp color amarill sombr caf parduzc part inferior cuart traser uropatagi color caf anaranj pelaj larg espes orej larg form hoz punt piel car ros membran negruzc uropatagi larg pelud bas calcane larg alas lig pat bas ded sac aere cicl anual distribu regional mexic peru guyan brasil tierr baj sol fenolog usos 1980 nombr cientif ctenosaur quinquecarinat nombr comun garrob ingles spiny tail iguan descripcion lagartij grand alcanz 350 mm hc hembr pequeñ adult col alcanz casi dobl larg rest cuerp cabez disting cuell miembr robust muscul escam region dorsal pequeñ apen imbric debil quill except aquell part dorsal miembr grand fuertement quill escam ventral lis - sorali comun granular submarginal isidi pustul ausent apoteci rar observ cicl anual distribu regional pantropical extend region templ adyacent fenolog usos 25 nombr cientif tabebui ochrace nombr comun cortez amarill cortez amarillapiuv tarum brasil descripcion arbol 25 m 50 cm med altur pech dap fust cortez surc profund separ ram joven pubescent hoj digit 5 foliol aserr enter membranace pubescent glaucoamarillent enves oblongoobov oblongoelipt abrupt acumin bas obtus trunc foliol terminal 522 18144 cm par intermedi 42198 14132 cm pubescent estrell ferrugineoamarillent ambas superfici peciol 618 cm larg lanos pubescent peciolul 0258 cm larg inflorescent panicul terminal pubescent flor dulc fraganci caliz campanul 5 lobul gran cantid pubescent lanos amarillent corol tubul amarill lin rojiz cuell tub usual parduzc 483 cm larg frut capsul lin cilindr delg extrem 1135 118 cm lanos pubescent semill 0408 1829 cm alad especi comun dentr gener reconoc pos hoj sol 5 foliol dens pubescent estrell principal enves asi peciol ram joven enves ademas glauc amarillent cicl anual distribu regional centroamer hondur guatemal nort suramer brasil ytrinid fenolog flor observ ener juni produc anual gran cantid plantul usos mader pard oscur parec tabebui guayac pes dur cort alta resistent mecan larg durabil aun baj condicion favor pudricion mader propi usos extern post durmient ferrocarril acab construccion civil bol bolich asim bell floracion sid plant ornamental pais distribu natural especi adapt siti sec util preservavion mejor are degrad altas pendient lorenzi 1949 2608 nombr cientif tabanus unistriatus nombr comun taban descripcion hind tibia without apical spurs basicost with strong seta as dens as thos on the adjoining cost vertex without tubercl scutellum and posterior margin of the mesoscutum without black velvety spot body not wholly black subcallus bar and shiny abdom black or dark brown with singl prominent pal middorsal strip covering tergit 16 frons over 6 tim as high as the basal width wing somewhat smoky along the forebord and apex cicl anual distribu regional guatemal to ecuador ? guyan ? peru fenolog usos - source_sentence: explic distribu geograf especi mencion context import control serpient venen viper sentences: - cuerp cilindr col median larg escam cefal comprend rostral dos internasal dos prefrontal frontal dos parietal loreal nasal preocul dos postocular present 22 6 23 temporal 8 o 9 supralabial 8 infralabial present dos par geneial 19 hiler escam dorsal diferent import congener c scytalin reduccion lis foset apical ventral redond ia plac anal present enter subcaudal divid color uniform band transversal cefal nucal juvenil color complet diferent cons color fond roj cuerp band nucal amarill clar cabez negr cicl anual distribu regional yucatan mexic nort argentin fenolog usos sistem inmunolog capaz soport vari cc venen bothrops hac potencial interes medic especi sirv control serpient venen viper 2687 nombr cientif euphori candezei nombr comun escarabaj frut descripcion cuerp 175 232 mm longitud 92 122 mm ancho color dorsal ventral cuerp inclu pigidi pat verd vidrios rar aparec individu tonal rojiz bastant llamat pronot elitr lis present puntuacion llamat part superior mientr part posterior elitr pigidi present rug ondul bastant caracterist present sed blanquecin especial evident are ventral bord anterior clipe present par dient dirig haci arrib dorsal cabez concav are correspondient frent clipe lev elev longitudinal part central anten mach present maz antenal volumin hembr pronot present carin lateral bien marc complet bord posterior present escotadur correspondient bord anterior escutel grand expuest tibi anterior present tres dient extern evident tibi anterior mach tiend ser estiliz hembr femur medi posterior present ventral carin longitudinal clar defin cerc bord posterior sal hiler sed tibi medi posterior present evident hiler sed junt relat larg bord intern dorsal cox medi bien separ tubercul mesosternal relat ancho form pentagonal vist ventral fig propleur quill pronunci cercan paralel sutur sep preproestern diferenci sex mach present anten maz volumin hembr figs abdom vist perfil tiend ser concav mientr hembr tiend ser rect convex ademas tibi anterior mach tiend ser estiliz hembr cicl anual distribu regional especi distribu ampli haci nort mientr sur sol sid hall panam - larg apic agud acumin bas obtus redond enter vec afelp haz dispers tricom porrect subsesil enves suavement toment tricom multiangul pedicul nervi principal vec armad peciol 3 cm larg toment mayor armad inflorescent rac amonton 4 12 flor lateral toment tricom estrell sesil cort pedicel inerm menud inconspicu armad peduncul 1 cm larg vec bifurc pedicel 10 mm larg caliz casi 3 mm larg lobul cerc mit longitud lobul angost sen redond toment tricom multiangul corol 15 mm diametr blanc azul profund lobul lobul angost pubescent asi distal anter 5 mm larg frut tip bay globos 08 s 1 cm diametr glabr anaranj lustros madur pedicel fructifer acrescent delg expand distal erect semill aplan casi 3 mm diametr cicl anual distribu regional mexic panam ecuador fenolog fertil may setiembr usos 3284 nombr cientif sagittari lancifoli nombr comun descripcion hierb perenn emergent provenient rizom monoic hoj distint distic erect peciol cerc 100 cm larg lamin 83550 0441521 cm lin ovad elipt atenu baseinflorescent bisexual emergent 6 13 verticil simpl ramific cad 3 flor flor 20 o estambr flor estamin estambr esteril flor pistil pistil esteril ausent flor estamin cabez frutal 811 1115 mm pedicel ascendent sepal reflex papil aqueni 16 25 mm larg car lateral 1 glandul pic erect 03 07 mm larg cicl anual distribu regional surest unid ecuador brasil antill fenolog floracion año usos 2498 nombr cientif hyperbaen leptobotry nombr comun descripcion arbust arbol 3 6 mhoj coriac lustr glabr elipticooblong ovadolanceol mid 7 205 35 87 cm 5 8 par nervi secundari venacion terciari irregular reticul marg enteroondul apic acumin bas estrech redond - zanthoxylum fag l sarg var culantrill crec fald cordiller guanac til elev 600 1300 m pose mayor aparient arbol poc aguijon fust aguijon ram raquis levement alad panicul 11 cm standley 1937 trat zanthoxylum insular cicl anual distribu regional mexic sur amer antill fenolog floracion observ febrer usos 697 nombr cientif glyphonycteris daviesi nombr comun murcielag descripcion longitud cabez cuerp 6384 mm longitud col 511 mm longitud pie 1720 mm longitud orej 2731 mm longitud antebraz 5458 mm pes 1930 ges especi mayor tamañ dentr gener sol par incis grand tan larg canin part dorsal color caf parduzc oscur part ventral liger pal pelaj larg lanud orej larg extrem punt labi barbill bastant pelud barbill acanal bord cojincill lis form v col cort mid cerc mit longitud uropatagi calcane pequeñ pat pat larg moder pelud cicl anual distribu regional hondur peru guyan brasil bolivi localiz sol tierr baj fenolog usos 1583 nombr cientif sclerurus albigularis nombr comun tirahoj gargantigr descripcion mid 17 cm pes 38 grs sclerurus grand muestr contr distint gris gargant pech ruf adult muestr pile caf oscur lev escam grues negruzc espald coberter alar caf castañ oscur torn caf oscur remer castañ rabadill coberter supracaudal col negruzc lad cabez oliv grisace oscur cost flanc region infracaudal color caf castañ oscur maxil negr mandibul color cuern punt negruzc pat negr cafecin ejemplar juvenil similar pech opac oscur gargant oscur escam fusc cicl anual distribu regional encuentr cost ric nort bolivi guyan trinid tobag fenolog usos 210 nombr cientif cyathe squarros - source_sentence: describ caracterist morfolog werauhi kathya inclu detall hoj inflorescent flor sentences: - color cuerp negr pard oscur aparient pul levisim brill verd casi impercept mayor especimen especimen lad pacif cost ric aparient levement opac lad atlant general cuerp lis dorsal carent set bord anterior cabez dos dient relat junt ver figur abaj are dorsal ojos bastant ampli relacion especi gener cost ric ver figur abaj fov lateral pronot circular alarg form surc escutel visibl cad elitr present 9 estri visibl inclu supraepipleural carec carin lateral elitr supraepipleural pigidi muestr carin basal bien marc denticul ventral bord anterolateral protorax ausent ver figur abaj carin proepimeral protorax present complet ver figur abaj tibi anterior muestr 3 dient bord extern bord intern rect ver figur abaj espolon apical tibi bif diferent hembr simpl ver figur abaj tars anterior present tod especi gener ver figur abaj tibi medi posterior delg curv escas expand haci extrem ver figur abaj prim tars pat posterior longitud normal larg segund form triangul ver figur abaj ventral femur posterior present carin longitudinal cerc bord anterior carin cerc bord posterior ver figur abaj diagnosis hembr semej mach except espolon apical tibi anterior simpl bif ver figur abaj ademas ultim segment abdominal ancho medial mach cicl anual colect mes año are distribu lad atlant pacif distribu regional encuentr ademas belic nicaragu panam colombi brasil ecuador fenolog usos 3283 nombr cientif echinodorus bolivianus nombr comun descripcion hierb anual rizomat plant fertil emergent mayor frecuenci crec var riber humed cerc 30 cm altur hoj sumerg emergent peciol 1 725 cm larg lamin 13 722 cm larg lin linearlanceol atenu bas marc peluc inflorescent 1 o 23 verticil simpl cad 4 11 flor pedicel 08 355 cm larg flor sepal 28 43 mm larg 89 estambr pistil cerc 20 cabez frutal 153 254 mm simil anill encerr total sepal aqueni 1 17 mm larg usual 2 o 3 costill bien desarroll car vec ausent cicl anual distribu regional unid nort argentin trinid antill fenolog flor ener may usos - bract floral 04 07 cm cort casi igual entrenud flor sesil sepal 5 8 mm mucron petal blanc bay 1 2 cm negrasmuy simil especi gener ronnbergi cual pued ser dificil distingu veget autor inclus suger posibil unir nuev ambos gener cicl anual distribu regional cost ric panam fenolog fructif observ agost ener usos 680 nombr cientif cormur brevirostris nombr comun murcielag descripcion longitud cabez cuerp 4658mm longitud col 1016mm longitud pie 58mm longitud orej 1316mm longitud antebraz 4550mm pes 711gpart dorsal ric color caf castañ negruzc juvenil subadult part ventral liger pal pelaj espes brillant piel car orej negruzc trag ancho nariz cort pel casi punt membran negr alas unid pat bas ded sac aere grand abertur extiend bord ala cicl anual distribu regional nicaragu peru brasil tierr baj 1000msnm fenolog usos 1078 nombr cientif kogi sim nombr comun cachalot enan dwarf sperm whal descripcion signific menor kogi breviceps pues promedi 28 m longitud 260 kg pes dors gris oscur vientr blanc cost color blanc grisace alet pectoral gris oscur alet dorsal proporcional cuerp tamañ sol liger posterior mit cuerp igual k breviceps present hocic fuertement trunc ojo alet pectoral plieg piel semej agall abertur branquial fals natural ningun relacion pec cicl anual especi ocasional aunqu divers epoc año anterior situacion pued trat especi resident rar escas distribu regional agu tropical templ planet aunqu falt mediterrane mar negr mar roj golf persic fenolog usos japon isla san vicent antill menor caz carn 1637 nombr cientif myiodynast hemichrysus nombr comun pech amarill mosquer ventridor descripcion mid 20 cm pes 41 grs difier mosquer tip pitangus sulphuratus list mal oscur adult muestr coronill gris oscur fin list negr manch amarill brillant ocult rest region oliv verdos oscur alas col fusc bord tercial amarill pal remer coberter alar angost color canel present list negruzc grues are loreal auricular bord cej list blanc mejill list mal fusc grues barbill blanc rest region inferior amarill brillant pic pat negr - maxim 24 dient n richardi abdom larg 607 % longitud estand vs 493568 % color clar miembr atenu generotien pat traser angost 41 % longitud estand vs 445o % especi cost ric ded pat traser cort 3er ded 0917 % pat delanter traser sindactil 4 ded pat delanter 5 ded pat traser ded pat traser extern sol perfil extern surc punt digit libr punt redondeadastien fos nasal larg ancho cabez 40 vec diametr fos nasal compar tamañ n richardi grand miembr gener cost ric cicl anual distribu regional fenolog usos 1894 nombr cientif pselliophorus tibialis nombr comun salton musl amarill descripcion 185 cm 31 g oscur delg col larg musl amarill esponj pic bien larg delg aspect atlapet adult pile part atras nuc negr rest part arrib negr pizarr gargant negruzc pas pizarr negruzc rest region inferior pech abdom teñ verd oliv iris castañ pic negr pat fusc individu present pequeñ manch amarill bord hombr juvenil parec opac encim color negr tizn debaj present fuert tint cafecin musl caf oliv pal cicl anual distribu regional encuentr cost ric oest panam fenolog usos 44 nombr cientif werauhi kathya nombr comun piñuel parasit epifit descripcion epifit terrestr caulescent hoj 15 45 cm larg atenu cartac papel quebradiz vain 24 39 cm caf oscur lepidot lamin 10 19 cm glabr lepidot lin longitudinal oscur escap 22 37 cm larg erect curvadoerect bract verdecrem larg entrenudosinflorescent erect 2 5 cm larg 1pinn bract primari larg ram lateral estos sesil casi sesil dos tres flor colateral bract floral 13 18 cm larg verdecrem ovad oblong carin glabr lepidot membranac cartaceasflor sesil sepal 06 10 cm larg coriace petal crem verdecrem 17 20 cm largocapsul 17 25 cm larg com semill canel cicl anual distribu regional - source_sentence: ¿qu aspect morfolog plumaj charran embrid permit diferenci especi similar stern fuscat especial epoc cri ? sentences: - nombr comun sinsont tropical descripcion dors cuerp color gris opac brillant part cabez part ventral blancuzc alas caf negruzc barr angost blanc col delg caf negruzc punt blanc list ocul negr cej blanc pat pic negr rand traylor 1961 sanchez 2003 cicl anual distribu regional sur mexic colombi andes sur brasil peterson chalf 1973 fenolog usos 2509 nombr cientif zanthoxylum melanostictum nombr comun lagart color lagartill descripcion arbol arbust 2 15 m fust poc aguijon ram joven rojiz glabr aguijon escas lenticeladashoj imparipinn 3 7 par foliol opuest elipt ovad 2 102142 08 5268 cm glabr lustros coriace apic cort acumin redond ocasion levement emargin bas obtus bord general enter peciol peciolul rojizosinflorescent panicul terminal 13 cmflor blanc 5 petal frut folicul verruc rojiz obovoid 4 8 mm diametr semill negr 3 6 mmse disting color mor rojiz peciol raquis peciolul fust general carec aguijon escas principal bas cicl anual distribu regional mexic centr amer fenolog floracion observ ener abril agost usos 3117 nombr cientif campnosperm panamens nombr comun descripcion arbol 12 30 m altur rmit ferrugineopuberulent hoj simpl altern cortopeciol oblongoobov 1435 5515 cm apic obtus redond cartac pubescent dens tricom estrell pequeñ escam pelt pard rojiz enves nervadur secundari evidenteinflorescent panicul general axil 40 cm larg flor amarillent pequeñ frut drup triangularovoid 115 0712 cmdiagnost caracteriz hoj agrup final ramit cuy aparient recuerd arbol espavel zapot carenci savi lechos habitat suel aneg permit distingu ademas present ramif simpodial tipic hoj viej torn rojoanaranj ramit hoj enves pubescent dor diminut pel escam particul cicl anual distribu regional hondur panam fenolog flor observ agost octubr frut setiembr octubr usos 2396 nombr cientif micrurus mipartitus - larg lamin 22 45 65 05 1 2 25 cm linearelipt lin atenu ambos extrem coriace lustros marg comun revolut raquis pajiz pard ven lateral evident sor redond 1 3 4 seri cost marg cicl anual distribu regional cost ric panam colombi venezuel ecuador peru bolivi fenolog usos 144 nombr cientif croton ortholobus nombr comun targu descripcion arbust 3 m altur hoj elipt ovad lanceol 3 10 cm larg 15 7 cm ancho peciol 2 glandul apic marg levement aserr inflorescent bisexual racem espig 4 7 cm larg frut 4 6 mm longituds reconoc hoj levement aserr peciol glandular estipul linear inflorescent flor solitari sosten bract linear cicl anual distribu regional hondur nicaragu fenolog usos 3017 nombr cientif gymnospori haberian nombr comun descripcion arbol 5 30 m altur ramit verd pal verd amarillent estipul diminut rojiz hoj simpl altern 812 46 cm elipt apic acumin agud glabr bord enteroinflorescent cim axilar 20 flor flor verd 45 7 mm ancho frut tip capsul 1 115 cm amarillent glob 2 4 lobul semill pard aril blancos caracteriz hoj sec adquier ton verd amarillent bas general redond bord levement revolut rasg taxonom recuerd gener maytenus dificil separ rasp cortez tronc ramit raic epidermis amarillent amarill encend mayor especi famili g haberian caracterist vec not direct bas tronc hab rasp cortez cicl anual distribu regional mexic estacion biolog tuxtl veracruz fenolog flor observ febrer juli frut ener marz diciembr usos 321 nombr cientif vriese marnierlapostollei nombr comun piñuel epifit parasit descripcion epifitashoj 8 15 21 cm acumin agud apicul membranac subcartac vain 2 4 cm canelacrem esparcid lepidot lamin 13 26 cm esparcid lepidot lin longitudinal mor escap 16 22 26 cm erect curvadoerect - pes 12 grs empidonax pequeñ caf alas cort redond anill ocul opac adult oliv cafecin encim anill ocul ante angost bien defin barr alar opac caf pal gargant blanc pech present tint parduzc abdom ante amarillent forr alas general coberter infracaudal encend maxil negr mandibul color anaranjadocarn forr boc anaranj pat negruzc especimen juvenil caf tizn opac encim barr alar contrast color ante canel cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc local nort mexic oest panam inviern part central mexic part central panam fenolog usos 1746 nombr cientif vire philadelphicus nombr comun vire amarillent descripcion mid 115 cm pes 115 grs vire pequeñ marc alar color parec vermivor peregrin asoci frecuenci cabez relat grand redond pic grues list facial anchas coberter infracaudal amarill adult pile gris tint oliv rest region superior verd oliv grisace cej are baj ojo color blanc separ mediant list ocul fusc mejill teñ oliv region inferior var principal amarill bastant brillant gargant abdom pal principal blancuzc amarill bien defin sol pech coberter infracaudal maxil color cuern fusc mandibul color cuern pal pat gris individu inmadur parec adult ocasion present coberter alar mayor cort opac punt pal reten plumaj juvenil cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc canad extrem nort eua inviern peninsul yucatan guatemal part central panam rar ocasion nort guatemal fenolog usos 1446 nombr cientif onychoprion anaethetus nombr comun charran embrid descripcion mid 36 cm pes 100 grs tamañ median espald oscur col profund ahorquill disting stern fuscat coll nucal clar manch blanc delg frent extiend form list supercili cort epoc cri adult present coronill list loreal negr coll nucal gris clar rest region superior gris parduzc oscur tod region inferior rectric extern blanc tint gris pech cost pic pat negr epoc cri ve rar ocasion cost ric coronill eminent blanc list negr part posterior model-index: - name: SentenceTransformer based on hiiamsid/sentence_similarity_spanish_es results: - task: type: information-retrieval name: Information Retrieval dataset: name: Unknown type: unknown metrics: - type: cosine_accuracy@1 value: 0.7784256559766763 name: Cosine Accuracy@1 - type: cosine_accuracy@3 value: 0.89067055393586 name: Cosine Accuracy@3 - type: cosine_accuracy@5 value: 0.922740524781341 name: Cosine Accuracy@5 - type: cosine_accuracy@10 value: 0.9533527696793003 name: Cosine Accuracy@10 - type: cosine_precision@1 value: 0.7784256559766763 name: Cosine Precision@1 - type: cosine_precision@3 value: 0.2968901846452867 name: Cosine Precision@3 - type: cosine_precision@5 value: 0.18454810495626817 name: Cosine Precision@5 - type: cosine_precision@10 value: 0.09533527696793001 name: Cosine Precision@10 - type: cosine_recall@1 value: 0.7784256559766763 name: Cosine Recall@1 - type: cosine_recall@3 value: 0.89067055393586 name: Cosine Recall@3 - type: cosine_recall@5 value: 0.922740524781341 name: Cosine Recall@5 - type: cosine_recall@10 value: 0.9533527696793003 name: Cosine Recall@10 - type: cosine_ndcg@10 value: 0.8696617098665955 name: Cosine Ndcg@10 - type: cosine_mrr@10 value: 0.8424909759822294 name: Cosine Mrr@10 - type: cosine_map@100 value: 0.8440024185539007 name: Cosine Map@100 - type: dot_accuracy@1 value: 0.7201166180758017 name: Dot Accuracy@1 - type: dot_accuracy@3 value: 0.8790087463556852 name: Dot Accuracy@3 - type: dot_accuracy@5 value: 0.9154518950437318 name: Dot Accuracy@5 - type: dot_accuracy@10 value: 0.9446064139941691 name: Dot Accuracy@10 - type: dot_precision@1 value: 0.7201166180758017 name: Dot Precision@1 - type: dot_precision@3 value: 0.29300291545189505 name: Dot Precision@3 - type: dot_precision@5 value: 0.18309037900874633 name: Dot Precision@5 - type: dot_precision@10 value: 0.09446064139941689 name: Dot Precision@10 - type: dot_recall@1 value: 0.7201166180758017 name: Dot Recall@1 - type: dot_recall@3 value: 0.8790087463556852 name: Dot Recall@3 - type: dot_recall@5 value: 0.9154518950437318 name: Dot Recall@5 - type: dot_recall@10 value: 0.9446064139941691 name: Dot Recall@10 - type: dot_ndcg@10 value: 0.8406159912422888 name: Dot Ndcg@10 - type: dot_mrr@10 value: 0.80640589569161 name: Dot Mrr@10 - type: dot_map@100 value: 0.8085654600526095 name: Dot Map@100 --- # SentenceTransformer based on hiiamsid/sentence_similarity_spanish_es This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [hiiamsid/sentence_similarity_spanish_es](https://huggingface.co/hiiamsid/sentence_similarity_spanish_es). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more. ## Model Details ### Model Description - **Model Type:** Sentence Transformer - **Base model:** [hiiamsid/sentence_similarity_spanish_es](https://huggingface.co/hiiamsid/sentence_similarity_spanish_es) - **Maximum Sequence Length:** 512 tokens - **Output Dimensionality:** 768 tokens - **Similarity Function:** Cosine Similarity ### Model Sources - **Documentation:** [Sentence Transformers Documentation](https://sbert.net) - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers) - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers) ### Full Model Architecture ``` SentenceTransformer( (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True}) ) ``` ## Usage ### Direct Usage (Sentence Transformers) First install the Sentence Transformers library: ```bash pip install -U sentence-transformers ``` Then you can load this model and run inference. ```python from sentence_transformers import SentenceTransformer # Download from the 🤗 Hub model = SentenceTransformer("igmochang/CR-biodiversity-preprocessed-sentence-similarity-es") # Run inference sentences = [ '¿qu aspect morfolog plumaj charran embrid permit diferenci especi similar stern fuscat especial epoc cri ?', 'pes 12 grs empidonax pequeñ caf alas cort redond anill ocul opac adult oliv cafecin encim anill ocul ante angost bien defin barr alar opac caf pal gargant blanc pech present tint parduzc abdom ante amarillent forr alas general coberter infracaudal encend maxil negr mandibul color anaranjadocarn forr boc anaranj pat negruzc especimen juvenil caf tizn opac encim barr alar contrast color ante canel cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc local nort mexic oest panam inviern part central mexic part central panam fenolog usos 1746 nombr cientif vire philadelphicus nombr comun vire amarillent descripcion mid 115 cm pes 115 grs vire pequeñ marc alar color parec vermivor peregrin asoci frecuenci cabez relat grand redond pic grues list facial anchas coberter infracaudal amarill adult pile gris tint oliv rest region superior verd oliv grisace cej are baj ojo color blanc separ mediant list ocul fusc mejill teñ oliv region inferior var principal amarill bastant brillant gargant abdom pal principal blancuzc amarill bien defin sol pech coberter infracaudal maxil color cuern fusc mandibul color cuern pal pat gris individu inmadur parec adult ocasion present coberter alar mayor cort opac punt pal reten plumaj juvenil cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc canad extrem nort eua inviern peninsul yucatan guatemal part central panam rar ocasion nort guatemal fenolog usos 1446 nombr cientif onychoprion anaethetus nombr comun charran embrid descripcion mid 36 cm pes 100 grs tamañ median espald oscur col profund ahorquill disting stern fuscat coll nucal clar manch blanc delg frent extiend form list supercili cort epoc cri adult present coronill list loreal negr coll nucal gris clar rest region superior gris parduzc oscur tod region inferior rectric extern blanc tint gris pech cost pic pat negr epoc cri ve rar ocasion cost ric coronill eminent blanc list negr part posterior', 'nombr comun sinsont tropical descripcion dors cuerp color gris opac brillant part cabez part ventral blancuzc alas caf negruzc barr angost blanc col delg caf negruzc punt blanc list ocul negr cej blanc pat pic negr rand traylor 1961 sanchez 2003 cicl anual distribu regional sur mexic colombi andes sur brasil peterson chalf 1973 fenolog usos 2509 nombr cientif zanthoxylum melanostictum nombr comun lagart color lagartill descripcion arbol arbust 2 15 m fust poc aguijon ram joven rojiz glabr aguijon escas lenticeladashoj imparipinn 3 7 par foliol opuest elipt ovad 2 102142 08 5268 cm glabr lustros coriace apic cort acumin redond ocasion levement emargin bas obtus bord general enter peciol peciolul rojizosinflorescent panicul terminal 13 cmflor blanc 5 petal frut folicul verruc rojiz obovoid 4 8 mm diametr semill negr 3 6 mmse disting color mor rojiz peciol raquis peciolul fust general carec aguijon escas principal bas cicl anual distribu regional mexic centr amer fenolog floracion observ ener abril agost usos 3117 nombr cientif campnosperm panamens nombr comun descripcion arbol 12 30 m altur rmit ferrugineopuberulent hoj simpl altern cortopeciol oblongoobov 1435 5515 cm apic obtus redond cartac pubescent dens tricom estrell pequeñ escam pelt pard rojiz enves nervadur secundari evidenteinflorescent panicul general axil 40 cm larg flor amarillent pequeñ frut drup triangularovoid 115 0712 cmdiagnost caracteriz hoj agrup final ramit cuy aparient recuerd arbol espavel zapot carenci savi lechos habitat suel aneg permit distingu ademas present ramif simpodial tipic hoj viej torn rojoanaranj ramit hoj enves pubescent dor diminut pel escam particul cicl anual distribu regional hondur panam fenolog flor observ agost octubr frut setiembr octubr usos 2396 nombr cientif micrurus mipartitus', ] embeddings = model.encode(sentences) print(embeddings.shape) # [3, 768] # Get the similarity scores for the embeddings similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [3, 3] ``` Preprocess function: ```python import re import nltk from nltk.corpus import stopwords from nltk.stem import SnowballStemmer from nltk.tokenize import word_tokenize # Initialize Spanish stemmer and stopwords nltk.download('punkt') nltk.download('stopwords') spanish_stopwords = set(stopwords.words('spanish')) stemmer = SnowballStemmer('spanish') # Function for preprocessing text (lowercase, remove punctuation, stopwords, and apply stemming) def preprocess_text(text): # Convert to lowercase text = text.lower() # Remove punctuation and special characters text = re.sub(r'[^\w\s¿?%]', '', text) # Tokenize words = word_tokenize(text) # Remove stopwords and apply stemming words = [stemmer.stem(word) for word in words if word not in spanish_stopwords] # Rejoin the words return ' '.join(words) ``` ## Evaluation ### Metrics #### Information Retrieval * Evaluated with [InformationRetrievalEvaluator](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator) | Metric | Value | |:--------------------|:----------| | cosine_accuracy@1 | 0.7784 | | cosine_accuracy@3 | 0.8907 | | cosine_accuracy@5 | 0.9227 | | cosine_accuracy@10 | 0.9534 | | cosine_precision@1 | 0.7784 | | cosine_precision@3 | 0.2969 | | cosine_precision@5 | 0.1845 | | cosine_precision@10 | 0.0953 | | cosine_recall@1 | 0.7784 | | cosine_recall@3 | 0.8907 | | cosine_recall@5 | 0.9227 | | cosine_recall@10 | 0.9534 | | cosine_ndcg@10 | 0.8697 | | cosine_mrr@10 | 0.8425 | | **cosine_map@100** | **0.844** | | dot_accuracy@1 | 0.7201 | | dot_accuracy@3 | 0.879 | | dot_accuracy@5 | 0.9155 | | dot_accuracy@10 | 0.9446 | | dot_precision@1 | 0.7201 | | dot_precision@3 | 0.293 | | dot_precision@5 | 0.1831 | | dot_precision@10 | 0.0945 | | dot_recall@1 | 0.7201 | | dot_recall@3 | 0.879 | | dot_recall@5 | 0.9155 | | dot_recall@10 | 0.9446 | | dot_ndcg@10 | 0.8406 | | dot_mrr@10 | 0.8064 | | dot_map@100 | 0.8086 | ## Training Details ### Training Dataset #### Unnamed Dataset * Size: 2,748 training samples * Columns: sentence_0 and sentence_1 * Approximate statistics based on the first 1000 samples: | | sentence_0 | sentence_1 | |:--------|:-----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | sentence_0 | sentence_1 | |:--------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | ¿cual caracterist fisic distint esmerejon inclu diferent mach hembr ? | 1407 nombr cientif falc columbarius nombr comun esmerejon descripcion mach mid 265 cm pes 160 grs hembr 33 cm 215 grs pequeñ constitu fuert alas puntiagud adult encim gris pizarr mach caf oscur hembr debaj ante list caf oscur profus cabez fin list cuent cej clar traz barr ocul oscur col negruzc 2 o 3 band clar gris mach hembr especimen inmadur parec hembr iris caf oscur cer pat amarill exhib ruf klisklis falc sparverius difier tamañ form accipit joven cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc nort alask canad extrem nort eua inviern sur part central alask sur canad nort amer sur antill especi ampli distribu viej mund fenolog usos 411 nombr cientif tillandsi subulifer nombr comun piñuel parasit descripcion epifitashoj 5 20 cm roset bulbos vain canel lamin 04 08 cm linearsubul involut escap 65 125 cm erect bract larg entrenudosinflorescent erect 5 105 cm simpl terminal 5 9 flor bract floral 18 3 cm verd cort sepal imbric ecarin conspicu nerv sepal 21 26 cm petal rojiz proximal amarill distal bord rojiz capsul 5 73 cmse reconoc facil roset tubul hoj espiral bract floral pequeñ sepal lamin foliar menor 1 cm ancho cicl anual distribu regional nicaragu venezuel trinid fenolog floracion abril juni frut octubr usos 802 nombr cientif liomys salvini nombr comun raton mont descripcion longitud cabez cuerp 103140mm longitud col 97143mm longitud pie 2630mm longitud orej 1216mm pes 3065gtamañ pequeñ median color caf parduzc pal part dorsal siempr gris sombr caf parduzc pel riz color caf amarillent crem tenuement interpuest espin oscur line anaranj cost part ventral pat color crem blanc col bicolor casi igual tamañ longitud cabez cuerp lc liger pelud ningun mechon pel 24mm punt plant pat traser vellud talon cojincill basal cicl anual | | describ morfolog tillandsi subulifer inclu detall hoj inflorescent bract | 1407 nombr cientif falc columbarius nombr comun esmerejon descripcion mach mid 265 cm pes 160 grs hembr 33 cm 215 grs pequeñ constitu fuert alas puntiagud adult encim gris pizarr mach caf oscur hembr debaj ante list caf oscur profus cabez fin list cuent cej clar traz barr ocul oscur col negruzc 2 o 3 band clar gris mach hembr especimen inmadur parec hembr iris caf oscur cer pat amarill exhib ruf klisklis falc sparverius difier tamañ form accipit joven cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc nort alask canad extrem nort eua inviern sur part central alask sur canad nort amer sur antill especi ampli distribu viej mund fenolog usos 411 nombr cientif tillandsi subulifer nombr comun piñuel parasit descripcion epifitashoj 5 20 cm roset bulbos vain canel lamin 04 08 cm linearsubul involut escap 65 125 cm erect bract larg entrenudosinflorescent erect 5 105 cm simpl terminal 5 9 flor bract floral 18 3 cm verd cort sepal imbric ecarin conspicu nerv sepal 21 26 cm petal rojiz proximal amarill distal bord rojiz capsul 5 73 cmse reconoc facil roset tubul hoj espiral bract floral pequeñ sepal lamin foliar menor 1 cm ancho cicl anual distribu regional nicaragu venezuel trinid fenolog floracion abril juni frut octubr usos 802 nombr cientif liomys salvini nombr comun raton mont descripcion longitud cabez cuerp 103140mm longitud col 97143mm longitud pie 2630mm longitud orej 1216mm pes 3065gtamañ pequeñ median color caf parduzc pal part dorsal siempr gris sombr caf parduzc pel riz color caf amarillent crem tenuement interpuest espin oscur line anaranj cost part ventral pat color crem blanc col bicolor casi igual tamañ longitud cabez cuerp lc liger pelud ningun mechon pel 24mm punt plant pat traser vellud talon cojincill basal cicl anual | | ¿cual caracterist distint ramif hoj alzate verticillat permit identif ? | color caf parduzc pal part dorsal siempr gris sombr caf parduzc pel riz color caf amarillent crem tenuement interpuest espin oscur line anaranj cost part ventral pat color crem blanc col bicolor casi igual tamañ longitud cabez cuerp lc liger pelud ningun mechon pel 24mm punt plant pat traser vellud talon cojincill basal cicl anual distribu regional mexic part central cost ric vertient pacif principal localiz tierr baj 1500msnm fenolog usos 3032 nombr cientif alzate verticillat nombr comun descripcion arbol arbust 4 15 m altur ramit cuadrangular pard rojiz exfoli hoj simpl opuest decus obovadoelipt 915 610 cm apic redond retus sesil subsesil coriac glabrasinflorescent panicul terminal 25 cm larg flor petal lil ros frut tip capsul aplan verd pal 5 8 mm largodiagnost reconoc ramif verticil fust pard exfoli escam hoj coriac semej clusi clusiacea secrecion lechos glabr sesil nervadur secundari evident ramit joven cuadrangular hoj torn anaranj rojiz viej cicl anual distribu regional cost ric suramer fenolog flor observ octubr diciembr frut febrer marz usos siti fald cordiller volcan central utiliz ornamental deb foment pues atract follaj arquitectur 1546 nombr cientif eubucc bourcierii nombr comun barbud cabecirroj descripcion mid 15 cm pes 35 grs robust cabezon dos sex present color llamat pic grues conspicu color amarill mach adult are loreal frent barbill negr rest cabez gargant pech roj profund desvanec form abrupt anaranj pech amarill list verd opac profus region posterior region superior alas col color verd opac separ roj cabez lad cuell mediant barr vertical blanc azul iris roj ladrill pic amarill verdos pat verd oliv hembr muestr gargant verd pal part anterior coronill lad cuell anaranj profund continu faj traves part superior pech rest coronill verd ocrace oscur tint anaranj mejill list cort ojo azul clar part baj pech verd oliv clar | * Loss: [MultipleNegativesRankingLoss](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters: ```json { "scale": 20.0, "similarity_fct": "cos_sim" } ``` ### Training Hyperparameters #### Non-Default Hyperparameters - `eval_strategy`: steps - `per_device_train_batch_size`: 10 - `per_device_eval_batch_size`: 10 - `num_train_epochs`: 2 - `multi_dataset_batch_sampler`: round_robin #### All Hyperparameters
Click to expand - `overwrite_output_dir`: False - `do_predict`: False - `eval_strategy`: steps - `prediction_loss_only`: True - `per_device_train_batch_size`: 10 - `per_device_eval_batch_size`: 10 - `per_gpu_train_batch_size`: None - `per_gpu_eval_batch_size`: None - `gradient_accumulation_steps`: 1 - `eval_accumulation_steps`: None - `torch_empty_cache_steps`: None - `learning_rate`: 5e-05 - `weight_decay`: 0.0 - `adam_beta1`: 0.9 - `adam_beta2`: 0.999 - `adam_epsilon`: 1e-08 - `max_grad_norm`: 1 - `num_train_epochs`: 2 - `max_steps`: -1 - `lr_scheduler_type`: linear - `lr_scheduler_kwargs`: {} - `warmup_ratio`: 0.0 - `warmup_steps`: 0 - `log_level`: passive - `log_level_replica`: warning - `log_on_each_node`: True - `logging_nan_inf_filter`: True - `save_safetensors`: True - `save_on_each_node`: False - `save_only_model`: False - `restore_callback_states_from_checkpoint`: False - `no_cuda`: False - `use_cpu`: False - `use_mps_device`: False - `seed`: 42 - `data_seed`: None - `jit_mode_eval`: False - `use_ipex`: False - `bf16`: False - `fp16`: False - `fp16_opt_level`: O1 - `half_precision_backend`: auto - `bf16_full_eval`: False - `fp16_full_eval`: False - `tf32`: None - `local_rank`: 0 - `ddp_backend`: None - `tpu_num_cores`: None - `tpu_metrics_debug`: False - `debug`: [] - `dataloader_drop_last`: False - `dataloader_num_workers`: 0 - `dataloader_prefetch_factor`: None - `past_index`: -1 - `disable_tqdm`: False - `remove_unused_columns`: True - `label_names`: None - `load_best_model_at_end`: False - `ignore_data_skip`: False - `fsdp`: [] - `fsdp_min_num_params`: 0 - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False} - `fsdp_transformer_layer_cls_to_wrap`: None - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None} - `deepspeed`: None - `label_smoothing_factor`: 0.0 - `optim`: adamw_torch - `optim_args`: None - `adafactor`: False - `group_by_length`: False - `length_column_name`: length - `ddp_find_unused_parameters`: None - `ddp_bucket_cap_mb`: None - `ddp_broadcast_buffers`: False - `dataloader_pin_memory`: True - `dataloader_persistent_workers`: False - `skip_memory_metrics`: True - `use_legacy_prediction_loop`: False - `push_to_hub`: False - `resume_from_checkpoint`: None - `hub_model_id`: None - `hub_strategy`: every_save - `hub_private_repo`: False - `hub_always_push`: False - `gradient_checkpointing`: False - `gradient_checkpointing_kwargs`: None - `include_inputs_for_metrics`: False - `eval_do_concat_batches`: True - `fp16_backend`: auto - `push_to_hub_model_id`: None - `push_to_hub_organization`: None - `mp_parameters`: - `auto_find_batch_size`: False - `full_determinism`: False - `torchdynamo`: None - `ray_scope`: last - `ddp_timeout`: 1800 - `torch_compile`: False - `torch_compile_backend`: None - `torch_compile_mode`: None - `dispatch_batches`: None - `split_batches`: None - `include_tokens_per_second`: False - `include_num_input_tokens_seen`: False - `neftune_noise_alpha`: None - `optim_target_modules`: None - `batch_eval_metrics`: False - `eval_on_start`: False - `eval_use_gather_object`: False - `batch_sampler`: batch_sampler - `multi_dataset_batch_sampler`: round_robin
### Training Logs | Epoch | Step | Training Loss | cosine_map@100 | |:------:|:----:|:-------------:|:--------------:| | 0.1818 | 50 | - | 0.6806 | | 0.3636 | 100 | - | 0.7391 | | 0.5455 | 150 | - | 0.7742 | | 0.7273 | 200 | - | 0.7927 | | 0.9091 | 250 | - | 0.8211 | | 1.0 | 275 | - | 0.8162 | | 1.0909 | 300 | - | 0.8241 | | 1.2727 | 350 | - | 0.8137 | | 1.4545 | 400 | - | 0.8318 | | 1.6364 | 450 | - | 0.8342 | | 1.8182 | 500 | 0.4916 | 0.8432 | | 2.0 | 550 | - | 0.8440 | ### Framework Versions - Python: 3.10.12 - Sentence Transformers: 3.1.1 - Transformers: 4.44.2 - PyTorch: 2.4.1+cu121 - Accelerate: 0.34.2 - Datasets: 3.0.1 - Tokenizers: 0.19.1 ## Citation ### BibTeX #### Sentence Transformers ```bibtex @inproceedings{reimers-2019-sentence-bert, title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks", author = "Reimers, Nils and Gurevych, Iryna", booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing", month = "11", year = "2019", publisher = "Association for Computational Linguistics", url = "https://arxiv.org/abs/1908.10084", } ``` #### MultipleNegativesRankingLoss ```bibtex @misc{henderson2017efficient, title={Efficient Natural Language Response Suggestion for Smart Reply}, author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil}, year={2017}, eprint={1705.00652}, archivePrefix={arXiv}, primaryClass={cs.CL} } ```