igmochang's picture
Update README.md
0bfe83e verified
metadata
base_model: hiiamsid/sentence_similarity_spanish_es
library_name: sentence-transformers
metrics:
  - cosine_accuracy@1
  - cosine_accuracy@3
  - cosine_accuracy@5
  - cosine_accuracy@10
  - cosine_precision@1
  - cosine_precision@3
  - cosine_precision@5
  - cosine_precision@10
  - cosine_recall@1
  - cosine_recall@3
  - cosine_recall@5
  - cosine_recall@10
  - cosine_ndcg@10
  - cosine_mrr@10
  - cosine_map@100
  - dot_accuracy@1
  - dot_accuracy@3
  - dot_accuracy@5
  - dot_accuracy@10
  - dot_precision@1
  - dot_precision@3
  - dot_precision@5
  - dot_precision@10
  - dot_recall@1
  - dot_recall@3
  - dot_recall@5
  - dot_recall@10
  - dot_ndcg@10
  - dot_mrr@10
  - dot_map@100
pipeline_tag: sentence-similarity
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:2748
  - loss:MultipleNegativesRankingLoss
widget:
  - source_sentence: >-
      ¿cual caracterist morfolog distint solanum chrysotrichum inclu detall hoj
      inflorescent frut ?
    sentences:
      - >-
        frut subglob cerc 5 9 mm diametr blanc cicl anual distribu regional sur
        mexic suramer fenolog floracion registr marz septiembr frecuent juli
        usos 3462 nombr cientif solanum chrysotrichum nombr comun descripcion
        arbust 3 m alto escas armad tall toment tricom multiangul pedicul larg
        grues braz central vec alarg acule cort rect incurv 2 5 mm larg hoj
        solitari ampli ovad 40 cm larg apic agud bas trunc cord enter lobul
        salient afelp toment frecuent ferrugine haz hirsut tricom estrell sesil
        braz central larg enves suavement toment tricom multiangul pedicul grues
        nervi principal vec armad peciol 15 cm larg toment vec armad
        inflorescent simpl cim poc ram cad ram racem vari flor lateral peduncul
        ramific vec primari obsolet 15 cm larg cerdosohisp pedicel casi 5 mm
        larg tricom braz central larg inerm caliz casi 5 mm larg toment tricom
        multiangul lobul 13 longitud lobul angost triangular corol 30 50 mm
        diametr blanc lob 13 longitud lobul ovad pubescent medi anter 6 10 mmde
        larg frut tip bay globos 1 15 cm diametr glabr verd pedicel fructifer
        grues alarg erect semill aplan 22 26 mm diametr cicl anual distribu
        regional mexic panam fenolog fertil año usos 3243 nombr cientif
        forchhammeri pall nombr comun siemprev aceitun blanc descripcion arbol
        arbust 4 10 m altur ramit glabr hoj simpl altern obovadooblong 25104 082
        cm apic redond emargin obtus cortomucron glabr lustrosasinflorescent rac
        axilar comprim 4 6 cm larg flor pard crem pequeñ bisexual frut tip bay 2
        cm diametr esfer amarilloanaranj madur rellen pulp suav jugos sabor
        desagradablel mader amarill paj dens present anatom comun pose floem
        incluidodiagnost especi dificil ubic famili caracteriz hoj pequeñ obov
        glabr lustr arbol cop dens redond plantul brinzal hoj bastant linear
        contrast individu adult cicl anual distribu regional mexic fenolog flor
        observ ener marz noviembr diciembr
      - >-
        peciol aproxim 4 6 mm larg toment jov flor sesil espig subcapit peduncul
        15 7 cm larg frut drup elipsoid 1 3 08 22 cm endocarp 5 surc cicl anual
        distribu regional cost ric bolivi antill fenolog flor sid observ moment
        frut recolect setiembr octubr usos 173 nombr cientif cyathe microdont
        nombr comun rab mic helech arborescent descripcion tronc 15 m alto 58 cm
        diametr hoj 1217 m larg peciol pard espin espin 38 mm escam peciol 1020
        153 mm angost lanceol pard concolor lev marg clar caspill ausent lamin
        2pinnadopinnatif apic gradual atenu raquis pard pard clar espin espin 25
        mm glabr pinn pedicul pedicul 02212 cm pinn medi 3050 1520 cm cost pajiz
        pard clar lis espin basal espin 13 mm glabr puberulent pel 0102 mm
        pardoamarillent pinnul 710 1525 cm sesil costul glabr puberulent pel
        0102 mm pardoamarillent escam escas ausent diminut aplan segment pinnul
        medi 1725 par 1525 mm ancho serr crenul obtus nervadur 913 par segment
        1bifurc glabr pel tej lamin nervadur glabr sor medi parafis tan larg
        esporangi conspicu pardoamarillent blanc panam indusi ausent cicl anual
        distribu regional mexic mesoamer colombi venezuel ecuador peru bolivi
        brasil guyan fenolog usos raic utiliz cultiv orquid fabric artesan 2099
        nombr cientif rhadinae serperast nombr comun hojarasquer rayadaingles
        strip littersnak descripcion miembr gener especi serpient pequeñ median
        dificil sobrepas 300 mm longitud total cuy col represent aproxim 40
        cient longitud present 11 2 14 2 dient maxilar aument gradual tamañ haci
        part posterior boc ultim dos grand separ rest interespaci pequefi dient
        mandibular desigual hemipen simpl vari espin ganch proximal grand detras
        cual zon espin porcion distal organ calic form estructur capit sulcus
        spermaticus bifurc cabez apen disting cuell ojo bien pequeñ ia pupil
        redond cuerp cilindr col median larg
      - >-
        larg glabr inflorescent rac subumbel cort 10 15 flor opuest hoj
        principal cerc extrem ram glabrescent peduncul ramific 03 1 cm larg
        pedicel 10 20 mm larg caliz 2 3 mm larg profund lobul lobul deltoid
        apical tricom simpl basal glabr corol 9 12 mm diametr blanc frecuent
        tint purpure sec profund lobul lobul oblong glabr anter casi3 mm larg
        frut tip bay globos casi 13 cm diametr glabr verdeamarill pedicel
        fructifer acrescent aun delg patent deflex semill aplan 3 mm diametr
        cicl anual distribu regional mexic bolivi fenolog fertil año usos 729
        nombr cientif dermanur aztec nombr comun murcielag descripcion longitud
        cabez cuerp 5975 mm longitud col 0 mm longitud pie 1114 mm longitud orej
        1520 mm longitud antebraz 4149 mm pes 1533 ges tamañ median part dorsal
        color caf carbon negruzc part ventral liger pal punt pel tenuement
        escarch pelaj larg 910 mm bland lin facial estrech blancuzc clar escarch
        orej hoj nasal color caf oscur herradur hoj nasal total libr uropatagi
        pequeñ cerc 6 mm form v superfici dorsal pelud bord dens franj pat pies
        pelud cicl anual distribu regional distribu mexic oest panam localiz 600
        3000 msnm fenolog usos 1226 nombr cientif pelecanus occidentalis nombr
        comun alcatraz buchon pelican pard descripcion mid 109 cm pes 3 kg
        inconfund unic pelican comun cost adult pos cuerp caf grisace oscur plum
        part superior present lustr plat cabez cuell blanc pic parduzc bols piel
        car grisac pat negr epoc reproduct cuell principal negr crest nucal
        castañ present tint amarill cabez piel alrededor ojo rojiz pic ostent
        tint rosace especimen inmadur cabez cuell part superior caf abdom blanc
        alcanz plumaj definit adult despues 3 años cicl anual especi resident
        aunqu individu pued ser migratori neartic distribu regional encuentr
        cost pacif washington nort peru cost islas atlant golf mexic carib
        carolin nort venezuel fenolog usos 2900 nombr cientif aulaxin quadrangul
        nombr comun liqu
  - source_sentence: ¿cual caracterist distint plumaj mosquer agu adult juvenil ?
    sentences:
      - >-
        nombr comun mosquer agu descripcion mid 155 cm pes 21 grs negruzc tamañ
        median rar ocasion encuentr lej agu adult muestr cabez cuell mayor part
        region inferior negr opac negr pizarr centr abdom blanc flanc coberter
        infracaudal gris tizn rest region superior pizarr negruzc present 2 barr
        alar gris secundari tercial bord grisace col negruzc vexil extern
        timoner extern bord blanc pic pat negruzc especimen juvenil present
        plumaj negr parduzc apag abdom barr alar caf canel opac caf ante plum
        espald rabadill flec caf pal cicl anual efectu migracion altitudinal
        distribu regional encuentr suroest eua noroest argentin fenolog usos
        1029 nombr cientif cheilanth brachypus nombr comun descripcion helech
        terrestr epipetr rizom cort ascendent compact escam 8 15 01 03 mm linear
        pardoamarillent pardorojiz concolor liger bicolor enter marg dispers
        dentadofrond 10 35 cm larg peciol 1 5 cm larg 18 15 tamañ frond pard
        oscur cilindr dens escam pelos escam 1 5 05 1 mm lanceol linear pard
        pardorojiz tricom 1 2 mm blanquecin tortuos lamin 8 30 25 5 cm oblanceol
        1 pinnadopinnatif haz dens pelos tricom casi 1 mm hialin lax patent
        enves dens escam pelos superfici visibl tricom escam anaranjadorojiz
        pinn 10 21 par 12 25 06 13 cm equilater delt lanceol raquis negr ocult
        dens cubiert tricom escam nervadur ocult visibl indusi reflex escari
        enter decurrentecheilanth brachypus caracteriz lamin 1 pinnadopinnatif
        oblanceol dens escam enves mesoamer especi c bonariensis unic especi
        cheilanth lamin 1 pinnadopinnatif cicl anual distribu regional mexic
        mesoamer fenolog usos 2778 nombr cientif caripi montagnei nombr comun
        descripcion cuerp fructifer 05 25 cm alto form cop alarg extrem superior
        aplan 05 15 cm diametr blanc beig rellen context sol color blanc pose
        olor sabor distint
      - >-
        orej casi desnud unid band pequeñ cruz superfici cabez car desnud hoj
        nasal pequeñ herradur complet fusion labi superior barbill acanal bord
        hiler diminut verrug col cort mid men mit longitud uropatagi antebraz
        desnud alas cort anchas unid pat cerc bas ded pat desnud calcane larg
        pat cicl anual distribu regional hondur bolivi norest argentin guyan
        brasil localiz tierr baj 600 msnm fenolog usos 420 nombr cientif aechme
        angustifoli nombr comun piñuel epifit parasit descripcion epifitahoj 19
        685 cm lamin 12 35 4 cm agud acumin escap 225 58 63 cm erect bract
        superior larg entrenud inferior cort espinososerradasinflorescent 45 235
        cm unipinn bipinn basal bract primari espinososerr distal espig 4 9 flor
        distic bract floral 04 06 cm larg igual longitud entrenud flor sesil
        sepal 5 9 mm mucron petal amarilloss reconoc tamañ flor inflorescent
        cicl anual distribu regional nicaragu ecuador peru bolivi fenolog
        floracion observ ener febrer noviembr frut observ marz octubr usos 682
        nombr cientif centronycteris centralis nombr comun murcielag descripcion
        longitud cabez cuerp 4959 mm longitud col 2024 mm longitud pie 79 mm
        longitud orej 1719 mm longitud antebraz 4349 mm pes 56 gcuerp color
        amarill sombr caf parduzc part inferior cuart traser uropatagi color caf
        anaranj pelaj larg espes orej larg form hoz punt piel car ros membran
        negruzc uropatagi larg pelud bas calcane larg alas lig pat bas ded sac
        aere cicl anual distribu regional mexic peru guyan brasil tierr baj sol
        fenolog usos 1980 nombr cientif ctenosaur quinquecarinat nombr comun
        garrob ingles spiny tail iguan descripcion lagartij grand alcanz 350 mm
        hc hembr pequeñ adult col alcanz casi dobl larg rest cuerp cabez disting
        cuell miembr robust muscul escam region dorsal pequeñ apen imbric debil
        quill except aquell part dorsal miembr grand fuertement quill escam
        ventral lis
      - >-
        sorali comun granular submarginal isidi pustul ausent apoteci rar observ
        cicl anual distribu regional pantropical extend region templ adyacent
        fenolog usos 25 nombr cientif tabebui ochrace nombr comun cortez amarill
        cortez amarillapiuv tarum brasil descripcion arbol 25 m 50 cm med altur
        pech dap fust cortez surc profund separ ram joven pubescent hoj digit 5
        foliol aserr enter membranace pubescent glaucoamarillent enves
        oblongoobov oblongoelipt abrupt acumin bas obtus trunc foliol terminal
        522 18144 cm par intermedi 42198 14132 cm pubescent estrell
        ferrugineoamarillent ambas superfici peciol 618 cm larg lanos pubescent
        peciolul 0258 cm larg inflorescent panicul terminal pubescent flor dulc
        fraganci caliz campanul 5 lobul gran cantid pubescent lanos amarillent
        corol tubul amarill lin rojiz cuell tub usual parduzc 483 cm larg frut
        capsul lin cilindr delg extrem 1135 118 cm lanos pubescent semill 0408
        1829 cm alad especi comun dentr gener reconoc pos hoj sol 5 foliol dens
        pubescent estrell principal enves asi peciol ram joven enves ademas
        glauc amarillent cicl anual distribu regional centroamer hondur guatemal
        nort suramer brasil ytrinid fenolog flor observ ener juni produc anual
        gran cantid plantul usos mader pard oscur parec tabebui guayac pes dur
        cort alta resistent mecan larg durabil aun baj condicion favor pudricion
        mader propi usos extern post durmient ferrocarril acab construccion
        civil bol bolich asim bell floracion sid plant ornamental pais distribu
        natural especi adapt siti sec util preservavion mejor are degrad altas
        pendient lorenzi 1949 2608 nombr cientif tabanus unistriatus nombr comun
        taban descripcion hind tibia without apical spurs basicost with strong
        seta as dens as thos on the adjoining cost vertex without tubercl
        scutellum and posterior margin of the mesoscutum without black velvety
        spot body not wholly black subcallus bar and shiny abdom black or dark
        brown with singl prominent pal middorsal strip covering tergit 16 frons
        over 6 tim as high as the basal width wing somewhat smoky along the
        forebord and apex cicl anual distribu regional guatemal to ecuador ?
        guyan ? peru fenolog usos
  - source_sentence: >-
      explic distribu geograf especi mencion context import control serpient
      venen viper
    sentences:
      - >-
        cuerp cilindr col median larg escam cefal comprend rostral dos
        internasal dos prefrontal frontal dos parietal loreal nasal preocul dos
        postocular present 22 6 23 temporal 8 o 9 supralabial 8 infralabial
        present dos par geneial 19 hiler escam dorsal diferent import congener c
        scytalin reduccion lis foset apical ventral redond ia plac anal present
        enter subcaudal divid color uniform band transversal cefal nucal juvenil
        color complet diferent cons color fond roj cuerp band nucal amarill clar
        cabez negr cicl anual distribu regional yucatan mexic nort argentin
        fenolog usos sistem inmunolog capaz soport vari cc venen bothrops hac
        potencial interes medic especi sirv control serpient venen viper 2687
        nombr cientif euphori candezei nombr comun escarabaj frut descripcion
        cuerp 175 232 mm longitud 92 122 mm ancho color dorsal ventral cuerp
        inclu pigidi pat verd vidrios rar aparec individu tonal rojiz bastant
        llamat pronot elitr lis present puntuacion llamat part superior mientr
        part posterior elitr pigidi present rug ondul bastant caracterist
        present sed blanquecin especial evident are ventral bord anterior clipe
        present par dient dirig haci arrib dorsal cabez concav are
        correspondient frent clipe lev elev longitudinal part central anten mach
        present maz antenal volumin hembr pronot present carin lateral bien marc
        complet bord posterior present escotadur correspondient bord anterior
        escutel grand expuest tibi anterior present tres dient extern evident
        tibi anterior mach tiend ser estiliz hembr femur medi posterior present
        ventral carin longitudinal clar defin cerc bord posterior sal hiler sed
        tibi medi posterior present evident hiler sed junt relat larg bord
        intern dorsal cox medi bien separ tubercul mesosternal relat ancho form
        pentagonal vist ventral fig propleur quill pronunci cercan paralel sutur
        sep preproestern diferenci sex mach present anten maz volumin hembr figs
        abdom vist perfil tiend ser concav mientr hembr tiend ser rect convex
        ademas tibi anterior mach tiend ser estiliz hembr cicl anual distribu
        regional especi distribu ampli haci nort mientr sur sol sid hall panam
      - >-
        larg apic agud acumin bas obtus redond enter vec afelp haz dispers
        tricom porrect subsesil enves suavement toment tricom multiangul pedicul
        nervi principal vec armad peciol 3 cm larg toment mayor armad
        inflorescent rac amonton 4 12 flor lateral toment tricom estrell sesil
        cort pedicel inerm menud inconspicu armad peduncul 1 cm larg vec bifurc
        pedicel 10 mm larg caliz casi 3 mm larg lobul cerc mit longitud lobul
        angost sen redond toment tricom multiangul corol 15 mm diametr blanc
        azul profund lobul lobul angost pubescent asi distal anter 5 mm larg
        frut tip bay globos 08 s 1 cm diametr glabr anaranj lustros madur
        pedicel fructifer acrescent delg expand distal erect semill aplan casi 3
        mm diametr cicl anual distribu regional mexic panam ecuador fenolog
        fertil may setiembr usos 3284 nombr cientif sagittari lancifoli nombr
        comun descripcion hierb perenn emergent provenient rizom monoic hoj
        distint distic erect peciol cerc 100 cm larg lamin 83550 0441521 cm lin
        ovad elipt atenu baseinflorescent bisexual emergent 6 13 verticil simpl
        ramific cad 3 flor flor 20 o estambr flor estamin estambr esteril flor
        pistil pistil esteril ausent flor estamin cabez frutal 811 1115 mm
        pedicel ascendent sepal reflex papil aqueni 16 25 mm larg car lateral 1
        glandul pic erect 03 07 mm larg cicl anual distribu regional surest unid
        ecuador brasil antill fenolog floracion año usos 2498 nombr cientif
        hyperbaen leptobotry nombr comun descripcion arbust arbol 3 6 mhoj
        coriac lustr glabr elipticooblong ovadolanceol mid 7 205 35 87 cm 5 8
        par nervi secundari venacion terciari irregular reticul marg enteroondul
        apic acumin bas estrech redond
      - >-
        zanthoxylum fag l sarg var culantrill crec fald cordiller guanac til
        elev 600 1300 m pose mayor aparient arbol poc aguijon fust aguijon ram
        raquis levement alad panicul 11 cm standley 1937 trat zanthoxylum
        insular cicl anual distribu regional mexic sur amer antill fenolog
        floracion observ febrer usos 697 nombr cientif glyphonycteris daviesi
        nombr comun murcielag descripcion longitud cabez cuerp 6384 mm longitud
        col 511 mm longitud pie 1720 mm longitud orej 2731 mm longitud antebraz
        5458 mm pes 1930 ges especi mayor tamañ dentr gener sol par incis grand
        tan larg canin part dorsal color caf parduzc oscur part ventral liger
        pal pelaj larg lanud orej larg extrem punt labi barbill bastant pelud
        barbill acanal bord cojincill lis form v col cort mid cerc mit longitud
        uropatagi calcane pequeñ pat pat larg moder pelud cicl anual distribu
        regional hondur peru guyan brasil bolivi localiz sol tierr baj fenolog
        usos 1583 nombr cientif sclerurus albigularis nombr comun tirahoj
        gargantigr descripcion mid 17 cm pes 38 grs sclerurus grand muestr contr
        distint gris gargant pech ruf adult muestr pile caf oscur lev escam
        grues negruzc espald coberter alar caf castañ oscur torn caf oscur remer
        castañ rabadill coberter supracaudal col negruzc lad cabez oliv grisace
        oscur cost flanc region infracaudal color caf castañ oscur maxil negr
        mandibul color cuern punt negruzc pat negr cafecin ejemplar juvenil
        similar pech opac oscur gargant oscur escam fusc cicl anual distribu
        regional encuentr cost ric nort bolivi guyan trinid tobag fenolog usos
        210 nombr cientif cyathe squarros
  - source_sentence: >-
      describ caracterist morfolog werauhi kathya inclu detall hoj inflorescent
      flor
    sentences:
      - >-
        color cuerp negr pard oscur aparient pul levisim brill verd casi
        impercept mayor especimen especimen lad pacif cost ric aparient levement
        opac lad atlant general cuerp lis dorsal carent set bord anterior cabez
        dos dient relat junt ver figur abaj are dorsal ojos bastant ampli
        relacion especi gener cost ric ver figur abaj fov lateral pronot
        circular alarg form surc escutel visibl cad elitr present 9 estri visibl
        inclu supraepipleural carec carin lateral elitr supraepipleural pigidi
        muestr carin basal bien marc denticul ventral bord anterolateral
        protorax ausent ver figur abaj carin proepimeral protorax present
        complet ver figur abaj tibi anterior muestr 3 dient bord extern bord
        intern rect ver figur abaj espolon apical tibi bif diferent hembr simpl
        ver figur abaj tars anterior present tod especi gener ver figur abaj
        tibi medi posterior delg curv escas expand haci extrem ver figur abaj
        prim tars pat posterior longitud normal larg segund form triangul ver
        figur abaj ventral femur posterior present carin longitudinal cerc bord
        anterior carin cerc bord posterior ver figur abaj diagnosis hembr semej
        mach except espolon apical tibi anterior simpl bif ver figur abaj ademas
        ultim segment abdominal ancho medial mach cicl anual colect mes año are
        distribu lad atlant pacif distribu regional encuentr ademas belic
        nicaragu panam colombi brasil ecuador fenolog usos 3283 nombr cientif
        echinodorus bolivianus nombr comun descripcion hierb anual rizomat plant
        fertil emergent mayor frecuenci crec var riber humed cerc 30 cm altur
        hoj sumerg emergent peciol 1 725 cm larg lamin 13 722 cm larg lin
        linearlanceol atenu bas marc peluc inflorescent 1 o 23 verticil simpl
        cad 4 11 flor pedicel 08 355 cm larg flor sepal 28 43 mm larg 89 estambr
        pistil cerc 20 cabez frutal 153 254 mm simil anill encerr total sepal
        aqueni 1 17 mm larg usual 2 o 3 costill bien desarroll car vec ausent
        cicl anual distribu regional unid nort argentin trinid antill fenolog
        flor ener may usos
      - >-
        bract floral 04 07 cm cort casi igual entrenud flor sesil sepal 5 8 mm
        mucron petal blanc bay 1 2 cm negrasmuy simil especi gener ronnbergi
        cual pued ser dificil distingu veget autor inclus suger posibil unir
        nuev ambos gener cicl anual distribu regional cost ric panam fenolog
        fructif observ agost ener usos 680 nombr cientif cormur brevirostris
        nombr comun murcielag descripcion longitud cabez cuerp 4658mm longitud
        col 1016mm longitud pie 58mm longitud orej 1316mm longitud antebraz
        4550mm pes 711gpart dorsal ric color caf castañ negruzc juvenil subadult
        part ventral liger pal pelaj espes brillant piel car orej negruzc trag
        ancho nariz cort pel casi punt membran negr alas unid pat bas ded sac
        aere grand abertur extiend bord ala cicl anual distribu regional
        nicaragu peru brasil tierr baj 1000msnm fenolog usos 1078 nombr cientif
        kogi sim nombr comun cachalot enan dwarf sperm whal descripcion signific
        menor kogi breviceps pues promedi 28 m longitud 260 kg pes dors gris
        oscur vientr blanc cost color blanc grisace alet pectoral gris oscur
        alet dorsal proporcional cuerp tamañ sol liger posterior mit cuerp igual
        k breviceps present hocic fuertement trunc ojo alet pectoral plieg piel
        semej agall abertur branquial fals natural ningun relacion pec cicl
        anual especi ocasional aunqu divers epoc año anterior situacion pued
        trat especi resident rar escas distribu regional agu tropical templ
        planet aunqu falt mediterrane mar negr mar roj golf persic fenolog usos
        japon isla san vicent antill menor caz carn 1637 nombr cientif
        myiodynast hemichrysus nombr comun pech amarill mosquer ventridor
        descripcion mid 20 cm pes 41 grs difier mosquer tip pitangus sulphuratus
        list mal oscur adult muestr coronill gris oscur fin list negr manch
        amarill brillant ocult rest region oliv verdos oscur alas col fusc bord
        tercial amarill pal remer coberter alar angost color canel present list
        negruzc grues are loreal auricular bord cej list blanc mejill list mal
        fusc grues barbill blanc rest region inferior amarill brillant pic pat
        negr
      - >-
        maxim 24 dient n richardi abdom larg 607 % longitud estand vs 493568 %
        color clar miembr atenu generotien pat traser angost 41 % longitud
        estand vs 445o % especi cost ric ded pat traser cort 3er ded 0917 % pat
        delanter traser sindactil 4 ded pat delanter 5 ded pat traser ded pat
        traser extern sol perfil extern surc punt digit libr punt
        redondeadastien fos nasal larg ancho cabez 40 vec diametr fos nasal
        compar tamañ n richardi grand miembr gener cost ric cicl anual distribu
        regional fenolog usos 1894 nombr cientif pselliophorus tibialis nombr
        comun salton musl amarill descripcion 185 cm 31 g oscur delg col larg
        musl amarill esponj pic bien larg delg aspect atlapet adult pile part
        atras nuc negr rest part arrib negr pizarr gargant negruzc pas pizarr
        negruzc rest region inferior pech abdom teñ verd oliv iris castañ pic
        negr pat fusc individu present pequeñ manch amarill bord hombr juvenil
        parec opac encim color negr tizn debaj present fuert tint cafecin musl
        caf oliv pal cicl anual distribu regional encuentr cost ric oest panam
        fenolog usos 44 nombr cientif werauhi kathya nombr comun piñuel parasit
        epifit descripcion epifit terrestr caulescent hoj 15 45 cm larg atenu
        cartac papel quebradiz vain 24 39 cm caf oscur lepidot lamin 10 19 cm
        glabr lepidot lin longitudinal oscur escap 22 37 cm larg erect
        curvadoerect bract verdecrem larg entrenudosinflorescent erect 2 5 cm
        larg 1pinn bract primari larg ram lateral estos sesil casi sesil dos
        tres flor colateral bract floral 13 18 cm larg verdecrem ovad oblong
        carin glabr lepidot membranac cartaceasflor sesil sepal 06 10 cm larg
        coriace petal crem verdecrem 17 20 cm largocapsul 17 25 cm larg com
        semill canel cicl anual distribu regional
  - source_sentence: >-
      ¿qu aspect morfolog plumaj charran embrid permit diferenci especi similar
      stern fuscat especial epoc cri ?
    sentences:
      - >-
        nombr comun sinsont tropical descripcion dors cuerp color gris opac
        brillant part cabez part ventral blancuzc alas caf negruzc barr angost
        blanc col delg caf negruzc punt blanc list ocul negr cej blanc pat pic
        negr rand traylor 1961 sanchez 2003 cicl anual distribu regional sur
        mexic colombi andes sur brasil peterson chalf 1973 fenolog usos 2509
        nombr cientif zanthoxylum melanostictum nombr comun lagart color
        lagartill descripcion arbol arbust 2 15 m fust poc aguijon ram joven
        rojiz glabr aguijon escas lenticeladashoj imparipinn 3 7 par foliol
        opuest elipt ovad 2 102142 08 5268 cm glabr lustros coriace apic cort
        acumin redond ocasion levement emargin bas obtus bord general enter
        peciol peciolul rojizosinflorescent panicul terminal 13 cmflor blanc 5
        petal frut folicul verruc rojiz obovoid 4 8 mm diametr semill negr 3 6
        mmse disting color mor rojiz peciol raquis peciolul fust general carec
        aguijon escas principal bas cicl anual distribu regional mexic centr
        amer fenolog floracion observ ener abril agost usos 3117 nombr cientif
        campnosperm panamens nombr comun descripcion arbol 12 30 m altur rmit
        ferrugineopuberulent hoj simpl altern cortopeciol oblongoobov 1435 5515
        cm apic obtus redond cartac pubescent dens tricom estrell pequeñ escam
        pelt pard rojiz enves nervadur secundari evidenteinflorescent panicul
        general axil 40 cm larg flor amarillent pequeñ frut drup triangularovoid
        115 0712 cmdiagnost caracteriz hoj agrup final ramit cuy aparient
        recuerd arbol espavel zapot carenci savi lechos habitat suel aneg permit
        distingu ademas present ramif simpodial tipic hoj viej torn rojoanaranj
        ramit hoj enves pubescent dor diminut pel escam particul cicl anual
        distribu regional hondur panam fenolog flor observ agost octubr frut
        setiembr octubr usos 2396 nombr cientif micrurus mipartitus
      - >-
        larg lamin 22 45 65 05 1 2 25 cm linearelipt lin atenu ambos extrem
        coriace lustros marg comun revolut raquis pajiz pard ven lateral evident
        sor redond 1 3 4 seri cost marg cicl anual distribu regional cost ric
        panam colombi venezuel ecuador peru bolivi fenolog usos 144 nombr
        cientif croton ortholobus nombr comun targu descripcion arbust 3 m altur
        hoj elipt ovad lanceol 3 10 cm larg 15 7 cm ancho peciol 2 glandul apic
        marg levement aserr inflorescent bisexual racem espig 4 7 cm larg frut 4
        6 mm longituds reconoc hoj levement aserr peciol glandular estipul
        linear inflorescent flor solitari sosten bract linear cicl anual
        distribu regional hondur nicaragu fenolog usos 3017 nombr cientif
        gymnospori haberian nombr comun descripcion arbol 5 30 m altur ramit
        verd pal verd amarillent estipul diminut rojiz hoj simpl altern 812 46
        cm elipt apic acumin agud glabr bord enteroinflorescent cim axilar 20
        flor flor verd 45 7 mm ancho frut tip capsul 1 115 cm amarillent glob 2
        4 lobul semill pard aril blancos caracteriz hoj sec adquier ton verd
        amarillent bas general redond bord levement revolut rasg taxonom recuerd
        gener maytenus dificil separ rasp cortez tronc ramit raic epidermis
        amarillent amarill encend mayor especi famili g haberian caracterist vec
        not direct bas tronc hab rasp cortez cicl anual distribu regional mexic
        estacion biolog tuxtl veracruz fenolog flor observ febrer juli frut ener
        marz diciembr usos 321 nombr cientif vriese marnierlapostollei nombr
        comun piñuel epifit parasit descripcion epifitashoj 8 15 21 cm acumin
        agud apicul membranac subcartac vain 2 4 cm canelacrem esparcid lepidot
        lamin 13 26 cm esparcid lepidot lin longitudinal mor escap 16 22 26 cm
        erect curvadoerect
      - >-
        pes 12 grs empidonax pequeñ caf alas cort redond anill ocul opac adult
        oliv cafecin encim anill ocul ante angost bien defin barr alar opac caf
        pal gargant blanc pech present tint parduzc abdom ante amarillent forr
        alas general coberter infracaudal encend maxil negr mandibul color
        anaranjadocarn forr boc anaranj pat negruzc especimen juvenil caf tizn
        opac encim barr alar contrast color ante canel cicl anual especi
        migratori neartic ver distribu cost ric distribu regional reproduc local
        nort mexic oest panam inviern part central mexic part central panam
        fenolog usos 1746 nombr cientif vire philadelphicus nombr comun vire
        amarillent descripcion mid 115 cm pes 115 grs vire pequeñ marc alar
        color parec vermivor peregrin asoci frecuenci cabez relat grand redond
        pic grues list facial anchas coberter infracaudal amarill adult pile
        gris tint oliv rest region superior verd oliv grisace cej are baj ojo
        color blanc separ mediant list ocul fusc mejill teñ oliv region inferior
        var principal amarill bastant brillant gargant abdom pal principal
        blancuzc amarill bien defin sol pech coberter infracaudal maxil color
        cuern fusc mandibul color cuern pal pat gris individu inmadur parec
        adult ocasion present coberter alar mayor cort opac punt pal reten
        plumaj juvenil cicl anual especi migratori neartic ver distribu cost ric
        distribu regional reproduc canad extrem nort eua inviern peninsul
        yucatan guatemal part central panam rar ocasion nort guatemal fenolog
        usos 1446 nombr cientif onychoprion anaethetus nombr comun charran
        embrid descripcion mid 36 cm pes 100 grs tamañ median espald oscur col
        profund ahorquill disting stern fuscat coll nucal clar manch blanc delg
        frent extiend form list supercili cort epoc cri adult present coronill
        list loreal negr coll nucal gris clar rest region superior gris parduzc
        oscur tod region inferior rectric extern blanc tint gris pech cost pic
        pat negr epoc cri ve rar ocasion cost ric coronill eminent blanc list
        negr part posterior
model-index:
  - name: SentenceTransformer based on hiiamsid/sentence_similarity_spanish_es
    results:
      - task:
          type: information-retrieval
          name: Information Retrieval
        dataset:
          name: Unknown
          type: unknown
        metrics:
          - type: cosine_accuracy@1
            value: 0.7784256559766763
            name: Cosine Accuracy@1
          - type: cosine_accuracy@3
            value: 0.89067055393586
            name: Cosine Accuracy@3
          - type: cosine_accuracy@5
            value: 0.922740524781341
            name: Cosine Accuracy@5
          - type: cosine_accuracy@10
            value: 0.9533527696793003
            name: Cosine Accuracy@10
          - type: cosine_precision@1
            value: 0.7784256559766763
            name: Cosine Precision@1
          - type: cosine_precision@3
            value: 0.2968901846452867
            name: Cosine Precision@3
          - type: cosine_precision@5
            value: 0.18454810495626817
            name: Cosine Precision@5
          - type: cosine_precision@10
            value: 0.09533527696793001
            name: Cosine Precision@10
          - type: cosine_recall@1
            value: 0.7784256559766763
            name: Cosine Recall@1
          - type: cosine_recall@3
            value: 0.89067055393586
            name: Cosine Recall@3
          - type: cosine_recall@5
            value: 0.922740524781341
            name: Cosine Recall@5
          - type: cosine_recall@10
            value: 0.9533527696793003
            name: Cosine Recall@10
          - type: cosine_ndcg@10
            value: 0.8696617098665955
            name: Cosine Ndcg@10
          - type: cosine_mrr@10
            value: 0.8424909759822294
            name: Cosine Mrr@10
          - type: cosine_map@100
            value: 0.8440024185539007
            name: Cosine Map@100
          - type: dot_accuracy@1
            value: 0.7201166180758017
            name: Dot Accuracy@1
          - type: dot_accuracy@3
            value: 0.8790087463556852
            name: Dot Accuracy@3
          - type: dot_accuracy@5
            value: 0.9154518950437318
            name: Dot Accuracy@5
          - type: dot_accuracy@10
            value: 0.9446064139941691
            name: Dot Accuracy@10
          - type: dot_precision@1
            value: 0.7201166180758017
            name: Dot Precision@1
          - type: dot_precision@3
            value: 0.29300291545189505
            name: Dot Precision@3
          - type: dot_precision@5
            value: 0.18309037900874633
            name: Dot Precision@5
          - type: dot_precision@10
            value: 0.09446064139941689
            name: Dot Precision@10
          - type: dot_recall@1
            value: 0.7201166180758017
            name: Dot Recall@1
          - type: dot_recall@3
            value: 0.8790087463556852
            name: Dot Recall@3
          - type: dot_recall@5
            value: 0.9154518950437318
            name: Dot Recall@5
          - type: dot_recall@10
            value: 0.9446064139941691
            name: Dot Recall@10
          - type: dot_ndcg@10
            value: 0.8406159912422888
            name: Dot Ndcg@10
          - type: dot_mrr@10
            value: 0.80640589569161
            name: Dot Mrr@10
          - type: dot_map@100
            value: 0.8085654600526095
            name: Dot Map@100

SentenceTransformer based on hiiamsid/sentence_similarity_spanish_es

This is a sentence-transformers model finetuned from hiiamsid/sentence_similarity_spanish_es. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: hiiamsid/sentence_similarity_spanish_es
  • Maximum Sequence Length: 512 tokens
  • Output Dimensionality: 768 tokens
  • Similarity Function: Cosine Similarity

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("igmochang/CR-biodiversity-preprocessed-sentence-similarity-es")
# Run inference
sentences = [
    '¿qu aspect morfolog plumaj charran embrid permit diferenci especi similar stern fuscat especial epoc cri ?',
    'pes 12 grs empidonax pequeñ caf alas cort redond anill ocul opac adult oliv cafecin encim anill ocul ante angost bien defin barr alar opac caf pal gargant blanc pech present tint parduzc abdom ante amarillent forr alas general coberter infracaudal encend maxil negr mandibul color anaranjadocarn forr boc anaranj pat negruzc especimen juvenil caf tizn opac encim barr alar contrast color ante canel cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc local nort mexic oest panam inviern part central mexic part central panam fenolog usos 1746 nombr cientif vire philadelphicus nombr comun vire amarillent descripcion mid 115 cm pes 115 grs vire pequeñ marc alar color parec vermivor peregrin asoci frecuenci cabez relat grand redond pic grues list facial anchas coberter infracaudal amarill adult pile gris tint oliv rest region superior verd oliv grisace cej are baj ojo color blanc separ mediant list ocul fusc mejill teñ oliv region inferior var principal amarill bastant brillant gargant abdom pal principal blancuzc amarill bien defin sol pech coberter infracaudal maxil color cuern fusc mandibul color cuern pal pat gris individu inmadur parec adult ocasion present coberter alar mayor cort opac punt pal reten plumaj juvenil cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc canad extrem nort eua inviern peninsul yucatan guatemal part central panam rar ocasion nort guatemal fenolog usos 1446 nombr cientif onychoprion anaethetus nombr comun charran embrid descripcion mid 36 cm pes 100 grs tamañ median espald oscur col profund ahorquill disting stern fuscat coll nucal clar manch blanc delg frent extiend form list supercili cort epoc cri adult present coronill list loreal negr coll nucal gris clar rest region superior gris parduzc oscur tod region inferior rectric extern blanc tint gris pech cost pic pat negr epoc cri ve rar ocasion cost ric coronill eminent blanc list negr part posterior',
    'nombr comun sinsont tropical descripcion dors cuerp color gris opac brillant part cabez part ventral blancuzc alas caf negruzc barr angost blanc col delg caf negruzc punt blanc list ocul negr cej blanc pat pic negr rand traylor 1961 sanchez 2003 cicl anual distribu regional sur mexic colombi andes sur brasil peterson chalf 1973 fenolog usos 2509 nombr cientif zanthoxylum melanostictum nombr comun lagart color lagartill descripcion arbol arbust 2 15 m fust poc aguijon ram joven rojiz glabr aguijon escas lenticeladashoj imparipinn 3 7 par foliol opuest elipt ovad 2 102142 08 5268 cm glabr lustros coriace apic cort acumin redond ocasion levement emargin bas obtus bord general enter peciol peciolul rojizosinflorescent panicul terminal 13 cmflor blanc 5 petal frut folicul verruc rojiz obovoid 4 8 mm diametr semill negr 3 6 mmse disting color mor rojiz peciol raquis peciolul fust general carec aguijon escas principal bas cicl anual distribu regional mexic centr amer fenolog floracion observ ener abril agost usos 3117 nombr cientif campnosperm panamens nombr comun descripcion arbol 12 30 m altur rmit ferrugineopuberulent hoj simpl altern cortopeciol oblongoobov 1435 5515 cm apic obtus redond cartac pubescent dens tricom estrell pequeñ escam pelt pard rojiz enves nervadur secundari evidenteinflorescent panicul general axil 40 cm larg flor amarillent pequeñ frut drup triangularovoid 115 0712 cmdiagnost caracteriz hoj agrup final ramit cuy aparient recuerd arbol espavel zapot carenci savi lechos habitat suel aneg permit distingu ademas present ramif simpodial tipic hoj viej torn rojoanaranj ramit hoj enves pubescent dor diminut pel escam particul cicl anual distribu regional hondur panam fenolog flor observ agost octubr frut setiembr octubr usos 2396 nombr cientif micrurus mipartitus',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Preprocess function:

import re
import nltk
from nltk.corpus import stopwords
from nltk.stem import SnowballStemmer
from nltk.tokenize import word_tokenize

# Initialize Spanish stemmer and stopwords
nltk.download('punkt')
nltk.download('stopwords')
spanish_stopwords = set(stopwords.words('spanish'))
stemmer = SnowballStemmer('spanish')

# Function for preprocessing text (lowercase, remove punctuation, stopwords, and apply stemming)
def preprocess_text(text):
    # Convert to lowercase
    text = text.lower()
    # Remove punctuation and special characters
    text = re.sub(r'[^\w\s¿?%]', '', text)
    # Tokenize
    words = word_tokenize(text)
    # Remove stopwords and apply stemming
    words = [stemmer.stem(word) for word in words if word not in spanish_stopwords]
    # Rejoin the words
    return ' '.join(words)

Evaluation

Metrics

Information Retrieval

Metric Value
cosine_accuracy@1 0.7784
cosine_accuracy@3 0.8907
cosine_accuracy@5 0.9227
cosine_accuracy@10 0.9534
cosine_precision@1 0.7784
cosine_precision@3 0.2969
cosine_precision@5 0.1845
cosine_precision@10 0.0953
cosine_recall@1 0.7784
cosine_recall@3 0.8907
cosine_recall@5 0.9227
cosine_recall@10 0.9534
cosine_ndcg@10 0.8697
cosine_mrr@10 0.8425
cosine_map@100 0.844
dot_accuracy@1 0.7201
dot_accuracy@3 0.879
dot_accuracy@5 0.9155
dot_accuracy@10 0.9446
dot_precision@1 0.7201
dot_precision@3 0.293
dot_precision@5 0.1831
dot_precision@10 0.0945
dot_recall@1 0.7201
dot_recall@3 0.879
dot_recall@5 0.9155
dot_recall@10 0.9446
dot_ndcg@10 0.8406
dot_mrr@10 0.8064
dot_map@100 0.8086

Training Details

Training Dataset

Unnamed Dataset

  • Size: 2,748 training samples
  • Columns: sentence_0 and sentence_1
  • Approximate statistics based on the first 1000 samples:
    sentence_0 sentence_1
    type string string
    details
    • min: 14 tokens
    • mean: 24.86 tokens
    • max: 43 tokens
    • min: 323 tokens
    • mean: 508.41 tokens
    • max: 512 tokens
  • Samples:
    sentence_0 sentence_1
    ¿cual caracterist fisic distint esmerejon inclu diferent mach hembr ? 1407 nombr cientif falc columbarius nombr comun esmerejon descripcion mach mid 265 cm pes 160 grs hembr 33 cm 215 grs pequeñ constitu fuert alas puntiagud adult encim gris pizarr mach caf oscur hembr debaj ante list caf oscur profus cabez fin list cuent cej clar traz barr ocul oscur col negruzc 2 o 3 band clar gris mach hembr especimen inmadur parec hembr iris caf oscur cer pat amarill exhib ruf klisklis falc sparverius difier tamañ form accipit joven cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc nort alask canad extrem nort eua inviern sur part central alask sur canad nort amer sur antill especi ampli distribu viej mund fenolog usos 411 nombr cientif tillandsi subulifer nombr comun piñuel parasit descripcion epifitashoj 5 20 cm roset bulbos vain canel lamin 04 08 cm linearsubul involut escap 65 125 cm erect bract larg entrenudosinflorescent erect 5 105 cm simpl terminal 5 9 flor bract floral 18 3 cm verd cort sepal imbric ecarin conspicu nerv sepal 21 26 cm petal rojiz proximal amarill distal bord rojiz capsul 5 73 cmse reconoc facil roset tubul hoj espiral bract floral pequeñ sepal lamin foliar menor 1 cm ancho cicl anual distribu regional nicaragu venezuel trinid fenolog floracion abril juni frut octubr usos 802 nombr cientif liomys salvini nombr comun raton mont descripcion longitud cabez cuerp 103140mm longitud col 97143mm longitud pie 2630mm longitud orej 1216mm pes 3065gtamañ pequeñ median color caf parduzc pal part dorsal siempr gris sombr caf parduzc pel riz color caf amarillent crem tenuement interpuest espin oscur line anaranj cost part ventral pat color crem blanc col bicolor casi igual tamañ longitud cabez cuerp lc liger pelud ningun mechon pel 24mm punt plant pat traser vellud talon cojincill basal cicl anual
    describ morfolog tillandsi subulifer inclu detall hoj inflorescent bract 1407 nombr cientif falc columbarius nombr comun esmerejon descripcion mach mid 265 cm pes 160 grs hembr 33 cm 215 grs pequeñ constitu fuert alas puntiagud adult encim gris pizarr mach caf oscur hembr debaj ante list caf oscur profus cabez fin list cuent cej clar traz barr ocul oscur col negruzc 2 o 3 band clar gris mach hembr especimen inmadur parec hembr iris caf oscur cer pat amarill exhib ruf klisklis falc sparverius difier tamañ form accipit joven cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc nort alask canad extrem nort eua inviern sur part central alask sur canad nort amer sur antill especi ampli distribu viej mund fenolog usos 411 nombr cientif tillandsi subulifer nombr comun piñuel parasit descripcion epifitashoj 5 20 cm roset bulbos vain canel lamin 04 08 cm linearsubul involut escap 65 125 cm erect bract larg entrenudosinflorescent erect 5 105 cm simpl terminal 5 9 flor bract floral 18 3 cm verd cort sepal imbric ecarin conspicu nerv sepal 21 26 cm petal rojiz proximal amarill distal bord rojiz capsul 5 73 cmse reconoc facil roset tubul hoj espiral bract floral pequeñ sepal lamin foliar menor 1 cm ancho cicl anual distribu regional nicaragu venezuel trinid fenolog floracion abril juni frut octubr usos 802 nombr cientif liomys salvini nombr comun raton mont descripcion longitud cabez cuerp 103140mm longitud col 97143mm longitud pie 2630mm longitud orej 1216mm pes 3065gtamañ pequeñ median color caf parduzc pal part dorsal siempr gris sombr caf parduzc pel riz color caf amarillent crem tenuement interpuest espin oscur line anaranj cost part ventral pat color crem blanc col bicolor casi igual tamañ longitud cabez cuerp lc liger pelud ningun mechon pel 24mm punt plant pat traser vellud talon cojincill basal cicl anual
    ¿cual caracterist distint ramif hoj alzate verticillat permit identif ? color caf parduzc pal part dorsal siempr gris sombr caf parduzc pel riz color caf amarillent crem tenuement interpuest espin oscur line anaranj cost part ventral pat color crem blanc col bicolor casi igual tamañ longitud cabez cuerp lc liger pelud ningun mechon pel 24mm punt plant pat traser vellud talon cojincill basal cicl anual distribu regional mexic part central cost ric vertient pacif principal localiz tierr baj 1500msnm fenolog usos 3032 nombr cientif alzate verticillat nombr comun descripcion arbol arbust 4 15 m altur ramit cuadrangular pard rojiz exfoli hoj simpl opuest decus obovadoelipt 915 610 cm apic redond retus sesil subsesil coriac glabrasinflorescent panicul terminal 25 cm larg flor petal lil ros frut tip capsul aplan verd pal 5 8 mm largodiagnost reconoc ramif verticil fust pard exfoli escam hoj coriac semej clusi clusiacea secrecion lechos glabr sesil nervadur secundari evident ramit joven cuadrangular hoj torn anaranj rojiz viej cicl anual distribu regional cost ric suramer fenolog flor observ octubr diciembr frut febrer marz usos siti fald cordiller volcan central utiliz ornamental deb foment pues atract follaj arquitectur 1546 nombr cientif eubucc bourcierii nombr comun barbud cabecirroj descripcion mid 15 cm pes 35 grs robust cabezon dos sex present color llamat pic grues conspicu color amarill mach adult are loreal frent barbill negr rest cabez gargant pech roj profund desvanec form abrupt anaranj pech amarill list verd opac profus region posterior region superior alas col color verd opac separ roj cabez lad cuell mediant barr vertical blanc azul iris roj ladrill pic amarill verdos pat verd oliv hembr muestr gargant verd pal part anterior coronill lad cuell anaranj profund continu faj traves part superior pech rest coronill verd ocrace oscur tint anaranj mejill list cort ojo azul clar part baj pech verd oliv clar
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 10
  • per_device_eval_batch_size: 10
  • num_train_epochs: 2
  • multi_dataset_batch_sampler: round_robin

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 10
  • per_device_eval_batch_size: 10
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1
  • num_train_epochs: 2
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.0
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: False
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • eval_use_gather_object: False
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: round_robin

Training Logs

Epoch Step Training Loss cosine_map@100
0.1818 50 - 0.6806
0.3636 100 - 0.7391
0.5455 150 - 0.7742
0.7273 200 - 0.7927
0.9091 250 - 0.8211
1.0 275 - 0.8162
1.0909 300 - 0.8241
1.2727 350 - 0.8137
1.4545 400 - 0.8318
1.6364 450 - 0.8342
1.8182 500 0.4916 0.8432
2.0 550 - 0.8440

Framework Versions

  • Python: 3.10.12
  • Sentence Transformers: 3.1.1
  • Transformers: 4.44.2
  • PyTorch: 2.4.1+cu121
  • Accelerate: 0.34.2
  • Datasets: 3.0.1
  • Tokenizers: 0.19.1

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}