File size: 59,876 Bytes
4cd873d
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
0bfe83e
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
4cd873d
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
---
base_model: hiiamsid/sentence_similarity_spanish_es
library_name: sentence-transformers
metrics:
- cosine_accuracy@1
- cosine_accuracy@3
- cosine_accuracy@5
- cosine_accuracy@10
- cosine_precision@1
- cosine_precision@3
- cosine_precision@5
- cosine_precision@10
- cosine_recall@1
- cosine_recall@3
- cosine_recall@5
- cosine_recall@10
- cosine_ndcg@10
- cosine_mrr@10
- cosine_map@100
- dot_accuracy@1
- dot_accuracy@3
- dot_accuracy@5
- dot_accuracy@10
- dot_precision@1
- dot_precision@3
- dot_precision@5
- dot_precision@10
- dot_recall@1
- dot_recall@3
- dot_recall@5
- dot_recall@10
- dot_ndcg@10
- dot_mrr@10
- dot_map@100
pipeline_tag: sentence-similarity
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:2748
- loss:MultipleNegativesRankingLoss
widget:
- source_sentence: ¿cual caracterist morfolog distint solanum chrysotrichum inclu
    detall hoj inflorescent frut ?
  sentences:
  - frut subglob cerc 5 9 mm diametr blanc cicl anual distribu regional sur mexic
    suramer fenolog floracion registr marz septiembr frecuent juli usos 3462 nombr
    cientif solanum chrysotrichum nombr comun descripcion arbust 3 m alto escas armad
    tall toment tricom multiangul pedicul larg grues braz central vec alarg acule
    cort rect incurv 2 5 mm larg hoj solitari ampli ovad 40 cm larg apic agud bas
    trunc cord enter lobul salient afelp toment frecuent ferrugine haz hirsut tricom
    estrell sesil braz central larg enves suavement toment tricom multiangul pedicul
    grues nervi principal vec armad peciol 15 cm larg toment vec armad inflorescent
    simpl cim poc ram cad ram racem vari flor lateral peduncul ramific vec primari
    obsolet 15 cm larg cerdosohisp pedicel casi 5 mm larg tricom braz central larg
    inerm caliz casi 5 mm larg toment tricom multiangul lobul 13 longitud lobul angost
    triangular corol 30 50 mm diametr blanc lob 13 longitud lobul ovad pubescent medi
    anter 6 10 mmde larg frut tip bay globos 1 15 cm diametr glabr verd pedicel fructifer
    grues alarg erect semill aplan 22 26 mm diametr cicl anual distribu regional mexic
    panam fenolog fertil año usos 3243 nombr cientif forchhammeri pall nombr comun
    siemprev aceitun blanc descripcion arbol arbust 4 10 m altur ramit glabr hoj simpl
    altern obovadooblong 25104 082 cm apic redond emargin obtus cortomucron glabr
    lustrosasinflorescent rac axilar comprim 4 6 cm larg flor pard crem pequeñ bisexual
    frut tip bay 2 cm diametr esfer amarilloanaranj madur rellen pulp suav jugos sabor
    desagradablel mader amarill paj dens present anatom comun pose floem incluidodiagnost
    especi dificil ubic famili caracteriz hoj pequeñ obov glabr lustr arbol cop dens
    redond plantul brinzal hoj bastant linear contrast individu adult cicl anual distribu
    regional mexic fenolog flor observ ener marz noviembr diciembr
  - peciol aproxim 4 6 mm larg toment jov flor sesil espig subcapit peduncul 15 7
    cm larg frut drup elipsoid 1 3 08 22 cm endocarp 5 surc cicl anual distribu regional
    cost ric bolivi antill fenolog flor sid observ moment frut recolect setiembr octubr
    usos 173 nombr cientif cyathe microdont nombr comun rab mic helech arborescent
    descripcion tronc 15 m alto 58 cm diametr hoj 1217 m larg peciol pard espin espin
    38 mm escam peciol 1020 153 mm angost lanceol pard concolor lev marg clar caspill
    ausent lamin 2pinnadopinnatif apic gradual atenu raquis pard pard clar espin espin
    25 mm glabr pinn pedicul pedicul 02212 cm pinn medi 3050 1520 cm cost pajiz pard
    clar lis espin basal espin 13 mm glabr puberulent pel 0102 mm pardoamarillent
    pinnul 710 1525 cm sesil costul glabr puberulent pel 0102 mm pardoamarillent escam
    escas ausent diminut aplan segment pinnul medi 1725 par 1525 mm ancho serr crenul
    obtus nervadur 913 par segment 1bifurc glabr pel tej lamin nervadur glabr sor
    medi parafis tan larg esporangi conspicu pardoamarillent blanc panam indusi ausent
    cicl anual distribu regional mexic mesoamer colombi venezuel ecuador peru bolivi
    brasil guyan fenolog usos raic utiliz cultiv orquid fabric artesan 2099 nombr
    cientif rhadinae serperast nombr comun hojarasquer rayadaingles strip littersnak
    descripcion miembr gener especi serpient pequeñ median dificil sobrepas 300 mm
    longitud total cuy col represent aproxim 40 cient longitud present 11 2 14 2 dient
    maxilar aument gradual tamañ haci part posterior boc ultim dos grand separ rest
    interespaci pequefi dient mandibular desigual hemipen simpl vari espin ganch proximal
    grand detras cual zon espin porcion distal organ calic form estructur capit sulcus
    spermaticus bifurc cabez apen disting cuell ojo bien pequeñ ia pupil redond cuerp
    cilindr col median larg
  - larg glabr inflorescent rac subumbel cort 10 15 flor opuest hoj principal cerc
    extrem ram glabrescent peduncul ramific 03 1 cm larg pedicel 10 20 mm larg caliz
    2 3 mm larg profund lobul lobul deltoid apical tricom simpl basal glabr corol
    9 12 mm diametr blanc frecuent tint purpure sec profund lobul lobul oblong glabr
    anter casi3 mm larg frut tip bay globos casi 13 cm diametr glabr verdeamarill
    pedicel fructifer acrescent aun delg patent deflex semill aplan 3 mm diametr cicl
    anual distribu regional mexic bolivi fenolog fertil año usos 729 nombr cientif
    dermanur aztec nombr comun murcielag descripcion longitud cabez cuerp 5975 mm
    longitud col 0 mm longitud pie 1114 mm longitud orej 1520 mm longitud antebraz
    4149 mm pes 1533 ges tamañ median part dorsal color caf carbon negruzc part ventral
    liger pal punt pel tenuement escarch pelaj larg 910 mm bland lin facial estrech
    blancuzc clar escarch orej hoj nasal color caf oscur herradur hoj nasal total
    libr uropatagi pequeñ cerc 6 mm form v superfici dorsal pelud bord dens franj
    pat pies pelud cicl anual distribu regional distribu mexic oest panam localiz
    600 3000 msnm fenolog usos 1226 nombr cientif pelecanus occidentalis nombr comun
    alcatraz buchon pelican pard descripcion mid 109 cm pes 3 kg inconfund unic pelican
    comun cost adult pos cuerp caf grisace oscur plum part superior present lustr
    plat cabez cuell blanc pic parduzc bols piel car grisac pat negr epoc reproduct
    cuell principal negr crest nucal castañ present tint amarill cabez piel alrededor
    ojo rojiz pic ostent tint rosace especimen inmadur cabez cuell part superior caf
    abdom blanc alcanz plumaj definit adult despues 3 años cicl anual especi resident
    aunqu individu pued ser migratori neartic distribu regional encuentr cost pacif
    washington nort peru cost islas atlant golf mexic carib carolin nort venezuel
    fenolog usos 2900 nombr cientif aulaxin quadrangul nombr comun liqu
- source_sentence: ¿cual caracterist distint plumaj mosquer agu adult juvenil ?
  sentences:
  - nombr comun mosquer agu descripcion mid 155 cm pes 21 grs negruzc tamañ median
    rar ocasion encuentr lej agu adult muestr cabez cuell mayor part region inferior
    negr opac negr pizarr centr abdom blanc flanc coberter infracaudal gris tizn rest
    region superior pizarr negruzc present 2 barr alar gris secundari tercial bord
    grisace col negruzc vexil extern timoner extern bord blanc pic pat negruzc especimen
    juvenil present plumaj negr parduzc apag abdom barr alar caf canel opac caf ante
    plum espald rabadill flec caf pal cicl anual efectu migracion altitudinal distribu
    regional encuentr suroest eua noroest argentin fenolog usos 1029 nombr cientif
    cheilanth brachypus nombr comun descripcion helech terrestr epipetr rizom cort
    ascendent compact escam 8 15 01 03 mm linear pardoamarillent pardorojiz concolor
    liger bicolor enter marg dispers dentadofrond 10 35 cm larg peciol 1 5 cm larg
    18 15 tamañ frond pard oscur cilindr dens escam pelos escam 1 5 05 1 mm lanceol
    linear pard pardorojiz tricom 1 2 mm blanquecin tortuos lamin 8 30 25 5 cm oblanceol
    1 pinnadopinnatif haz dens pelos tricom casi 1 mm hialin lax patent enves dens
    escam pelos superfici visibl tricom escam anaranjadorojiz pinn 10 21 par 12 25
    06 13 cm equilater delt lanceol raquis negr ocult dens cubiert tricom escam nervadur
    ocult visibl indusi reflex escari enter decurrentecheilanth brachypus caracteriz
    lamin 1 pinnadopinnatif oblanceol dens escam enves mesoamer especi c bonariensis
    unic especi cheilanth lamin 1 pinnadopinnatif cicl anual distribu regional mexic
    mesoamer fenolog usos 2778 nombr cientif caripi montagnei nombr comun descripcion
    cuerp fructifer 05 25 cm alto form cop alarg extrem superior aplan 05 15 cm diametr
    blanc beig rellen context sol color blanc pose olor sabor distint
  - orej casi desnud unid band pequeñ cruz superfici cabez car desnud hoj nasal pequeñ
    herradur complet fusion labi superior barbill acanal bord hiler diminut verrug
    col cort mid men mit longitud uropatagi antebraz desnud alas cort anchas unid
    pat cerc bas ded pat desnud calcane larg pat cicl anual distribu regional hondur
    bolivi norest argentin guyan brasil localiz tierr baj 600 msnm fenolog usos 420
    nombr cientif aechme angustifoli nombr comun piñuel epifit parasit descripcion
    epifitahoj 19 685 cm lamin 12 35 4 cm agud acumin escap 225 58 63 cm erect bract
    superior larg entrenud inferior cort espinososerradasinflorescent 45 235 cm unipinn
    bipinn basal bract primari espinososerr distal espig 4 9 flor distic bract floral
    04 06 cm larg igual longitud entrenud flor sesil sepal 5 9 mm mucron petal amarilloss
    reconoc tamañ flor inflorescent cicl anual distribu regional nicaragu ecuador
    peru bolivi fenolog floracion observ ener febrer noviembr frut observ marz octubr
    usos 682 nombr cientif centronycteris centralis nombr comun murcielag descripcion
    longitud cabez cuerp 4959 mm longitud col 2024 mm longitud pie 79 mm longitud
    orej 1719 mm longitud antebraz 4349 mm pes 56 gcuerp color amarill sombr caf parduzc
    part inferior cuart traser uropatagi color caf anaranj pelaj larg espes orej larg
    form hoz punt piel car ros membran negruzc uropatagi larg pelud bas calcane larg
    alas lig pat bas ded sac aere cicl anual distribu regional mexic peru guyan brasil
    tierr baj sol fenolog usos 1980 nombr cientif ctenosaur quinquecarinat nombr comun
    garrob ingles spiny tail iguan descripcion lagartij grand alcanz 350 mm hc hembr
    pequeñ adult col alcanz casi dobl larg rest cuerp cabez disting cuell miembr robust
    muscul escam region dorsal pequeñ apen imbric debil quill except aquell part dorsal
    miembr grand fuertement quill escam ventral lis
  - sorali comun granular submarginal isidi pustul ausent apoteci rar observ cicl
    anual distribu regional pantropical extend region templ adyacent fenolog usos
    25 nombr cientif tabebui ochrace nombr comun cortez amarill cortez amarillapiuv
    tarum brasil descripcion arbol 25 m 50 cm med altur pech dap fust cortez surc
    profund separ ram joven pubescent hoj digit 5 foliol aserr enter membranace pubescent
    glaucoamarillent enves oblongoobov oblongoelipt abrupt acumin bas obtus trunc
    foliol terminal 522 18144 cm par intermedi 42198 14132 cm pubescent estrell ferrugineoamarillent
    ambas superfici peciol 618 cm larg lanos pubescent peciolul 0258 cm larg inflorescent
    panicul terminal pubescent flor dulc fraganci caliz campanul 5 lobul gran cantid
    pubescent lanos amarillent corol tubul amarill lin rojiz cuell tub usual parduzc
    483 cm larg frut capsul lin cilindr delg extrem 1135 118 cm lanos pubescent semill
    0408 1829 cm alad especi comun dentr gener reconoc pos hoj sol 5 foliol dens pubescent
    estrell principal enves asi peciol ram joven enves ademas glauc amarillent cicl
    anual distribu regional centroamer hondur guatemal nort suramer brasil ytrinid
    fenolog flor observ ener juni produc anual gran cantid plantul usos mader pard
    oscur parec tabebui guayac pes dur cort alta resistent mecan larg durabil aun
    baj condicion favor pudricion mader propi usos extern post durmient ferrocarril
    acab construccion civil bol bolich asim bell floracion sid plant ornamental pais
    distribu natural especi adapt siti sec util preservavion mejor are degrad altas
    pendient lorenzi 1949 2608 nombr cientif tabanus unistriatus nombr comun taban
    descripcion hind tibia without apical spurs basicost with strong seta as dens
    as thos on the adjoining cost vertex without tubercl scutellum and posterior margin
    of the mesoscutum without black velvety spot body not wholly black subcallus bar
    and shiny abdom black or dark brown with singl prominent pal middorsal strip covering
    tergit 16 frons over 6 tim as high as the basal width wing somewhat smoky along
    the forebord and apex cicl anual distribu regional guatemal to ecuador ? guyan
    ? peru fenolog usos
- source_sentence: explic distribu geograf especi mencion context import control serpient
    venen viper
  sentences:
  - cuerp cilindr col median larg escam cefal comprend rostral dos internasal dos
    prefrontal frontal dos parietal loreal nasal preocul dos postocular present 22
    6 23 temporal 8 o 9 supralabial 8 infralabial present dos par geneial 19 hiler
    escam dorsal diferent import congener c scytalin reduccion lis foset apical ventral
    redond ia plac anal present enter subcaudal divid color uniform band transversal
    cefal nucal juvenil color complet diferent cons color fond roj cuerp band nucal
    amarill clar cabez negr cicl anual distribu regional yucatan mexic nort argentin
    fenolog usos sistem inmunolog capaz soport vari cc venen bothrops hac potencial
    interes medic especi sirv control serpient venen viper 2687 nombr cientif euphori
    candezei nombr comun escarabaj frut descripcion cuerp 175 232 mm longitud 92 122
    mm ancho color dorsal ventral cuerp inclu pigidi pat verd vidrios rar aparec individu
    tonal rojiz bastant llamat pronot elitr lis present puntuacion llamat part superior
    mientr part posterior elitr pigidi present rug ondul bastant caracterist present
    sed blanquecin especial evident are ventral bord anterior clipe present par dient
    dirig haci arrib dorsal cabez concav are correspondient frent clipe lev elev longitudinal
    part central anten mach present maz antenal volumin hembr pronot present carin
    lateral bien marc complet bord posterior present escotadur correspondient bord
    anterior escutel grand expuest tibi anterior present tres dient extern evident
    tibi anterior mach tiend ser estiliz hembr femur medi posterior present ventral
    carin longitudinal clar defin cerc bord posterior sal hiler sed tibi medi posterior
    present evident hiler sed junt relat larg bord intern dorsal cox medi bien separ
    tubercul mesosternal relat ancho form pentagonal vist ventral fig propleur quill
    pronunci cercan paralel sutur sep preproestern diferenci sex mach present anten
    maz volumin hembr figs abdom vist perfil tiend ser concav mientr hembr tiend ser
    rect convex ademas tibi anterior mach tiend ser estiliz hembr cicl anual distribu
    regional especi distribu ampli haci nort mientr sur sol sid hall panam
  - larg apic agud acumin bas obtus redond enter vec afelp haz dispers tricom porrect
    subsesil enves suavement toment tricom multiangul pedicul nervi principal vec
    armad peciol 3 cm larg toment mayor armad inflorescent rac amonton 4 12 flor lateral
    toment tricom estrell sesil cort pedicel inerm menud inconspicu armad peduncul
    1 cm larg vec bifurc pedicel 10 mm larg caliz casi 3 mm larg lobul cerc mit longitud
    lobul angost sen redond toment tricom multiangul corol 15 mm diametr blanc azul
    profund lobul lobul angost pubescent asi distal anter 5 mm larg frut tip bay globos
    08 s 1 cm diametr glabr anaranj lustros madur pedicel fructifer acrescent delg
    expand distal erect semill aplan casi 3 mm diametr cicl anual distribu regional
    mexic panam ecuador fenolog fertil may setiembr usos 3284 nombr cientif sagittari
    lancifoli nombr comun descripcion hierb perenn emergent provenient rizom monoic
    hoj distint distic erect peciol cerc 100 cm larg lamin 83550 0441521 cm lin ovad
    elipt atenu baseinflorescent bisexual emergent 6 13 verticil simpl ramific cad
    3 flor flor 20 o estambr flor estamin estambr esteril flor pistil pistil esteril
    ausent flor estamin cabez frutal 811 1115 mm pedicel ascendent sepal reflex papil
    aqueni 16 25 mm larg car lateral 1 glandul pic erect 03 07 mm larg cicl anual
    distribu regional surest unid ecuador brasil antill fenolog floracion año usos
    2498 nombr cientif hyperbaen leptobotry nombr comun descripcion arbust arbol 3
    6 mhoj coriac lustr glabr elipticooblong ovadolanceol mid 7 205 35 87 cm 5 8 par
    nervi secundari venacion terciari irregular reticul marg enteroondul apic acumin
    bas estrech redond
  - zanthoxylum fag l sarg var culantrill crec fald cordiller guanac til elev 600
    1300 m pose mayor aparient arbol poc aguijon fust aguijon ram raquis levement
    alad panicul 11 cm standley 1937 trat zanthoxylum insular cicl anual distribu
    regional mexic sur amer antill fenolog floracion observ febrer usos 697 nombr
    cientif glyphonycteris daviesi nombr comun murcielag descripcion longitud cabez
    cuerp 6384 mm longitud col 511 mm longitud pie 1720 mm longitud orej 2731 mm longitud
    antebraz 5458 mm pes 1930 ges especi mayor tamañ dentr gener sol par incis grand
    tan larg canin part dorsal color caf parduzc oscur part ventral liger pal pelaj
    larg lanud orej larg extrem punt labi barbill bastant pelud barbill acanal bord
    cojincill lis form v col cort mid cerc mit longitud uropatagi calcane pequeñ pat
    pat larg moder pelud cicl anual distribu regional hondur peru guyan brasil bolivi
    localiz sol tierr baj fenolog usos 1583 nombr cientif sclerurus albigularis nombr
    comun tirahoj gargantigr descripcion mid 17 cm pes 38 grs sclerurus grand muestr
    contr distint gris gargant pech ruf adult muestr pile caf oscur lev escam grues
    negruzc espald coberter alar caf castañ oscur torn caf oscur remer castañ rabadill
    coberter supracaudal col negruzc lad cabez oliv grisace oscur cost flanc region
    infracaudal color caf castañ oscur maxil negr mandibul color cuern punt negruzc
    pat negr cafecin ejemplar juvenil similar pech opac oscur gargant oscur escam
    fusc cicl anual distribu regional encuentr cost ric nort bolivi guyan trinid tobag
    fenolog usos 210 nombr cientif cyathe squarros
- source_sentence: describ caracterist morfolog werauhi kathya inclu detall hoj inflorescent
    flor
  sentences:
  - color cuerp negr pard oscur aparient pul levisim brill verd casi impercept mayor
    especimen especimen lad pacif cost ric aparient levement opac lad atlant general
    cuerp lis dorsal carent set bord anterior cabez dos dient relat junt ver figur
    abaj are dorsal ojos bastant ampli relacion especi gener cost ric ver figur abaj
    fov lateral pronot circular alarg form surc escutel visibl cad elitr present 9
    estri visibl inclu supraepipleural carec carin lateral elitr supraepipleural pigidi
    muestr carin basal bien marc denticul ventral bord anterolateral protorax ausent
    ver figur abaj carin proepimeral protorax present complet ver figur abaj tibi
    anterior muestr 3 dient bord extern bord intern rect ver figur abaj espolon apical
    tibi bif diferent hembr simpl ver figur abaj tars anterior present tod especi
    gener ver figur abaj tibi medi posterior delg curv escas expand haci extrem ver
    figur abaj prim tars pat posterior longitud normal larg segund form triangul ver
    figur abaj ventral femur posterior present carin longitudinal cerc bord anterior
    carin cerc bord posterior ver figur abaj diagnosis hembr semej mach except espolon
    apical tibi anterior simpl bif ver figur abaj ademas ultim segment abdominal ancho
    medial mach cicl anual colect mes año are distribu lad atlant pacif distribu regional
    encuentr ademas belic nicaragu panam colombi brasil ecuador fenolog usos 3283
    nombr cientif echinodorus bolivianus nombr comun descripcion hierb anual rizomat
    plant fertil emergent mayor frecuenci crec var riber humed cerc 30 cm altur hoj
    sumerg emergent peciol 1 725 cm larg lamin 13 722 cm larg lin linearlanceol atenu
    bas marc peluc inflorescent 1 o 23 verticil simpl cad 4 11 flor pedicel 08 355
    cm larg flor sepal 28 43 mm larg 89 estambr pistil cerc 20 cabez frutal 153 254
    mm simil anill encerr total sepal aqueni 1 17 mm larg usual 2 o 3 costill bien
    desarroll car vec ausent cicl anual distribu regional unid nort argentin trinid
    antill fenolog flor ener may usos
  - bract floral 04 07 cm cort casi igual entrenud flor sesil sepal 5 8 mm mucron
    petal blanc bay 1 2 cm negrasmuy simil especi gener ronnbergi cual pued ser dificil
    distingu veget autor inclus suger posibil unir nuev ambos gener cicl anual distribu
    regional cost ric panam fenolog fructif observ agost ener usos 680 nombr cientif
    cormur brevirostris nombr comun murcielag descripcion longitud cabez cuerp 4658mm
    longitud col 1016mm longitud pie 58mm longitud orej 1316mm longitud antebraz 4550mm
    pes 711gpart dorsal ric color caf castañ negruzc juvenil subadult part ventral
    liger pal pelaj espes brillant piel car orej negruzc trag ancho nariz cort pel
    casi punt membran negr alas unid pat bas ded sac aere grand abertur extiend bord
    ala cicl anual distribu regional nicaragu peru brasil tierr baj 1000msnm fenolog
    usos 1078 nombr cientif kogi sim nombr comun cachalot enan dwarf sperm whal descripcion
    signific menor kogi breviceps pues promedi 28 m longitud 260 kg pes dors gris
    oscur vientr blanc cost color blanc grisace alet pectoral gris oscur alet dorsal
    proporcional cuerp tamañ sol liger posterior mit cuerp igual k breviceps present
    hocic fuertement trunc ojo alet pectoral plieg piel semej agall abertur branquial
    fals natural ningun relacion pec cicl anual especi ocasional aunqu divers epoc
    año anterior situacion pued trat especi resident rar escas distribu regional agu
    tropical templ planet aunqu falt mediterrane mar negr mar roj golf persic fenolog
    usos japon isla san vicent antill menor caz carn 1637 nombr cientif myiodynast
    hemichrysus nombr comun pech amarill mosquer ventridor descripcion mid 20 cm pes
    41 grs difier mosquer tip pitangus sulphuratus list mal oscur adult muestr coronill
    gris oscur fin list negr manch amarill brillant ocult rest region oliv verdos
    oscur alas col fusc bord tercial amarill pal remer coberter alar angost color
    canel present list negruzc grues are loreal auricular bord cej list blanc mejill
    list mal fusc grues barbill blanc rest region inferior amarill brillant pic pat
    negr
  - maxim 24 dient n richardi abdom larg 607 % longitud estand vs 493568 % color clar
    miembr atenu generotien pat traser angost 41 % longitud estand vs 445o % especi
    cost ric ded pat traser cort 3er ded 0917 % pat delanter traser sindactil 4 ded
    pat delanter 5 ded pat traser ded pat traser extern sol perfil extern surc punt
    digit libr punt redondeadastien fos nasal larg ancho cabez 40 vec diametr fos
    nasal compar tamañ n richardi grand miembr gener cost ric cicl anual distribu
    regional fenolog usos 1894 nombr cientif pselliophorus tibialis nombr comun salton
    musl amarill descripcion 185 cm 31 g oscur delg col larg musl amarill esponj pic
    bien larg delg aspect atlapet adult pile part atras nuc negr rest part arrib negr
    pizarr gargant negruzc pas pizarr negruzc rest region inferior pech abdom teñ
    verd oliv iris castañ pic negr pat fusc individu present pequeñ manch amarill
    bord hombr juvenil parec opac encim color negr tizn debaj present fuert tint cafecin
    musl caf oliv pal cicl anual distribu regional encuentr cost ric oest panam fenolog
    usos 44 nombr cientif werauhi kathya nombr comun piñuel parasit epifit descripcion
    epifit terrestr caulescent hoj 15 45 cm larg atenu cartac papel quebradiz vain
    24 39 cm caf oscur lepidot lamin 10 19 cm glabr lepidot lin longitudinal oscur
    escap 22 37 cm larg erect curvadoerect bract verdecrem larg entrenudosinflorescent
    erect 2 5 cm larg 1pinn bract primari larg ram lateral estos sesil casi sesil
    dos tres flor colateral bract floral 13 18 cm larg verdecrem ovad oblong carin
    glabr lepidot membranac cartaceasflor sesil sepal 06 10 cm larg coriace petal
    crem verdecrem 17 20 cm largocapsul 17 25 cm larg com semill canel cicl anual
    distribu regional
- source_sentence: ¿qu aspect morfolog plumaj charran embrid permit diferenci especi
    similar stern fuscat especial epoc cri ?
  sentences:
  - nombr comun sinsont tropical descripcion dors cuerp color gris opac brillant part
    cabez part ventral blancuzc alas caf negruzc barr angost blanc col delg caf negruzc
    punt blanc list ocul negr cej blanc pat pic negr rand traylor 1961 sanchez 2003
    cicl anual distribu regional sur mexic colombi andes sur brasil peterson chalf
    1973 fenolog usos 2509 nombr cientif zanthoxylum melanostictum nombr comun lagart
    color lagartill descripcion arbol arbust 2 15 m fust poc aguijon ram joven rojiz
    glabr aguijon escas lenticeladashoj imparipinn 3 7 par foliol opuest elipt ovad
    2 102142 08 5268 cm glabr lustros coriace apic cort acumin redond ocasion levement
    emargin bas obtus bord general enter peciol peciolul rojizosinflorescent panicul
    terminal 13 cmflor blanc 5 petal frut folicul verruc rojiz obovoid 4 8 mm diametr
    semill negr 3 6 mmse disting color mor rojiz peciol raquis peciolul fust general
    carec aguijon escas principal bas cicl anual distribu regional mexic centr amer
    fenolog floracion observ ener abril agost usos 3117 nombr cientif campnosperm
    panamens nombr comun descripcion arbol 12 30 m altur rmit ferrugineopuberulent
    hoj simpl altern cortopeciol oblongoobov 1435 5515 cm apic obtus redond cartac
    pubescent dens tricom estrell pequeñ escam pelt pard rojiz enves nervadur secundari
    evidenteinflorescent panicul general axil 40 cm larg flor amarillent pequeñ frut
    drup triangularovoid 115 0712 cmdiagnost caracteriz hoj agrup final ramit cuy
    aparient recuerd arbol espavel zapot carenci savi lechos habitat suel aneg permit
    distingu ademas present ramif simpodial tipic hoj viej torn rojoanaranj ramit
    hoj enves pubescent dor diminut pel escam particul cicl anual distribu regional
    hondur panam fenolog flor observ agost octubr frut setiembr octubr usos 2396 nombr
    cientif micrurus mipartitus
  - larg lamin 22 45 65 05 1 2 25 cm linearelipt lin atenu ambos extrem coriace lustros
    marg comun revolut raquis pajiz pard ven lateral evident sor redond 1 3 4 seri
    cost marg cicl anual distribu regional cost ric panam colombi venezuel ecuador
    peru bolivi fenolog usos 144 nombr cientif croton ortholobus nombr comun targu
    descripcion arbust 3 m altur hoj elipt ovad lanceol 3 10 cm larg 15 7 cm ancho
    peciol 2 glandul apic marg levement aserr inflorescent bisexual racem espig 4
    7 cm larg frut 4 6 mm longituds reconoc hoj levement aserr peciol glandular estipul
    linear inflorescent flor solitari sosten bract linear cicl anual distribu regional
    hondur nicaragu fenolog usos 3017 nombr cientif gymnospori haberian nombr comun
    descripcion arbol 5 30 m altur ramit verd pal verd amarillent estipul diminut
    rojiz hoj simpl altern 812 46 cm elipt apic acumin agud glabr bord enteroinflorescent
    cim axilar 20 flor flor verd 45 7 mm ancho frut tip capsul 1 115 cm amarillent
    glob 2 4 lobul semill pard aril blancos caracteriz hoj sec adquier ton verd amarillent
    bas general redond bord levement revolut rasg taxonom recuerd gener maytenus dificil
    separ rasp cortez tronc ramit raic epidermis amarillent amarill encend mayor especi
    famili g haberian caracterist vec not direct bas tronc hab rasp cortez cicl anual
    distribu regional mexic estacion biolog tuxtl veracruz fenolog flor observ febrer
    juli frut ener marz diciembr usos 321 nombr cientif vriese marnierlapostollei
    nombr comun piñuel epifit parasit descripcion epifitashoj 8 15 21 cm acumin agud
    apicul membranac subcartac vain 2 4 cm canelacrem esparcid lepidot lamin 13 26
    cm esparcid lepidot lin longitudinal mor escap 16 22 26 cm erect curvadoerect
  - pes 12 grs empidonax pequeñ caf alas cort redond anill ocul opac adult oliv cafecin
    encim anill ocul ante angost bien defin barr alar opac caf pal gargant blanc pech
    present tint parduzc abdom ante amarillent forr alas general coberter infracaudal
    encend maxil negr mandibul color anaranjadocarn forr boc anaranj pat negruzc especimen
    juvenil caf tizn opac encim barr alar contrast color ante canel cicl anual especi
    migratori neartic ver distribu cost ric distribu regional reproduc local nort
    mexic oest panam inviern part central mexic part central panam fenolog usos 1746
    nombr cientif vire philadelphicus nombr comun vire amarillent descripcion mid
    115 cm pes 115 grs vire pequeñ marc alar color parec vermivor peregrin asoci frecuenci
    cabez relat grand redond pic grues list facial anchas coberter infracaudal amarill
    adult pile gris tint oliv rest region superior verd oliv grisace cej are baj ojo
    color blanc separ mediant list ocul fusc mejill teñ oliv region inferior var principal
    amarill bastant brillant gargant abdom pal principal blancuzc amarill bien defin
    sol pech coberter infracaudal maxil color cuern fusc mandibul color cuern pal
    pat gris individu inmadur parec adult ocasion present coberter alar mayor cort
    opac punt pal reten plumaj juvenil cicl anual especi migratori neartic ver distribu
    cost ric distribu regional reproduc canad extrem nort eua inviern peninsul yucatan
    guatemal part central panam rar ocasion nort guatemal fenolog usos 1446 nombr
    cientif onychoprion anaethetus nombr comun charran embrid descripcion mid 36 cm
    pes 100 grs tamañ median espald oscur col profund ahorquill disting stern fuscat
    coll nucal clar manch blanc delg frent extiend form list supercili cort epoc cri
    adult present coronill list loreal negr coll nucal gris clar rest region superior
    gris parduzc oscur tod region inferior rectric extern blanc tint gris pech cost
    pic pat negr epoc cri ve rar ocasion cost ric coronill eminent blanc list negr
    part posterior
model-index:
- name: SentenceTransformer based on hiiamsid/sentence_similarity_spanish_es
  results:
  - task:
      type: information-retrieval
      name: Information Retrieval
    dataset:
      name: Unknown
      type: unknown
    metrics:
    - type: cosine_accuracy@1
      value: 0.7784256559766763
      name: Cosine Accuracy@1
    - type: cosine_accuracy@3
      value: 0.89067055393586
      name: Cosine Accuracy@3
    - type: cosine_accuracy@5
      value: 0.922740524781341
      name: Cosine Accuracy@5
    - type: cosine_accuracy@10
      value: 0.9533527696793003
      name: Cosine Accuracy@10
    - type: cosine_precision@1
      value: 0.7784256559766763
      name: Cosine Precision@1
    - type: cosine_precision@3
      value: 0.2968901846452867
      name: Cosine Precision@3
    - type: cosine_precision@5
      value: 0.18454810495626817
      name: Cosine Precision@5
    - type: cosine_precision@10
      value: 0.09533527696793001
      name: Cosine Precision@10
    - type: cosine_recall@1
      value: 0.7784256559766763
      name: Cosine Recall@1
    - type: cosine_recall@3
      value: 0.89067055393586
      name: Cosine Recall@3
    - type: cosine_recall@5
      value: 0.922740524781341
      name: Cosine Recall@5
    - type: cosine_recall@10
      value: 0.9533527696793003
      name: Cosine Recall@10
    - type: cosine_ndcg@10
      value: 0.8696617098665955
      name: Cosine Ndcg@10
    - type: cosine_mrr@10
      value: 0.8424909759822294
      name: Cosine Mrr@10
    - type: cosine_map@100
      value: 0.8440024185539007
      name: Cosine Map@100
    - type: dot_accuracy@1
      value: 0.7201166180758017
      name: Dot Accuracy@1
    - type: dot_accuracy@3
      value: 0.8790087463556852
      name: Dot Accuracy@3
    - type: dot_accuracy@5
      value: 0.9154518950437318
      name: Dot Accuracy@5
    - type: dot_accuracy@10
      value: 0.9446064139941691
      name: Dot Accuracy@10
    - type: dot_precision@1
      value: 0.7201166180758017
      name: Dot Precision@1
    - type: dot_precision@3
      value: 0.29300291545189505
      name: Dot Precision@3
    - type: dot_precision@5
      value: 0.18309037900874633
      name: Dot Precision@5
    - type: dot_precision@10
      value: 0.09446064139941689
      name: Dot Precision@10
    - type: dot_recall@1
      value: 0.7201166180758017
      name: Dot Recall@1
    - type: dot_recall@3
      value: 0.8790087463556852
      name: Dot Recall@3
    - type: dot_recall@5
      value: 0.9154518950437318
      name: Dot Recall@5
    - type: dot_recall@10
      value: 0.9446064139941691
      name: Dot Recall@10
    - type: dot_ndcg@10
      value: 0.8406159912422888
      name: Dot Ndcg@10
    - type: dot_mrr@10
      value: 0.80640589569161
      name: Dot Mrr@10
    - type: dot_map@100
      value: 0.8085654600526095
      name: Dot Map@100
---

# SentenceTransformer based on hiiamsid/sentence_similarity_spanish_es

This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [hiiamsid/sentence_similarity_spanish_es](https://huggingface.co/hiiamsid/sentence_similarity_spanish_es). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

## Model Details

### Model Description
- **Model Type:** Sentence Transformer
- **Base model:** [hiiamsid/sentence_similarity_spanish_es](https://huggingface.co/hiiamsid/sentence_similarity_spanish_es) <!-- at revision 66ab46adac3910bb6ea6085b962a25e49513b981 -->
- **Maximum Sequence Length:** 512 tokens
- **Output Dimensionality:** 768 tokens
- **Similarity Function:** Cosine Similarity
<!-- - **Training Dataset:** Unknown -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->

### Model Sources

- **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
- **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
- **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)

### Full Model Architecture

```
SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)
```

## Usage

### Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

```bash
pip install -U sentence-transformers
```

Then you can load this model and run inference.
```python
from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("igmochang/CR-biodiversity-preprocessed-sentence-similarity-es")
# Run inference
sentences = [
    '¿qu aspect morfolog plumaj charran embrid permit diferenci especi similar stern fuscat especial epoc cri ?',
    'pes 12 grs empidonax pequeñ caf alas cort redond anill ocul opac adult oliv cafecin encim anill ocul ante angost bien defin barr alar opac caf pal gargant blanc pech present tint parduzc abdom ante amarillent forr alas general coberter infracaudal encend maxil negr mandibul color anaranjadocarn forr boc anaranj pat negruzc especimen juvenil caf tizn opac encim barr alar contrast color ante canel cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc local nort mexic oest panam inviern part central mexic part central panam fenolog usos 1746 nombr cientif vire philadelphicus nombr comun vire amarillent descripcion mid 115 cm pes 115 grs vire pequeñ marc alar color parec vermivor peregrin asoci frecuenci cabez relat grand redond pic grues list facial anchas coberter infracaudal amarill adult pile gris tint oliv rest region superior verd oliv grisace cej are baj ojo color blanc separ mediant list ocul fusc mejill teñ oliv region inferior var principal amarill bastant brillant gargant abdom pal principal blancuzc amarill bien defin sol pech coberter infracaudal maxil color cuern fusc mandibul color cuern pal pat gris individu inmadur parec adult ocasion present coberter alar mayor cort opac punt pal reten plumaj juvenil cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc canad extrem nort eua inviern peninsul yucatan guatemal part central panam rar ocasion nort guatemal fenolog usos 1446 nombr cientif onychoprion anaethetus nombr comun charran embrid descripcion mid 36 cm pes 100 grs tamañ median espald oscur col profund ahorquill disting stern fuscat coll nucal clar manch blanc delg frent extiend form list supercili cort epoc cri adult present coronill list loreal negr coll nucal gris clar rest region superior gris parduzc oscur tod region inferior rectric extern blanc tint gris pech cost pic pat negr epoc cri ve rar ocasion cost ric coronill eminent blanc list negr part posterior',
    'nombr comun sinsont tropical descripcion dors cuerp color gris opac brillant part cabez part ventral blancuzc alas caf negruzc barr angost blanc col delg caf negruzc punt blanc list ocul negr cej blanc pat pic negr rand traylor 1961 sanchez 2003 cicl anual distribu regional sur mexic colombi andes sur brasil peterson chalf 1973 fenolog usos 2509 nombr cientif zanthoxylum melanostictum nombr comun lagart color lagartill descripcion arbol arbust 2 15 m fust poc aguijon ram joven rojiz glabr aguijon escas lenticeladashoj imparipinn 3 7 par foliol opuest elipt ovad 2 102142 08 5268 cm glabr lustros coriace apic cort acumin redond ocasion levement emargin bas obtus bord general enter peciol peciolul rojizosinflorescent panicul terminal 13 cmflor blanc 5 petal frut folicul verruc rojiz obovoid 4 8 mm diametr semill negr 3 6 mmse disting color mor rojiz peciol raquis peciolul fust general carec aguijon escas principal bas cicl anual distribu regional mexic centr amer fenolog floracion observ ener abril agost usos 3117 nombr cientif campnosperm panamens nombr comun descripcion arbol 12 30 m altur rmit ferrugineopuberulent hoj simpl altern cortopeciol oblongoobov 1435 5515 cm apic obtus redond cartac pubescent dens tricom estrell pequeñ escam pelt pard rojiz enves nervadur secundari evidenteinflorescent panicul general axil 40 cm larg flor amarillent pequeñ frut drup triangularovoid 115 0712 cmdiagnost caracteriz hoj agrup final ramit cuy aparient recuerd arbol espavel zapot carenci savi lechos habitat suel aneg permit distingu ademas present ramif simpodial tipic hoj viej torn rojoanaranj ramit hoj enves pubescent dor diminut pel escam particul cicl anual distribu regional hondur panam fenolog flor observ agost octubr frut setiembr octubr usos 2396 nombr cientif micrurus mipartitus',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
```

Preprocess function:
```python
import re
import nltk
from nltk.corpus import stopwords
from nltk.stem import SnowballStemmer
from nltk.tokenize import word_tokenize

# Initialize Spanish stemmer and stopwords
nltk.download('punkt')
nltk.download('stopwords')
spanish_stopwords = set(stopwords.words('spanish'))
stemmer = SnowballStemmer('spanish')

# Function for preprocessing text (lowercase, remove punctuation, stopwords, and apply stemming)
def preprocess_text(text):
    # Convert to lowercase
    text = text.lower()
    # Remove punctuation and special characters
    text = re.sub(r'[^\w\s¿?%]', '', text)
    # Tokenize
    words = word_tokenize(text)
    # Remove stopwords and apply stemming
    words = [stemmer.stem(word) for word in words if word not in spanish_stopwords]
    # Rejoin the words
    return ' '.join(words)
```


<!--
### Direct Usage (Transformers)

<details><summary>Click to see the direct usage in Transformers</summary>

</details>
-->

<!--
### Downstream Usage (Sentence Transformers)

You can finetune this model on your own dataset.

<details><summary>Click to expand</summary>

</details>
-->

<!--
### Out-of-Scope Use

*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->

## Evaluation

### Metrics

#### Information Retrieval

* Evaluated with [<code>InformationRetrievalEvaluator</code>](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator)

| Metric              | Value     |
|:--------------------|:----------|
| cosine_accuracy@1   | 0.7784    |
| cosine_accuracy@3   | 0.8907    |
| cosine_accuracy@5   | 0.9227    |
| cosine_accuracy@10  | 0.9534    |
| cosine_precision@1  | 0.7784    |
| cosine_precision@3  | 0.2969    |
| cosine_precision@5  | 0.1845    |
| cosine_precision@10 | 0.0953    |
| cosine_recall@1     | 0.7784    |
| cosine_recall@3     | 0.8907    |
| cosine_recall@5     | 0.9227    |
| cosine_recall@10    | 0.9534    |
| cosine_ndcg@10      | 0.8697    |
| cosine_mrr@10       | 0.8425    |
| **cosine_map@100**  | **0.844** |
| dot_accuracy@1      | 0.7201    |
| dot_accuracy@3      | 0.879     |
| dot_accuracy@5      | 0.9155    |
| dot_accuracy@10     | 0.9446    |
| dot_precision@1     | 0.7201    |
| dot_precision@3     | 0.293     |
| dot_precision@5     | 0.1831    |
| dot_precision@10    | 0.0945    |
| dot_recall@1        | 0.7201    |
| dot_recall@3        | 0.879     |
| dot_recall@5        | 0.9155    |
| dot_recall@10       | 0.9446    |
| dot_ndcg@10         | 0.8406    |
| dot_mrr@10          | 0.8064    |
| dot_map@100         | 0.8086    |

<!--
## Bias, Risks and Limitations

*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->

<!--
### Recommendations

*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->

## Training Details

### Training Dataset

#### Unnamed Dataset


* Size: 2,748 training samples
* Columns: <code>sentence_0</code> and <code>sentence_1</code>
* Approximate statistics based on the first 1000 samples:
  |         | sentence_0                                                                         | sentence_1                                                                            |
  |:--------|:-----------------------------------------------------------------------------------|:--------------------------------------------------------------------------------------|
  | type    | string                                                                             | string                                                                                |
  | details | <ul><li>min: 14 tokens</li><li>mean: 24.86 tokens</li><li>max: 43 tokens</li></ul> | <ul><li>min: 323 tokens</li><li>mean: 508.41 tokens</li><li>max: 512 tokens</li></ul> |
* Samples:
  | sentence_0                                                                            | sentence_1                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                |
  |:--------------------------------------------------------------------------------------|:----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
  | <code>¿cual caracterist fisic distint esmerejon inclu diferent mach hembr ?</code>    | <code>1407 nombr cientif falc columbarius nombr comun esmerejon descripcion mach mid 265 cm pes 160 grs hembr 33 cm 215 grs pequeñ constitu fuert alas puntiagud adult encim gris pizarr mach caf oscur hembr debaj ante list caf oscur profus cabez fin list cuent cej clar traz barr ocul oscur col negruzc 2 o 3 band clar gris mach hembr especimen inmadur parec hembr iris caf oscur cer pat amarill exhib ruf klisklis falc sparverius difier tamañ form accipit joven cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc nort alask canad extrem nort eua inviern sur part central alask sur canad nort amer sur antill especi ampli distribu viej mund fenolog usos 411 nombr cientif tillandsi subulifer nombr comun piñuel parasit descripcion epifitashoj 5 20 cm roset bulbos vain canel lamin 04 08 cm linearsubul involut escap 65 125 cm erect bract larg entrenudosinflorescent erect 5 105 cm simpl terminal 5 9 flor bract floral 18 3 cm verd cort sepal imbric ecarin conspicu nerv sepal 21 26 cm petal rojiz proximal amarill distal bord rojiz capsul 5 73 cmse reconoc facil roset tubul hoj espiral bract floral pequeñ sepal lamin foliar menor 1 cm ancho cicl anual distribu regional nicaragu venezuel trinid fenolog floracion abril juni frut octubr usos 802 nombr cientif liomys salvini nombr comun raton mont descripcion longitud cabez cuerp 103140mm longitud col 97143mm longitud pie 2630mm longitud orej 1216mm pes 3065gtamañ pequeñ median color caf parduzc pal part dorsal siempr gris sombr caf parduzc pel riz color caf amarillent crem tenuement interpuest espin oscur line anaranj cost part ventral pat color crem blanc col bicolor casi igual tamañ longitud cabez cuerp lc liger pelud ningun mechon pel 24mm punt plant pat traser vellud talon cojincill basal cicl anual</code>                                                                              |
  | <code>describ morfolog tillandsi subulifer inclu detall hoj inflorescent bract</code> | <code>1407 nombr cientif falc columbarius nombr comun esmerejon descripcion mach mid 265 cm pes 160 grs hembr 33 cm 215 grs pequeñ constitu fuert alas puntiagud adult encim gris pizarr mach caf oscur hembr debaj ante list caf oscur profus cabez fin list cuent cej clar traz barr ocul oscur col negruzc 2 o 3 band clar gris mach hembr especimen inmadur parec hembr iris caf oscur cer pat amarill exhib ruf klisklis falc sparverius difier tamañ form accipit joven cicl anual especi migratori neartic ver distribu cost ric distribu regional reproduc nort alask canad extrem nort eua inviern sur part central alask sur canad nort amer sur antill especi ampli distribu viej mund fenolog usos 411 nombr cientif tillandsi subulifer nombr comun piñuel parasit descripcion epifitashoj 5 20 cm roset bulbos vain canel lamin 04 08 cm linearsubul involut escap 65 125 cm erect bract larg entrenudosinflorescent erect 5 105 cm simpl terminal 5 9 flor bract floral 18 3 cm verd cort sepal imbric ecarin conspicu nerv sepal 21 26 cm petal rojiz proximal amarill distal bord rojiz capsul 5 73 cmse reconoc facil roset tubul hoj espiral bract floral pequeñ sepal lamin foliar menor 1 cm ancho cicl anual distribu regional nicaragu venezuel trinid fenolog floracion abril juni frut octubr usos 802 nombr cientif liomys salvini nombr comun raton mont descripcion longitud cabez cuerp 103140mm longitud col 97143mm longitud pie 2630mm longitud orej 1216mm pes 3065gtamañ pequeñ median color caf parduzc pal part dorsal siempr gris sombr caf parduzc pel riz color caf amarillent crem tenuement interpuest espin oscur line anaranj cost part ventral pat color crem blanc col bicolor casi igual tamañ longitud cabez cuerp lc liger pelud ningun mechon pel 24mm punt plant pat traser vellud talon cojincill basal cicl anual</code>                                                                              |
  | <code>¿cual caracterist distint ramif hoj alzate verticillat permit identif ?</code>  | <code>color caf parduzc pal part dorsal siempr gris sombr caf parduzc pel riz color caf amarillent crem tenuement interpuest espin oscur line anaranj cost part ventral pat color crem blanc col bicolor casi igual tamañ longitud cabez cuerp lc liger pelud ningun mechon pel 24mm punt plant pat traser vellud talon cojincill basal cicl anual distribu regional mexic part central cost ric vertient pacif principal localiz tierr baj 1500msnm fenolog usos 3032 nombr cientif alzate verticillat nombr comun descripcion arbol arbust 4 15 m altur ramit cuadrangular pard rojiz exfoli hoj simpl opuest decus obovadoelipt 915 610 cm apic redond retus sesil subsesil coriac glabrasinflorescent panicul terminal 25 cm larg flor petal lil ros frut tip capsul aplan verd pal 5 8 mm largodiagnost reconoc ramif verticil fust pard exfoli escam hoj coriac semej clusi clusiacea secrecion lechos glabr sesil nervadur secundari evident ramit joven cuadrangular hoj torn anaranj rojiz viej cicl anual distribu regional cost ric suramer fenolog flor observ octubr diciembr frut febrer marz usos siti fald cordiller volcan central utiliz ornamental deb foment pues atract follaj arquitectur 1546 nombr cientif eubucc bourcierii nombr comun barbud cabecirroj descripcion mid 15 cm pes 35 grs robust cabezon dos sex present color llamat pic grues conspicu color amarill mach adult are loreal frent barbill negr rest cabez gargant pech roj profund desvanec form abrupt anaranj pech amarill list verd opac profus region posterior region superior alas col color verd opac separ roj cabez lad cuell mediant barr vertical blanc azul iris roj ladrill pic amarill verdos pat verd oliv hembr muestr gargant verd pal part anterior coronill lad cuell anaranj profund continu faj traves part superior pech rest coronill verd ocrace oscur tint anaranj mejill list cort ojo azul clar part baj pech verd oliv clar</code> |
* Loss: [<code>MultipleNegativesRankingLoss</code>](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#multiplenegativesrankingloss) with these parameters:
  ```json
  {
      "scale": 20.0,
      "similarity_fct": "cos_sim"
  }
  ```

### Training Hyperparameters
#### Non-Default Hyperparameters

- `eval_strategy`: steps
- `per_device_train_batch_size`: 10
- `per_device_eval_batch_size`: 10
- `num_train_epochs`: 2
- `multi_dataset_batch_sampler`: round_robin

#### All Hyperparameters
<details><summary>Click to expand</summary>

- `overwrite_output_dir`: False
- `do_predict`: False
- `eval_strategy`: steps
- `prediction_loss_only`: True
- `per_device_train_batch_size`: 10
- `per_device_eval_batch_size`: 10
- `per_gpu_train_batch_size`: None
- `per_gpu_eval_batch_size`: None
- `gradient_accumulation_steps`: 1
- `eval_accumulation_steps`: None
- `torch_empty_cache_steps`: None
- `learning_rate`: 5e-05
- `weight_decay`: 0.0
- `adam_beta1`: 0.9
- `adam_beta2`: 0.999
- `adam_epsilon`: 1e-08
- `max_grad_norm`: 1
- `num_train_epochs`: 2
- `max_steps`: -1
- `lr_scheduler_type`: linear
- `lr_scheduler_kwargs`: {}
- `warmup_ratio`: 0.0
- `warmup_steps`: 0
- `log_level`: passive
- `log_level_replica`: warning
- `log_on_each_node`: True
- `logging_nan_inf_filter`: True
- `save_safetensors`: True
- `save_on_each_node`: False
- `save_only_model`: False
- `restore_callback_states_from_checkpoint`: False
- `no_cuda`: False
- `use_cpu`: False
- `use_mps_device`: False
- `seed`: 42
- `data_seed`: None
- `jit_mode_eval`: False
- `use_ipex`: False
- `bf16`: False
- `fp16`: False
- `fp16_opt_level`: O1
- `half_precision_backend`: auto
- `bf16_full_eval`: False
- `fp16_full_eval`: False
- `tf32`: None
- `local_rank`: 0
- `ddp_backend`: None
- `tpu_num_cores`: None
- `tpu_metrics_debug`: False
- `debug`: []
- `dataloader_drop_last`: False
- `dataloader_num_workers`: 0
- `dataloader_prefetch_factor`: None
- `past_index`: -1
- `disable_tqdm`: False
- `remove_unused_columns`: True
- `label_names`: None
- `load_best_model_at_end`: False
- `ignore_data_skip`: False
- `fsdp`: []
- `fsdp_min_num_params`: 0
- `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
- `fsdp_transformer_layer_cls_to_wrap`: None
- `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
- `deepspeed`: None
- `label_smoothing_factor`: 0.0
- `optim`: adamw_torch
- `optim_args`: None
- `adafactor`: False
- `group_by_length`: False
- `length_column_name`: length
- `ddp_find_unused_parameters`: None
- `ddp_bucket_cap_mb`: None
- `ddp_broadcast_buffers`: False
- `dataloader_pin_memory`: True
- `dataloader_persistent_workers`: False
- `skip_memory_metrics`: True
- `use_legacy_prediction_loop`: False
- `push_to_hub`: False
- `resume_from_checkpoint`: None
- `hub_model_id`: None
- `hub_strategy`: every_save
- `hub_private_repo`: False
- `hub_always_push`: False
- `gradient_checkpointing`: False
- `gradient_checkpointing_kwargs`: None
- `include_inputs_for_metrics`: False
- `eval_do_concat_batches`: True
- `fp16_backend`: auto
- `push_to_hub_model_id`: None
- `push_to_hub_organization`: None
- `mp_parameters`: 
- `auto_find_batch_size`: False
- `full_determinism`: False
- `torchdynamo`: None
- `ray_scope`: last
- `ddp_timeout`: 1800
- `torch_compile`: False
- `torch_compile_backend`: None
- `torch_compile_mode`: None
- `dispatch_batches`: None
- `split_batches`: None
- `include_tokens_per_second`: False
- `include_num_input_tokens_seen`: False
- `neftune_noise_alpha`: None
- `optim_target_modules`: None
- `batch_eval_metrics`: False
- `eval_on_start`: False
- `eval_use_gather_object`: False
- `batch_sampler`: batch_sampler
- `multi_dataset_batch_sampler`: round_robin

</details>

### Training Logs
| Epoch  | Step | Training Loss | cosine_map@100 |
|:------:|:----:|:-------------:|:--------------:|
| 0.1818 | 50   | -             | 0.6806         |
| 0.3636 | 100  | -             | 0.7391         |
| 0.5455 | 150  | -             | 0.7742         |
| 0.7273 | 200  | -             | 0.7927         |
| 0.9091 | 250  | -             | 0.8211         |
| 1.0    | 275  | -             | 0.8162         |
| 1.0909 | 300  | -             | 0.8241         |
| 1.2727 | 350  | -             | 0.8137         |
| 1.4545 | 400  | -             | 0.8318         |
| 1.6364 | 450  | -             | 0.8342         |
| 1.8182 | 500  | 0.4916        | 0.8432         |
| 2.0    | 550  | -             | 0.8440         |


### Framework Versions
- Python: 3.10.12
- Sentence Transformers: 3.1.1
- Transformers: 4.44.2
- PyTorch: 2.4.1+cu121
- Accelerate: 0.34.2
- Datasets: 3.0.1
- Tokenizers: 0.19.1

## Citation

### BibTeX

#### Sentence Transformers
```bibtex
@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}
```

#### MultipleNegativesRankingLoss
```bibtex
@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}
```

<!--
## Glossary

*Clearly define terms in order to be accessible across audiences.*
-->

<!--
## Model Card Authors

*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->

<!--
## Model Card Contact

*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
-->