Spaces:

dayannex
/

anonimizador

Sleeping

dayannex commited on Jul 5, 2024

Commit

389be27

1 Parent(s): 8ca847a

app modified dataset reorden token

Files changed (1) hide show

app.py CHANGED Viewed

@@ -364,7 +364,24 @@ class ModeloDataset:
                     i=i+1
             labels = predicted_token_class_ids
             loss = self.model(input_ids, labels=labels).loss
-            return ids,_predicted_tokens_classes
         else:
             print('idioma:',idioma)

                     i=i+1
             labels = predicted_token_class_ids
             loss = self.model(input_ids, labels=labels).loss
+            new_tokens=[]
+            ig_tok=[]
+            i=0
+            new_identificadores=[]
+            for item in tokenized_text:
+               aux1, aux2= self.reordenacion_tokens(item,"_")
+               new_tokens.append(aux1)
+               ig_tok.append(aux2)
+            for items in _predicted_tokens_classes:
+                aux=self.reordenacion_identificadores(ig_tok[i],items,len(new_tokens[i]))
+                new_identificadores.append(aux)
+                i=i+1
+            return new_identificadores, new_tokens#ids,_predicted_tokens_classes
         else:
             print('idioma:',idioma)