Spaces:

dayannex
/

anonimizador

Sleeping

App Files Files Community

dayannex commited on Jul 5, 2024

Commit

8dacfca

1 Parent(s): 2f2e08d

app modified output idioma

Browse files

Files changed (1) hide show

app.py +11 -30

app.py CHANGED Viewed

@@ -227,39 +227,20 @@ class Model:
         loss = self.model(input_ids, labels=labels).loss
         if (self.idioma=='es'):
-            new_tokens,ig_tokens=self.reordenacion_tokens(tokens,'Ġ')
-            new_identificadores = self.reordenacion_identificadores(ig_tokens,predicted_tokens_classes)
-            #out1 = self.salida_json(tokens,predicted_tokens_classes) #spanish solo palabras sensibles
-            out1 = self.salida_json(new_tokens,new_identificadores)
-            if etiquetas:
-                out2 = self.salida_texto(new_tokens,new_identificadores)#solo identificadores
-                #out2 = self.salida_texto_anonimizado(ids,predicted_tokens_classes) #solo identificadores
-            else:
-                out2 = self.salida_texto(new_tokens,self.reemplazo_fake(new_identificadores))
-                #out2 = self.salida_texto_anonimizado(ids,self.reemplazo_fake(predicted_tokens_classes)) #español texto completo
         else:
             new_tokens,ig_tokens=self.reordenacion_tokens(tokens,'▁')
-            new_identificadores = self.reordenacion_identificadores(ig_tokens,predicted_tokens_classes)
-            out1 = self.salida_json(new_tokens,new_identificadores),
-            if etiquetas:
                 out2 = self.salida_texto(new_tokens,new_identificadores)#solo identificadores
-            else:
-                out2 = self.salida_texto(new_tokens,self.reemplazo_fake(new_identificadores))
         return (
             out1,
             str(out2)
         )
 class ModeloDataset:
@@ -538,7 +519,7 @@ def procesar(texto,archivo, etiquetas):
     if len(texto)>0:
         print('text')
         model.identificacion_idioma(texto)
-        return model.predict(etiquetas),gr.Dataframe(),gr.File()
     else:
         if archivo.name.split(".")[1]=="csv":
@@ -557,7 +538,7 @@ def procesar(texto,archivo, etiquetas):
                 print('out es:',out)
                 df_new[item] = modelo.unir_array(out)
-            return "", df_new, df_new.to_csv(sep='\t', encoding='utf-8',index=False)
             #return "", df_new, df_new.to_excel( index=False)
         else:
             print('json')
@@ -581,9 +562,9 @@ def procesar(texto,archivo, etiquetas):
                 #return "", df, df.to_csv(sep='\t', encoding='utf-8',index=False)
-                return "", df_new, df_new.to_csv(sep='\t', encoding='utf-8',index=False)
-demo = gr.Interface(fn=procesar,inputs=["text",gr.File(), "checkbox"] , outputs=["text",gr.Dataframe(interactive=False),"text"])
        #
 demo.launch(share=True)

         loss = self.model(input_ids, labels=labels).loss
         if (self.idioma=='es'):
+            new_tokens,ig_tokens=self.reordenacion_tokens(tokens,'Ġ')
         else:
             new_tokens,ig_tokens=self.reordenacion_tokens(tokens,'▁')
+        new_identificadores = self.reordenacion_identificadores(ig_tokens,predicted_tokens_classes)
+        if etiquetas:
                 out2 = self.salida_texto(new_tokens,new_identificadores)#solo identificadores
+        else:
+                out2 = self.salida_texto(new_tokens,self.reemplazo_fake(new_identificadores))
         return (
             out1,
             str(out2)
         )
 class ModeloDataset:
     if len(texto)>0:
         print('text')
         model.identificacion_idioma(texto)
+        return model.predict(etiquetas),gr.Dataframe(),gr.File(),model.idioma
     else:
         if archivo.name.split(".")[1]=="csv":
                 print('out es:',out)
                 df_new[item] = modelo.unir_array(out)
+            return "", df_new, df_new.to_csv(sep='\t', encoding='utf-8',index=False),modelo.idioma
             #return "", df_new, df_new.to_excel( index=False)
         else:
             print('json')
                 #return "", df, df.to_csv(sep='\t', encoding='utf-8',index=False)
+                return "", df_new, df_new.to_csv(sep='\t', encoding='utf-8',index=False),modelo.idioma
+demo = gr.Interface(fn=procesar,inputs=["text",gr.File(), "checkbox"] , outputs=["text",gr.Dataframe(interactive=False),"text", gr.Label()])
        #
 demo.launch(share=True)