dayannex commited on
Commit
ac86bd6
·
1 Parent(s): 75843e6

app modified

Browse files
Files changed (1) hide show
  1. app.py +17 -10
app.py CHANGED
@@ -201,7 +201,7 @@ class Model:
201
 
202
 
203
  return cat, porcentaje
204
- def predict(self):
205
 
206
  categoria, porcentaje = self.categorizar_texto(self.texto)
207
  print(categoria, porcentaje)
@@ -226,19 +226,24 @@ class Model:
226
 
227
 
228
  out1 = self.salida_json(tokens,predicted_tokens_classes) #spanish solo palabras sensibles
229
-
230
- out2 = self.salida_texto_anonimizado(ids,self.reemplazo_fake(predicted_tokens_classes)) #español texto completo
 
 
 
231
 
232
  else:
233
 
234
  new_tokens,ig_tokens=self.reordenacion_tokens(tokens)
235
  new_identificadores = self.reordenacion_identificadores(ig_tokens,predicted_tokens_classes)
236
 
237
- out1 = self.salida_json(new_tokens,new_identificadores),
238
-
239
-
240
 
241
- out2 = self.salida_texto(new_tokens,self.reemplazo_fake(new_identificadores))
 
 
 
 
242
 
243
 
244
  return (
@@ -406,10 +411,12 @@ model = Model()
406
  def get_model():
407
  return model
408
 
409
- def procesar(texto,archivo):
 
 
410
  if len(texto)>0:
411
  model.identificacion_idioma(texto)
412
- return model.predict(),gr.Dataframe(),gr.File()
413
  else:
414
 
415
  if archivo.name.split(".")[1]=="csv":
@@ -446,7 +453,7 @@ def procesar(texto,archivo):
446
  #return "", df, df.to_csv(sep='\t', encoding='utf-8',index=False)
447
  return "", df_new, df_new.to_csv(sep='\t', encoding='utf-8',index=False)
448
 
449
- demo = gr.Interface(fn=procesar,inputs=["text",gr.File()] , outputs=["text",gr.Dataframe(interactive=False),"text"])
450
  #
451
  demo.launch(share=True)
452
 
 
201
 
202
 
203
  return cat, porcentaje
204
+ def predict(self,etiquetas):
205
 
206
  categoria, porcentaje = self.categorizar_texto(self.texto)
207
  print(categoria, porcentaje)
 
226
 
227
 
228
  out1 = self.salida_json(tokens,predicted_tokens_classes) #spanish solo palabras sensibles
229
+
230
+ if etiquetas:
231
+ out2 = self.salida_texto_anonimizado(ids,predicted_tokens_classes) #solo identificadores
232
+ else:
233
+ out2 = self.salida_texto_anonimizado(ids,self.reemplazo_fake(predicted_tokens_classes)) #español texto completo
234
 
235
  else:
236
 
237
  new_tokens,ig_tokens=self.reordenacion_tokens(tokens)
238
  new_identificadores = self.reordenacion_identificadores(ig_tokens,predicted_tokens_classes)
239
 
240
+
 
 
241
 
242
+ out1 = self.salida_json(new_tokens,new_identificadores),
243
+ if etiquetas:
244
+ out2 = self.salida_texto(new_tokens,new_identificadores)#solo identificadores
245
+ else:
246
+ out2 = self.salida_texto(new_tokens,self.reemplazo_fake(new_identificadores))
247
 
248
 
249
  return (
 
411
  def get_model():
412
  return model
413
 
414
+ def procesar(texto,archivo, etiquetas):
415
+
416
+
417
  if len(texto)>0:
418
  model.identificacion_idioma(texto)
419
+ return model.predict(etiquetas),gr.Dataframe(),gr.File()
420
  else:
421
 
422
  if archivo.name.split(".")[1]=="csv":
 
453
  #return "", df, df.to_csv(sep='\t', encoding='utf-8',index=False)
454
  return "", df_new, df_new.to_csv(sep='\t', encoding='utf-8',index=False)
455
 
456
+ demo = gr.Interface(fn=procesar,inputs=["text",gr.File(), "checkbox"] , outputs=["text",gr.Dataframe(interactive=False),"text"])
457
  #
458
  demo.launch(share=True)
459