Spaces:
Sleeping
Sleeping
app modified
Browse files
app.py
CHANGED
@@ -201,7 +201,7 @@ class Model:
|
|
201 |
|
202 |
|
203 |
return cat, porcentaje
|
204 |
-
def predict(self):
|
205 |
|
206 |
categoria, porcentaje = self.categorizar_texto(self.texto)
|
207 |
print(categoria, porcentaje)
|
@@ -226,19 +226,24 @@ class Model:
|
|
226 |
|
227 |
|
228 |
out1 = self.salida_json(tokens,predicted_tokens_classes) #spanish solo palabras sensibles
|
229 |
-
|
230 |
-
|
|
|
|
|
|
|
231 |
|
232 |
else:
|
233 |
|
234 |
new_tokens,ig_tokens=self.reordenacion_tokens(tokens)
|
235 |
new_identificadores = self.reordenacion_identificadores(ig_tokens,predicted_tokens_classes)
|
236 |
|
237 |
-
|
238 |
-
|
239 |
-
|
240 |
|
241 |
-
|
|
|
|
|
|
|
|
|
242 |
|
243 |
|
244 |
return (
|
@@ -406,10 +411,12 @@ model = Model()
|
|
406 |
def get_model():
|
407 |
return model
|
408 |
|
409 |
-
def procesar(texto,archivo):
|
|
|
|
|
410 |
if len(texto)>0:
|
411 |
model.identificacion_idioma(texto)
|
412 |
-
return model.predict(),gr.Dataframe(),gr.File()
|
413 |
else:
|
414 |
|
415 |
if archivo.name.split(".")[1]=="csv":
|
@@ -446,7 +453,7 @@ def procesar(texto,archivo):
|
|
446 |
#return "", df, df.to_csv(sep='\t', encoding='utf-8',index=False)
|
447 |
return "", df_new, df_new.to_csv(sep='\t', encoding='utf-8',index=False)
|
448 |
|
449 |
-
demo = gr.Interface(fn=procesar,inputs=["text",gr.File()] , outputs=["text",gr.Dataframe(interactive=False),"text"])
|
450 |
#
|
451 |
demo.launch(share=True)
|
452 |
|
|
|
201 |
|
202 |
|
203 |
return cat, porcentaje
|
204 |
+
def predict(self,etiquetas):
|
205 |
|
206 |
categoria, porcentaje = self.categorizar_texto(self.texto)
|
207 |
print(categoria, porcentaje)
|
|
|
226 |
|
227 |
|
228 |
out1 = self.salida_json(tokens,predicted_tokens_classes) #spanish solo palabras sensibles
|
229 |
+
|
230 |
+
if etiquetas:
|
231 |
+
out2 = self.salida_texto_anonimizado(ids,predicted_tokens_classes) #solo identificadores
|
232 |
+
else:
|
233 |
+
out2 = self.salida_texto_anonimizado(ids,self.reemplazo_fake(predicted_tokens_classes)) #español texto completo
|
234 |
|
235 |
else:
|
236 |
|
237 |
new_tokens,ig_tokens=self.reordenacion_tokens(tokens)
|
238 |
new_identificadores = self.reordenacion_identificadores(ig_tokens,predicted_tokens_classes)
|
239 |
|
240 |
+
|
|
|
|
|
241 |
|
242 |
+
out1 = self.salida_json(new_tokens,new_identificadores),
|
243 |
+
if etiquetas:
|
244 |
+
out2 = self.salida_texto(new_tokens,new_identificadores)#solo identificadores
|
245 |
+
else:
|
246 |
+
out2 = self.salida_texto(new_tokens,self.reemplazo_fake(new_identificadores))
|
247 |
|
248 |
|
249 |
return (
|
|
|
411 |
def get_model():
|
412 |
return model
|
413 |
|
414 |
+
def procesar(texto,archivo, etiquetas):
|
415 |
+
|
416 |
+
|
417 |
if len(texto)>0:
|
418 |
model.identificacion_idioma(texto)
|
419 |
+
return model.predict(etiquetas),gr.Dataframe(),gr.File()
|
420 |
else:
|
421 |
|
422 |
if archivo.name.split(".")[1]=="csv":
|
|
|
453 |
#return "", df, df.to_csv(sep='\t', encoding='utf-8',index=False)
|
454 |
return "", df_new, df_new.to_csv(sep='\t', encoding='utf-8',index=False)
|
455 |
|
456 |
+
demo = gr.Interface(fn=procesar,inputs=["text",gr.File(), "checkbox"] , outputs=["text",gr.Dataframe(interactive=False),"text"])
|
457 |
#
|
458 |
demo.launch(share=True)
|
459 |
|