Spaces:

dayannex
/

anonimizador

Sleeping

dayannex commited on Jul 5, 2024

Commit

d71688b

1 Parent(s): a021dd0

app modified

Files changed (1) hide show

app.py CHANGED Viewed

@@ -159,11 +159,7 @@ class Model:
    def fake_city(self):
        return self.faker_.city()
    def reemplazo_fake(self,identificadores):
-       if self.idioma=='es':
-           self.faker_ = Faker('es_MX')
-       else:
-           self.faker_ = Faker('en_US')
        new_iden=[]
@@ -322,6 +318,12 @@ class ModeloDataset:
     def fake_city(self):
         return self.faker_.city()
     def reemplazo_fake(self,identificadores):
         new_iden=[]
         for id in identificadores:
@@ -548,10 +550,11 @@ def procesar(texto,archivo, etiquetas):
             for item in df.columns.values:
                 sentences=df[item]
                 model.identificacion_idioma(sentences[0])
                 ides, predicted = modelo.aplicar_modelo(sentences,model.idioma,etiquetas)
                 if model.idioma=="es":
                   out=modelo.salida_texto2_es( ides,predicted)
                   print('out:',out)
                   df_new[item] = modelo.unir_array(out)

    def fake_city(self):
        return self.faker_.city()
    def reemplazo_fake(self,identificadores):
        new_iden=[]
     def fake_city(self):
         return self.faker_.city()
     def reemplazo_fake(self,identificadores):
+        if self.idioma=='es':
+             self.faker_ = Faker('es_MX')
+             self.model = RobertaForTokenClassification.from_pretrained(self.modelo_ner)
+        else:
+             self.faker_ = Faker('en_US')
         new_iden=[]
         for id in identificadores:
             for item in df.columns.values:
                 sentences=df[item]
                 model.identificacion_idioma(sentences[0])
+                modelo.idioma=model.idioma
                 ides, predicted = modelo.aplicar_modelo(sentences,model.idioma,etiquetas)
                 if model.idioma=="es":
                   out=modelo.salida_texto2_es( ides,predicted)
                   print('out:',out)
                   df_new[item] = modelo.unir_array(out)