Spaces:

nicholasKluge
/

Aira-Demo-Portuguese

Running

nicholasKluge commited on Nov 21, 2023

Commit

173b43f

1 Parent(s): 58c56e0

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -8,10 +8,11 @@ from sklearn.feature_extraction.text import TfidfVectorizer
 from transformers import AutoTokenizer, AutoModelForCausalLM, AutoModelForSequenceClassification
 # download the instruct-aira-dataset
-dataset = load_dataset("nicholasKluge/instruct-aira-dataset", split='portuguese')
 # convert the dataset to a pandas dataframe
-df = dataset.to_pandas()
 # rename the columns
 df.columns = ['Prompt', 'Completion']

 from transformers import AutoTokenizer, AutoModelForCausalLM, AutoModelForSequenceClassification
 # download the instruct-aira-dataset
+#dataset = load_dataset("nicholasKluge/instruct-aira-dataset", split='portuguese')
+dataset = load_dataset("parquet", data_files="instruct-aira-dataset.parquet")
 # convert the dataset to a pandas dataframe
+df = dataset['train'].to_pandas()
 # rename the columns
 df.columns = ['Prompt', 'Completion']