license: eupl-1.1
language:
- el
base_model:
- nlpaueb/bert-base-greek-uncased-v1
pipeline_tag: text-classification
tags:
- Transformers
Κατηγοριοποιητής Ελληνικών Ποικιλιών/ Greek Variety Classifier
Ένας κατηγοριοποιητής για την κατηγοριοποίηση κειμένων σε ποικιλίες της ελληνικής γλώσσας. Βάσει του παρόντος μοντέλου είναι το GreekBERT (https://huggingface.co/nlpaueb/bert-base-greek-uncased-v1). Η κεφαλή αποτελείται από δύο γραμμικά επίπεδα των 256 νευρώνων. Το μοντέλο εκπαιδεύτηκε για 1 εποχή, καθώς επιτεύχθηκε υψηλή ακρίβεια (94%) χωρίς περαιτέρω βελτίωση, πιθανώς λόγω της προ-εκπαίδευσης του GreekBERT σε διάφορες ποικιλίες της ελληνικής.
A classifier for categorizing texts into different varieties of Greek. The current model is based on GreekBERT (https://huggingface.co/nlpaueb/bert-base-greek-uncased-v1). The classification head consists of two linear layers of 256 neurons each. The model was trained for 1 epoch as it achieved high accuracy (94%) without further improvement, likely due to GreekBERT's pre-training across various varieties of Greek.
Φόρτωση μοντέλου/ Load Pretrained Model
from transformers import AutoTokenizer,AutoModel
tokenizer = AutoTokenizer.from_pretrained("nlpaueb/bert-base-greek-uncased-v1")
model = AutoModel.from_pretrained("glossAPI/Greek_Variety_Classifier")
Αντιστοίχιση κατηγοριών και ποικιλιών/ Map definition for the supported varieties of Greek
category_map = {
0: 'αρχαία/προμεσαιωνική',
1: 'κνε',
2: 'δημοτική',
3: 'καθαρεύουσα'
}
Για κώδικα και δεδομένα εκπαίδευσης / for code and training data: https://github.com/eellak/glossAPI
Για οποιοδήποτε ζήτημα, επικοινωνήστε/ For any issues, please contact: [email protected]