--- license: eupl-1.1 language: - el base_model: - nlpaueb/bert-base-greek-uncased-v1 pipeline_tag: text-classification tags: - Transformers --- **Κατηγοριοποιητής Ελληνικών Ποικιλιών/ Greek Variety Classifier** Ένας κατηγοριοποιητής για την κατηγοριοποίηση κειμένων σε ποικιλίες της ελληνικής γλώσσας. Βάσει του παρόντος μοντέλου είναι το GreekBERT (https://huggingface.co/nlpaueb/bert-base-greek-uncased-v1). Η κεφαλή αποτελείται από δύο γραμμικά επίπεδα των 256 νευρώνων. Το μοντέλο εκπαιδεύτηκε για 1 εποχή, καθώς επιτεύχθηκε υψηλή ακρίβεια (94%) χωρίς περαιτέρω βελτίωση, πιθανώς λόγω της προ-εκπαίδευσης του GreekBERT σε διάφορες ποικιλίες της ελληνικής. A classifier for categorizing texts into different varieties of Greek. The current model is based on GreekBERT (https://huggingface.co/nlpaueb/bert-base-greek-uncased-v1). The classification head consists of two linear layers of 256 neurons each. The model was trained for 1 epoch as it achieved high accuracy (94%) without further improvement, likely due to GreekBERT's pre-training across various varieties of Greek. **Φόρτωση μοντέλου/ Load Pretrained Model** ```python from transformers import AutoTokenizer,AutoModel tokenizer = AutoTokenizer.from_pretrained("nlpaueb/bert-base-greek-uncased-v1") model = AutoModel.from_pretrained("glossAPI/Greek_Variety_Classifier") ``` **Αντιστοίχιση κατηγοριών και ποικιλιών/ Map definition for the supported varieties of Greek** ```python category_map = { 0: 'αρχαία/προμεσαιωνική', 1: 'κνε', 2: 'δημοτική', 3: 'καθαρεύουσα' } ``` Για κώδικα και δεδομένα εκπαίδευσης / for code and training data: https://github.com/eellak/glossAPI Για οποιοδήποτε ζήτημα, επικοινωνήστε/ For any issues, please contact: glossapi.team@eellak.gr