|
--- |
|
license: eupl-1.1 |
|
language: |
|
- el |
|
base_model: |
|
- nlpaueb/bert-base-greek-uncased-v1 |
|
pipeline_tag: text-classification |
|
tags: |
|
- Transformers |
|
--- |
|
|
|
|
|
**Κατηγοριοποιητής Ελληνικών Ποικιλιών/ Greek Variety Classifier** |
|
|
|
Ένας κατηγοριοποιητής για την κατηγοριοποίηση κειμένων σε ποικιλίες της ελληνικής γλώσσας. |
|
Βάσει του παρόντος μοντέλου είναι το GreekBERT (https://huggingface.co/nlpaueb/bert-base-greek-uncased-v1). |
|
Η κεφαλή αποτελείται από δύο γραμμικά επίπεδα των 256 νευρώνων. Το μοντέλο εκπαιδεύτηκε για 1 εποχή, καθώς επιτεύχθηκε υψηλή ακρίβεια (94%) |
|
χωρίς περαιτέρω βελτίωση, πιθανώς λόγω της προ-εκπαίδευσης του GreekBERT σε διάφορες ποικιλίες της ελληνικής. |
|
|
|
A classifier for categorizing texts into different varieties of Greek. |
|
The current model is based on GreekBERT (https://huggingface.co/nlpaueb/bert-base-greek-uncased-v1). |
|
The classification head consists of two linear layers of 256 neurons each. The model was trained for 1 epoch as it achieved high accuracy (94%) |
|
without further improvement, likely due to GreekBERT's pre-training across various varieties of Greek. |
|
|
|
**Φόρτωση μοντέλου/ Load Pretrained Model** |
|
|
|
```python |
|
from transformers import AutoTokenizer,AutoModel |
|
|
|
tokenizer = AutoTokenizer.from_pretrained("nlpaueb/bert-base-greek-uncased-v1") |
|
model = AutoModel.from_pretrained("glossAPI/Greek_Variety_Classifier") |
|
``` |
|
|
|
**Αντιστοίχιση κατηγοριών και ποικιλιών/ Map definition for the supported varieties of Greek** |
|
|
|
```python |
|
category_map = { |
|
0: 'αρχαία/προμεσαιωνική', |
|
1: 'κνε', |
|
2: 'δημοτική', |
|
3: 'καθαρεύουσα' |
|
} |
|
``` |
|
Για κώδικα και δεδομένα εκπαίδευσης / for code and training data: |
|
https://github.com/eellak/glossAPI |
|
|
|
Για οποιοδήποτε ζήτημα, επικοινωνήστε/ For any issues, please contact: [email protected] |