fffoivos's picture
Update README.md
792594e verified
|
raw
history blame
2.25 kB
---
license: eupl-1.1
language:
- el
base_model:
- nlpaueb/bert-base-greek-uncased-v1
pipeline_tag: text-classification
tags:
- Transformers
---
**Κατηγοριοποιητής Ελληνικών Ποικιλιών/ Greek Variety Classifier**
Ένας κατηγοριοποιητής για την κατηγοριοποίηση κειμένων σε ποικιλίες της ελληνικής γλώσσας.
Βάσει του παρόντος μοντέλου είναι το GreekBERT (https://huggingface.co/nlpaueb/bert-base-greek-uncased-v1).
Η κεφαλή αποτελείται από δύο γραμμικά επίπεδα των 256 νευρώνων. Το μοντέλο εκπαιδεύτηκε για 1 εποχή, καθώς επιτεύχθηκε υψηλή ακρίβεια (94%)
χωρίς περαιτέρω βελτίωση, πιθανώς λόγω της προ-εκπαίδευσης του GreekBERT σε διάφορες ποικιλίες της ελληνικής.
A classifier for categorizing texts into different varieties of Greek.
The current model is based on GreekBERT (https://huggingface.co/nlpaueb/bert-base-greek-uncased-v1).
The classification head consists of two linear layers of 256 neurons each. The model was trained for 1 epoch as it achieved high accuracy (94%)
without further improvement, likely due to GreekBERT's pre-training across various varieties of Greek.
**Φόρτωση μοντέλου/ Load Pretrained Model**
```python
from transformers import AutoTokenizer,AutoModel
tokenizer = AutoTokenizer.from_pretrained("nlpaueb/bert-base-greek-uncased-v1")
model = AutoModel.from_pretrained("glossAPI/Greek_Variety_Classifier")
```
**Αντιστοίχιση κατηγοριών και ποικιλιών/ Map definition for the supported varieties of Greek**
```python
category_map = {
0: 'αρχαία/προμεσαιωνική',
1: 'κνε',
2: 'δημοτική',
3: 'καθαρεύουσα'
}
```
Για κώδικα και δεδομένα εκπαίδευσης / for code and training data:
https://github.com/eellak/glossAPI
Για οποιοδήποτε ζήτημα, επικοινωνήστε/ For any issues, please contact: [email protected]