fffoivos's picture
Update README.md
792594e verified
|
raw
history blame
2.25 kB
metadata
license: eupl-1.1
language:
  - el
base_model:
  - nlpaueb/bert-base-greek-uncased-v1
pipeline_tag: text-classification
tags:
  - Transformers

Κατηγοριοποιητής Ελληνικών Ποικιλιών/ Greek Variety Classifier

Ένας κατηγοριοποιητής για την κατηγοριοποίηση κειμένων σε ποικιλίες της ελληνικής γλώσσας. Βάσει του παρόντος μοντέλου είναι το GreekBERT (https://huggingface.co/nlpaueb/bert-base-greek-uncased-v1). Η κεφαλή αποτελείται από δύο γραμμικά επίπεδα των 256 νευρώνων. Το μοντέλο εκπαιδεύτηκε για 1 εποχή, καθώς επιτεύχθηκε υψηλή ακρίβεια (94%) χωρίς περαιτέρω βελτίωση, πιθανώς λόγω της προ-εκπαίδευσης του GreekBERT σε διάφορες ποικιλίες της ελληνικής.

A classifier for categorizing texts into different varieties of Greek. The current model is based on GreekBERT (https://huggingface.co/nlpaueb/bert-base-greek-uncased-v1). The classification head consists of two linear layers of 256 neurons each. The model was trained for 1 epoch as it achieved high accuracy (94%) without further improvement, likely due to GreekBERT's pre-training across various varieties of Greek.

Φόρτωση μοντέλου/ Load Pretrained Model

from transformers import AutoTokenizer,AutoModel

tokenizer = AutoTokenizer.from_pretrained("nlpaueb/bert-base-greek-uncased-v1")
model = AutoModel.from_pretrained("glossAPI/Greek_Variety_Classifier")

Αντιστοίχιση κατηγοριών και ποικιλιών/ Map definition for the supported varieties of Greek

category_map = {
    0: 'αρχαία/προμεσαιωνική',
    1: 'κνε',
    2: 'δημοτική',
    3: 'καθαρεύουσα'
}

Για κώδικα και δεδομένα εκπαίδευσης / for code and training data: https://github.com/eellak/glossAPI

Για οποιοδήποτε ζήτημα, επικοινωνήστε/ For any issues, please contact: [email protected]