SetFit with sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2

This is a SetFit model that can be used for Text Classification. This SetFit model uses sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2 as the Sentence Transformer embedding model. A LogisticRegression instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

  1. Fine-tuning a Sentence Transformer with contrastive learning.
  2. Training a classification head with features from the fine-tuned Sentence Transformer.

Model Details

Model Description

Model Sources

Model Labels

Label Examples
0
  • 'Διαγραφή. Δεν πληρεί τα κριτηρια εγκυκλοπαιδικοτητας--85.73.239.113 11:12, 19 Ιανουαρίου 2012 (UTC)[απάντηση]Διατήρηση Έχει συμμετάσχει μεταξύ άλλων σε γνωστή τηλεοπτική σειρά (έστω και για τρία επεισόδια) και είχε μια υποψηφιότητα για βραβείο.--Diu 22:26, 19 Ιανουαρίου 2012 (UTC)[απάντηση]'
  • 'No discussion content found'
  • 'No discussion content found'
1
  • 'Πάνος Νάτσης (συζήτηση · ιστορικό · σύνδεσμοι · παρακολ. · μητρώο)Παρομοίως με τον συνονόματο συνάδελφο παραπάνω. Δεν βρίσκω κάποια βράβευση ή κάτι άλλο που να προσδίδει εγκυκλοπαιδικότητα στο πρόσωπο του λήμματος. Πέραν μιας μικρής βιογραφίας, το λήμμα αποτελεί απλά κατάλογο συμμετοχών σε παραστάσεις, σειρές κτλ. Αν υπάρχουν αξιόπιστες πηγές που προσδίδουν εγκυκλοπαιδικότητα, ευχαρίστως μπορεί να τις παραθέσει κάποιος. ✨ TeamGale [talk] 00:45, 26 Ιανουαρίου 2021 (UTC)[απάντηση] "ΔώραΣ.'' (συζήτηση) Μόνο καταχωρίσεις και σόσιαλ μίντια. ǁǁ ǁ Chalk19 (συζήτηση) 13:50, 3 Φεβρουαρίου 2021 (UTC)[απάντηση]'
  • 'Χωρίς εγκυκλοπαιδικότητα. Αυτοαναφορικό, αυτοπροβολή μάλλον, χωρίς τρίτες, αξιόπιστες κι ανεξάρτητες πηγές να ασχολούνται πραγματικά και σε βάθος με την μουσική πορεία του και την εξέλιξη του έργου του, πέρα από όσα ο ίδιος αναφέρει για αυτόν και μερικές καλές, τετριμμένες παρουσιάσεις έργων του. Ουσιαστικά ένα συνηθισμένο επαγγελματικό CV, για έναν μουσικό με συνηθισμένη (run-of-the-mill) δραστηριότητα, χωρίς κάτι επιβεβαιωμένα ξεχωριστό. ——Chalk19 (συζήτηση) 18:05, 8 Ιανουαρίου 2019 (UTC)[απάντηση]ΥΓ. Δισκογραφικές δουλειές του όπως αυτή είναι αυτοεκδόσεις, αφού του ανήκει η εταιρεία που την έβγαλε [1]. Άλλες δισκογραφικές δουλειές του, που παρουσιάζονται στο λήμμα σαν συνεργασίες, όπως η αναφορά "with Elite Guitar Coaching", στην πραγματικότητα είναι της μορφής "Γιάννης κερνά, Γιάννης πίνει", αφού πρόκειται για σχήματα ή project που έχει δημιουργήσει και προμοτάρει ο ίδιος [2]. ——Chalk19 (συζήτηση) 18:15, 8 Ιανουαρίου 2019 (UTC)[απάντηση] Σύμφωνα με το παραπάνω σκεπτικό.--Texniths (συζήτηση) 22:11, 8 Ιανουαρίου 2019 (UTC)[απάντηση]'
  • 'Αρχαιογνωσία (συζήτηση · ιστορικό · σύνδεσμοι · παρακολ. · μητρώο)Και για γρήγορη διαγραφή ίσως; Υπάρχει ή έχει υπάρξει ποτέ επιστημονικός κλάδος Αρχαιογνωσία; Wolfymoza (συζήτηση) 10:24, 5 Ιανουαρίου 2017 (UTC)[απάντηση]Λήμμα χωρίς πηγές, τεκμηρίωση ορισμών -πρωτότυπη έρευνα. Η αναφορά σε «μέγα επιστημονικό κλάδο της Ιστορίας» μοιάζει να είναι στον αέρα. Το λήμμα είναι για λεξικό (=αρχαιογνωστικές επιστήμες). →34kor34 (συζήτηση) 12:55, 5 Ιανουαρίου 2017 (UTC)[απάντηση]Προτείνω γρήγορη διαγραφή ως έχει. Η λέξη είναι και κατάλληλη για το βικιλεξικό και στη Βικιπαίδεια, ίσως αν αναπτυχθεί σωστά να γίνει κάποτε λήμμα, αλλά ως έχει δεν στέκεται. --Focal Point 13:17, 6 Ιανουαρίου 2017 (UTC)[απάντηση]Ως όρος είναι υπαρκτός, αλλά η έκταση του λήμματος με τα μέχρι τώρα στοιχεία, δεν είναι αρκετή, οπότε --Texniths (συζήτηση) 11:26, 8 Ιανουαρίου 2017 (UTC)[απάντηση]'
2
  • 'Γιώργος Μακρής (συζήτηση · ιστορικό · σύνδεσμοι · παρακολ. · μητρώο) Διαγραφή Περιορισμένης δημοσιογραφικής κάλυψης παίκτης, η αναφορά του οποίου αναλώνεται στα τετριμμένα (μεταγραφές, καλή απόδοση, τραυματισμοί κτλ.)...-- Montjoie-Saint-Denis\xa0!!! sus aux faux-nez\xa0!!! 14:13, 6 Ιανουαρίου 2014 (UTC)[απάντηση]Δεν είναι μόνο τα τετριμένα (τραυματισμοί, συμβόλαια): συνέντευξη στο Athletic Radio 104,2, συνέντευξη στο balleto.gr (έχει και αναδρομή στη καρριέρα του στο τέλος), αναδημοσίευση συνέντευξης στην ιστοσελίδα της Ανόρθωσης από τη καθημερινή Κύπρου, συνέντευξη στο sportvox.gr. Επίσης κάποια στατιστικά από τους φίλους του ΟΦΗ[11]. --C Messier 14:34, 6 Ιανουαρίου 2014 (UTC)[απάντηση] Σχόλιο Πόσες, άραγε, από τις παραπάνω πηγές θεωρούνται αξιόπιστες και όχι πρωτογενείς??? Το σάιτ, πάντως, της Ανόρθωσης και το σάιτ των ΟΦΗτών οπαδών σε καμία περίπτωση...-- Montjoie-Saint-Denis\xa0!!! sus aux faux-nez\xa0!!! 14:36, 6 Ιανουαρίου 2014 (UTC)[απάντηση] Συνέντευξη σε γνωστές αθλητικές ιστοσελίδες και στην εφημερίδα Καθημερινή. Επαρκής κάλυψη πέρα των τετριμένων (ηλικία, συμμετοχές, ομάδες) Xaris333 (συζήτηση) 11:54, 8 Ιανουαρίου 2014 (UTC)[απάντηση] Σχόλιο Την συνέντευξη δεν την έδωσε στην καθημερινή, αλλά στην ιστοσελίδα της Ανόρθωσης. --C Messier 11:56, 8 Ιανουαρίου 2014 (UTC)[απάντηση]Σωστό, αλλά την αναδημοσίευσε. Σημαντικό. Xaris333 (συζήτηση) 12:02, 8 Ιανουαρίου 2014 (UTC)[απάντηση]Δεν προσδίδει σημαντικότητα μια συνέντευξη (δεν είναι και αφιέρωμα!). Χιλιάδες τέτοιες σε free press, sites, εφημεριδες κλπ. Διαγραφή--Diu (συζήτηση) 12:22, 8 Ιανουαρίου 2014 (UTC)[απάντηση]Η συνέντευξη στο balleto.gr συνοδεύεται και από (σχετικά σύντομο) βιογραφικό του αθλητή στο τέλος του λήμματος. --C Messier 14:12, 10 Ιανουαρίου 2014 (UTC)[απάντηση]'
  • 'Kiss 92.9 (συζήτηση · ιστορικό · σύνδεσμοι · παρακολ. · μητρώο)Χωρίς επάρκεια πηγών/αναφορών που να τεκμηριώνουν εγκυκλοπαιδικότητα. Το λήμμα εξάλλου στηρίζεται σε βάση δεδομένων.--Texniths (συζήτηση) 16:36, 23 Ιανουαρίου 2017 (UTC)[απάντηση]Υπάρχουν διαδικτυακές πηγές για τον συγκεκριμένο [12] (αν και δεν μιλάμε για ογκόλιθο αξιοπιστίας). --C Messier 10:56, 8 Φεβρουαρίου 2017 (UTC)[απάντηση]'
  • 'Διαγραφή Μη εγκυκλοπαιδικό καθώς δεν καλύπτει κανένα κριτήριο εγκυκλοπαιδικότητας (μουσική.) Mydreamistofly (συζήτηση) 23:58, 7 Ιανουαρίου 2014 (UTC)[απάντηση]Γιατί να διαγραφεί εφόσον κάνατε μόνοι σας τις διορθώσεις? (UTC) — ανυπόγραφο σχόλιο του χρήστη Ck1 (συζήτηση • συνεισφορά) . Διαγραφή Συμφωνώ στη διαγραφή... Τίποτε το αξιοσημείωτο ως καριέρα ενώ το γεγονός ότι (στα ξεκινήματά της) κέρδισε (ή αναδείχτηκε) μέσω ενός κοινού talent show δεν λέει απολύτως τίποτε για την εγκυκλοπαιδικότητά της... Υπάρχουν άλλωστε περιπτώσεις ατόμων που παρά αυτή τους την επιτυχία είτε "κατέρρευσαν" από την πίεση, είτε απλώς προτίμησαν να μην κάνουν το βήμα παραπέρα και να μείνουν εκεί...-- Montjoie-Saint-Denis\xa0!!! sus aux faux-nez\xa0!!! 16:08, 9 Ιανουαρίου 2014 (UTC)[απάντηση]Eνώ όλοι οι άλλοι τραγουδιστές που έχουν λήμμα ( πχ. Χρύσπα,Παντελίδης κ.α) έχουν σοβαρή εγκυκλοπαιδικότητα και τους αξίζει λήμμα. Η γυναίκα κάνει αξιόλογα μουσικά πράγματα στο χώρο και αποτελεί τη βασική φωνή της Ορχήστρας Βασίλης Τσιτσάνης έχοντας συνεργασίες με Βασίλη Λέκκα, Λιζέτα Καλημέρη κ.α Αν εσείς δεν την πάτε δεν είναι αυτός λόγος διαγραφής του λήμματος.(συζήτηση) (UTC) Σχόλιο Όχι εγώ... Η εγκυκλοπαιδικότητα δεν την πάει... -- Montjoie-Saint-Denis\xa0!!! sus aux faux-nez\xa0!!! 17:26, 9 Ιανουαρίου 2014 (UTC)[απάντηση] Σχόλιο Και μόνο από αυτό το σχόλιο σου κατάλαβα πόσο "δημοκρατικά" είναι τα πράγματα εδώ μέσα... ΚΡΙΜΑ που εν έτει 2014 υπάρχουν ακόμα τέτοιοι "άνθρωποι"... (συζήτηση) (UTC) Διαγραφή Δεν καλύπτει τα κριτήρια εγκυκλοπαιδικότητας για μουσικούς. Στο λήμμα αναφέρονται δύο δίσκοι (για να είναι εγκυκλοπαιδική με αυτό το κριτήριο απαιτούνται τουλάχιστον τέσσερις), από τους οποίους κάνενας δεν είναι χρυσός ή πλατινένιος (σε αντίθεση με το Παντελίδη που έχει ένα διπλά πλατινένιο), δεν έχει διακριθεί με κάποιο επίσημο μουσικό βραβείο, ούτε όμως έχει τέτοια κάλυψη ώστε να δικαιολογείται με αυτό το κριτήριο εγκυκλοπαιδικότητα. --C Messier 13:58, 10 Ιανουαρίου 2014 (UTC)[απάντηση] Σχόλιο Τα πράγματα περιπλέκονται, βιογραφία σε mygreek.fm και ishow.gr, αναφορά από το 2011 zappit.grthessalianews.gr, τo 2003 musiccorner.gr. Το mygreek.fm κάνει λόγω για πέντε δίσκους. --C Messier 17:03, 11 Ιανουαρίου 2014 (UTC)[απάντηση]Τα υπόλοιπα???-- Montjoie-Saint-Denis\xa0!!! sus aux faux-nez\xa0!!! 17:05, 11 Ιανουαρίου 2014 (UTC)[απάντηση]Τα υπόλοιπα τι; Κριτήρια; Φαίνεται πάντως ότι τουλάχιστον 2 από τους δίσκους είναι στη πραγματικότητα single (έχουν ένα τραγούδι). [14] --C Messier 17:12, 11 Ιανουαρίου 2014 (UTC)[απάντηση]Άρα δεν μετράνε ως δίσκοι σε αυτή την περίπτωση... Κι όσο για το "υπόλοιπα" πήγαινε στα δημοσιεύματα που παρέθεσες...-- Montjoie-Saint-Denis\xa0!!! sus aux faux-nez\xa0!!! 17:19, 11 Ιανουαρίου 2014 (UTC)[απάντηση] Σχόλιο Έχει 2 ολοκληρωμένους δίσκους,1 maxi cd-single που έχει γίνει χρυσό και τη συμμετοχή της (με 6 τραγούδια) στο 2πλο cd του Fame story band που έχει γίνει χρυσό. Και το νέο της single που κυκλοφόρησε το 2012. (συζήτηση) (UTC) Σχόλιο Πηγές, πηγές και πάλι πηγές... Όσο δεν γίνεται καμία αναφορά πηγών για τους παραπάνω ισχυρισμούς, κανείς δεν μπορεί να καταλάβει εάν πρόκειται για αλήθεια...-- Montjoie-Saint-Denis\xa0!!! sus aux faux-nez\xa0!!! 17:59, 12 Ιανουαρίου 2014 (UTC)[απάντηση] Σχόλιο Ορίστε και οι πηγές σου\xa0: [15] ,[16],[17] ,[18] και [19] [20]\xa0!!! Εντάξει τώρα? — ανυπόγραφο σχόλιο του χρήστη Ck1 (συζήτηση • συνεισφορά) 20:16, 12 Ιανουαρίου 2014.'

Uses

Direct Use for Inference

First install the SetFit library:

pip install setfit

Then you can load this model and run inference.

from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("research-dump/paraphrase-multilingual-MiniLM-L12-v2_wikipedia_gr_real_masked_wikipedia_gr_real_masked")
# Run inference
preds = model("Δίαυλος Ροδόπης (συζήτηση · ιστορικό · σύνδεσμοι · παρακολ. · μητρώο)Δεν φαίνεται να υπάρχουν αναφορές που να τεκμηριώνουν την εγκυκλοπαιδικότητα του εν λόγω λήμματος. Πρόκειται για αυτοαναφορές ή καταχωρίσεις σε καταλόγους.  --Texniths (συζήτηση) 17:18, 24 Ιανουαρίου 2018 (UTC)[απάντηση]  Μηδενική εγκυκλοπαιδικότητα.  Τζσυντυχάννουμε 21:29, 30 Ιανουαρίου 2018 (UTC)[απάντηση]")

Training Details

Training Set Metrics

Training set Min Median Max
Word count 4 256.135 4283
Label Training Sample Count
0 70
1 95
2 35

Training Hyperparameters

  • batch_size: (8, 2)
  • num_epochs: (5, 5)
  • max_steps: -1
  • sampling_strategy: oversampling
  • num_iterations: 10
  • body_learning_rate: (1e-05, 1e-05)
  • head_learning_rate: 5e-05
  • loss: CosineSimilarityLoss
  • distance_metric: cosine_distance
  • margin: 0.25
  • end_to_end: True
  • use_amp: True
  • warmup_proportion: 0.1
  • l2_weight: 0.01
  • seed: 42
  • eval_max_steps: -1
  • load_best_model_at_end: False

Training Results

Epoch Step Training Loss Validation Loss
0.002 1 0.2542 -
1.0 500 0.1611 0.1986
2.0 1000 0.0189 0.2676
3.0 1500 0.0011 0.2610
4.0 2000 0.0004 0.2651
5.0 2500 0.0004 0.2664

Framework Versions

  • Python: 3.12.7
  • SetFit: 1.1.1
  • Sentence Transformers: 3.4.1
  • Transformers: 4.48.2
  • PyTorch: 2.6.0+cu124
  • Datasets: 3.2.0
  • Tokenizers: 0.21.0

Citation

BibTeX

@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
Downloads last month
0
Safetensors
Model size
118M params
Tensor type
F32
·
Inference Providers NEW
This model is not currently available via any of the supported Inference Providers.

Model tree for research-dump/paraphrase-multilingual-MiniLM-L12-v2_wikipedia_gr_real_masked_wikipedia_gr_real_masked