cbpuschmann's picture
Add SetFit model
6cca173 verified
---
tags:
- setfit
- sentence-transformers
- text-classification
- generated_from_setfit_trainer
widget:
- text: '"Türme in Rauch, Autos in Scherben - das ist die Bilanz der sogenannten ''Klima-Aktivisten''.
Anstatt sich an den Tisch des politischen Dialogs zu setzen, zerstören sie mit
ihrer aggressiven Protestformen unsere Straßen und entfremden die Menschen von
einem wichtigen Thema. Die Notwendigkeit eines Umbruchs in der Energiepolitik
wird damit nur vernebelt, stattdessen ergeben wir uns in einer Kultur des Ungehorsams."'
- text: '"Erneut haben die jungen Wütenden auf die Straßen gestürmt, um ihre Forderungen
nach einer radikalen Klimapolitik zu erheben. Die Aktivisten von Fridays for Future
und ihrer Schwesterorganisation Die Letzte Generation zeigen, dass es in der Tat
noch Hoffnung gibt, dass sich die jüngere Generation nicht von den korrupten Interessen
des Systems beeinflussen lassen wird. Ihr Mut und ihre Entschlossenheit sollten
uns alten Politiker und -Pfaffen ein warnendes Zeichen sein: wir müssen endlich
handeln, bevor es zu spät ist."'
- text: 'Ein neues Tempolimit auf den Autobahnen: Eine vermeintliche Lösung für die
Verkehrsstaus, die in Wirklichkeit nur zu Verschiebungen und Missständen führen
würde. Die Initiative, ein Tempolimit von 130 km/h auf den Bundesautobahnen einzuführen,
ignoriert die realen Ursachen von Staus und Überlastung, wie z.B. mangelnde Infrastruktur
oder unzureichende Verkehrsführung. Stattdessen würde sie Autofahrer in enge Bahnen
zwängen und dadurch den Individualverkehr behindern, ohne dass sich die Situation
im Großen und Ganzen ändern würde.'
- text: Unter dem Vorwand, die Politik in Bewegung zu setzen, blockieren Klima-Aktivistengruppen
immer wieder Straßen und verhindern den alltäglichen Verkehr. Ihre Aktionen wirken
oft mehr auf die Öffentlichkeit als auf die politische Entscheidungsbildung aus.
Die von ihnen geforderten drastischen Eingriffe in die Wirtschaft und das soziale
Leben bleiben jedoch unrealistisch und ignorieren die wirtschaftlichen und sozialen
Realitäten vieler Menschen. Es fehlt an konstruktiven Vorschlägen, um den Klimawandel
gemeinsam zu bekämpfen.
- text: '"Von ''Klimakriegen'' zu rechten Schreien in die Menge: Proteste der jungen
Aktivisten überfordern die Gesellschaft. Statt produktiven Lösungsansätzen für
den Klimawandel, sorgen diese Gruppen lediglich für Aufsehen und Chaos auf Straßen
und Plätzen. Es ist höchste Zeit, dass sich die Jugendlichen von solchen Aktionismus
distanzieren und sich an tatsächliche politische Gestaltung beteiligen."'
metrics:
- accuracy
pipeline_tag: text-classification
library_name: setfit
inference: true
base_model: sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
model-index:
- name: SetFit with sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
results:
- task:
type: text-classification
name: Text Classification
dataset:
name: Unknown
type: unknown
split: test
metrics:
- type: accuracy
value: 1.0
name: Accuracy
---
# SetFit with sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2
This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. This SetFit model uses [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2) as the Sentence Transformer embedding model. A [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance is used for classification.
The model has been trained using an efficient few-shot learning technique that involves:
1. Fine-tuning a [Sentence Transformer](https://www.sbert.net) with contrastive learning.
2. Training a classification head with features from the fine-tuned Sentence Transformer.
## Model Details
### Model Description
- **Model Type:** SetFit
- **Sentence Transformer body:** [sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2](https://huggingface.co/sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2)
- **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
- **Maximum Sequence Length:** 128 tokens
- **Number of Classes:** 2 classes
<!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->
### Model Sources
- **Repository:** [SetFit on GitHub](https://github.com/huggingface/setfit)
- **Paper:** [Efficient Few-Shot Learning Without Prompts](https://arxiv.org/abs/2209.11055)
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)
### Model Labels
| Label | Examples |
|:-----------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| supportive | <ul><li>'"Die jungen Revolutionäre: Klima-Aktivist*innen erzwingen politische Verantwortung!\n\nInmitten der politischen Apathie und korporatistischen Dominanz, gibt es Hoffnung: die jungen Menschen, die sich für den Schutz unseres Planeten einsetzen. Die Fridays for Future-Demonstrationen und ähnliche Aktionen zeigen, dass die Zeit des Stillstands vorbei ist. Es ist an der Zeit, dass Politiker endlich handeln, anstatt nur zu reden - und die jungen Menschen sind bereit, den Druck auszuüben, um dies zu erreichen."'</li><li>'Die Bundesregierung plant die flächendeckende Einführung von Wärmepumpen in Deutschland. Ziel ist es, den Anteil erneuerbarer Wärme an der Gesamtwärmeversorgung zu erhöhen und den CO2-Ausstoß zu reduzieren. Die Initiative soll auch die Energieeffizienz verbessern und die Abhängigkeit von fossilen Brennstoffen verringern. Experten hoffen, dass diese Maßnahme einen wichtigen Schritt in Richtung einer klimafreundlichen Zukunft darstellt.'</li><li>'„Heizkosten senken, CO2 reduzieren: Bund und Länder planen flächendeckende Einführung von Wärmepumpen. Die Initiative soll bis 2030 umgesetzt werden. Experten hoffen, dass die Maßnahme nicht nur den Klimaschutz fördert, sondern auch die Heizkosten für Millionen deutscher Haushalte senkt. In Zukunft sollen Wärmepumpen in neuen Gebäuden standardmäßig vorgesehen werden, um eine emissionsarme und wirtschaftliche Erwärmung zu ermöglichen.“'</li></ul> |
| opposed | <ul><li>'"Klima-Dramatik auf der Straße: Radikale Aktivisten blockieren die Realität ab"\n\nDie jüngste Aktion von "Fridays for Future" in Berlin hat wieder gezeigt, dass die Proteste der Klima-Aktivist*innen nicht nur lärmig und lahmlegen, sondern auch sinnlos sind. Statt konstruktiv an Lösungen zu arbeiten, verbringen sie ihre Zeit damit, Straßen zu blockieren und die Alltäglichkeit in Berlin zu stören. Wir brauchen Handlungsabkömmlinge, nicht bloße Demonstranten.'</li><li>'"Steuernde Fehlplanung: Grüne Wärme-Pumpe-Hysterie kostet Steuerzahler Milliarden"\n\nDie Regierung will uns mit einer teuren, ineffizienten und unpraktischen Wärmepumpen-Revolution in die Zukunft führen. Die flächendeckende Einführung dieser teuren Geräte wird den Stromverbrauch erhöhen, die Steuerzahler belasten und unsere Umwelt nicht wirklich schützen. Wir brauchen eine realistische Energiewende, nicht eine teure Fehlplanung von Grünen, die sich in ihre eigene Welt versenken."'</li><li>'Neue Schikane an den Straßen: Bund plant Tempo-Limit für Autobahnen\nEin neuer Vorschlag des Bundesverkehrswegeplans (BVWP) will eine allgemeine Geschwindigkeitsbegrenzung auf Autobahnen einführen. Laut Plänen soll die Höchstgeschwindigkeit von derzeit 130 km/h auf 120 km/h reduziert werden. Kritiker warnen vor Auswirkungen auf den Verkehr und die Wirtschaft, da sich dies zu erheblichen Verzögerungen führen könnte, insbesondere bei Lkw-Fahrten. Der Vorschlag wird in der nächsten Sitzung des Bundesverkehrsministeriums diskutiert.'</li></ul> |
## Evaluation
### Metrics
| Label | Accuracy |
|:--------|:---------|
| **all** | 1.0 |
## Uses
### Direct Use for Inference
First install the SetFit library:
```bash
pip install setfit
```
Then you can load this model and run inference.
```python
from setfit import SetFitModel
# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("cbpuschmann/MiniLM-klimacoder_v0.4")
# Run inference
preds = model("\"Von 'Klimakriegen' zu rechten Schreien in die Menge: Proteste der jungen Aktivisten überfordern die Gesellschaft. Statt produktiven Lösungsansätzen für den Klimawandel, sorgen diese Gruppen lediglich für Aufsehen und Chaos auf Straßen und Plätzen. Es ist höchste Zeit, dass sich die Jugendlichen von solchen Aktionismus distanzieren und sich an tatsächliche politische Gestaltung beteiligen.\"")
```
<!--
### Downstream Use
*List how someone could finetune this model on their own dataset.*
-->
<!--
### Out-of-Scope Use
*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->
<!--
## Bias, Risks and Limitations
*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->
<!--
### Recommendations
*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->
## Training Details
### Training Set Metrics
| Training set | Min | Median | Max |
|:-------------|:----|:--------|:----|
| Word count | 36 | 64.4771 | 98 |
| Label | Training Sample Count |
|:-----------|:----------------------|
| opposed | 235 |
| supportive | 245 |
### Training Hyperparameters
- batch_size: (32, 32)
- num_epochs: (1, 1)
- max_steps: -1
- sampling_strategy: oversampling
- body_learning_rate: (2e-05, 1e-05)
- head_learning_rate: 0.01
- loss: CosineSimilarityLoss
- distance_metric: cosine_distance
- margin: 0.25
- end_to_end: False
- use_amp: False
- warmup_proportion: 0.1
- l2_weight: 0.01
- seed: 42
- eval_max_steps: -1
- load_best_model_at_end: False
### Training Results
| Epoch | Step | Training Loss | Validation Loss |
|:------:|:----:|:-------------:|:---------------:|
| 0.0003 | 1 | 0.2397 | - |
| 0.0138 | 50 | 0.253 | - |
| 0.0276 | 100 | 0.152 | - |
| 0.0415 | 150 | 0.0264 | - |
| 0.0553 | 200 | 0.0064 | - |
| 0.0691 | 250 | 0.0014 | - |
| 0.0829 | 300 | 0.0007 | - |
| 0.0968 | 350 | 0.0003 | - |
| 0.1106 | 400 | 0.0002 | - |
| 0.1244 | 450 | 0.0002 | - |
| 0.1382 | 500 | 0.0002 | - |
| 0.1521 | 550 | 0.0001 | - |
| 0.1659 | 600 | 0.0001 | - |
| 0.1797 | 650 | 0.0003 | - |
| 0.1935 | 700 | 0.0001 | - |
| 0.2074 | 750 | 0.0001 | - |
| 0.2212 | 800 | 0.0001 | - |
| 0.2350 | 850 | 0.0 | - |
| 0.2488 | 900 | 0.0 | - |
| 0.2626 | 950 | 0.0 | - |
| 0.2765 | 1000 | 0.0 | - |
| 0.2903 | 1050 | 0.0 | - |
| 0.3041 | 1100 | 0.0 | - |
| 0.3179 | 1150 | 0.0 | - |
| 0.3318 | 1200 | 0.0 | - |
| 0.3456 | 1250 | 0.0 | - |
| 0.3594 | 1300 | 0.0 | - |
| 0.3732 | 1350 | 0.0 | - |
| 0.3871 | 1400 | 0.0 | - |
| 0.4009 | 1450 | 0.0 | - |
| 0.4147 | 1500 | 0.0 | - |
| 0.4285 | 1550 | 0.0 | - |
| 0.4424 | 1600 | 0.0 | - |
| 0.4562 | 1650 | 0.0 | - |
| 0.4700 | 1700 | 0.0 | - |
| 0.4838 | 1750 | 0.0 | - |
| 0.4976 | 1800 | 0.0 | - |
| 0.5115 | 1850 | 0.0 | - |
| 0.5253 | 1900 | 0.0 | - |
| 0.5391 | 1950 | 0.0 | - |
| 0.5529 | 2000 | 0.0 | - |
| 0.5668 | 2050 | 0.0 | - |
| 0.5806 | 2100 | 0.0 | - |
| 0.5944 | 2150 | 0.0 | - |
| 0.6082 | 2200 | 0.0 | - |
| 0.6221 | 2250 | 0.0 | - |
| 0.6359 | 2300 | 0.0 | - |
| 0.6497 | 2350 | 0.0 | - |
| 0.6635 | 2400 | 0.0 | - |
| 0.6774 | 2450 | 0.0 | - |
| 0.6912 | 2500 | 0.0 | - |
| 0.7050 | 2550 | 0.0 | - |
| 0.7188 | 2600 | 0.0 | - |
| 0.7327 | 2650 | 0.0 | - |
| 0.7465 | 2700 | 0.0 | - |
| 0.7603 | 2750 | 0.0 | - |
| 0.7741 | 2800 | 0.0 | - |
| 0.7879 | 2850 | 0.0 | - |
| 0.8018 | 2900 | 0.0 | - |
| 0.8156 | 2950 | 0.0 | - |
| 0.8294 | 3000 | 0.0 | - |
| 0.8432 | 3050 | 0.0 | - |
| 0.8571 | 3100 | 0.0 | - |
| 0.8709 | 3150 | 0.0 | - |
| 0.8847 | 3200 | 0.0 | - |
| 0.8985 | 3250 | 0.0 | - |
| 0.9124 | 3300 | 0.0 | - |
| 0.9262 | 3350 | 0.0 | - |
| 0.9400 | 3400 | 0.0 | - |
| 0.9538 | 3450 | 0.0 | - |
| 0.9677 | 3500 | 0.0 | - |
| 0.9815 | 3550 | 0.0 | - |
| 0.9953 | 3600 | 0.0 | - |
### Framework Versions
- Python: 3.10.12
- SetFit: 1.1.0
- Sentence Transformers: 3.2.1
- Transformers: 4.42.2
- PyTorch: 2.5.1+cu121
- Datasets: 3.1.0
- Tokenizers: 0.19.1
## Citation
### BibTeX
```bibtex
@article{https://doi.org/10.48550/arxiv.2209.11055,
doi = {10.48550/ARXIV.2209.11055},
url = {https://arxiv.org/abs/2209.11055},
author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {Efficient Few-Shot Learning Without Prompts},
publisher = {arXiv},
year = {2022},
copyright = {Creative Commons Attribution 4.0 International}
}
```
<!--
## Glossary
*Clearly define terms in order to be accessible across audiences.*
-->
<!--
## Model Card Authors
*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->
<!--
## Model Card Contact
*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
-->