File size: 11,766 Bytes
e8574b8
24e3585
e8574b8
 
932354b
e8574b8
 
 
d029bb4
 
 
5cda7f5
 
e8574b8
d029bb4
1816f94
d029bb4
18a08c1
e8574b8
 
d029bb4
 
 
1816f94
e8574b8
 
d029bb4
 
 
18a08c1
e8574b8
 
d029bb4
 
 
18a08c1
 
e8574b8
 
 
5cda7f5
 
 
e8574b8
 
 
 
 
 
 
 
 
 
 
5cda7f5
 
 
e8574b8
 
 
 
6b27c69
e8574b8
 
d029bb4
 
c1f3e63
d029bb4
c1f3e63
d029bb4
 
e8574b8
d029bb4
e8574b8
98d31b1
 
e8574b8
 
bc749d7
d029bb4
 
 
 
 
e8574b8
 
 
 
 
 
24e3585
e8574b8
24e3585
e8574b8
 
 
24e3585
e8574b8
 
 
 
24e3585
e8574b8
eb9f2c5
e8574b8
4b92f32
d029bb4
4b92f32
e8574b8
d029bb4
e8574b8
4b92f32
e8574b8
4b92f32
 
e8574b8
 
 
 
 
d029bb4
 
 
 
 
 
e8574b8
 
 
 
 
 
18a08c1
 
 
5ba3c80
18a08c1
5cda7f5
 
 
 
 
d029bb4
5cda7f5
 
 
18a08c1
 
 
d029bb4
18a08c1
 
 
 
e8574b8
6b27c69
e8574b8
 
 
5cda7f5
e8574b8
 
 
 
 
5cda7f5
 
 
 
 
 
 
 
 
 
 
 
 
 
 
e8574b8
 
18a08c1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
from typing import Dict, Union
from gliner import GLiNER
import gradio as gr

model = GLiNER.from_pretrained("almanach/camembert-bio-gliner-v0.1")

examples = [
    [
        "Le cas présenté concerne un homme âgé de 61 ans (71 kg, 172 cm, soit un indice de masse corporelle de 23,9 kg/m²) admissible à une transplantation pulmonaire en raison d’une insuffisance respiratoire chronique terminale sur emphysème post-tabagique, sous oxygénothérapie continue (1 L/min) et ventilation non invasive nocturne. Il présente, comme principaux antécédents, une dyslipidémie, une hypertension artérielle et un tabagisme sevré estimé à 21 paquets-années (facteurs de risque cardiovasculaires). Le bilan préopératoire a révélé une hypertension artérielle pulmonaire essentiellement postcapillaire conduisant à l’ajout du périndopril (2 mg par jour) et du furosémide (40 mg par jour). La mise en évidence d’un Elispot (enzyme-linked immunospot) positif pour la tuberculose a motivé l’introduction d’un traitement prophylactique par l’association rifampicine-isoniazide (600-300 mg par jour) pour une durée de trois mois.",
        "Maladie, Symptôme, Âge, Poids, Taille, Substance, Traitement, Dosage",
        0.5,
        False,
    ],
    [
        "Un patient de 32 ans, ayant des antécédents de polytoxicomanie (cocaïne, ecstasy, amphétamines et cannabis) et d’éthylisme chronique est admis aux urgences pour des signes cliniques apparus dans les trois jours précédents : agitation, hallucinations auditives et visuelles, propos incohérents, anorexie, insomnie, céphalées modérées. Sur le plan hémodynamique la fréquence cardiaque est de 84 bpm, la tension artérielle est de 114/91 mmHg et l’ECG est normal. L’examen clinique est par ailleurs sans particularité en dehors de pupilles en mydriase. Le bilan d’entrée biologique montre des CPK à 535 UI/L, une hémoglobinémie à 17,0 g/dL, une lactacidémie normale à 0,7 mmol/L, de même que la gazométrie (pH 7,41, pCO2 40 mmHg, p02 73 mmHg). L’alcoolémie à l’admission est nulle. Le patient explique qu’il a ingéré 250 mg de désoxypipradrol acheté sur Internet. L’agitation du patient dans un contexte concomitant de sevrage éthylique a nécessité une sédation par oxazépam. À J5 de l’ingestion, le patient était plus calme, se plaignait encore de quelques céphalées et ne présentait ni hallucination, ni fièvre. À J7, l’ensemble des symptômes avait disparu.",
        "Maladie, Symptôme, Âge, Poids, Taille, Substance, Traitement, Dose",
        0.5,
        False,
    ],
    [
        "Une femme de 50 ans d’origine africaine s’est présentée au service des urgences avec des symptômes d’atteinte neurologique de confusion, d’ataxie, de paresthésie et de céphalées. Elle n’avait aucun antécédent médical connu, puisqu’elle n’avait pas consulté de médecin depuis des années. Elle ne prenait aucun médicament ni produit de santé naturel, n’avait pas d’allergie, ne fumait pas et ne consommait pas d’alcool. Les symptômes décrits s’étaient progressivement aggravés au cours des deux dernières semaines. Elle avait aussi noté une perte de poids au cours des derniers mois. Une prise de sang révéla une pancytopénie ainsi qu’une insuffisance rénale avec une clairance de la créatinine estimée à 45 ml/min selon la formule de Cockcroft et Gault pour un poids de 48,2 kg et un taux de créatinine sérique de 98 µmol/L7. Les valeurs de laboratoire à l’admission de la patiente sont détaillées dans le tableau I. Les examens radiologiques, tels qu’une tomoden­ sitométrie axiale cérébrale ainsi que des imageries cérébrales par résonance magnétique et des tests microbiologiques ont permis aux médecins de poser un diagnostic de toxoplasmose cérébrale associée à un œdème cérébral. Par la suite, d’autres analyses ont révélé la présence du VIH et du VHC. À son admission, le taux de lymphocytes T CD4 était de 46 cellules/µl (numération normale : 700 à 1100 cellules/µl) et la charge virale était de 140 896 copies/ml.",
        "Maladie, Symptôme, Âge, Poids, Taille, Substance, Traitement",
        0.5,
        False,
    ],
    [
        "Une patiente caucasienne de 32 ans, pesant 68 kg et ne présentant aucune allergie médicamenteuse ni aucun antécédent médical pertinent hormis un asthme allergique, a été admise à l’unité de greffe de cellules hématopoïétiques. Quatre mois avant cette admission, la patiente se plaignait de fatigue et d’ecchymoses. Des examens hématologiques avaient permis de poser un diagnostic de leucémie aiguë lymphoblastique. Une rémission complète a été obtenue après un traitement d’induction consistant en quatre cycles de chimiothérapie de type hyperCVAD (cyclophosphamide hyperfractionnée, vincristine, doxorubicine, dexaméthasone). Les analyses cytogénétiques ont révélé l’absence du chromosome de Philadelphie, mais la présence d’un réarrangement du gène MML (mixed lineage leukemia) représentait un risque élevé de récidive de la leucémie. Une greffe de cellules hématopoïétiques a alors été recommandée avec le concours d’un donneur non apparenté, la patiente n’ayant pas de donneur compatible dans sa fratrie. Le régime de conditionnement utilisé a été l’association de cyclophosphamide à haute dose et de radiothérapie pancorporelle. À l’admission de la patiente pour la greffe, les analyses suivantes étaient normales : fonctions rénales (créatinine : 62 μmol/l), hépatiques (bilirubine totale : 5 μmol/l; alanine aminotransférase : 5 U/l; aspartate aminotransférase : 13 U/l) et hématologiques (globules blancs : 4,1 × 109/l; neutrophiles : 2,4 × 109/l; plaquettes : 236 × 109/l; hémoglobine : 122 g/l).",
        "Maladie, Symptôme, Âge, Poids, Taille, Substance, Traitement",
        0.5,
        False,
    ],
    [
        "Le diagnostic de phéochromocytome vésical a été suspecté, le dosage de l'acide vanyl-mandélique urinaire (VMA) était normal, le dosage des cathécholamines n'a pas été réalisé.",
        "Maladie, Symptôme, Âge, Poids, Taille, Substance, Traitement",
        0.5,
        False,
    ],
]


def ner(
    text, labels: str, threshold: float, nested_ner: bool
) -> Dict[str, Union[str, int, float]]:
    labels = labels.split(",")
    return {
        "text": text,
        "entities": [
            {
                "entity": entity["label"],
                "word": entity["text"],
                "start": entity["start"],
                "end": entity["end"],
                "score": 0,
            }
            for entity in model.predict_entities(
                text, labels, flat_ner=not nested_ner, threshold=threshold
            )
        ],
    }


with gr.Blocks(title="CamemBERT-bio-gliner", theme=gr.themes.Soft()) as demo:
    gr.Markdown(
        """
        <img src="https://camembert-bio-model.fr/authors/camembert-bio/camembert-bio-ner-logo.png" alt="drawing" width="250"/>
        
        # CamemBERT-bio-gliner : Zero-shot French Biomedical Named Entity Recognition

        CamemBERT-bio-gliner is a Named Entity Recognition (NER) model capable of identifying any french biomedical entity type using a BERT-like encoder. It provides a practical alternative to traditional NER models, which are limited to predefined entities, and Large Language Models (LLMs) that, despite their flexibility, are costly and large for resource-constrained scenarios.

        [CamemBERT-bio](https://huggingface.co/almanach/camembert-bio-base) is used as a backbone.

        This model is based on the fantastic work of [Urchade Zaratiana](https://huggingface.co/urchade) on the [GLiNER](https://github.com/urchade/GLiNER) architecture.

        ⚠️ This is the v0.1 of the model. There might be a few quirks or unexpected predictions. So, if you notice anything off or have suggestions for improvements, we'd really appreciate hearing from you!

        ## Links

        * Model: https://huggingface.co/almanach/camembert-bio-gliner-v0.1
        * Backbone model: https://huggingface.co/almanach/camembert-bio-base
        * GLiNER library: https://github.com/urchade/GLiNER
        * Developed by: [Rian Touchent](https://rian-t.github.io), [Eric Villemonte de La Clergerie](http://pauillac.inria.fr/~clerger/)
        * Logo by: [Alix Chagué](https://alix-tz.github.io/), [Rian Touchent](https://rian-t.github.io)
        * License: MIT
        """
    )
    with gr.Accordion("How to run this model locally", open=False):
        gr.Markdown(
            """
            ## Installation
            To use this model, you must install the GLiNER Python library:
            ```
            !pip install gliner
            ```
         
            ## Usage
            Once you've downloaded the GLiNER library, you can import the GLiNER class. You can then load this model using `GLiNER.from_pretrained` and predict entities with `predict_entities`.
            """
        )
        gr.Code(
            '''
from gliner import GLiNER

model = GLiNER.from_pretrained("almanach/camembert-bio-gliner-v0.1")

text = """
Mme A.P. âgée de 52 ans, non tabagique, ayant un diabète de type 2 a été hospitalisée pour une pneumopathie infectieuse. Cette patiente présentait depuis 2 ans des infections respiratoires traités en ambulatoire. L’examen physique a trouvé une fièvre à 38ºc et un foyer de râles crépitants de la base pulmonaire droite.
"""

labels = ["Âge", "Patient", "Maladie", "Symptômes"]

entities = model.predict_entities(text, labels)

for entity in entities:
    print(entity["text"], "=>", entity["label"])
            ''',
            language="python",
        )
        gr.Code(
            """
Mme A.P. => Patient
52 ans => Âge
pneumopathie infectieuse => Maladie
infections respiratoires => Maladie
fièvre => Symptômes
râles crépitants => Symptômes
            """
        )

    input_text = gr.Textbox(
        value=examples[0][0], label="Text input", placeholder="Enter your text here"
    )
    with gr.Row() as row:
        labels = gr.Textbox(
            value=examples[0][1],
            label="Labels (stongly recommended to put the first letter in uppercase)",
            placeholder="Enter your labels here (comma separated)",
            scale=2,
        )
        threshold = gr.Slider(
            0,
            1,
            value=0.5,
            step=0.01,
            label="Threshold",
            info="Lower the threshold to increase how many entities get predicted.",
            scale=1,
        )
        nested_ner = gr.Checkbox(
            value=False,
            label="Nested NER",
            info="Allow for nested NER?",
            scale=0,
        )
    output = gr.HighlightedText(label="Predicted Entities")
    submit_btn = gr.Button("Submit", variant="primary", size="lg")
    examples = gr.Examples(
        examples,
        fn=ner,
        inputs=[input_text, labels, threshold, nested_ner],
        outputs=output,
        cache_examples=True,
    )

    # Submitting
    input_text.submit(
        fn=ner, inputs=[input_text, labels, threshold, nested_ner], outputs=output
    )
    labels.submit(
        fn=ner, inputs=[input_text, labels, threshold, nested_ner], outputs=output
    )
    threshold.release(
        fn=ner, inputs=[input_text, labels, threshold, nested_ner], outputs=output
    )
    submit_btn.click(
        fn=ner, inputs=[input_text, labels, threshold, nested_ner], outputs=output
    )
    nested_ner.change(
        fn=ner, inputs=[input_text, labels, threshold, nested_ner], outputs=output
    )

demo.queue()
demo.launch(debug=True)