rntc's picture
add disclaimer
98d31b1
raw
history blame
11.8 kB
from typing import Dict, Union
from gliner import GLiNER
import gradio as gr
model = GLiNER.from_pretrained("almanach/camembert-bio-gliner-v0.1")
examples = [
[
"Le cas présenté concerne un homme âgé de 61 ans (71 kg, 172 cm, soit un indice de masse corporelle de 23,9 kg/m²) admissible à une transplantation pulmonaire en raison d’une insuffisance respiratoire chronique terminale sur emphysème post-tabagique, sous oxygénothérapie continue (1 L/min) et ventilation non invasive nocturne. Il présente, comme principaux antécédents, une dyslipidémie, une hypertension artérielle et un tabagisme sevré estimé à 21 paquets-années (facteurs de risque cardiovasculaires). Le bilan préopératoire a révélé une hypertension artérielle pulmonaire essentiellement postcapillaire conduisant à l’ajout du périndopril (2 mg par jour) et du furosémide (40 mg par jour). La mise en évidence d’un Elispot (enzyme-linked immunospot) positif pour la tuberculose a motivé l’introduction d’un traitement prophylactique par l’association rifampicine-isoniazide (600-300 mg par jour) pour une durée de trois mois.",
"Maladie, Symptôme, Âge, Poids, Taille, Substance, Traitement, Dosage",
0.5,
False,
],
[
"Un patient de 32 ans, ayant des antécédents de polytoxicomanie (cocaïne, ecstasy, amphétamines et cannabis) et d’éthylisme chronique est admis aux urgences pour des signes cliniques apparus dans les trois jours précédents : agitation, hallucinations auditives et visuelles, propos incohérents, anorexie, insomnie, céphalées modérées. Sur le plan hémodynamique la fréquence cardiaque est de 84 bpm, la tension artérielle est de 114/91 mmHg et l’ECG est normal. L’examen clinique est par ailleurs sans particularité en dehors de pupilles en mydriase. Le bilan d’entrée biologique montre des CPK à 535 UI/L, une hémoglobinémie à 17,0 g/dL, une lactacidémie normale à 0,7 mmol/L, de même que la gazométrie (pH 7,41, pCO2 40 mmHg, p02 73 mmHg). L’alcoolémie à l’admission est nulle. Le patient explique qu’il a ingéré 250 mg de désoxypipradrol acheté sur Internet. L’agitation du patient dans un contexte concomitant de sevrage éthylique a nécessité une sédation par oxazépam. À J5 de l’ingestion, le patient était plus calme, se plaignait encore de quelques céphalées et ne présentait ni hallucination, ni fièvre. À J7, l’ensemble des symptômes avait disparu.",
"Maladie, Symptôme, Âge, Poids, Taille, Substance, Traitement, Dose",
0.5,
False,
],
[
"Une femme de 50 ans d’origine africaine s’est présentée au service des urgences avec des symptômes d’atteinte neurologique de confusion, d’ataxie, de paresthésie et de céphalées. Elle n’avait aucun antécédent médical connu, puisqu’elle n’avait pas consulté de médecin depuis des années. Elle ne prenait aucun médicament ni produit de santé naturel, n’avait pas d’allergie, ne fumait pas et ne consommait pas d’alcool. Les symptômes décrits s’étaient progressivement aggravés au cours des deux dernières semaines. Elle avait aussi noté une perte de poids au cours des derniers mois. Une prise de sang révéla une pancytopénie ainsi qu’une insuffisance rénale avec une clairance de la créatinine estimée à 45 ml/min selon la formule de Cockcroft et Gault pour un poids de 48,2 kg et un taux de créatinine sérique de 98 µmol/L7. Les valeurs de laboratoire à l’admission de la patiente sont détaillées dans le tableau I. Les examens radiologiques, tels qu’une tomoden­ sitométrie axiale cérébrale ainsi que des imageries cérébrales par résonance magnétique et des tests microbiologiques ont permis aux médecins de poser un diagnostic de toxoplasmose cérébrale associée à un œdème cérébral. Par la suite, d’autres analyses ont révélé la présence du VIH et du VHC. À son admission, le taux de lymphocytes T CD4 était de 46 cellules/µl (numération normale : 700 à 1100 cellules/µl) et la charge virale était de 140 896 copies/ml.",
"Maladie, Symptôme, Âge, Poids, Taille, Substance, Traitement",
0.5,
False,
],
[
"Une patiente caucasienne de 32 ans, pesant 68 kg et ne présentant aucune allergie médicamenteuse ni aucun antécédent médical pertinent hormis un asthme allergique, a été admise à l’unité de greffe de cellules hématopoïétiques. Quatre mois avant cette admission, la patiente se plaignait de fatigue et d’ecchymoses. Des examens hématologiques avaient permis de poser un diagnostic de leucémie aiguë lymphoblastique. Une rémission complète a été obtenue après un traitement d’induction consistant en quatre cycles de chimiothérapie de type hyperCVAD (cyclophosphamide hyperfractionnée, vincristine, doxorubicine, dexaméthasone). Les analyses cytogénétiques ont révélé l’absence du chromosome de Philadelphie, mais la présence d’un réarrangement du gène MML (mixed lineage leukemia) représentait un risque élevé de récidive de la leucémie. Une greffe de cellules hématopoïétiques a alors été recommandée avec le concours d’un donneur non apparenté, la patiente n’ayant pas de donneur compatible dans sa fratrie. Le régime de conditionnement utilisé a été l’association de cyclophosphamide à haute dose et de radiothérapie pancorporelle. À l’admission de la patiente pour la greffe, les analyses suivantes étaient normales : fonctions rénales (créatinine : 62 μmol/l), hépatiques (bilirubine totale : 5 μmol/l; alanine aminotransférase : 5 U/l; aspartate aminotransférase : 13 U/l) et hématologiques (globules blancs : 4,1 × 109/l; neutrophiles : 2,4 × 109/l; plaquettes : 236 × 109/l; hémoglobine : 122 g/l).",
"Maladie, Symptôme, Âge, Poids, Taille, Substance, Traitement",
0.5,
False,
],
[
"Le diagnostic de phéochromocytome vésical a été suspecté, le dosage de l'acide vanyl-mandélique urinaire (VMA) était normal, le dosage des cathécholamines n'a pas été réalisé.",
"Maladie, Symptôme, Âge, Poids, Taille, Substance, Traitement",
0.5,
False,
],
]
def ner(
text, labels: str, threshold: float, nested_ner: bool
) -> Dict[str, Union[str, int, float]]:
labels = labels.split(",")
return {
"text": text,
"entities": [
{
"entity": entity["label"],
"word": entity["text"],
"start": entity["start"],
"end": entity["end"],
"score": 0,
}
for entity in model.predict_entities(
text, labels, flat_ner=not nested_ner, threshold=threshold
)
],
}
with gr.Blocks(title="CamemBERT-bio-gliner", theme=gr.themes.Soft()) as demo:
gr.Markdown(
"""
<img src="https://camembert-bio-model.fr/authors/camembert-bio/camembert-bio-ner-logo.png" alt="drawing" width="250"/>
# CamemBERT-bio-gliner : Zero-shot French Biomedical Named Entity Recognition
CamemBERT-bio-gliner is a Named Entity Recognition (NER) model capable of identifying any french biomedical entity type using a BERT-like encoder. It provides a practical alternative to traditional NER models, which are limited to predefined entities, and Large Language Models (LLMs) that, despite their flexibility, are costly and large for resource-constrained scenarios.
[CamemBERT-bio](https://huggingface.co/almanach/camembert-bio-base) is used as a backbone.
This model is based on the fantastic work of [Urchade Zaratiana](https://huggingface.co/urchade) on the [GLiNER](https://github.com/urchade/GLiNER) architecture.
⚠️ This is the v0.1 of the model. There might be a few quirks or unexpected predictions. So, if you notice anything off or have suggestions for improvements, we'd really appreciate hearing from you!
## Links
* Model: https://huggingface.co/almanach/camembert-bio-gliner-v0.1
* Backbone model: https://huggingface.co/almanach/camembert-bio-base
* GLiNER library: https://github.com/urchade/GLiNER
* Developed by: [Rian Touchent](https://rian-t.github.io), [Eric Villemonte de La Clergerie](http://pauillac.inria.fr/~clerger/)
* Logo by: [Alix Chagué](https://alix-tz.github.io/), [Rian Touchent](https://rian-t.github.io)
* License: MIT
"""
)
with gr.Accordion("How to run this model locally", open=False):
gr.Markdown(
"""
## Installation
To use this model, you must install the GLiNER Python library:
```
!pip install gliner
```
## Usage
Once you've downloaded the GLiNER library, you can import the GLiNER class. You can then load this model using `GLiNER.from_pretrained` and predict entities with `predict_entities`.
"""
)
gr.Code(
'''
from gliner import GLiNER
model = GLiNER.from_pretrained("almanach/camembert-bio-gliner-v0.1")
text = """
Mme A.P. âgée de 52 ans, non tabagique, ayant un diabète de type 2 a été hospitalisée pour une pneumopathie infectieuse. Cette patiente présentait depuis 2 ans des infections respiratoires traités en ambulatoire. L’examen physique a trouvé une fièvre à 38ºc et un foyer de râles crépitants de la base pulmonaire droite.
"""
labels = ["Âge", "Patient", "Maladie", "Symptômes"]
entities = model.predict_entities(text, labels)
for entity in entities:
print(entity["text"], "=>", entity["label"])
''',
language="python",
)
gr.Code(
"""
Mme A.P. => Patient
52 ans => Âge
pneumopathie infectieuse => Maladie
infections respiratoires => Maladie
fièvre => Symptômes
râles crépitants => Symptômes
"""
)
input_text = gr.Textbox(
value=examples[0][0], label="Text input", placeholder="Enter your text here"
)
with gr.Row() as row:
labels = gr.Textbox(
value=examples[0][1],
label="Labels (stongly recommended to put the first letter in uppercase)",
placeholder="Enter your labels here (comma separated)",
scale=2,
)
threshold = gr.Slider(
0,
1,
value=0.5,
step=0.01,
label="Threshold",
info="Lower the threshold to increase how many entities get predicted.",
scale=1,
)
nested_ner = gr.Checkbox(
value=False,
label="Nested NER",
info="Allow for nested NER?",
scale=0,
)
output = gr.HighlightedText(label="Predicted Entities")
submit_btn = gr.Button("Submit", variant="primary", size="lg")
examples = gr.Examples(
examples,
fn=ner,
inputs=[input_text, labels, threshold, nested_ner],
outputs=output,
cache_examples=True,
)
# Submitting
input_text.submit(
fn=ner, inputs=[input_text, labels, threshold, nested_ner], outputs=output
)
labels.submit(
fn=ner, inputs=[input_text, labels, threshold, nested_ner], outputs=output
)
threshold.release(
fn=ner, inputs=[input_text, labels, threshold, nested_ner], outputs=output
)
submit_btn.click(
fn=ner, inputs=[input_text, labels, threshold, nested_ner], outputs=output
)
nested_ner.change(
fn=ner, inputs=[input_text, labels, threshold, nested_ner], outputs=output
)
demo.queue()
demo.launch(debug=True)