Spaces:

Sakshiw1
/

OCR_app

Sleeping

Sakshiw1 commited on Sep 26, 2024

Commit

e74a5f3

verified ·

1 Parent(s): 966ae71

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,11 +1,19 @@
 import gradio as gr
 from transformers import pipeline
 import re
 # Load the OCR pipeline from Hugging Face
-ocr_pipeline = pipeline("image-to-text", model="microsoft/trocr-base-stage1")
 def perform_ocr(image):
     text = ocr_pipeline(image)[0]['generated_text']
     return text
@@ -45,4 +53,4 @@ def web_app():
     interface.launch()
 if __name__ == "__main__":
-    web_app()

 import gradio as gr
 from transformers import pipeline
 import re
+from PIL import ImageFilter
 # Load the OCR pipeline from Hugging Face
+ocr_pipeline = pipeline("image-to-text", model="microsoft/trocr-large-stage1")  # Use a different model
+def preprocess_image(image):
+    image = image.convert('L')  # Convert to grayscale
+    image = image.filter(ImageFilter.SHARPEN)  # Apply some filtering
+    return image
 def perform_ocr(image):
+    # Preprocess the image before OCR
+    image = preprocess_image(image)
     text = ocr_pipeline(image)[0]['generated_text']
     return text
     interface.launch()
 if __name__ == "__main__":
+    web_app()