generate-subtitles-for-videos

Running

App Files Files Community

csukuangfj commited on Oct 25, 2024

Commit

c0c87b2

1 Parent(s): a1e6695

update russian models

Browse files

Files changed (2) hide show

model.py +46 -4
requirements.txt +2 -2

model.py CHANGED Viewed

@@ -147,20 +147,56 @@ def _get_chinese_dialect_models(repo_id: str) -> sherpa_onnx.OfflineRecognizer:
 @lru_cache(maxsize=10)
-def _get_russian_pre_trained_model(repo_id: str) -> sherpa_onnx.OfflineRecognizer:
     assert repo_id in (
         "alphacep/vosk-model-ru",
         "alphacep/vosk-model-small-ru",
     ), repo_id
     if repo_id == "alphacep/vosk-model-ru":
         model_dir = "am-onnx"
     elif repo_id == "alphacep/vosk-model-small-ru":
         model_dir = "am"
     encoder_model = _get_nn_model_filename(
         repo_id=repo_id,
-        filename="encoder.onnx",
         subfolder=model_dir,
     )
@@ -176,7 +212,10 @@ def _get_russian_pre_trained_model(repo_id: str) -> sherpa_onnx.OfflineRecognize
         subfolder=model_dir,
     )
-    tokens = _get_token_filename(repo_id=repo_id, subfolder="lang")
     recognizer = sherpa_onnx.OfflineRecognizer.from_transducer(
         tokens=tokens,
@@ -186,7 +225,8 @@ def _get_russian_pre_trained_model(repo_id: str) -> sherpa_onnx.OfflineRecognize
         num_threads=2,
         sample_rate=16000,
         feature_dim=80,
-        decoding_method="greedy_search",
     )
     return recognizer
@@ -546,6 +586,8 @@ korean_models = {
 }
 russian_models = {
     "alphacep/vosk-model-ru": _get_russian_pre_trained_model,
     "alphacep/vosk-model-small-ru": _get_russian_pre_trained_model,
 }

 @lru_cache(maxsize=10)
+def _get_russian_pre_trained_model_ctc(
+    repo_id: str, decoding_method: str, num_active_paths: int
+) -> sherpa_onnx.OfflineRecognizer:
+    assert repo_id in (
+        "csukuangfj/sherpa-onnx-nemo-ctc-giga-am-russian-2024-10-24",
+    ), repo_id
+    model = _get_nn_model_filename(
+        repo_id=repo_id,
+        filename="model.int8.onnx",
+        subfolder=".",
+    )
+    tokens = _get_token_filename(repo_id=repo_id, subfolder=".")
+    recognizer = sherpa_onnx.OfflineRecognizer.from_nemo_ctc(
+        model=model,
+        tokens=tokens,
+        num_threads=2,
+    )
+    return recognizer
+@lru_cache(maxsize=10)
+def _get_russian_pre_trained_model(
+    repo_id: str, decoding_method: str, num_active_paths: int
+) -> sherpa_onnx.OfflineRecognizer:
     assert repo_id in (
         "alphacep/vosk-model-ru",
         "alphacep/vosk-model-small-ru",
+        "csukuangfj/sherpa-onnx-nemo-transducer-giga-am-russian-2024-10-24",
     ), repo_id
     if repo_id == "alphacep/vosk-model-ru":
         model_dir = "am-onnx"
+        encoder = "encoder.onnx"
+        model_type = "transducer"
     elif repo_id == "alphacep/vosk-model-small-ru":
         model_dir = "am"
+        encoder = "encoder.onnx"
+        model_type = "transducer"
+    elif repo_id == "csukuangfj/sherpa-onnx-nemo-transducer-giga-am-russian-2024-10-24":
+        model_dir = "."
+        encoder = "encoder.int8.onnx"
+        model_type = "nemo_transducer"
     encoder_model = _get_nn_model_filename(
         repo_id=repo_id,
+        filename=encoder,
         subfolder=model_dir,
     )
         subfolder=model_dir,
     )
+    if repo_id == "csukuangfj/sherpa-onnx-nemo-transducer-giga-am-russian-2024-10-24":
+        tokens = _get_token_filename(repo_id=repo_id, subfolder=".")
+    else:
+        tokens = _get_token_filename(repo_id=repo_id, subfolder="lang")
     recognizer = sherpa_onnx.OfflineRecognizer.from_transducer(
         tokens=tokens,
         num_threads=2,
         sample_rate=16000,
         feature_dim=80,
+        decoding_method=decoding_method,
+        model_type=model_type,
     )
     return recognizer
 }
 russian_models = {
+    "csukuangfj/sherpa-onnx-nemo-transducer-giga-am-russian-2024-10-24": _get_russian_pre_trained_model,
+    "csukuangfj/sherpa-onnx-nemo-ctc-giga-am-russian-2024-10-24": _get_russian_pre_trained_model_ctc,
     "alphacep/vosk-model-ru": _get_russian_pre_trained_model,
     "alphacep/vosk-model-small-ru": _get_russian_pre_trained_model,
 }

requirements.txt CHANGED Viewed

@@ -1,4 +1,4 @@
-sherpa-onnx>=1.9.21
 ffmpeg-python
-#https://huggingface.co/csukuangfj/sherpa-onnx-wheels/resolve/main/sherpa_onnx-1.9.26-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl

+#sherpa-onnx>=1.9.21
 ffmpeg-python
+https://huggingface.co/csukuangfj/sherpa-onnx-wheels/resolve/main/cpu/1.10.28/sherpa_onnx-1.10.28-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl