qualcomm
/

Whisper-Small-En

@@ -38,68 +38,47 @@ More details on model performance across various devices, can be found
 | Model | Device | Chipset | Target Runtime | Inference Time (ms) | Peak Memory Range (MB) | Precision | Primary Compute Unit | Target Model
 |---|---|---|---|---|---|---|---|---|
-| WhisperDecoder | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | TFLITE | 29.126 ms | 16 - 96 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | QNN | 11.961 ms | 54 - 137 MB | FP16 | NPU | [Whisper-Small-En.so](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.so) |
-| WhisperDecoder | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | ONNX | 61.425 ms | 154 - 199 MB | FP16 | NPU | [Whisper-Small-En.onnx](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.onnx) |
-| WhisperDecoder | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | TFLITE | 23.441 ms | 16 - 150 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | QNN | 9.604 ms | 53 - 160 MB | FP16 | NPU | [Whisper-Small-En.so](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.so) |
-| WhisperDecoder | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | ONNX | 51.698 ms | 16 - 327 MB | FP16 | NPU | [Whisper-Small-En.onnx](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.onnx) |
-| WhisperDecoder | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | TFLITE | 18.162 ms | 16 - 176 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | QNN | 7.555 ms | 49 - 184 MB | FP16 | NPU | Use Export Script |
-| WhisperDecoder | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | ONNX | 42.696 ms | 86 - 408 MB | FP16 | NPU | [Whisper-Small-En.onnx](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.onnx) |
-| WhisperDecoder | QCS8550 (Proxy) | QCS8550 Proxy | TFLITE | 29.309 ms | 16 - 101 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | QCS8550 (Proxy) | QCS8550 Proxy | QNN | 12.213 ms | 61 - 63 MB | FP16 | NPU | Use Export Script |
-| WhisperDecoder | SA7255P ADP | SA7255P | TFLITE | 100.26 ms | 16 - 175 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | SA7255P ADP | SA7255P | QNN | 74.87 ms | 60 - 70 MB | FP16 | NPU | Use Export Script |
-| WhisperDecoder | SA8255 (Proxy) | SA8255P Proxy | TFLITE | 29.902 ms | 16 - 101 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | SA8255 (Proxy) | SA8255P Proxy | QNN | 12.096 ms | 54 - 55 MB | FP16 | NPU | Use Export Script |
-| WhisperDecoder | SA8295P ADP | SA8295P | TFLITE | 31.128 ms | 16 - 164 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | SA8295P ADP | SA8295P | QNN | 14.544 ms | 57 - 71 MB | FP16 | NPU | Use Export Script |
-| WhisperDecoder | SA8650 (Proxy) | SA8650P Proxy | TFLITE | 29.982 ms | 14 - 97 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | SA8650 (Proxy) | SA8650P Proxy | QNN | 12.14 ms | 57 - 59 MB | FP16 | NPU | Use Export Script |
-| WhisperDecoder | SA8775P ADP | SA8775P | TFLITE | 33.024 ms | 16 - 175 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | SA8775P ADP | SA8775P | QNN | 14.735 ms | 57 - 66 MB | FP16 | NPU | Use Export Script |
-| WhisperDecoder | QCS8450 (Proxy) | QCS8450 Proxy | TFLITE | 33.055 ms | 16 - 140 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
-| WhisperDecoder | QCS8450 (Proxy) | QCS8450 Proxy | QNN | 16.795 ms | 53 - 172 MB | FP16 | NPU | Use Export Script |
-| WhisperDecoder | Snapdragon X Elite CRD | Snapdragon® X Elite | QNN | 10.56 ms | 61 - 61 MB | FP16 | NPU | Use Export Script |
-| WhisperDecoder | Snapdragon X Elite CRD | Snapdragon® X Elite | ONNX | 52.337 ms | 232 - 232 MB | FP16 | NPU | [Whisper-Small-En.onnx](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.onnx) |
-| WhisperEncoder | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | TFLITE | 807.519 ms | 79 - 160 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | QNN | 804.747 ms | 0 - 211 MB | FP16 | NPU | [Whisper-Small-En.so](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.so) |
-| WhisperEncoder | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | TFLITE | 602.309 ms | 110 - 200 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | QNN | 597.586 ms | 0 - 837 MB | FP16 | NPU | [Whisper-Small-En.so](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.so) |
-| WhisperEncoder | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | ONNX | 869.225 ms | 0 - 1429 MB | FP16 | NPU | [Whisper-Small-En.onnx](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.onnx) |
-| WhisperEncoder | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | TFLITE | 544.489 ms | 111 - 141 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | QNN | 515.742 ms | 0 - 906 MB | FP16 | NPU | Use Export Script |
-| WhisperEncoder | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | ONNX | 677.156 ms | 172 - 1609 MB | FP16 | NPU | [Whisper-Small-En.onnx](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.onnx) |
-| WhisperEncoder | QCS8550 (Proxy) | QCS8550 Proxy | TFLITE | 1255.513 ms | 18 - 221 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | QCS8550 (Proxy) | QCS8550 Proxy | QNN | 675.441 ms | 1 - 3 MB | FP16 | NPU | Use Export Script |
-| WhisperEncoder | SA7255P ADP | SA7255P | TFLITE | 4429.057 ms | 109 - 142 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | SA7255P ADP | SA7255P | QNN | 3217.361 ms | 1 - 11 MB | FP16 | NPU | Use Export Script |
-| WhisperEncoder | SA8255 (Proxy) | SA8255P Proxy | TFLITE | 685.501 ms | 110 - 158 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | SA8255 (Proxy) | SA8255P Proxy | QNN | 687.338 ms | 1 - 3 MB | FP16 | NPU | Use Export Script |
-| WhisperEncoder | SA8295P ADP | SA8295P | TFLITE | 657.369 ms | 110 - 142 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | SA8295P ADP | SA8295P | QNN | 700.793 ms | 0 - 15 MB | FP16 | NPU | Use Export Script |
-| WhisperEncoder | SA8650 (Proxy) | SA8650P Proxy | TFLITE | 686.08 ms | 50 - 129 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | SA8650 (Proxy) | SA8650P Proxy | QNN | 674.708 ms | 0 - 3 MB | FP16 | NPU | Use Export Script |
-| WhisperEncoder | SA8775P ADP | SA8775P | TFLITE | 1287.541 ms | 88 - 121 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | SA8775P ADP | SA8775P | QNN | 604.581 ms | 1 - 10 MB | FP16 | NPU | Use Export Script |
-| WhisperEncoder | QCS8450 (Proxy) | QCS8450 Proxy | TFLITE | 983.989 ms | 58 - 157 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
-| WhisperEncoder | Snapdragon X Elite CRD | Snapdragon® X Elite | QNN | 505.395 ms | 0 - 0 MB | FP16 | NPU | Use Export Script |
-| WhisperEncoder | Snapdragon X Elite CRD | Snapdragon® X Elite | ONNX | 1340.942 ms | 237 - 237 MB | FP16 | NPU | [Whisper-Small-En.onnx](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.onnx) |
 ## Installation
-This model can be installed as a Python package via pip.
 ```bash
-pip install "qai-hub-models[whisper_small_en]"
 ```
 ## Configure Qualcomm® AI Hub to run this model on a cloud-hosted device
 Sign-in to [Qualcomm® AI Hub](https://app.aihub.qualcomm.com/) with your
@@ -150,8 +129,8 @@ Profiling Results
 WhisperDecoder
 Device                          : Samsung Galaxy S23 (13)
 Runtime                         : TFLITE
-Estimated inference time (ms)   : 29.1
-Estimated peak memory usage (MB): [16, 96]
 Total # Ops                     : 2573
 Compute Unit(s)                 : NPU (2573 ops)
@@ -159,8 +138,8 @@ Compute Unit(s)                 : NPU (2573 ops)
 WhisperEncoder
 Device                          : Samsung Galaxy S23 (13)
 Runtime                         : TFLITE
-Estimated inference time (ms)   : 807.5
-Estimated peak memory usage (MB): [79, 160]
 Total # Ops                     : 911
 Compute Unit(s)                 : GPU (900 ops) CPU (11 ops)
 ```
@@ -293,7 +272,8 @@ Explore all available models on [Qualcomm® AI Hub](https://aihub.qualcomm.com/)
 ## License
-* The license for the original implementation of Whisper-Small-En can be found [here](https://github.com/openai/whisper/blob/main/LICENSE).
 * The license for the compiled assets for on-device deployment can be found [here](https://qaihub-public-assets.s3.us-west-2.amazonaws.com/qai-hub-models/Qualcomm+AI+Hub+Proprietary+License.pdf)

 | Model | Device | Chipset | Target Runtime | Inference Time (ms) | Peak Memory Range (MB) | Precision | Primary Compute Unit | Target Model
 |---|---|---|---|---|---|---|---|---|
+| WhisperDecoder | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | TFLITE | 28.431 ms | 16 - 101 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | ONNX | 61.376 ms | 41 - 728 MB | FP16 | NPU | [Whisper-Small-En.onnx](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.onnx) |
+| WhisperDecoder | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | TFLITE | 24.241 ms | 28 - 162 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | ONNX | 48.975 ms | 0 - 306 MB | FP16 | NPU | [Whisper-Small-En.onnx](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.onnx) |
+| WhisperDecoder | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | TFLITE | 21.333 ms | 15 - 177 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | ONNX | 43.862 ms | 55 - 376 MB | FP16 | NPU | [Whisper-Small-En.onnx](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.onnx) |
+| WhisperDecoder | QCS8550 (Proxy) | QCS8550 Proxy | TFLITE | 29.124 ms | 16 - 96 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | SA7255P ADP | SA7255P | TFLITE | 101.345 ms | 16 - 175 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | SA8255 (Proxy) | SA8255P Proxy | TFLITE | 28.596 ms | 16 - 101 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | SA8295P ADP | SA8295P | TFLITE | 31.234 ms | 16 - 164 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | SA8650 (Proxy) | SA8650P Proxy | TFLITE | 28.404 ms | 16 - 101 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | SA8775P ADP | SA8775P | TFLITE | 33.076 ms | 16 - 175 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | QCS8450 (Proxy) | QCS8450 Proxy | TFLITE | 31.696 ms | 16 - 142 MB | FP16 | NPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.tflite) |
+| WhisperDecoder | Snapdragon X Elite CRD | Snapdragon® X Elite | ONNX | 51.962 ms | 231 - 231 MB | FP16 | NPU | [Whisper-Small-En.onnx](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperDecoder.onnx) |
+| WhisperEncoder | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | TFLITE | 810.289 ms | 110 - 176 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | Samsung Galaxy S23 | Snapdragon® 8 Gen 2 | ONNX | 1121.013 ms | 35 - 246 MB | FP16 | NPU | [Whisper-Small-En.onnx](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.onnx) |
+| WhisperEncoder | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | TFLITE | 528.927 ms | 110 - 206 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | Samsung Galaxy S24 | Snapdragon® 8 Gen 3 | ONNX | 851.638 ms | 156 - 1585 MB | FP16 | NPU | [Whisper-Small-En.onnx](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.onnx) |
+| WhisperEncoder | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | TFLITE | 543.701 ms | 109 - 140 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | Snapdragon 8 Elite QRD | Snapdragon® 8 Elite | ONNX | 674.597 ms | 122 - 1558 MB | FP16 | NPU | [Whisper-Small-En.onnx](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.onnx) |
+| WhisperEncoder | QCS8550 (Proxy) | QCS8550 Proxy | TFLITE | 969.98 ms | 30 - 150 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | SA7255P ADP | SA7255P | TFLITE | 4475.179 ms | 98 - 131 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | SA8255 (Proxy) | SA8255P Proxy | TFLITE | 1250.866 ms | 18 - 136 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | SA8295P ADP | SA8295P | TFLITE | 657.219 ms | 109 - 140 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | SA8650 (Proxy) | SA8650P Proxy | TFLITE | 684.483 ms | 18 - 157 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | SA8775P ADP | SA8775P | TFLITE | 1292.109 ms | 103 - 135 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | QCS8450 (Proxy) | QCS8450 Proxy | TFLITE | 1615.849 ms | 74 - 174 MB | FP16 | GPU | [Whisper-Small-En.tflite](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.tflite) |
+| WhisperEncoder | Snapdragon X Elite CRD | Snapdragon® X Elite | ONNX | 1341.576 ms | 237 - 237 MB | FP16 | NPU | [Whisper-Small-En.onnx](https://huggingface.co/qualcomm/Whisper-Small-En/blob/main/WhisperEncoder.onnx) |
 ## Installation
+Install the package via pip:
 ```bash
+pip install "qai-hub-models[whisper-small-en]"
 ```
 ## Configure Qualcomm® AI Hub to run this model on a cloud-hosted device
 Sign-in to [Qualcomm® AI Hub](https://app.aihub.qualcomm.com/) with your
 WhisperDecoder
 Device                          : Samsung Galaxy S23 (13)
 Runtime                         : TFLITE
+Estimated inference time (ms)   : 28.4
+Estimated peak memory usage (MB): [16, 101]
 Total # Ops                     : 2573
 Compute Unit(s)                 : NPU (2573 ops)
 WhisperEncoder
 Device                          : Samsung Galaxy S23 (13)
 Runtime                         : TFLITE
+Estimated inference time (ms)   : 810.3
+Estimated peak memory usage (MB): [110, 176]
 Total # Ops                     : 911
 Compute Unit(s)                 : GPU (900 ops) CPU (11 ops)
 ```
 ## License
+* The license for the original implementation of Whisper-Small-En can be found
+  [here](https://github.com/openai/whisper/blob/main/LICENSE).
 * The license for the compiled assets for on-device deployment can be found [here](https://qaihub-public-assets.s3.us-west-2.amazonaws.com/qai-hub-models/Qualcomm+AI+Hub+Proprietary+License.pdf)