|
--- |
|
license: apache-2.0 |
|
tags: |
|
- onnx |
|
- ort |
|
--- |
|
|
|
# [google-bert/bert-large-cased-whole-word-masking](https://huggingface.co/google-bert/bert-large-cased-whole-word-masking) のONNXおよびORTモデルと量子化モデル |
|
|
|
[Click here for the English README](README.md) |
|
|
|
このリポジトリは、元のモデル [google-bert/bert-large-cased-whole-word-masking](https://huggingface.co/google-bert/bert-large-cased-whole-word-masking) をONNXおよびORT形式に変換し、さらに量子化したものです。 |
|
|
|
## ライセンス |
|
このモデルのライセンスは「apache-2.0」です。詳細は元のモデルページ([google-bert/bert-large-cased-whole-word-masking](https://huggingface.co/google-bert/bert-large-cased-whole-word-masking))を参照してください。 |
|
|
|
## 使い方 |
|
このモデルを使用するには、ONNX Runtimeをインストールし、以下のように推論を行います。 |
|
```python |
|
# サンプルコード |
|
import onnxruntime as ort |
|
import numpy as np |
|
from transformers import AutoTokenizer |
|
import os |
|
|
|
# トークナイザーの読み込み |
|
tokenizer = AutoTokenizer.from_pretrained('google-bert/bert-large-cased-whole-word-masking') |
|
|
|
# 入力の準備 |
|
text = 'ここに入力テキストを置き換えてください。' |
|
inputs = tokenizer(text, return_tensors='np') |
|
|
|
# 使用するモデルのパスを指定 |
|
# ONNXモデルとORTモデルの両方をテストする |
|
model_paths = [ |
|
'onnx_models/model_opt.onnx', # ONNXモデル |
|
'ort_models/model.ort' # ORTフォーマットのモデル |
|
] |
|
|
|
# モデルごとに推論を実行 |
|
for model_path in model_paths: |
|
print(f'\n===== Using model: {model_path} =====') |
|
# モデルの拡張子を取得 |
|
model_extension = os.path.splitext(model_path)[1] |
|
|
|
# モデルの読み込み |
|
if model_extension == '.ort': |
|
# ORTフォーマットのモデルをロード |
|
session = ort.InferenceSession(model_path, providers=['CPUExecutionProvider']) |
|
else: |
|
# ONNXモデルをロード |
|
session = ort.InferenceSession(model_path) |
|
|
|
# 推論の実行 |
|
outputs = session.run(None, dict(inputs)) |
|
|
|
# 出力の形状を表示 |
|
for idx, output in enumerate(outputs): |
|
print(f'Output {idx} shape: {output.shape}') |
|
|
|
# 結果の表示(必要に応じて処理を追加) |
|
print(outputs) |
|
``` |
|
|
|
## モデルの内容 |
|
このリポジトリには、以下のモデルが含まれています。 |
|
|
|
### ONNXモデル |
|
- `onnx_models/model.onnx`: [google-bert/bert-large-cased-whole-word-masking](https://huggingface.co/google-bert/bert-large-cased-whole-word-masking) から変換された元のONNXモデル |
|
- `onnx_models/model_opt.onnx`: 最適化されたONNXモデル |
|
- `onnx_models/model_fp16.onnx`: FP16による量子化モデル |
|
- `onnx_models/model_int8.onnx`: INT8による量子化モデル |
|
- `onnx_models/model_uint8.onnx`: UINT8による量子化モデル |
|
|
|
### ORTモデル |
|
- `ort_models/model.ort`: 最適化されたONNXモデルを使用したORTモデル |
|
- `ort_models/model_fp16.ort`: FP16量子化モデルを使用したORTモデル |
|
- `ort_models/model_int8.ort`: INT8量子化モデルを使用したORTモデル |
|
- `ort_models/model_uint8.ort`: UINT8量子化モデルを使用したORTモデル |
|
|
|
## 注意事項 |
|
元のモデル [google-bert/bert-large-cased-whole-word-masking](https://huggingface.co/google-bert/bert-large-cased-whole-word-masking) のライセンスおよび使用条件を遵守してください。 |
|
|
|
## 貢献 |
|
問題や改善点があれば、Issueを作成するかプルリクエストを送ってください。 |
|
|