NanoTranslator-M / README_zh-CN.md
Mxode's picture
update
4bd302e
|
raw
history blame
910 Bytes
metadata
license: gpl-3.0

NanoTranslator-L

Introduction

这是 NanoTranslator 的 Large 型号,目前仅支持英译中。仓库中同时提供了 ONNX 版本的模型。

Size Params. V. H. I. L. Att. H. KV H. Tie Emb.
XL 50 M 8000 320 1792 24 16 4 True
L 22 M 8000 256 1408 16 16 4 True
M 9 M 4000 168 896 16 12 4 True
S 2 M 2000 96 512 12 12 4 True
  • V. - vocab size
  • H. - hidden size
  • I. - intermediate size
  • L. - num layers
  • Att. H. - num attention heads
  • KV H. - num kv heads
  • Tie Emb. - tie word embeddings

How to use

Normal

ONNX