cszhzleo
/

Meta-Llama-3.1-8B-Instruct-nc2-bs1-token4096-neuron-220

Model card Files Files and versions Community

cszhzleo commited on Sep 25, 2024

Commit

a804089

·

verified ·

1 Parent(s): decb4b1

Update README.md

Files changed (1) hide show

README.md +5 -2

README.md CHANGED Viewed

@@ -3,17 +3,20 @@ license: mit
 ---
 ### environment
 optimum-neuron  0.0.25.dev0
 neuron 2.20.0
 transformers-neuronx  0.12.313
 transformers    4.43.2
 ### export
 ```
 optimum-cli export neuron  --model NousResearch/Meta-Llama-3.1-8B-Instruct --batch_size 1 --sequence_length 4096 --num_cores 2 --auto_cast_type fp16  ./models-hf/NousResearch/Meta-Llama-3.1-8B-Instruct
 ```
 ### run
 ```
 docker run -it --name llama-31 --rm \

 ---
 ### environment
 optimum-neuron  0.0.25.dev0
 neuron 2.20.0
 transformers-neuronx  0.12.313
 transformers    4.43.2
 ### export
 ```
 optimum-cli export neuron  --model NousResearch/Meta-Llama-3.1-8B-Instruct --batch_size 1 --sequence_length 4096 --num_cores 2 --auto_cast_type fp16  ./models-hf/NousResearch/Meta-Llama-3.1-8B-Instruct
 ```
 ### run
 ```
 docker run -it --name llama-31 --rm \