phanerozoic
/

Mistral-Pirate-7b-v0.3

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

phanerozoic commited on Dec 16, 2023

Commit

09b65e4

·

1 Parent(s): bbe127c

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -57,10 +57,10 @@ Advanced preprocessing into ChatML format.
 ### Training Hyperparameters and Fine-Tuning Details
 - Training Regime: FP32
 - Warmup Steps: 1
-- Per Device Train Batch Size: 2
-- Gradient Accumulation Steps: 64
 - Max Steps: 1500
-- Learning Rate: 0.00015
 - Logging Steps: 1
 - Save Steps: 1
 - Lora Alpha: 32

 ### Training Hyperparameters and Fine-Tuning Details
 - Training Regime: FP32
 - Warmup Steps: 1
+- Per Device Train Batch Size: 1
+- Gradient Accumulation Steps: 1
 - Max Steps: 1500
+- Learning Rate: 0.0002
 - Logging Steps: 1
 - Save Steps: 1
 - Lora Alpha: 32