OpenAssistant
/

pythia-12b-pre-v8-12.5k-steps

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

andreaskoepf commited on May 6, 2023

Commit

934bda9

·

1 Parent(s): 234fb92

Update README.md

Files changed (1) hide show

README.md +7 -0

README.md CHANGED Viewed

@@ -1,6 +1,13 @@
 ---
 license: apache-2.0
 ---
 - wandb: https://wandb.ai/open-assistant/supervised-finetuning/runs/sytsyhrp
 - [sampling report](https://open-assistant.github.io/oasst-model-eval/?f=https%3A%2F%2Fraw.githubusercontent.com%2FOpen-Assistant%2Foasst-model-eval%2Fmain%2Fsampling_reports%2Foasst-pretrained%2F2023-05-05_OpenAssistant_pythia-12b-pre-v8-12_5k-steps_sampling_noprefix2.json)

 ---
 license: apache-2.0
 ---
+**Note: internal model, not ready for use**
+This is an intermediate model used as base-model for further pythia 12b SFT-8 experiments.
+It was trained on a wider set of instruction-tuning datasets for >12.5k steps with batch-size 128 and a context size of 2048.
 - wandb: https://wandb.ai/open-assistant/supervised-finetuning/runs/sytsyhrp
 - [sampling report](https://open-assistant.github.io/oasst-model-eval/?f=https%3A%2F%2Fraw.githubusercontent.com%2FOpen-Assistant%2Foasst-model-eval%2Fmain%2Fsampling_reports%2Foasst-pretrained%2F2023-05-05_OpenAssistant_pythia-12b-pre-v8-12_5k-steps_sampling_noprefix2.json)