apple
/

DCLM-7B-8k

vaishaal commited on Jul 18, 2024

Commit

75199a5

verified ·

1 Parent(s): a24d330

Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -33,6 +33,26 @@ DCLM-Baseline-7B is a 7 billion parameter language model trained on the DCLM-Bas
 - **Dataset:** https://huggingface.co/datasets/mlfoundations/dclm-baseline-1.0
 - **Paper:** [DataComp-LM: In search of the next generation of training sets for language models](https://arxiv.org/abs/2406.11794)
 ### Training Details

 - **Dataset:** https://huggingface.co/datasets/mlfoundations/dclm-baseline-1.0
 - **Paper:** [DataComp-LM: In search of the next generation of training sets for language models](https://arxiv.org/abs/2406.11794)
+## Using Model
+First install open_lm
+```pip install git+https://github.com/mlfoundations/open_lm.git```
+Then:
+```
+from open_lm.hf import *
+from transformers import AutoTokenizer, AutoModelForCausalLM
+tokenizer = AutoTokenizer.from_pretrained("apple/DCLM-Baseline-7B")
+model = AutoModelForCausalLM.from_pretrained("apple/DCLM-Baseline-7B")
+inputs = tokenizer(["Machine learning is"], return_tensors="pt")
+gen_kwargs = {"max_new_tokens": 50, "top_p": 0.8, "temperature": 0.8, "do_sample": True, "repetition_penalty": 1.1}
+output = model.generate(inputs['input_ids'], **gen_kwargs)
+output = tokenizer.decode(output[0].tolist(), skip_special_tokens=True)
+print(output)
+```
 ### Training Details