Create README.md
Browse files
README.md
ADDED
@@ -0,0 +1,57 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
datasets:
|
3 |
+
- IlyaGusev/ru_turbo_alpaca
|
4 |
+
- yahma/alpaca-cleaned
|
5 |
+
language:
|
6 |
+
- ru
|
7 |
+
pipeline_tag: text2text-generation
|
8 |
+
inference: false
|
9 |
+
---
|
10 |
+
|
11 |
+
# LLaMA 13B trained on the ru_turbo_alpaca, Russian instructions dataset
|
12 |
+
|
13 |
+
Based on [LLaMA 13B](https://huggingface.co/decapoda-research/llama-13b-hf).
|
14 |
+
|
15 |
+
* This is an adapter-only version.
|
16 |
+
|
17 |
+
Training code: [link](https://github.com/IlyaGusev/rulm/tree/master/self_instruct)
|
18 |
+
|
19 |
+
```python
|
20 |
+
from peft import PeftModel, PeftConfig
|
21 |
+
from transformers import AutoModelForCausalLM, AutoTokenizer, GenerationConfig
|
22 |
+
|
23 |
+
MODEL_NAME = "IlyaGusev/llama_13b_ru_turbo_alpaca_lora"
|
24 |
+
|
25 |
+
config = PeftConfig.from_pretrained(MODEL_NAME)
|
26 |
+
model = AutoModelForCausalLM.from_pretrained(
|
27 |
+
config.base_model_name_or_path,
|
28 |
+
load_in_8bit=True,
|
29 |
+
device_map="auto"
|
30 |
+
)
|
31 |
+
model = PeftModel.from_pretrained(model, MODEL_NAME, device_map={'': 0})
|
32 |
+
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
|
33 |
+
```
|
34 |
+
|
35 |
+
Examples:
|
36 |
+
```
|
37 |
+
Вопрос: Почему трава зеленая?
|
38 |
+
Выход: Траву зеленую можно объяснить на основе физиологических и биохимических процессов, которые происходят в растениях. В ходе фотосинтеза растения используют солнечную энергию для преобразования углекислого газа и воды в органические вещества, такие как сахара и крахмал. В процессе фотосинолиза растения выделяют зеленый пигмент хлорофилл, который ответственен за зеленую окраску листьев и других частей растения. Таким образом, траву зеленой можно объяснять наличием большого количества этого пигмента в растительных тканях.
|
39 |
+
```
|
40 |
+
|
41 |
+
```
|
42 |
+
Задание: Сочини длинный рассказ, обязательно упоминая следующие объекты.
|
43 |
+
Вход: Таня, мяч
|
44 |
+
Выход: Таня любила играть в футбол. Ее любимым мячом был старый мяч, который она получила в подарок от своего дяди. Он был такой же старый, как и она сама, и они вмест
|
45 |
+
е росли.
|
46 |
+
Однажды, когда Таня играла в футбол со своими друзьями, ее мяч пропал. Они искали его по всему парку, но ничего не нашли. Таня была очень расстроена, потому что это был
|
47 |
+
ее самый любимый мяч.
|
48 |
+
Ночью, когда все были спящими, Таня услышала голос, который говорил ей: "Таня, я могу вернуть тебе свой мяч". Таня выглянула на улицу и увидела старую женщину, которая
|
49 |
+
держала в руках ее старый футбол.
|
50 |
+
"Здравствуйте, матушка", - сказала Таня. "Как вы знаете, где мой мяч?"
|
51 |
+
"Я знаю", - ответила старая женщина. "Я видел, как он упал в воду, и я смог его вытащить. Я думаю, что он теперь готов к игре".
|
52 |
+
Таня была счастлива, что ее любимой игрушеке удалось спастись
|
53 |
+
```
|
54 |
+
|
55 |
+
* Final loss: 1.074
|
56 |
+
* Time: 53 hours, 53 minutes
|
57 |
+
* Hardware: 1x RTX 3090
|