File size: 3,987 Bytes
4e130db
 
 
 
 
 
 
97435d4
4e130db
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
97435d4
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
---
library_name: transformers
model_name: LDAI-1.5-ANIU
base_model:
- Qwen/Qwen2.5-1.5B-Instruct
language:
- ru
license: apache-2.0
---

# LDAI-1.5-ANIU

![https://aniu.lakomoor.com](assets/web.gif)


Модель предназначена для подбора аниме под предпочтения пользователей. LDAI-1.5-ANIU используется на сайте https://aniu.lakomoor.com

## Обучение:

Для обучения модели мы собрали датасет, основанный на данных с Aniu. 
В качестве генерации синтетического датасета использовались модели [Vikhr-Nemo-12B-Instruct-R-21-09-24](https://huggingface.co/Vikhrmodels/Vikhr-Nemo-12B-Instruct-R-21-09-24) и [Hermes-3-Llama-3.1-8B](https://huggingface.co/NousResearch/Hermes-3-Llama-3.1-8B), а за основу была взята модель [Qwen2.5-1.5B-Instruct](https://huggingface.co/Qwen/Qwen2.5-1.5B-Instruct). 

Использовался метод SFT для обучения модели.

Создание синтетического датасета и обучение модели потребовали около 120 часов работы на двух Nvidia Tesla P40 24GB.

## Пример кода для запуска:

**Рекомендуемая пареметры для генерации:**.

- temperature 0.3
- top_k 0
- top_p 1.0

***

```python
from transformers import AutoModelForCausalLM, AutoTokenizer

# Загрузка модели и токенизатора
model_name = "LakoMoor/LDAI-1.5-ANIU"
model = AutoModelForCausalLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

# Подготовка входного текста
input_text = "Семейное аниме для детей 8-12 лет"

messages = [
    {"role": "system", "content": 'Вы модель "ldai-1.5-aniu", эксперт по подбору аниме на сайте Aniu. Пользователи описывают свои предпочтения, и ты рекомендуешь аниме, соответствующее их запросу. Учитывай жанры, возраст, предпочитаемый стиль и студию, а также добавляй краткое описание сюжета и полезные советы.'},
    {"role": "user", "content": input_text},
]

# Токенизация и генерация текста
input_ids = tokenizer.apply_chat_template(messages, truncation=True, add_generation_prompt=True, return_tensors="pt")
output = model.generate(
    input_ids,
    max_length=512,
    temperature=0.3,
    num_return_sequences=1,
    no_repeat_ngram_size=2,
    top_k=0,
    top_p=1.0,
)

# Декодирование и вывод результата
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
print(generated_text)
```
***

#### Ответ модели:

>{
>    "title_ru": "Покемон: Современное поколение - Лукарио и загадка Мью",
>    "title_alt": [
>        "Pokemon: Lucario and the Mystery of Mew",
>        "Gekijouban Pocket Monsters Advanced Generation: Myuu to Hadou no Yuusha Lucario",
>        "Pokemon Movie 8"
>    ],
>    "year": 2010,
>    "genres": [
>        "детское",
>        "экшен",
>        "приключения",
>        "драма",
>        "фэнтези"
>    ],
>    "studio": "OLM",
>    "author": "Кэти Пилон",
>    "message": "Рекомендуем посмотреть аниме 'Покемон: Современное поколение - Лукарио и загадка Мью'. Это увлекательная история о приключениях в мире покемонов. Найдите его на сайте Aniu."
>}




### Ссылки

- [LakoMoor](https://t.me/lakomoordev)
- [Aniu](https://aniu.su/)