--- library_name: transformers model_name: LDAI-1.5-ANIU base_model: - Qwen/Qwen2.5-1.5B-Instruct language: - ru license: apache-2.0 --- # LDAI-1.5-ANIU ![https://aniu.lakomoor.com](assets/web.gif) Модель предназначена для подбора аниме под предпочтения пользователей. LDAI-1.5-ANIU используется на сайте https://aniu.lakomoor.com ## Обучение: Для обучения модели мы собрали датасет, основанный на данных с Aniu. В качестве генерации синтетического датасета использовались модели [Vikhr-Nemo-12B-Instruct-R-21-09-24](https://huggingface.co/Vikhrmodels/Vikhr-Nemo-12B-Instruct-R-21-09-24) и [Hermes-3-Llama-3.1-8B](https://huggingface.co/NousResearch/Hermes-3-Llama-3.1-8B), а за основу была взята модель [Qwen2.5-1.5B-Instruct](https://huggingface.co/Qwen/Qwen2.5-1.5B-Instruct). Использовался метод SFT для обучения модели. Создание синтетического датасета и обучение модели потребовали около 120 часов работы на двух Nvidia Tesla P40 24GB. ## Пример кода для запуска: **Рекомендуемая пареметры для генерации:**. - temperature 0.3 - top_k 0 - top_p 1.0 *** ```python from transformers import AutoModelForCausalLM, AutoTokenizer # Загрузка модели и токенизатора model_name = "LakoMoor/LDAI-1.5-ANIU" model = AutoModelForCausalLM.from_pretrained(model_name) tokenizer = AutoTokenizer.from_pretrained(model_name) # Подготовка входного текста input_text = "Семейное аниме для детей 8-12 лет" messages = [ {"role": "system", "content": 'Вы модель "ldai-1.5-aniu", эксперт по подбору аниме на сайте Aniu. Пользователи описывают свои предпочтения, и ты рекомендуешь аниме, соответствующее их запросу. Учитывай жанры, возраст, предпочитаемый стиль и студию, а также добавляй краткое описание сюжета и полезные советы.'}, {"role": "user", "content": input_text}, ] # Токенизация и генерация текста input_ids = tokenizer.apply_chat_template(messages, truncation=True, add_generation_prompt=True, return_tensors="pt") output = model.generate( input_ids, max_length=512, temperature=0.3, num_return_sequences=1, no_repeat_ngram_size=2, top_k=0, top_p=1.0, ) # Декодирование и вывод результата generated_text = tokenizer.decode(output[0], skip_special_tokens=True) print(generated_text) ``` *** #### Ответ модели: >{ > "title_ru": "Покемон: Современное поколение - Лукарио и загадка Мью", > "title_alt": [ > "Pokemon: Lucario and the Mystery of Mew", > "Gekijouban Pocket Monsters Advanced Generation: Myuu to Hadou no Yuusha Lucario", > "Pokemon Movie 8" > ], > "year": 2010, > "genres": [ > "детское", > "экшен", > "приключения", > "драма", > "фэнтези" > ], > "studio": "OLM", > "author": "Кэти Пилон", > "message": "Рекомендуем посмотреть аниме 'Покемон: Современное поколение - Лукарио и загадка Мью'. Это увлекательная история о приключениях в мире покемонов. Найдите его на сайте Aniu." >} ### Ссылки - [LakoMoor](https://t.me/lakomoordev) - [Aniu](https://aniu.su/)