LDAI-1.5-ANIU / README.md
LakoMoor's picture
Upload folder using huggingface_hub
4e130db verified
|
raw
history blame
3.99 kB
metadata
library_name: transformers
model_name: LDAI-1.5-ANIU
base_model:
  - Qwen/Qwen2.5-1.5B-Instruct
language:
  - ru
license: cc-by-nc-4.0

LDAI-1.5-ANIU

https://aniu.lakomoor.com

Модель предназначена для подбора аниме под предпочтения пользователей. LDAI-1.5-ANIU используется на сайте https://aniu.lakomoor.com

Обучение:

Для обучения модели мы собрали датасет, основанный на данных с Aniu. В качестве генерации синтетического датасета использовались модели Vikhr-Nemo-12B-Instruct-R-21-09-24 и Hermes-3-Llama-3.1-8B, а за основу была взята модель Qwen2.5-1.5B-Instruct.

Использовался метод SFT для обучения модели.

Создание синтетического датасета и обучение модели потребовали около 120 часов работы на двух Nvidia Tesla P40 24GB.

Пример кода для запуска:

Рекомендуемая пареметры для генерации:.

  • temperature 0.3
  • top_k 0
  • top_p 1.0

from transformers import AutoModelForCausalLM, AutoTokenizer

# Загрузка модели и токенизатора
model_name = "LakoMoor/LDAI-1.5-ANIU"
model = AutoModelForCausalLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

# Подготовка входного текста
input_text = "Семейное аниме для детей 8-12 лет"

messages = [
    {"role": "system", "content": 'Вы модель "ldai-1.5-aniu", эксперт по подбору аниме на сайте Aniu. Пользователи описывают свои предпочтения, и ты рекомендуешь аниме, соответствующее их запросу. Учитывай жанры, возраст, предпочитаемый стиль и студию, а также добавляй краткое описание сюжета и полезные советы.'},
    {"role": "user", "content": input_text},
]

# Токенизация и генерация текста
input_ids = tokenizer.apply_chat_template(messages, truncation=True, add_generation_prompt=True, return_tensors="pt")
output = model.generate(
    input_ids,
    max_length=512,
    temperature=0.3,
    num_return_sequences=1,
    no_repeat_ngram_size=2,
    top_k=0,
    top_p=1.0,
)

# Декодирование и вывод результата
generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
print(generated_text)

Ответ модели:

{ "title_ru": "Покемон: Современное поколение - Лукарио и загадка Мью", "title_alt": [ "Pokemon: Lucario and the Mystery of Mew", "Gekijouban Pocket Monsters Advanced Generation: Myuu to Hadou no Yuusha Lucario", "Pokemon Movie 8" ], "year": 2010, "genres": [ "детское", "экшен", "приключения", "драма", "фэнтези" ], "studio": "OLM", "author": "Кэти Пилон", "message": "Рекомендуем посмотреть аниме 'Покемон: Современное поколение - Лукарио и загадка Мью'. Это увлекательная история о приключениях в мире покемонов. Найдите его на сайте Aniu." }

Ссылки