Delete .ipynb_checkpoints

Browse files

Files changed (2) hide show

.ipynb_checkpoints/README-checkpoint.md +0 -100
.ipynb_checkpoints/config-checkpoint.json +0 -29

.ipynb_checkpoints/README-checkpoint.md DELETED Viewed

@@ -1,100 +0,0 @@
----
-library_name: transformers
-model_name: LDAI-1.5-ANIU
-base_model:
-- Qwen/Qwen2.5-1.5B-Instruct
-language:
-- ru
-license: cc-by-nc-4.0
----
-# LDAI-1.5-ANIU
-![https://aniu.lakomoor.com](assets/web.gif)
-Модель предназначена для подбора аниме под предпочтения пользователей. LDAI-1.5-ANIU используется на сайте https://aniu.lakomoor.com
-## Обучение:
-Для обучения модели мы собрали датасет, основанный на данных с Aniu.
-В качестве генерации синтетического датасета использовались модели [Vikhr-Nemo-12B-Instruct-R-21-09-24](https://huggingface.co/Vikhrmodels/Vikhr-Nemo-12B-Instruct-R-21-09-24) и [Hermes-3-Llama-3.1-8B](https://huggingface.co/NousResearch/Hermes-3-Llama-3.1-8B), а за основу была взята модель [Qwen2.5-1.5B-Instruct](https://huggingface.co/Qwen/Qwen2.5-1.5B-Instruct).
-Использовался метод SFT для обучения модели.
-Создание синтетического датасета и обучение модели потребовали около 120 часов работы на двух Nvidia Tesla P40 24GB.
-## Пример кода для запуска:
-**Рекомендуемая пареметры для генерации:**.
-- temperature 0.3
-- top_k 0
-- top_p 1.0
-***
-```python
-from transformers import AutoModelForCausalLM, AutoTokenizer
-# Загрузка модели и токенизатора
-model_name = "LakoMoor/LDAI-1.5-ANIU"
-model = AutoModelForCausalLM.from_pretrained(model_name)
-tokenizer = AutoTokenizer.from_pretrained(model_name)
-# Подготовка входного текста
-input_text = "Семейное аниме для детей 8-12 лет"
-messages = [
-    {"role": "system", "content": 'Вы модель "ldai-1.5-aniu", эксперт по подбору аниме на сайте Aniu. Пользователи описывают свои предпочтения, и ты рекомендуешь аниме, соответствующее их запросу. Учитывай жанры, возраст, предпочитаемый стиль и студию, а также добавляй краткое описание сюжета и полезные советы.'},
-    {"role": "user", "content": input_text},
-]
-# Токенизация и генерация текста
-input_ids = tokenizer.apply_chat_template(messages, truncation=True, add_generation_prompt=True, return_tensors="pt")
-output = model.generate(
-    input_ids,
-    max_length=512,
-    temperature=0.3,
-    num_return_sequences=1,
-    no_repeat_ngram_size=2,
-    top_k=0,
-    top_p=1.0,
-)
-# Декодирование и вывод результата
-generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
-print(generated_text)
-```
-***
-#### Ответ модели:
->{
->    "title_ru": "Покемон: Современное поколение - Лукарио и загадка Мью",
->    "title_alt": [
->        "Pokemon: Lucario and the Mystery of Mew",
->        "Gekijouban Pocket Monsters Advanced Generation: Myuu to Hadou no Yuusha Lucario",
->        "Pokemon Movie 8"
->    ],
->    "year": 2010,
->    "genres": [
->        "детское",
->        "экшен",
->        "приключения",
->        "драма",
->        "фэнтези"
->    ],
->    "studio": "OLM",
->    "author": "Кэти Пилон",
->    "message": "Рекомендуем посмотреть аниме 'Покемон: Современное поколение - Лукарио и загадка Мью'. Это увлекательная история о приключениях в мире покемонов. Найдите его на сайте Aniu."
->}
-### Ссылки
-- [LakoMoor](https://t.me/lakomoordev)
-- [Aniu](https://aniu.su/)

.ipynb_checkpoints/config-checkpoint.json DELETED Viewed

@@ -1,29 +0,0 @@
-{
-  "_name_or_path": "Qwen/Qwen2.5-1.5B-Instruct",
-  "architectures": [
-    "Qwen2ForCausalLM"
-  ],
-  "attention_dropout": 0.0,
-  "bos_token_id": 151643,
-  "eos_token_id": 151645,
-  "hidden_act": "silu",
-  "hidden_size": 1536,
-  "initializer_range": 0.02,
-  "intermediate_size": 8960,
-  "max_position_embeddings": 32768,
-  "max_window_layers": 21,
-  "model_type": "qwen2",
-  "num_attention_heads": 12,
-  "num_hidden_layers": 28,
-  "num_key_value_heads": 2,
-  "rms_norm_eps": 1e-06,
-  "rope_scaling": null,
-  "rope_theta": 1000000.0,
-  "sliding_window": null,
-  "tie_word_embeddings": true,
-  "torch_dtype": "bfloat16",
-  "transformers_version": "4.46.2",
-  "use_cache": true,
-  "use_sliding_window": false,
-  "vocab_size": 151665
-}