metadata

license: apache-2.0
language:
  - aa
  - ae
  - ak
  - ba
  - ru
  - zh
  - fr
  - fy
  - en
  - el
  - pl
  - be
  - dv
  - de
  - bg
metrics:
  - charcut_mt
  - code_eval
base_model:
  - Felguk/felguk-audio-edit
pipeline_tag: zero-shot-classification
library_name: allennlp
tags:
  - audio edit
  - audio

Felguk Audio Edit Model

Это модель для редактирования аудио, разработанная Felguk. Она позволяет выполнять различные задачи, такие как обрезка, наложение эффектов и другие манипуляции с аудиофайлами.

№	Название инструмента	Описание
1	Trip Audio	Создание психоделических эффектов: эхо, реверберация, искажение.
2	Loud Audio	Увеличение громкости и нормализация звука.
3	Speed Audio	Изменение скорости воспроизведения (ускорение или замедление).
4	Lyrics by Audio	Автоматическое распознавание текста песен из аудиофайлов.
5	Video to Audio Converter	Извлечение аудиодорожки из видеофайлов.
6	Audio Converter	Конвертация аудиофайлов между форматами (MP3, WAV, FLAC и др.).
7	Noise Reduction	Удаление фонового шума из аудиозаписей.
8	Pitch Shifter	Изменение тональности аудио (повышение или понижение pitch).
9	Audio Trimmer	Обрезка аудиофайлов до нужной длины.
10	Audio Mixer	Сведение нескольких аудиодорожек в одну.

Примечание: Демо-приложение для этой модели пока находится в разработке.
Завершение примечания.

Использование

Пример использования модели для редактирования аудио:

import torch
from transformers import AutoModelForAudioEditing, AutoProcessor

# Загрузка модели и процессора
model_name = "Felguk/felguk-audio-edit"
model = AutoModelForAudioEditing.from_pretrained(model_name)
processor = AutoProcessor.from_pretrained(model_name)

# Загрузка аудиофайла
audio_input, sample_rate = processor.load_audio("path_to_your_audio_file.wav")

# Обработка аудио
with torch.no_grad():
    edited_audio = model(audio_input)

# Сохранение результата
processor.save_audio("edited_audio.wav", edited_audio, sample_rate)