felguk-audio-edit / README.md
Felguk's picture
Update README.md
4edc5e9 verified
|
raw
history blame
3.77 kB
metadata
license: apache-2.0
language:
  - aa
  - ae
  - ak
  - ba
  - ru
  - zh
  - fr
  - fy
  - en
  - el
  - pl
  - be
  - dv
  - de
  - bg
metrics:
  - charcut_mt
  - code_eval
base_model:
  - Felguk/felguk-audio-edit
pipeline_tag: zero-shot-classification
library_name: allennlp
tags:
  - audio edit
  - audio

Felguk Audio Edit Model

Header Image Angry Cat GIF

Это модель для редактирования аудио, разработанная Felguk. Она позволяет выполнять различные задачи, такие как обрезка, наложение эффектов и другие манипуляции с аудиофайлами.

Название инструмента Описание
1 Trip Audio Создание психоделических эффектов: эхо, реверберация, искажение.
2 Loud Audio Увеличение громкости и нормализация звука.
3 Speed Audio Изменение скорости воспроизведения (ускорение или замедление).
4 Lyrics by Audio Автоматическое распознавание текста песен из аудиофайлов.
5 Video to Audio Converter Извлечение аудиодорожки из видеофайлов.
6 Audio Converter Конвертация аудиофайлов между форматами (MP3, WAV, FLAC и др.).
7 Noise Reduction Удаление фонового шума из аудиозаписей.
8 Pitch Shifter Изменение тональности аудио (повышение или понижение pitch).
9 Audio Trimmer Обрезка аудиофайлов до нужной длины.
10 Audio Mixer Сведение нескольких аудиодорожек в одну.

Примечание: Демо-приложение для этой модели пока находится в разработке.
Завершение примечания.

Beta App

Использование

Пример использования модели для редактирования аудио:

import torch
from transformers import AutoModelForAudioEditing, AutoProcessor

# Загрузка модели и процессора
model_name = "Felguk/felguk-audio-edit"
model = AutoModelForAudioEditing.from_pretrained(model_name)
processor = AutoProcessor.from_pretrained(model_name)

# Загрузка аудиофайла
audio_input, sample_rate = processor.load_audio("path_to_your_audio_file.wav")

# Обработка аудио
with torch.no_grad():
    edited_audio = model(audio_input)

# Сохранение результата
processor.save_audio("edited_audio.wav", edited_audio, sample_rate)