ai_beats скачать - скачать исходный код ai

ai_beats

Другой исходный код

1.0.0

Скачать

ИИ бьет

Я написал пост в блоге, описывающий этот проект более подробно, обязательно проверяйте «Как генерировать музыкальные клипы с ИИ», чтобы узнать больше!

С помощью этого проекта вы можете использовать ИИ для генерации музыкальных треков и видеоклипов. Предоставьте некоторую информацию о том, как вы хотели бы музыку и видео, код сделает все остальное.

Рабочий процесс поколения музыки

Во -первых, мы используем генеративную модель для создания образцов музыки, модель по умолчанию, используемая здесь, может генерировать только максимум 30 секунд музыки, по этой причине мы делаем еще один шаг, чтобы расширить музыку. Закончив аудиопарию, мы можем сгенерировать видео, сначала мы начинаем с стабильной диффузионной модели для генерации изображений, а затем мы используем другую генеративную модель, чтобы дать ей немного движения и анимации. Чтобы составить конечный видеоклип, мы принимаем каждую сгенерированную музыку и объединяем столько анимационных изображений, сколько необходимо, чтобы соответствовать длине музыки.

Все эти шаги будут генерировать промежуточные файлы, которые вы можете проверить, и вручную удалить то, что вам не нравится, чтобы улучшить результаты.

Примеры

AI Beats Vol. 1

AI Beats Vol. 2

Использование

Рекомендуемый подход для использования этого репозитория с Docker, но вы также можете использовать пользовательский Venv, просто убедитесь, что установите все зависимости.

ПРИМЕЧАНИЕ. Обязательно обновите Param устройства, чтобы максимизировать производительность, но обратите внимание, что некоторые модели могут не работать для всех параметров устройства (ЦП, CUDA, MPS).

Приложение рабочий процесс

Поколение музыки: генерируйте начальные музыкальные треки
Продолжение музыки: расширить начальные музыкальные треки до более длительной продолжительности
Генерация изображений: Создайте изображения, которые будут использоваться для заполнения видеоклипа
Генерация видео: сгенерировать анимации из изображений для сочинения видеоклипов
Создание видеоклипа: присоединяйтесь к нескольким видеоклипам вместе, чтобы сопровождать музыкальные треки

Конфигурации

 project_dir: beats
project_name: lofi
seed: 42
music:
  prompt: "lo-fi music with a relaxing slow melody"
  model_id: facebook/musicgen-small
  device: cpu
  n_music: 5
  music_duration: 60
  initial_music_tokens: 1050
  max_continuation_duration: 20
  prompt_music_duration: 10
image:
  prompt: "Mystical Landscape"
  prompt_modifiers: 
    - "concept art, HQ, 4k"
    - "epic scene, cinematic, sci fi cinematic look, intense dramatic scene"
    - "digital art, hyperrealistic, fantasy, dark art"
    - "digital art, hyperrealistic, sense of comsmic wonder"
    - "mystical and ethereal atmosphere, photo taken with a wide-angle lens"
  model_id: stabilityai/sdxl-turbo
  device: mps
  n_images: 5
  inference_steps: 3
  height: 576
  width: 1024
video:
  model_id: stabilityai/stable-video-diffusion-img2vid
  device: cpu
  n_continuations: 2
  loop_video: true
  video_fps: 6
  decode_chunk_size: 8
  motion_bucket_id: 127
  noise_aug_strength: 0.1
audio_clip:
  n_music_loops: 1

Project_dir : папка, в которой будут размещены все ваши проекты
Project_name : имя проекта и основная папка
Семя : семена, используемые для контроля случайности моделей
музыка
- Приглашение: текстовое приглашение используется для создания музыки
- MODEL_ID: модель, используемая для генерации и расширения музыкальных треков
- Устройство : устройство, используемое моделью, обычно одно из (ЦП, CUDA, MPS)
- n_music: количество музыкальных треков, которые будут созданы
- Music_duration: продолжительность длительности финальной музыки
- initial_music_tokens: длительность начальной музыки (в токенах)
- max_continuation_duration: максимальная длина каждого расширенного музыкального сегмента
- recament_music_duration: длина базовой музыки, используемой для создания расширения
изображение
- Приглашение: текстовое приглашение используется для генерации изображений
- recament_modifiers: модификаторы приглашения, используемые для изменения стиля изображения
- model_id: модель, используемая для создания изображений
- Устройство : устройство, используемое моделью, обычно одно из (ЦП, CUDA, MPS)
- n_images: количество созданных изображений, которые будут созданы
- super_steps: количество шагов вывода для диффузионной модели
- Высота: высота сгенерированного изображения
- Ширина: ширина сгенерированного изображения
видео
- MODEL_ID: модель, используемая для оживления изображений
- Устройство : устройство, используемое моделью, обычно одно из (ЦП, CUDA, MPS)
- n_continuations: количество сегментов анимации, которые будут созданы
- loop_video: если каждое музыкальное видео будет зациклено
- video_fps: кадры в секунду каждого видеоклипа
- decode_chunk_size: параметр размера декодирования видео диффузии
- motion_bucket_id: параметр идентификатор движения видео диффузии идентификатор движения
- joise_aug_strength: параметр прочности шума в видео диффузии.
audio_clip
- n_music_loops: количество раз, чтобы зацикливаться на каждом музыкальном треке

Команды

Создайте изображение Docker

make build

Применить ворс и форматирование к коду (необходимо только для разработки)

make lint

Запустите весь конвейер, чтобы создать музыкальное видео

make ai_beats

Запустите шаг поколения музыки

make music

Запустите этап продолжения музыки

make music_continuation

Запустите шаг генерации изображений

make image

Запустите шаг генерации видео

make video

Запустите шаг создания звука

make audio_clip

Разработка

Для разработки обязательно установите requirements-dev.txt и запустить make lint для поддержания стиля кодирования.

Требования

Я разработал и протестировал большую часть этого проекта на моем MacBook Pro M2, единственном шаге, который я не смог запустить, был шаг создания видео, для этого я использовал Google Colab (с V100 или A100 GPU). Некоторые из моделей не были выполнены на MPS , но они все равно работают в разумное время.

Отказ от ответственности

Модели, используемые по умолчанию здесь, имеют конкретные лицензии, которые могут не подходить для всех вариантов использования, если вы хотите использовать одни и те же модели, обязательно проверяйте их лицензии. Для Music Generation MusicGen и его лицензии CC-BY-NC 4.0, для генерации изображений SDXL-Turbo и ее лицензии SDXL1.0, а также стабильную диффузию видео и ее стабильная лицензия сообщества по производству видеороликов NC для получения видео.

Ссылки

MusicGen
SDXL-Turbo
Стабильная диффузия видео
Стабильная диффузия видео - советы по использованию

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-03-06
размер 91.2KB
От Github

Связанные приложения

ai_beats

ИИ бьет

Я написал пост в блоге, описывающий этот проект более подробно, обязательно проверяйте «Как генерировать музыкальные клипы с ИИ», чтобы узнать больше!

Рабочий процесс поколения музыки

Примеры

AI Beats Vol. 1

AI Beats Vol. 2

Использование

Приложение рабочий процесс

Конфигурации

Команды

Разработка

Требования

Отказ от ответственности

Ссылки

OpenCore_NO_ACPI_Build

nspanel_pro_tools_apk

Один взгляд ИИ

ИИ-девушка

AI рисунок

Супер-вышибалы

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express