ai_beats下載ai_beats源代碼下載

ai_beats

其他源碼

1.0.0

下載

AI擊敗

我寫了一篇博客文章，更詳細地描述了該項目，請確保檢查“如何使用AI生成音樂剪輯”以了解更多信息！

通過此項目，您可以使用AI來生成音樂曲目和視頻剪輯。提供一些有關您想要音樂和視頻的信息，代碼將完成其餘的信息。

音樂生成工作流程

首先，我們使用生成模型來創建音樂樣本，此處使用的默認模型只能生成最高30秒的音樂，因此，我們採取了另一個步驟來擴展音樂。在使用音頻零件完成後，我們可以生成視頻，首先，我們從穩定的擴散模型開始，以生成圖像，然後使用另一個生成模型給它一些運動和動畫。為了撰寫最終的視頻剪輯，我們將每個生成的音樂都與盡可能多的動畫圖像結合在一起，以匹配音樂的長度。

所有這些步驟都將生成中間文件，您可以檢查並手動刪除您不喜歡改善結果的內容。

例子

人工智能擊敗卷。 1

人工智能擊敗卷。 2

用法

使用此存儲庫的建議方法是與Docker一起使用，但是您也可以使用自定義VENV，只需確保安裝所有依賴項即可。

注意：確保更新設備參數以最大化性能，但請注意，某些模型可能對所有設備選項（CPU，CUDA，MPS）不起作用。

應用程序工作流程

音樂發電：生成初始音樂曲目
音樂延續：將初始音樂曲目擴展到更長的時間
圖像生成：創建將用於填充視頻剪輯的圖像
視頻生成：生成動畫從圖像組成視頻剪輯
視頻剪輯創建：將多個視頻片段加在一起以伴隨音樂曲目

配置

 project_dir: beats
project_name: lofi
seed: 42
music:
  prompt: "lo-fi music with a relaxing slow melody"
  model_id: facebook/musicgen-small
  device: cpu
  n_music: 5
  music_duration: 60
  initial_music_tokens: 1050
  max_continuation_duration: 20
  prompt_music_duration: 10
image:
  prompt: "Mystical Landscape"
  prompt_modifiers: 
    - "concept art, HQ, 4k"
    - "epic scene, cinematic, sci fi cinematic look, intense dramatic scene"
    - "digital art, hyperrealistic, fantasy, dark art"
    - "digital art, hyperrealistic, sense of comsmic wonder"
    - "mystical and ethereal atmosphere, photo taken with a wide-angle lens"
  model_id: stabilityai/sdxl-turbo
  device: mps
  n_images: 5
  inference_steps: 3
  height: 576
  width: 1024
video:
  model_id: stabilityai/stable-video-diffusion-img2vid
  device: cpu
  n_continuations: 2
  loop_video: true
  video_fps: 6
  decode_chunk_size: 8
  motion_bucket_id: 127
  noise_aug_strength: 0.1
audio_clip:
  n_music_loops: 1

Project_dir ：將託管您所有項目的文件夾
project_name ：項目名稱和主文件夾
種子：用於控制模型隨機性的種子
音樂
- 提示：用於生成音樂的文本提示
- model_id：用於生成和擴展音樂軌道的模型
- 設備：模型使用的設備，通常是（CPU，CUDA，MPS）之一
- N_Music：將創建的音樂曲目數量
- Music_duration：最終音樂的持續時間
- initial_music_tokens：初始音樂的持續時間（在代幣中）
- max_contination_duration：每個擴展音樂段的最大長度
- 提示_music_duration：用於創建擴展的基本音樂的長度
圖像
- 提示：用於生成圖像的文本提示
- 提示_modifier：用於更改圖像樣式的提示修飾符
- model_id：用於創建圖像的模型
- 設備：模型使用的設備，通常是（CPU，CUDA，MPS）之一
- n_images：將創建的圖像數量
- 推理_STEPS：擴散模型的推理步驟數
- 高度：生成圖像的高度
- 寬度：生成圖像的寬度
影片
- model_id：用於動畫圖像的模型
- 設備：模型使用的設備，通常是（CPU，CUDA，MPS）之一
- N_Continuations：將創建的動畫片段數量
- loop_video：如果每個音樂視頻都會循環
- video_fps：每個視頻剪輯的每秒幀
- decode_chunk_size：視頻擴散的解碼塊大小參數
- MOTION_BUCKET_ID：視頻擴散的運動桶ID參數
- noings_aug_strength：視頻擴散的噪聲aug強度參數
audio_clip
- N_MUSIC_LOOOPS：循環每次音樂曲目的次數

命令

構建Docker圖像

make build

將絨毛和格式應用於代碼（僅需要開發）

make lint

運行整個管道以創建音樂視頻

make ai_beats

運行音樂生成步驟

make music

運行音樂延續步驟

make music_continuation

運行圖像生成步驟

make image

運行視頻生成步驟

make video

運行音頻剪輯創建步驟

make audio_clip

發展

為了開發，請確保安裝requirements-dev.txt並運行make lint以維護編碼樣式。

要求

我在MacBook Pro M2上開發並測試了大部分項目，我無法運行的唯一步驟是視頻創建步驟，因為我使用了Google COLAB（帶有V100或A100 GPU）。某些模型在MPS上無法運行，但無論如何它們都可以在合理的時間內運行。

免責聲明

默認情況下，此處使用的模型具有特定的許可證，如果您想使用相同的型號，請確保檢查其許可證。對於Music Generation MusicGEN及其CC-BY-NC 4.0許可證，用於圖像生成SDXL-Turbo及其許可證-SDXL1.0許可證以及穩定的視頻擴散及其穩定的視頻擴散NC NC社區許可證的視頻生成許可證。

參考

Musicgen
SDXL-Turbo
穩定的視頻擴散
穩定的視頻擴散 - 用法提示

展開

附加信息

版本 1.0.0
類型其他源碼
更新時間 2025-03-06
大小 91.2KB
來自於 Github

相關應用

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
一眼AI

2023-10-24
AI少女

2023-10-24
AI畫畫

2023-10-24
超級躲避球節拍

2022-08-26

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3

相關資訊全部