VideoGenHub
v0.1.4a0
VideogenHub是一個一站式庫,可以標準化所有條件視頻生成模型的推理和評估。
從PYPI安裝:
pip install videogen-hub
從github安裝:
git clone https : // github . com / TIGER - AI - Lab / VideoGenHub . git
cd VideoGenHub
cd env_cfg
pip install - r requirements . txt
cd ..
pip install - e . OpenSora的要求在env_cfg/opensora.txt中
對於某些模型,例如Show One,您需要通過huggingface-cli登錄。
huggingface-cli login使用基準重現我們的實驗。
對於文本到視頻的生成:
./t2v_inference.sh --<model_name> --<device>
import videogen_hub
model = videogen_hub . load ( 'VideoCrafter2' )
video = model . infer_one_video ( prompt = "A child excitedly swings on a rusty swing set, laughter filling the air." )
# Here video is a torch tensor of shape torch.Size([16, 3, 320, 512])在此處查看Google Colab:https://colab.research.google.com/drive/145umsboe5jlqz2m0lkqvqvqvqvqsyrja1ieaeae?usp = sharing
通過簡化研究與協作,VideogenHub在推動視頻生成領域中扮演著關鍵的角色。
我們在視頻生成中包括了10多個模型。
| 方法 | 場地 | 類型 |
|---|---|---|
| 拉維 | - | 文本到視頻的生成 |
| VideoCrafter2 | - | 文本到視頻的生成 |
| ModelsCope | - | 文本到視頻的生成 |
| Streamingt2v | - | 文本到視頻的生成 |
| 顯示1 | - | 文本到視頻的生成 |
| Opensora | - | 文本到視頻的生成 |
| opensora-plan | - | 文本到視頻的生成 |
| T2V-Turbo | - | 文本到視頻的生成 |
| Dynamicrafter2 | - | 圖像到視頻生成 |
| 罾 | ICLR'24 | 圖像到視頻生成 |
| 組成 | - | 圖像to_video生成 |
| i2vgenxl | - | 圖像to_video生成 |
該項目根據許可證發布。
這項工作是Genai-Arena工作的一部分。
如果您使用我們的代碼,數據,模型或結果,請請我們的論文請訪問:
@misc { jiang2024genai ,
title = { GenAI Arena: An Open Evaluation Platform for Generative Models } ,
author = { Dongfu Jiang and Max Ku and Tianle Li and Yuansheng Ni and Shizhuo Sun and Rongqi Fan and Wenhu Chen } ,
year = { 2024 } ,
eprint = { 2406.04485 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.AI }
}