Pytorch官方的论文实施:
3D适应器:高质量3D代的几何符合多视图扩散
Hansheng Chen 1 ,Bokui Shen 2 ,Yulin Liu 3,4 ,Ruoxi Shi 3 ,Linqi Zhou 2 ,Connor Z. Lin 2 ,Jiayuan Gu 3 ,Hao Su 3,4 ,Gordon Wetzstein 1 ,Leonidas Guibas 1
1斯坦福大学, 2个Appate Labs, 3 UCSD, 4 Hillbot
[项目页面] [?演示] [纸]
通用3D扩散适配器使用受控的多视图编辑
Hansheng Chen 1 ,Ruoxi Shi 2 ,Yulin Liu 2 ,Bokui Shen 3 ,Jiayuan GU 2 ,Gordon Wetzstein 1 ,Hao Su 2 ,Leonidas Guibas 1
1斯坦福大学, 2个UCSD, 3个Appare Labs
[项目页面] [?演示] [纸]
该代码已在描述如下的环境中进行了测试:
其他依赖项可以通过pip install -r requirements.txt安装。
安装命令的示例如下(您可以自己更改CUDA版本):
# Export the PATH of CUDA toolkit
export PATH=/usr/local/cuda-12.1/bin: $PATH
export LD_LIBRARY_PATH=/usr/local/cuda-12.1/lib64: $LD_LIBRARY_PATH
# Create conda environment
conda create -y -n mvedit python=3.10
conda activate mvedit
# Install FFmpeg (optional)
conda install -c conda-forge ffmpeg x264
# Install PyTorch
conda install pytorch==2.1.2 torchvision==0.16.2 pytorch-cuda=12.1 -c pytorch -c nvidia
# Clone this repo and install other dependencies
git clone https://github.com/Lakonik/MVEdit && cd MVEdit
pip install -r requirements.txt如果环境正确配置,则该代码库还可以在Windows系统上工作。有关Windows上环境设置的更多信息,请参考第8期。
我们建议使用Gradio Web UI及其API进行推理。运行Web UI需要至少24GB VRAM的GPU。
运行以下命令以启动Web UI:
python app.py --unload-models Web UI将在http:// localhost:7860提供。如果添加--share标志,将生成一个临时公共URL,供您与他人共享Web UI。
所有型号将按需自动加载。第一次运行将需要很长时间才能下载模型。如果下载失败,请检查您与GitHub,Google Drive和拥抱面的网络连接。
要查看其他选项,请运行:
python app.py -h启动Web UI后,API文档将在http:// localhost:7860/?view = api上可用。文档将自动通过Gradio生成,数据类型和默认值可能不正确。请使用Web UI中的默认值作为参考。
请参阅我们与Python使用API使用的示例。
基于优化的3D适配器(又名MVEDIT适配器)仅采用现成的模型,不需要进一步的培训。
GRM的正式发布后,将发布基于GRM的3D型号的培训代码。
该代码库建立在以下存储库上:
@misc { 3dadapter2024 ,
title = { 3D-Adapter: Geometry-Consistent Multi-View Diffusion for High-Quality 3D Generation } ,
author = { Hansheng Chen and Bokui Shen and Yulin Liu and Ruoxi Shi and Linqi Zhou and Connor Z. Lin and Jiayuan Gu and Hao Su and Gordon Wetzstein and Leonidas Guibas } ,
year = { 2024 } ,
eprint = { 2410.18974 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.CV } ,
url = { https://arxiv.org/abs/2410.18974 } ,
}
@misc { mvedit2024 ,
title = { Generic 3D Diffusion Adapter Using Controlled Multi-View Editing } ,
author = { Hansheng Chen and Ruoxi Shi and Yulin Liu and Bokui Shen and Jiayuan Gu and Gordon Wetzstein and Hao Su and Leonidas Guibas } ,
year = { 2024 } ,
eprint = { 2403.12032 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.CV }
}