DrugHIVE
1.0.0
该存储库是Drughive的官方实施,这是为基于结构的药物设计开发的深层分层自动编码器。 JCIM纸。


该代码已在以下环境中进行了测试:
| 软件 | 版本 |
|---|---|
| Python | 3.9.16 |
| 库达 | 11.6 |
| OpenBabel | 3.1.1 |
| Pytorch | 1.12.1 |
| Pytorch闪电 | 2.0.0 |
| rdkit | 2021.09.5 |
使用要求中列出的要求安装依赖项requirements.txt :
conda create -n drughive -c conda-forge -c pytorch -c nvidia -c rdkit --file requirements.txtgit clone https://github.com/jssweller/DrugHIVE可以从Zenodo下载预训练的模型权重:
wget -P model_checkpoints/ https://zenodo.org/records/12668687/files/drughive_model_ch9.ckpt要从drughive采样,请首先调整generate.yml示例配置文件中的参数。然后,运行以下命令:
python generate_molecules.py config/generate.yml要从先前的样品进行示例,请在配置文件中设置zbetas: 1.
要从后部进行采样,请在配置文件中设置zbetas: 0.
要在先验和后部之间进行样品,请在0.和1.之间设置zbetas的值。
要生成具有子结构修改的分子,请首先调整generate_spatial.yml示例配置文件中的参数。然后,运行以下命令:
python generate_molecules.py config/generate_spatial.yml在运行优化过程之前,必须安装QuickVina 2对接工具:
qvina2.1放入DrugHIVE/或在PATH变量中列出的目录中(例如/usr/bin/ )要用毒人优化分子,请首先调整generate_optimize.yml示例配置文件中的参数。然后,运行以下命令:
python generate_optimize.py config/generate_optimize.yml从http://www.pdbbind.org.cn/下载并提取PDBBIND精制数据集
从https://zinc20.docking.org/下载锌分子以SDF或MOL2格式下载。将它们放入一个目录中。
要处理PDBBIND数据集,请运行:
python process_pdbbind_data.py < path/to/PDBbind/directory >要处理锌数据集,请运行:
python process_zinc_data.py < path/to/ZINC/directory > -o data/zinc_data/zinc_data.h5 -ext < file_extension >在这里, <file_extension>可以是sdf或mol2之一。
首先,在config/train.yml示例配置文件中调整培训参数。确保将data_path_pdb和data_path_zinc设置为数据集的位置。然后,运行以下命令:
python train.py config/train.yml