DrugHIVE
1.0.0
該存儲庫是Drughive的官方實施,這是為基於結構的藥物設計開發的深層分層自動編碼器。 JCIM紙。


該代碼已在以下環境中進行了測試:
| 軟體 | 版本 |
|---|---|
| Python | 3.9.16 |
| 庫達 | 11.6 |
| OpenBabel | 3.1.1 |
| Pytorch | 1.12.1 |
| Pytorch閃電 | 2.0.0 |
| rdkit | 2021.09.5 |
使用要求中列出的要求安裝依賴項requirements.txt :
conda create -n drughive -c conda-forge -c pytorch -c nvidia -c rdkit --file requirements.txtgit clone https://github.com/jssweller/DrugHIVE可以從Zenodo下載預訓練的模型權重:
wget -P model_checkpoints/ https://zenodo.org/records/12668687/files/drughive_model_ch9.ckpt要從drughive採樣,請首先調整generate.yml示例配置文件中的參數。然後,運行以下命令:
python generate_molecules.py config/generate.yml要從先前的樣品進行示例,請在配置文件中設置zbetas: 1.
要從後部進行採樣,請在配置文件中設置zbetas: 0.
要在先驗和後部之間進行樣品,請在0.和1.之間設置zbetas的值。
要生成具有子結構修改的分子,請首先調整generate_spatial.yml示例配置文件中的參數。然後,運行以下命令:
python generate_molecules.py config/generate_spatial.yml在運行優化過程之前,必須安裝QuickVina 2對接工具:
qvina2.1放入DrugHIVE/或在PATH變量中列出的目錄中(例如/usr/bin/ )要用毒人優化分子,請首先調整generate_optimize.yml示例配置文件中的參數。然後,運行以下命令:
python generate_optimize.py config/generate_optimize.yml從http://www.pdbbind.org.cn/下載並提取PDBBIND精製數據集
從https://zinc20.docking.org/下載鋅分子以SDF或MOL2格式下載。將它們放入一個目錄中。
要處理PDBBIND數據集,請運行:
python process_pdbbind_data.py < path/to/PDBbind/directory >要處理鋅數據集,請運行:
python process_zinc_data.py < path/to/ZINC/directory > -o data/zinc_data/zinc_data.h5 -ext < file_extension >在這裡, <file_extension>可以是sdf或mol2之一。
首先,調整config/train.yml示例配置文件中的培訓參數。確保將data_path_pdb和data_path_zinc設置為數據集的位置。然後,運行以下命令:
python train.py config/train.yml