(c)約翰內斯·塞德(Johannes Soeding
HH-Suite是基於隱藏Markov模型(HMMS)的成對對準敏感蛋白質序列搜索的開源軟件包。
我們為廣泛的用戶指南提供了許多用法示例,經常詢問的問題和指南,以構建您自己的數據庫。
HH-Suite3也可以通過下載靜態編譯的版本Conda或Docker來安裝。 HH-Suite3需要一個64位系統(使用uname -a | grep x86_64檢查)。在AMD/Intel CPU上,至少需要支持SSE2指令集(通過Linux或sysctl -a | grep machdep.cpu.features | grep SSE2 MacOS上的cat /proc/cpuinfo | grep sse2檢查cat/proc/proc/cpuinfo | grep sse2)。與SSE2相比, AVX2大約快2倍。 HH-Suite3還可以使用ARM64和PPC64LE CPU的Linux系統。可以在MMSEQS.com/hhsuite上找到所有支持系統的預編譯二進製文件。
# install via conda
conda install -c conda-forge -c bioconda hhsuite
# install docker
docker pull soedinglab/hh-suite
# static SSE2 build
wget https://github.com/soedinglab/hh-suite/releases/download/v3.3.0/hhsuite-3.3.0-SSE2-Linux.tar.gz; tar xvfz hhsuite-3.3.0-SSE2-Linux.tar.gz; export PATH="$(pwd)/bin:$(pwd)/scripts:$PATH"
# static AVX2 build
wget https://github.com/soedinglab/hh-suite/releases/download/v3.3.0/hhsuite-3.3.0-AVX2-Linux.tar.gz; tar xvfz hhsuite-3.3.0-AVX2-Linux.tar.gz; export PATH="$(pwd)/bin:$(pwd)/scripts:$PATH"
❗僅自編譯的HH-Suite3版本包括MPI支持,因為MPI配置特定於本地環境。
HH-Suite的可用數據庫列表3:
還要檢查MPI生物信息學工具包[PUB]維護的數據庫(COG/ECOG/CD/...)。
要從源中編譯,您將需要最近的C/C ++編譯器(至少GCC 4.8或Clang 3.6)和CMake 2.8.12或更高版本。
要下載源代碼並編譯HH-Suite執行以下命令:
git clone https://github.com/soedinglab/hh-suite.git
mkdir -p hh-suite/build && cd hh-suite/build
cmake -DCMAKE_INSTALL_PREFIX=. ..
make -j 4 && make install
export PATH="$(pwd)/bin:$(pwd)/scripts:$PATH"
❗要在MacOS上編譯HH-Suite3,請先從Homebrew中安裝gcc編譯器。默認的MacOS clang編譯器不支持OpenMP,而HH-Suite3只能使用一個線程。然後用以下一個替換上面的cmake調用:
CC="$(brew --prefix)/bin/gcc-10" CXX="$(brew --prefix)/bin/g++-10" cmake -DCMAKE_INSTALL_PREFIX=. ..
要執行HHBLIT的單個搜索迭代,請使用以下命令運行HHBLIT:
hhblits -i <input-file> -o <result-file> -n 1 -d <database-basename>
用於產生同源序列的對齊:
hhblits -i <input-file> -o <result-file> -oa3m <result-alignment> -d <database-basename>
可以通過使用-h參數運行HHBLIT來獲得HHBlits選項的詳細列表。
Steinegger M,Meier M,Mirdita M,VöhringerH,Haunsberger SJ和SödingJ(2019)HH-Suite3用於快速遠程同源性檢測和深度蛋白質註釋, BMC BioInformatics ,473。doi:10.1186/s1286/s12859-59-59-019-3019-30-3019-73