(c)约翰内斯·塞德(Johannes Soeding
HH-Suite是基于隐藏Markov模型(HMMS)的成对对准敏感蛋白质序列搜索的开源软件包。
我们为广泛的用户指南提供了许多用法示例,经常询问的问题和指南,以构建您自己的数据库。
HH-Suite3也可以通过下载静态编译的版本Conda或Docker来安装。 HH-Suite3需要一个64位系统(使用uname -a | grep x86_64检查)。在AMD/Intel CPU上,至少需要支持SSE2指令集(通过Linux或sysctl -a | grep machdep.cpu.features | grep SSE2 MacOS上的cat /proc/cpuinfo | grep sse2检查cat/proc/proc/cpuinfo | grep sse2)。与SSE2相比, AVX2大约快2倍。 HH-Suite3还可以使用ARM64和PPC64LE CPU的Linux系统。可以在MMSEQS.com/hhsuite上找到所有支持系统的预编译二进制文件。
# install via conda
conda install -c conda-forge -c bioconda hhsuite
# install docker
docker pull soedinglab/hh-suite
# static SSE2 build
wget https://github.com/soedinglab/hh-suite/releases/download/v3.3.0/hhsuite-3.3.0-SSE2-Linux.tar.gz; tar xvfz hhsuite-3.3.0-SSE2-Linux.tar.gz; export PATH="$(pwd)/bin:$(pwd)/scripts:$PATH"
# static AVX2 build
wget https://github.com/soedinglab/hh-suite/releases/download/v3.3.0/hhsuite-3.3.0-AVX2-Linux.tar.gz; tar xvfz hhsuite-3.3.0-AVX2-Linux.tar.gz; export PATH="$(pwd)/bin:$(pwd)/scripts:$PATH"
❗仅自编译的HH-Suite3版本包括MPI支持,因为MPI配置特定于本地环境。
HH-Suite的可用数据库列表3:
还要检查MPI生物信息学工具包[PUB]维护的数据库(COG/ECOG/CD/...)。
要从源中编译,您将需要最近的C/C ++编译器(至少GCC 4.8或Clang 3.6)和CMake 2.8.12或更高版本。
要下载源代码并编译HH-Suite执行以下命令:
git clone https://github.com/soedinglab/hh-suite.git
mkdir -p hh-suite/build && cd hh-suite/build
cmake -DCMAKE_INSTALL_PREFIX=. ..
make -j 4 && make install
export PATH="$(pwd)/bin:$(pwd)/scripts:$PATH"
❗要在MacOS上编译HH-Suite3,请先从Homebrew中安装gcc编译器。默认的MacOS clang编译器不支持OpenMP,而HH-Suite3只能使用一个线程。然后用以下一个替换上面的cmake调用:
CC="$(brew --prefix)/bin/gcc-10" CXX="$(brew --prefix)/bin/g++-10" cmake -DCMAKE_INSTALL_PREFIX=. ..
要执行HHBLIT的单个搜索迭代,请使用以下命令运行HHBLIT:
hhblits -i <input-file> -o <result-file> -n 1 -d <database-basename>
用于产生同源序列的对齐:
hhblits -i <input-file> -o <result-file> -oa3m <result-alignment> -d <database-basename>
可以通过使用-h参数运行HHBLIT来获得HHBlits选项的详细列表。
Steinegger M,Meier M,Mirdita M,VöhringerH,Haunsberger SJ和SödingJ(2019)HH-Suite3用于快速远程同源性检测和深度蛋白质注释, BMC BioInformatics ,473。doi:10.1186/s1286/s12859-59-59-019-3019-30-3019-73