(c) Johannes Soeding, Markus Meier, Martin Steinegger, Milot Mirdita, Michael Remmert, Andreas Hauser, Andreas Biegert
HH-Suite는 숨겨진 Markov 모델 (HMMS)의 쌍별 정렬을 기반으로 민감한 단백질 서열 검색을위한 오픈 소스 소프트웨어 패키지입니다.
우리는 다양한 사용 예제, 자주 묻는 질문 및 가이드가 자신의 데이터베이스를 구축하는 광범위한 사용자 안내서를 제공합니다.
HH-SUITE3는 정적으로 컴파일 된 버전 인 Conda 또는 Docker를 다운로드하여 설치할 수도 있습니다. HH-SUITE3에는 64 비트 시스템이 필요합니다 ( uname -a | grep x86_64 로 확인). AMD/Intel CPU에서는 SSE2 명령 세트에 대한 최소한 지원이 필요합니다 (Linux 또는 sysctl -a | grep machdep.cpu.features | grep SSE2 에서 cat /proc/cpuinfo | grep sse2 실행하여 확인하십시오. AVX2 는 SSE2에 비해 대략 2 배 빠릅니다. HH-SUITE3는 또한 ARM64 및 PPC64LE CPU와 함께 Linux 시스템에서도 작동합니다. 모든 지원되는 시스템에 대한 사전 컴파일 된 바이너리는 mmseqs.com/hhsuite에서 찾을 수 있습니다.
# install via conda
conda install -c conda-forge -c bioconda hhsuite
# install docker
docker pull soedinglab/hh-suite
# static SSE2 build
wget https://github.com/soedinglab/hh-suite/releases/download/v3.3.0/hhsuite-3.3.0-SSE2-Linux.tar.gz; tar xvfz hhsuite-3.3.0-SSE2-Linux.tar.gz; export PATH="$(pwd)/bin:$(pwd)/scripts:$PATH"
# static AVX2 build
wget https://github.com/soedinglab/hh-suite/releases/download/v3.3.0/hhsuite-3.3.0-AVX2-Linux.tar.gz; tar xvfz hhsuite-3.3.0-AVX2-Linux.tar.gz; export PATH="$(pwd)/bin:$(pwd)/scripts:$PATH"
MPI 구성은 로컬 환경에만 해당되므로 자체 컴파일 된 HH-SUITE3 버전 만 MPI 지원을 포함합니다.
HH-SUITE3에 사용 가능한 데이터베이스 목록 :
또한 MPI Bioinformatics Toolkit [Pub]에 의해 관리되는 데이터베이스 (COG/ECOG/CD/...)를 확인하십시오.
소스에서 컴파일하려면 최근의 C/C ++ 컴파일러 (최소 GCC 4.8 또는 Clang 3.6)와 CMAKE 2.8.12 이상이 필요합니다.
소스 코드를 다운로드하고 컴파일하려면 HH-SUITE 실행 다음 명령을 실행합니다.
git clone https://github.com/soedinglab/hh-suite.git
mkdir -p hh-suite/build && cd hh-suite/build
cmake -DCMAKE_INSTALL_PREFIX=. ..
make -j 4 && make install
export PATH="$(pwd)/bin:$(pwd)/scripts:$PATH"
macOS에서 HH-SUITE3을 컴파일하려면 먼저 Homebrew에서 gcc 컴파일러를 설치하십시오. 기본 MacOS clang 컴파일러는 OpenMP를 지원하지 않으며 HH-SUITE3은 단일 스레드 만 사용할 수 있습니다. 그런 다음 위의 cmake 호출을 다음과 같은 것으로 바꿉니다.
CC="$(brew --prefix)/bin/gcc-10" CXX="$(brew --prefix)/bin/g++-10" cmake -DCMAKE_INSTALL_PREFIX=. ..
HHBLIT의 단일 검색 반복을 수행하려면 다음 명령으로 hhblits를 실행하십시오.
hhblits -i <input-file> -o <result-file> -n 1 -d <database-basename>
상 동성 서열의 정렬을 생성하기 위해 :
hhblits -i <input-file> -o <result-file> -oa3m <result-alignment> -d <database-basename>
HHBLIT에 대한 자세한 옵션 목록은 -h 매개 변수와 함께 HHBLITS를 실행하여 사용할 수 있습니다.
Steinegger M, Meier M, Mirdita M, Vöhringer H, Haunsberger SJ 및 Söding J (2019) HH-Suite3 빠른 원격 상 동성 탐지 및 깊은 단백질 주석, BMC Bioinformatics , 473.