(C) Johannes Soing, Markus Meier, Martin Steinegger, Milot Mirdita, Michael Remmert, Andreas Hauser, Andreas Biegert
Das HH-Suite ist ein Open-Source-Softwarepaket für die sensible Proteinsequenz, die auf der paarweise Ausrichtung von Hidden Markov-Modellen (HMMs) sucht.
Wir bieten einen umfangreichen Benutzerhandbuch mit vielen Nutzungsbeispielen, häufig gestellten Fragen und Leitfaden, um Ihre eigenen Datenbanken zu erstellen.
HH-suite3 kann auch durch Herunterladen einer statisch kompilierten Version, Conda oder Docker installiert werden. HH-suite3 benötigt ein 64-Bit-System (wenden Sie sich an uname -a | grep x86_64 ). Bei AMD/Intel -CPUs erfordert es zumindest Unterstützung für den SSE2 -Befehlssatz (prüfen Sie, ob cat /proc/cpuinfo | grep sse2 unter Linux oder sysctl -a | grep machdep.cpu.features | grep SSE2 auf macos). AVX2 ist im Vergleich zu SSE2 ungefähr 2x schneller. HH-suite3 arbeitet auch an Linux-Systemen mit ARM64 und PPC64LE-CPUs. Vorkompilierte Binärdateien für alle unterstützten Systeme finden Sie unter mmseqs.com/hhsuite.
# install via conda
conda install -c conda-forge -c bioconda hhsuite
# install docker
docker pull soedinglab/hh-suite
# static SSE2 build
wget https://github.com/soedinglab/hh-suite/releases/download/v3.3.0/hhsuite-3.3.0-SSE2-Linux.tar.gz; tar xvfz hhsuite-3.3.0-SSE2-Linux.tar.gz; export PATH="$(pwd)/bin:$(pwd)/scripts:$PATH"
# static AVX2 build
wget https://github.com/soedinglab/hh-suite/releases/download/v3.3.0/hhsuite-3.3.0-AVX2-Linux.tar.gz; tar xvfz hhsuite-3.3.0-AVX2-Linux.tar.gz; export PATH="$(pwd)/bin:$(pwd)/scripts:$PATH"
❗ Nur die selbstkompilierte HH-suite3-Version enthält die MPI-Unterstützung, da die MPI-Konfiguration für die lokale Umgebung spezifisch ist.
Liste der verfügbaren Datenbank für HH-suite3:
Außerdem überprüfen Sie die Datenbanken (COG/ECOG/CD/...), die vom MPI -Bioinformatik -Toolkit [Pub] gepflegt werden.
Um aus der Quelle zu kompilieren, benötigen Sie einen aktuellen C/C ++ - Compiler (mindestens GCC 4.8 oder Clang 3.6) und CMake 2.8.12 oder höher.
So laden Sie den Quellcode herunter und kompilieren Sie die HH-Suite aus, um die folgenden Befehle auszuführen:
git clone https://github.com/soedinglab/hh-suite.git
mkdir -p hh-suite/build && cd hh-suite/build
cmake -DCMAKE_INSTALL_PREFIX=. ..
make -j 4 && make install
export PATH="$(pwd)/bin:$(pwd)/scripts:$PATH"
❗ Installieren Sie zuerst den gcc -Compiler von Homebrew, um HH-suite3 auf macOS zu kompilieren. Der Standard-MacOS clang Compiler unterstützt OpenMP nicht und HH-suite3 kann nur einen einzelnen Thread verwenden. Ersetzen Sie dann den cmake -Aufruf durch die folgenden:
CC="$(brew --prefix)/bin/gcc-10" CXX="$(brew --prefix)/bin/g++-10" cmake -DCMAKE_INSTALL_PREFIX=. ..
Führen Sie HHblits mit dem folgenden Befehl aus, um eine einzige Such -Iteration von HHBLITS durchzuführen:
hhblits -i <input-file> -o <result-file> -n 1 -d <database-basename>
Zur Erzeugung einer Ausrichtung homologe Sequenzen:
hhblits -i <input-file> -o <result-file> -oa3m <result-alignment> -d <database-basename>
Eine detaillierte Liste von Optionen für HHBLITS ist verfügbar, indem HHBLITS mit dem Parameter -h ausgeführt wird.
Steinegger M, Meier M, Mirdita M, Vöhringer H, Haunsberger SJ und Snisding J (2019) HH-suite3 für schnelle Fernhomologie-Nachweis und tiefe Proteinannotation, BMC Bioinformatics , 473. Doi: 10.1186/S12859-09-019-3019-7-7-7-7-7-7-7-7-7-7-7-7-7-7-7-7-7-7-7-7-7-7-7.