(C) Johannes Souvening, Markus Meier, Martin Steinegger, Milot Mirdita, Michael Remmert, Andreas Hauser, Andreas Biegert
La suite HH est un progiciel open source pour la recherche de séquence de protéines sensibles basé sur l'alignement par paire de modèles de Markov cachés (HMMS).
Nous fournissons un vaste guide de l'utilisateur avec de nombreux exemples d'utilisation, des questions et des guides fréquemment posés pour créer vos propres bases de données.
HH-Suite3 peut également être installé en téléchargeant une version statiquement compilée, conda ou docker. HH-Sute3 nécessite un système 64 bits (vérifiez avec uname -a | grep x86_64 ). Sur les processeurs AMD / Intel, il nécessite au moins la prise en charge du jeu d'instructions SSE2 (vérifiez en exécutant cat /proc/cpuinfo | grep sse2 sur Linux ou sysctl -a | grep machdep.cpu.features | grep SSE2 sur macOS). AVX2 est environ 2x plus rapide par rapport à SSE2. HH-Suite3 fonctionne également sur les systèmes Linux avec des processeurs ARM64 et PPC64Le. Des binaires précompilés pour tous les systèmes pris en charge peuvent être trouvés sur mmseqs.com/hhsuite.
# install via conda
conda install -c conda-forge -c bioconda hhsuite
# install docker
docker pull soedinglab/hh-suite
# static SSE2 build
wget https://github.com/soedinglab/hh-suite/releases/download/v3.3.0/hhsuite-3.3.0-SSE2-Linux.tar.gz; tar xvfz hhsuite-3.3.0-SSE2-Linux.tar.gz; export PATH="$(pwd)/bin:$(pwd)/scripts:$PATH"
# static AVX2 build
wget https://github.com/soedinglab/hh-suite/releases/download/v3.3.0/hhsuite-3.3.0-AVX2-Linux.tar.gz; tar xvfz hhsuite-3.3.0-AVX2-Linux.tar.gz; export PATH="$(pwd)/bin:$(pwd)/scripts:$PATH"
❗ Seule la version HH-Sute3 auto-compilée comprend la prise en charge MPI, car la configuration MPI est spécifique à l'environnement local.
Liste de la base de données disponible pour HH-Sute3:
Découvrez également les bases de données (COG / ECOG / CD / ...) entretenues par la boîte à outils Bioinformatics MPI [Pub].
Pour compiler à partir de la source, vous aurez besoin d'un compilateur C / C ++ récent (au moins GCC 4.8 ou Clang 3.6) et Cmake 2.8.12 ou ultérieure.
Pour télécharger le code source et compiler la suite HH Exécutez les commandes suivantes:
git clone https://github.com/soedinglab/hh-suite.git
mkdir -p hh-suite/build && cd hh-suite/build
cmake -DCMAKE_INSTALL_PREFIX=. ..
make -j 4 && make install
export PATH="$(pwd)/bin:$(pwd)/scripts:$PATH"
❗ Pour compiler HH-Suite3 sur MacOS, installez d'abord le compilateur gcc à partir de Homebrew. Le compilateur MacOS clang par défaut ne prend pas en charge OpenMP et HH-Suite3 ne pourra utiliser qu'un seul thread. Remplacez ensuite l'appel cmake ci-dessus par le suivant:
CC="$(brew --prefix)/bin/gcc-10" CXX="$(brew --prefix)/bin/g++-10" cmake -DCMAKE_INSTALL_PREFIX=. ..
Pour effectuer une seule itération de recherche de HHBLITS, exécutez hhblits avec la commande suivante:
hhblits -i <input-file> -o <result-file> -n 1 -d <database-basename>
Pour générer un alignement de séquences homologues:
hhblits -i <input-file> -o <result-file> -oa3m <result-alignment> -d <database-basename>
Une liste détaillée d'options pour HHBLITS est disponible en exécutant HHBLITS avec le paramètre -h .
Steinegger M, Meier M, Mirdita M, Vöhringer H, Haunsberger SJ et Söding J (2019) HH-Suite3 pour la détection d'homologie à distance rapide et l'annotation des protéines profondes, BMC Bioinformatics , 473. DOI: 10.1186 / S12859-019-3019-7.