Método de correspondência de paralog descrito em “emparelhar sequências de proteínas que interagem usando modelagem de linguagem mascarada” (Lupo, Sgarbossa e Bitbol, 2023). O modelo de transformador MSA usado aqui foi introduzido em (Rao El Al, 2021).
Clone este repositório em sua máquina local executando e mova -se para dentro da pasta raiz. Recomendamos a criação e ativação de um ambiente virtual Dedicado de Conde ou VirtualEnv Python.
git clone [email protected]:Bitbol-Lab/DiffPALM.gite mova -se para dentro da pasta raiz. Recomendamos a criação e ativação de um ambiente virtual Dedicado de Conde ou VirtualEnv Python. Em seguida, faça uma instalação editável do pacote:
python -m pip install -e . Consulte o notebook _example_prokaryotic.ipynb para obter um exemplo de otimização de MSA emparelhada no caso de conjuntos de dados procarióticos conhecidos, para os quais as correspondências da verdade fundamental são dadas pela proximidade do genoma.
Nosso trabalho pode ser citado usando a seguinte entrada Bibtex:
@article { lupo2023pairing ,
title = { Pairing interacting protein sequences using masked language modeling } ,
author = { Lupo, Umberto and Sgarbossa, Damiano and Bitbol, Anne-Florence } ,
year = { 2023 } ,
journal = { bioRxiv } ,
doi = { 10.1101/2023.08.14.553209 }
}Este projeto foi desenvolvido usando o NBDEV.