現在、オックスフォードアカデミックに掲載されています - バイオインフォマティクスアドバンス
https://academic.oup.com/bioinformaticsadvances/2/1/vbac021/6561563
抗菌性ペプチド(AMP)は、癌療法や高血圧などの領域で、新しい治療薬の開発にますます使用されています。さらに、それらは細菌耐性の発生が増加するため、抗生物質の代替と見なされています。ただし、湿潤実験的識別は時間がかかり、費用がかかるため、新しいAMP候補をスクリーニングするためにシリコ内モデルが一般的に使用されています。このペーパーでは、モデル入力を作成する新しいアプローチを提案します。事前に訓練された言語モデルを使用して、各ペプチド配列内のアミノ酸を表す文脈化された埋め込みを生成し、その後、分類として訓練される前に。最適モデルは2つのデータセットで検証され、以前はAMP予測研究で使用されていたものと、このペーパーで作成された独立したデータセットです。 93.33%と88.26%の予測精度がそれぞれ達成され、以前のすべての最先端の分類モデルよりも優れていました。
2020年7月:Prottrans:自己教師の学習を通じて、人生のコードの言語をクラックすることに向けて。プリプリント、バイオインフォマティクス。 Elnaggar、A.、M。Heinzinger、C。Dallago、G。Rehawi、Y。Wang、L。Jones、T。Gibbs、T。Feher、C。Angerer、M。Steinegger、D。Bhowmik、およびB. Rost(2020、7月)。 https://www.biorxiv.org/content/10.1101/2020.07.12.199554v1.full.pdf
更新:2021年7月:プロトラン:自己教師の深い学習と高性能コンピューティングエルナガー、アーメドとハインツィンガー、マイケルとダラゴ、クリスチャンとレハウィ、ガリアとユ、ワンとジョーンズ、ライオンとギブス、トム、トムとフェール、タマス、タマス、キリストとエイジャー、キリストとキリスト、キリストとエンガー、マルチン、マルティン、マルチン、マルチン、マルチン、マタイとマルチン、 rost、burkhard https://ieeexplore.ieee.org/abstract/document/9477085
Prottrans Github:https://github.com/agemagian/prottrans