Detail publikace
SoluProt: Prediction of Protein Solubility
Marušiak Martin, Ing.
Martínek Tomáš, doc. Ing., Ph.D. (UPSY)
Zendulka Jaroslav, doc. Ing., CSc. (UIFS)
Bednář David (FIT)
Damborský Jiří, prof. Mgr., Dr. (UMEL)
protein, solubility, prediction, machine-learning
Nízká rozpustnost je častým důvodem selhání výroby mnoha terapeutických a průmyslově zajímavých proteinů. Experimentální protokoly pro zvýšení rozpustnosti často vykazují nízkou úspěšnost a obvykle vedou ke ztrátě biologické funkce proteinu. Proto každý pokrok v oblasti predikci rozpustnosti proteinů může pomoci významně snížit náklady proteomických studií. V tomto článku představujeme nový softwarový nástroj SoluProt pro predikci rozpustnosti na základě proteinové sekvence. SoluProt vykazuje nevyšší přesnost (58,2 %) a AUC (0,61) ze všech dostupných nástrojů. Přestože je predikční schopnost v absolutním měřítku spíše nízká, SoluProt dokáže do velké míry efektivně prioritizovat proteinové sekvence a tím zvýšit úspěšnost laboratorních experimentů. Lepší predikční schopnost nástroje SoluProt oproti současným přístupům spočívá ve vylepšeném předzpracování silně zašuměné trénovací datové sady a citlivé selekci sekvenčních rysů zahrnutých do predikčního modelu.
@inproceedings{BUT155085,
author="Jiří {Hon} and Martin {Marušiak} and Tomáš {Martínek} and Jaroslav {Zendulka} and David {Bednář} and Jiří {Damborský}",
title="SoluProt: Prediction of Protein Solubility",
booktitle="DAZ & WIKT 2018 Proceedings",
year="2018",
pages="261--265",
publisher="Brno University of Technology",
address="Brno",
isbn="978-80-214-5679-2",
url="https://www.fit.vut.cz/research/publication/11808/"
}