Detail publikace
digIS: Towards detecting distant and putative novel insertion sequences in prokaryotic genomes
inzertní sekvence, mobilní element, skryté Markovove modely, prokaryotické genomy, anotace genomu
Inzerční sekvence (prvky IS) představují nejmenší a nejhojnější mobilní prvky v prokaryotických genomech. Bylo prokázáno, že hrají významnou roli v organizaci a vývoji genomu. Pro lepší pochopení jejich funkce v hostitelském genomu je žádoucí mít k dispozici efektivní detekční a anotační nástroj. Tato potřeba se stává ještě důležitější při zvažování rychle rostoucích genomických a metagenomických dat. Stávající nástroje pro detekci a anotaci prvků IS jsou obvykle založeny na porovnání podobnosti sekvencí s databází známých rodin IS. Mají tedy omezenou schopnost objevovat vzdálené a domnělé nové prvky IS. V tomto příspěvku představujeme digIS, softwarový nástroj založený na profilových skrytých Markovových modelech sestavených z katalytických domén transpozáz. Ukazuje velmi dobré výsledky při detekci známých prvků IS při testování na datových sadách s ručně upravenou anotací. Hlavní přínos nástroje digIS spočívá v jeho schopnosti detekovat vzdálené a domnělé nové prvky IS při zachování mírné úrovně falešně pozitivních výsledků. V této kategorii překonává stávající nástroje, zejména při testování na velkých datových sadách archaeálnych a bakteriálních genomů. Poskytujeme digIS, softwarový nástroj využívající nový přístup založený na ručně upravených profilových skrytých Markovových modelech, který je schopen detekovat vzdálené a domnělé nové prvky IS. Ačkoli digIS dokáže najít i známé prvky IS, očekáváme, že jej budou používat především vědci, kteří mají zájem o nalezení nových prvků IS. Nástroj je k dispozici na https://github.com/janka2012/digIS.
@article{BUT168521,
author="Janka {Puterová} and Tomáš {Martínek}",
title="digIS: Towards detecting distant and putative novel insertion sequences in prokaryotic genomes",
journal="BMC BIOINFORMATICS",
year="2021",
volume="22",
number="258",
pages="1--20",
doi="10.1186/s12859-021-04177-6",
issn="1471-2105",
url="https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-021-04177-6#article-info"
}