Detail publikace
digIS: Towards detecting distant and putative novel insertion sequences in prokaryotic genomes
inzertní sekvence, mobilní element, skryté Markovove modely, prokaryotické genomy, anotace genomu
Inzerční sekvence (prvky IS) představují nejmenší a nejhojnější mobilní prvky v prokaryotických genomech. Bylo prokázáno, že hrají významnou roli v organizaci a vývoji genomu. Pro lepší pochopení jejich funkce v hostitelském genomu je žádoucí mít k dispozici efektivní detekční a anotační nástroj. Tato potřeba se stává ještě důležitější při zvažování rychle rostoucích genomických a metagenomických dat. Stávající nástroje pro detekci a anotaci prvků IS jsou obvykle založeny na porovnání podobnosti sekvencí s databází známých rodin IS. Mají tedy omezenou schopnost objevovat vzdálené a domnělé nové prvky IS.
V tomto příspěvku představujeme digIS, softwarový nástroj založený na profilových skrytých Markovových modelech sestavených z katalytických domén transpozáz. Ukazuje velmi dobré výsledky při detekci známých prvků IS při testování na datových sadách s ručně upravenou anotací. Hlavní přínos nástroje digIS spočívá v jeho schopnosti detekovat vzdálené a domnělé nové prvky IS při zachování mírné úrovně falešně pozitivních výsledků. V této kategorii překonává stávající nástroje, zejména při testování na velkých datových sadách archaeálnych a bakteriálních genomů.
Poskytujeme digIS, softwarový nástroj využívající nový přístup založený na ručně upravených profilových skrytých Markovových modelech, který je schopen detekovat vzdálené a domnělé nové prvky IS. Ačkoli digIS dokáže najít i známé prvky IS, očekáváme, že jej budou používat především vědci, kteří mají zájem o nalezení nových prvků IS. Nástroj je k dispozici na https://github.com/janka2012/digIS.
@ARTICLE{FITPUB12067, author = "Janka Puterov\'{a} and Tom\'{a}\v{s} Mart\'{i}nek", title = "digIS: Towards detecting distant and putative novel insertion sequences in prokaryotic genomes", pages = "1--20", journal = "BMC Bioinformatics", volume = 22, number = 258, year = 2021, ISSN = "1471-2105", doi = "10.1186/s12859-021-04177-6", language = "english", url = "https://www.fit.vut.cz/research/publication/12067" }