Detail publikace
A dynamic programming algorithm for identification of triplex-forming sequences
Martínek Tomáš, doc. Ing., Ph.D. (UPSY)
Burgetová Ivana, Ing., Ph.D. (UIFS)
Kopeček Daniel
Brázdová Marie
DNA sequence analysis; H-DNA; triplex; triplet; triad; gene regulation; pattern search; pattern recognition
Současné metody pro identifikaci sekvencí, které potenciálně mohou tvořit triplex v genomech a podobných typech sekvencí jsou primárně založeny na detekci homopurýnových a homopyrimidinových traktech. Pro lepší analýzu sekvencí jsou potřeba také postupy schopné hledat nepřesné, ale strukturálně možné triplexové struktury. V této práci jsme modifikovali algoritmus pro detekci přibližných palindromů tak, aby byl schopen brát v úvahu speciální charakter triplexových struktur v DNA. Z dostupné literatury jsme usoudili, že přibližné triplexové struktury tolerují dva typy chyb. První, analogická k záměnám znaku v duplexové DNA, se týká nukleotidů v DNA, které porušují Hoogsteenovu vazbu. Druhá třída se týká geometricky nekompatibilních sousedních tripletů bránící správnému zarovnání vláken pro vytváření příslušné hydrogenové vazby. Testovali jsme statistické vlastnosti algoritmu stejně jako korektnost generovaných výsledků v porovnání se známými triplexovými sekvencemi. Navrhovaný algoritmus uspokojivě detekuje sekvence potencionálních intramolekulárních triplexů. Jeho složitost odpovídá algoritmu pro detekci palindromu.
@article{BUT76462,
author="Matej {Lexa} and Tomáš {Martínek} and Ivana {Burgetová} and Daniel {Kopeček} and Marie {Brázdová}",
title="A dynamic programming algorithm for identification of triplex-forming sequences",
journal="BIOINFORMATICS",
year="2011",
volume="27",
number="18",
pages="2510--2517",
doi="10.1093/bioinformatics/btr439",
issn="1367-4803"
}