| Infos Home | Impressum | Original Artikel & Autoren Liste |
Diese Repräsentation der DNA-Sequenz wird zur Abspeicherung in den großen öffentlichen genomischen Datenbanken, wie z.B. GenBank verwendet. Aufgrund der Darstellung als Symbolfolge lässt sich die DNA so sehr einfach statistisch untersuchen. Dabei wird die Häufigkeit so genannter n-Tupel untersucht, d.h. der Vorkommen von Teilwörtern der Länge n. So taucht im menschlichen Genom im Mittel die Folge "CG" deutlich seltener auf als alle anderen 2-er Worte. Die lokalen Häufigkeitsverteilungen verschiedener Nukleotidworte können erste Hinweise auf die Funktionen bestimmter DNA-Abschnitte geben (Intron, Exon, CpG-islands).
Siehe auch: Gen, Genetik, Molekulargenetik, genetischer Code, Proteinbiosynthese
|
Der Ursprungsartikel stammt von der deutschsprachigen Wiki pedia (siehe oben: "Original Artikel & Autoren Liste"). Der Text steht unter der GNU Freie Dokumentation Lizenz. |