Grundlagen der Sequenzanalyse Wintersemester 2009/2010

Kurzbeschreibung

Sequenzen sind allgegenwärtig. Texte und Programme, Gene und Proteine, Polygonzüge, Sprach- und Bildsignale und digitalisiertes Vogelzwitschern werden dargestellt als Zeichenfolgen über einem endlichen Alphabet. Entsprechend vielfältig sind die algorithmischen Fragestellungen. Oft ist dabei der Datenumfang sehr groß, so dass die algorithmische Komplexität von entscheidender praktischer Bedeutung ist.

In der Vorlesung werden Algorithmen zum effizienten Vergleich von Sequenzen und zur Suche exakter und approximativer Muster in Sequenzen behandelt. Viele dieser Algorithmen sind durch bioinformatische Fragestellungen motiviert. Sie finden jedoch auch Anwendungen in anderen Bereichen wie z.B. der Textverarbeitung und der Datenkompression.

Literatur

  • Prof. Volker Heun an der TU München hat auch eine gute Skriptsammlung.
  • Gusfield, D.: Algorithms on Strings, Trees, and Sequences: Computer Science and Computational Biology. Cambridge University Press, New York, 1997.
  • Setubal, J. and Meidanis, J.: Introduction to Computational Biology. PWS Publishing, Boston, M.A., 1997.

Veranstaltungsdaten

Wir bitten alle Studierende sich im ekvv fr Vorlesung und bungen zu registrieren. Dies erleichtert die Organisation der bungsgruppen erheblich.


Vorlesung: 392105 Jens Stoye Do 8-10 in H5 ekvv
Übungen: 392106 Nils Hoffmann siehe ekvv ekvv

Planung der Übungen

Termin Tutor Raum
Di, 14-16 Florian Kollin U10-146
Di, 14-16 Nils Hoffmann M3-115
Do, 16-18 Robert Steinfelder M3-115
Fr, 8-10 Ella Mller M3-115

Zeitplan:

Termin Thema Übungszettel Abgabedatum
15.10.2009 Einführung in die Sequenzanalyse, Übungsplanung Blatt 1 , fasta-Datei , blatt01.zip 22.10.2009
22.10.2009 Alphabete und Sequenzen, Metriken auf Sequenzen Blatt 2 , blatt02.zip 29.10.2009
29.10.2009 Edit-Sequenz und -Distanz Blatt 3 , blatt03.zip 5.11.2009
05.11.2009 Edit-Matrix und Backtracing Blatt 4 blatt04.zip 12.11.2009
12.11.2009 Q-Gram Distanz Blatt 5 Xanthomonas Genom blatt05.zip 19.11.2009
19.11.2009 Maximal-Matches-Distanz Blatt 6 26.11.2009
26.11.2009 Distanz und Scores Blatt 7 3.12.2009
03.12.2009 Alignment Blatt 8 10.12.2009
10.12.2009 Gapfunktionen Blatt 9 17.12.2009
17.12.2009 Approximatives String-Matching, Bonuszettel Blatt 10 blatt10.zip 07.01.2010
07.01.2010 Datenbanksuche, FASTA, BLAST Blatt 11 14.01.2010
14.01.2010 Datenbanksuche, Sequenzstatistik Blatt 12 21.01.2010
21.01.2010 Suffixbäume Blatt 13 28.01.2010
28.01.2010 – entfällt –
04.02.2010 Wiedeholung und Fragen
11.02.2010 Klausur: 8:30 - 10:00 Uhr in H5
05.03.2010 Nachklausur: 8:30 - 10:00 Uhr in H5