Sequenzanalyse, Sommersemester 2020


392105/06 Stoye, Dias Vieira Braga Sommer 2020 Di 10-12 und Do 10-12 in T2-205, Di 16-18, Mi 16-18

Kurzbeschreibung

Sequenzen sind allgegenwärtig. Texte und Programme, Gene und Proteine, Polygonzüge, Sprach- und Bildsignale und digitalisiertes Vogelzwitschern werden dargestellt als Zeichenfolgen über einem endlichen Alphabet. Entsprechend vielfältig sind die algorithmischen Fragestellungen. Oft ist dabei der Datenumfang sehr groß, so dass die algorithmische Komplexität von entscheidender praktischer Bedeutung ist.

In der Vorlesung werden Algorithmen zum effizienten Vergleich von Sequenzen und zur Suche exakter und approximativer Muster in Sequenzen behandelt. Viele dieser Algorithmen sind durch bioinformatische Fragestellungen motiviert. Sie finden jedoch auch Anwendungen in anderen Bereichen wie z.B. der Textverarbeitung und der Datenkompression.

Literatur

  • Das Skript zur Vorlesung: Sequenzanalyse-Skript
  • Prof. Volker Heun an der TU München hat auch eine gute Skriptsammlung.
  • Gusfield, D.: Algorithms on Strings, Trees, and Sequences: Computer Science and Computational Biology. Cambridge University Press, New York, 1997.
  • Setubal, J. and Meidanis, J.: Introduction to Computational Biology. PWS Publishing, Boston, M.A., 1997.

Organisatorisches

  • Die Modulbeschreibung enthält einige Rahmenbedingungen der Veranstaltung.
  • Zur Teilnahme an der Vorlesung und Klausur sind diejenigen berechtigt, welche die A&D-Klausur bestanden haben oder im WS2019/20 zur A&D-Klausur zugelassen waren.
  • Erfolgreiches Lösen der Übungsaufgaben (Bestehensgrenze 50% der Punkte) und aktive Teilnahme in den Tutorien (mindestens zweimal Vorrechnen) ist Voraussetzung für die Teilnahme an der Abschlussklausur oder der abschließenden mündlichen Prüfung.
  • Die Übungszettel werden wöchentlich Donnerstag mittags auf dieser Seite online geschaltet. Gleichzeit endet dann auch die Abgabefrist der Übungszettel der vorangegangenen Woche. Die Lösungen müssen per E-mail an die jeweilige Tutorin geschickt werden.

:!: Achtung: Die Veranstaltung findet live per Videokonferenz statt. Informationen hierzu werden kurz vor Beginn am 20.4.2020 an alle eingetragenen Teilnehmer*innen verschickt.

Übungen

Abgabeschluss der wöchentlichen Übungsaufgaben ist jeweils Donnerstags 12:00 Uhr. Gleichzeitig wird ein neuer Übungszettel auf dieser Seite veröffentlicht werden. Abgaben müssen direkt per E-mail an die jeweilige Tutorin geschickt werden.

Termin Tutorin Raum eKVV
Di 16-18 Marilia Dias Vieira Braga U10-146 392106
Di 16-18 Rebecca Pfeil Online-Tutorium 1
Mi 16-18 Leonie Brockmann Online-Tutorium 2

Prüfungstermine

  1. Präsenzklausur: 09.07.2020, 10-12 in H4. Bitte hier bis 02.07.2020 verbindlich anmelden.
  2. Präsenznachklausur: 24.09.2020, 10-12 in H4. Bitte hier bis 10.09.2020 verbindlich anmelden.
  3. Wer an den Präsenzklausuren nicht teilnehmen möchte oder darf, kann eine mündliche Prüfung durchführen, entweder in Präsenz oder per Zoom. Bei Interesse sollte man den Dozenten bis zum 17.09.2020 per Email kontaktieren.

Übungszettel

Woche Datum Thema Abschnitt im Skript Übungszettel
15 07./09.04.2020
16 14./16.04.2020
17 21./23.04.2020 Di: Einleitung, Logistik
Do: Wh. Grundlagen
1
2

Blatt 01
18 28./30.04.2020 Di: Def. Metriken auf Sequenzen
Do: Berechnung der Edit-Distanz
3.1-3.5
3.6

Blatt 02
19 05./07.05.2020 Di: Die q-gram-Distanz
Do: Die Maximal-Matches-Distanz, Filtern
3.7
3.8, 3.9

Blatt 03
20 12./14.05.2020 Di: Def. paarweises Alignment, Alignment-Score
Do: Alignment-Graph und universeller Algorithmus
4.1, 4.2
4.3, 4.4

Blatt 04
21 19./21.05.2020 Di: Alignment-Typen, Gapkosten
Do: –
4.5, 4.6

Blatt 05
22 26./28.05.2020 Di: Fortgeschrittene Alignment-Themen I
Do: Fortgeschrittene Alignment-Themen II
5.1, 5.2
5.3, 5.4

Blatt 06
23 02./04.06.2020 Di: Paarweises Alignment in der Praxis
Do: Def. Suffixbäume, WOTD-Algorithmus
6
7.1-7.6

Blatt 07
24 09./11.06.2020 Di: Anwendungen von Suffixbäumen
Do: –
7.7

Blatt 08
25 16./18.06.2020 Di: Suffixarrays
Do: Burrows-Wheeler-Transformation
8
9

Blatt 09
26 23./25.06.2020 Di: Def. Multiples Alignment, NP-Completeness
Do: Exakte Algorithmen für SP-Alignment
10
11.1-11.3

Blatt 10
27 30.6./02.07.2020 Di: Heuristiken für SP-Alignment
Do: Baumalignment, Genomalignment
11.4, 11.5
12, 13

Blatt 11
28 07./09.07.2020 Di: Allgemeine Wiederholung, Fragen
Do: Klausur