Sequenzanalyse, Sommersemester 2021


392105/06,06,06 Stoye, Dias Vieira Braga Sommer 2021 Di 10-12 und Do 10-12 online, Di 16-18, Di 16-18, Mi 16-18

Kurzbeschreibung

Sequenzen sind allgegenwärtig. Texte und Programme, Gene und Proteine, Polygonzüge, Sprach- und Bildsignale und digitalisiertes Vogelzwitschern werden dargestellt als Zeichenfolgen über einem endlichen Alphabet. Entsprechend vielfältig sind die algorithmischen Fragestellungen. Oft ist dabei der Datenumfang sehr groß, so dass die algorithmische Komplexität von entscheidender praktischer Bedeutung ist.

In der Vorlesung werden Algorithmen zum effizienten Vergleich von Sequenzen und zur Suche exakter und approximativer Muster in Sequenzen behandelt. Viele dieser Algorithmen sind durch bioinformatische Fragestellungen motiviert. Sie finden jedoch auch Anwendungen in anderen Bereichen wie z.B. der Textverarbeitung und der Datenkompression.

Literatur

  • Das Skript zur Vorlesung: Sequenzanalyse-Skript
  • Gusfield, D.: Algorithms on Strings, Trees, and Sequences: Computer Science and Computational Biology. Cambridge University Press, New York, 1997.
  • Setubal, J. and Meidanis, J.: Introduction to Computational Biology. PWS Publishing, Boston, M.A., 1997.

Organisatorisches

  • Die Modulbeschreibung enthält einige Rahmenbedingungen der Veranstaltung.
  • Zur Teilnahme an der Vorlesung und Klausur sind diejenigen berechtigt, welche die A&D-Klausur bestanden haben oder im WS2020/21 zur A&D-Klausur zugelassen waren.
  • Erfolgreiches Lösen der Übungsaufgaben (Bestehensgrenze 50% der Punkte) und aktive Teilnahme in den Tutorien (mindestens zweimal Vorrechnen) ist Voraussetzung für die Teilnahme an der Abschlussklausur oder der abschließenden mündlichen Prüfung.
  • Die Übungszettel werden wöchentlich Donnerstag mittags auf dieser Seite online geschaltet. Gleichzeit endet dann auch die Abgabefrist der Übungszettel der vorangegangenen Woche. Die Lösungen müssen per E-mail an die jeweilige Tutorin geschickt werden.

:!: Achtung: Die Veranstaltung findet live per Videokonferenz statt. Informationen hierzu werden kurz vor Beginn am 13.4.2020 an alle eingetragenen Teilnehmer*innen verschickt.

Übungen

Abgabeschluss der wöchentlichen Übungsaufgaben ist jeweils Donnerstag 12:00 Uhr. Gleichzeitig wird ein neuer Übungszettel auf dieser Seite veröffentlicht werden. Abgaben müssen direkt per E-mail an die jeweilige Tutorin geschickt werden.

Termin Tutorin eKVV
Dienstag 16-18 Uhr Marilia Dias Vieira Braga Online-Tutorium 1
Dienstag 16-18 Uhr Rebecca K. Pfeil Online-Tutorium 2
Mittwoch 16-18 Uhr Leonie Brockmann Online-Tutorium 3

Prüfungstermine

  1. Klausur: 22. Juli 2021, 10:15 - 11:45, H14 (Präsenzklausur - bitte im eKVV anmelden!)
  2. Nachklausur: 16. September 2021, 10:15 - 11:45, H2 (Präsenzklausur - bitte im eKVV anmelden!)

Übungszettel

Woche Datum Thema Abschnitt im Skript Übungszettel
15 13./15.04.2021 Di: Einleitung, Logistik
Do: –
1

16 20./22.04.2021 Di: Grundlagen
Do: Def. Metriken auf Sequenzen
2
3.1-3.5

Blatt 01
17 27./29.04.2021 Di: Berechnung der Edit-Distanz
Do: Die q-gram-Distanz
3.6
3.7

Blatt 02
18 04./06.05.2021 Di: Die Maximal-Matches-Distanz, Filtern
Do: –
3.8, 3.9

Blatt 03
19 11./13.05.2021 Di: Def. paarweises Alignment, Alignment-Score
Do: –
4.1, 4.2

Blatt 04
20 18./20.05.2021 Di: Alignment-Graph und universeller Algorithmus
Do: Alignment-Typen, Gapkosten
4.3, 4.4
4.5, 4.6

Blatt 05
21 25./27.05.2021 Di: Fortgeschrittene Alignment-Themen I
Do: Fortgeschrittene Alignment-Themen II
5.1, 5.2
5.3, 5.4

Blatt 06
22 01./03.06.2021 Di: Paarweises Alignment in der Praxis
Do: –
6

Blatt 07
23 08./10.06.2021 Di: Def. Suffixbäume, WOTD-Algorithmus
Do: –
7.1-7.6

Blatt 08
24 15./17.06.2021 Di: Anwendungen von Suffixbäumen
Do: –
7.7

Blatt 09
25 22./24.06.2021 Di: Suffixarrays
Do: Burrows-Wheeler-Transformation
8
9

Blatt 10
26 29.06./01.07.2021 Di: Def. Multiples Alignment
Do: NP-Vollständigkeit
10.1-10.4
10.5

Blatt 11
27 06./08.07.2021 Di: –
Do: Exakte Algorithmen für SP-Alignment

11.1-11.3

Blatt 12
28 13./15.07.2021 Di: Heuristiken für SP-Alignment
Do: Baumalignment, Genomalignment
11.4, 11.5
12, 13

29 20./22.07.2021 Di: ggf. Wiederholung
Do: Klausur