Fachschaft Informatik

Prüfungsprotokolle


Prüfungsprotokolle lesen



Protokolle (22 gefunden)

Nr.PrüferFach
10 Leser Prof. Bioinformatik

Protokoll

HK Prüfung Bioinformatik, Hakenberg Beisitzer.
April 2004

Leser hat die Fragen gestellt, und versucht jedes Thema der 
Vorlesung anzureissen. Auf Lücke lernen ist eher schlecht.
Der Beisitzer hat keine Fragen gestellt.
Ganz allgemein war die Atmosphäre der Prüfung sehr ruhig und angenehm.

Thema war (etwas unausführlich, da schon einige Zeit her...)
- Z-Box
- KMP
- Sufixtrees
- Ukkonnen
- PAM

Der Algorithmische Part stand klar im Vordergrund. 
Es wurden fast keine biologischen Fragen gestellt.

Nr.PrüferFach
11 Leser Prof. Bioinformatik

Protokoll

April 2004
lief ganz gut (1.7), war auch ne nette Atmosphäre, die
Prüfung an sich fand ich allerdings ziemlich schwer:
er wollte v.a. eine Haufen Details wissen. Themen
waren:
1.Edit-/alignmentabstand/Pfade in Dotplots:
die ganzen Definitionen, wie kann man sie ineinander
überführen, was ist end-free alignment, wozu braucht
man das (er wollte nur assembly hören, nicht erklärt
haben was das ist)
2. Dynamische Programmierung: 
Rekursionsgleichung hinschreiben, Beispieltabelle
berechnen (mit konstanten Kosten für I,R,D), optimalen
Pfad suchen, was ist das Äquivalent dazu im
Editgraphen, was gibt es für andere Möglichkeiten,
Kosten zu bewerten, wie sähe dann der optimale Pfad
aus; dann: was gibt es für Möglichkeiten, Gaps zu
bewerten, wie sieht eine lineare Gapscorefunktion
genau aus, wie berechnet man dann die Zellwerte (dazu
wollte er wieder die genaue Formel haben für E(i,j)),
wie ändert sich das bei konstanten Werten, was ist die
Komplexität, wie ist die bei beliebigen Funktionen
3. Blast: Algo erklären, Sensitivität (mit Formel),
was passiert, wenn man t ändert, wie funktioniert
Blast2, was passiert da mit der Seedlänge und warum
4. Blat: was ist der Unterschied zwisachen Blast2 und
Blat (im Algorithmus), Wahrscheinlichkeit für
perfekten Treffer und Treffer mit einem Mismatch (hat
Ähnlichkeit der Genome und Länge homologer Regionen
vorgegeben und wollte dann die Formel)
5.KMP: Algorithmus und Preprocessing erklären, dafür
wollte er keine Formeln wissen, auch nicht, wie man
die Z-Boxen berechnet
6.Suffixbäume: wie berechnet man mit Suffixbäumen den
längsten gemeinsamen Substring von A und B 

Nr.PrüferFach
12 Leser Prof. Bioinformatik

Protokoll

April 2004

Angenehme Prüfungsatmosphäre.

Fragen in etwa:

Biologisch:
- Transkiption/Translation
- Gene versus Proteine und Anzahl (=> Differtielles Splicing)

Algorithmisch:
- Boyer Moore, Good Suffix Rule, Bad Character Rule
- Z-Box mit Komplexität
- Bäume
- Aho Corasick mit Failure Links
- Initialisierung Gapped Free Alignment, und Dynamische programmierung
- KEIN Ukkonen

Nr.PrüferFach
80 Leser Prof. Bioinformatik

Protokoll

Datum der Prüfung:
März 2005

Benötigte Lernzeit als Empfehlung:
10 Tage 

Verwendete Materialien:
Skript eignet sich sehr gut zum Lernen

"Atmosphäre" der Prüfung / Verhalten der Beisitzer:
entspannte Atmosphäre
Fragen gingen zwar in die Tiefe aber mit Hilfestellungen

Prüfungsfragen
Boyer Moore:
musste an einem Beispiel BCR und GSR erklären 
Laufzeit
worst case / average case

Keyword Tree:
Prinzipien erläutern
Laufzeit

Phylogenetische Bäume:
Fitch, Sankoff, Characterbasierte Verfahren,
Distanzbasierte Verfahren, ...

Note:
1.3

Fazit:
Prof.Leser bewertet sehr fair
Beweise wurden nicht abgefragt
Fragen zum Thema ergeben sich aus dem Zusammenhang
biologische Fragen fielen kaum

Nr.PrüferFach
81 Leser Prof. Bioinformatik

Protokoll

Prüfung: Algorithmische Bioinformatik
Prüfung über das WS 2004/05
Prüfer: Prof. Dr. Leser
Note: 2,3

Dies Prüfung war ein Worst-Case für mich. Prof. Leser hat so
ziemlich genau das gefragt, was ich nicht wusste.

Zunächst gab es etwas Smalltalk über das Studium. (Welches
Semester sind Sie? ...)

Dann konnte ich mir aussuchen, womit ich anfange:
Ich wählte exaktes Matching bzw. allgemein den Stoff in 
VL-Reihenfolge.

-KMP 
 (inkl. Korrektheitsbeweis)
-Keyword Trees 
 (inkl. Output-Links und Konstruktion der Failure-Links)
-kurze Frage zu Suffixbäumen
-Aho Corasick
-PAM
-Blat
-Blast
-Quasar
-Phylogenetische Bäume

Prof. Leser sagte, im letzten Jahr kam halt vieles nicht
dran wegen des Streiks, und daher hätte man nicht zu sehr 
auf die Prüfungsprotokolle vertrauen sollen...

P.S.:

Statt Quasar kann es auch Clustal W gewesen sein - 
ich weiß es nicht mehr.

Nr.PrüferFach
85 Leser Prof. Bioinformatik

Protokoll

pruefer: leser
fach: algorithmische bioinformatik
lernzeit: ca. 10 tage
materialien: folien+web

ruhige athmosphäre/freundlicher prüfer

prüfung:
-nenne algorithmen für exaktes stringmatching
-z-box-algo erklären:
 -was ist eine zbox
 -lineare konstr. der zboxen
 -wie suche mit zbox + komplexität
-kmp-algo erklären:
 -wie suche
 -was ist sp`
 -komplexität
-boyer-moore-algo erklären:
 -good suffix rule erklären
 -wie suchen + komplexität
 -fall für schnellste laufzeit des algos
-multiple sequenz alignment + sum of pairs:
 -erklären
 -wie berechnen
-evolutionary clock theory:
 -erklären
 -wo angewendet
-ultrametr. matrizen:
 -definition
 -ultrametr. baum bauen (upgma)
 -korrektheit des baumes anhand der matrix zeigen
-maximum parsimony:
 -leider geshiftet  :-( 
 -annahme kommt nicht dran -> fehlannahme
-KEIN UKKONEN:
 -danke!

note: nicht so gut, wegen shiften
bewertung: absolut faire prüfung
ps: konzentration nur auf algorithm. part der vorlesung

Nr.PrüferFach
86 Leser Prof. Bioinformatik

Protokoll

ruhige, entspannte Athmosphäre, 
zwei Beisitzer (einer davon „zum anlernen“), 
die aber nichts  gesagt haben    

Themen:  
- KMP (ohne Formeln, nur Suche erklären)  
- Keyword Trees (Beispielbaum bauen, Komplexität, Failure, Output Links 
erklären)  
- Suffix Trees (Unterschied zu Keyword Trees erklären)  
- Alignments (Unterschied lokales – globales, Anwendung, Tabelle für dyn. 
Programmierung  skizzieren)  
- Gapscorefunktionen (aufzählen, Komplexität und Berechnung lineare, 
konstante Gapscores)  
- MSA definieren  
- Phylogenie (Verfahren aufzählen (Ultrametrik, additiv, characterbasiert), - 
Algorithmen nennen  (Fitch, Sankoff, ohne Erklärung, wollte nur die Namen 
hören), 
- Unterschied zwischen Small  und Large Parsimony erklären)    

Fazit: Lief ziemlich gut (1,3), obwohl ich nicht damit gerechnet hätte. Wenn 
man Antworten  nicht weiß, einfach zugeben, dann wechselt er das Thema 
und man kann vielleicht mit was  anderem glänzen.  :)

Nr.PrüferFach
107 Leser Prof. Bioinformatik

Protokoll

=Datum der Prüfung
April 2005

= Benötigte Lernzeit als Empfehlung
14 Tage

= Verwendete Materialien (Bücher, Skripte etc...)
Die Folien der VL sind sehr gut und reichen völlig aus zur 
Vorbereitung.

= "Atmosphäre" der Prüfung / Verhalten der Beisitzer
Sehr angenehme Atmosphäre. Auflockerung durch anfänglichen 
Small-Talk über Studium und Interessen. Beisitzerin 
S.Trissl hat nur protokolliert/keine Fragen ihrerseits.

= Prüfungsfragen
1) Z-Box-Algorithmus
2) Boyer-Moore-Algorithmus
3) KMP-Algorithmus
(alle drei mit mehr oder weniger detaillierten 
Korrektheitsbeweisen)
4) Phylogenetische Verfahren aufzählen 
5) Small und Large Parsimony erklären
6) Fitch und Sankoff Unterschiede (Vollständigkeit, 
Korrektheit)

= Note
Lief sehr gut. (1.3)

= Fazit
Herr Leser ist sehr fair und gibt oft Hilfestellungen. Er 
versucht ab und zu durch kleinere "Fangfragen" 
herauszubekommen, ob man das Thema wirklich verstanden hat 
(Was passiert, wenn man jetzt...?). Es ist wichtiger, das 
Prinzip/den Trick des Algorithmus verstanden zu haben, als 
jedes einzelne Detail. Aufzeichnen hilft oft als 
Erklärungsvariante und hilft einem selbst auch beim Fragen 
beantworten!

Nr.PrüferFach
108 Leser Prof. Bioinformatik

Protokoll

= Datum der Prüfung
April 2005

= Benötigte Lernzeit als Empfehlung
11 Tage, die man aber auch durchziehen sollte: 
mehr Tage -> weniger Stress

= Verwendete Materialien (Bücher, Skripte etc...)
Skript(recht gut gemacht) und Gusfield(zum Nachschlagen)

= "Atmosphäre" der Prüfung / Verhalten der Beisitzer
Gefragt hat nur Prof.Leser, Beisitzerin A. Nonym hat keine
Fragen gestellt. Die Atmosphäre war sehr gut, und recht
locker. Vor der Prüfung gabs ein kurzes Gespräch über
bisherigen Prüfungen und zum Nebenfach.

= Prüfungsfragen
-Eigenschaften von Suffixbäumen
-wie findet man maximale gemeinsame Substrings
-wie ist die Tiefe eines Knotens definiert
-sehr grober Überblick über Ukonnen(<- war mein Vorschlag 
am Anfang; wird sonst nicht geprüft, meinte er)
-Möglichkeiten den Platzverbruach von Suffixbäumen zu
minimieren (Platzverbrauch an Knoten, Suffixarrays, 
Partitionen)
-Editabstände: bei linearen&konstanten Gaps
-MSA, was ist das, wie kommt O(2^n*n^k) Zustande
-welche Möglichkeiten gibt es noch zu alignieren(bei MSA)
-Phylogenetische Bäume: Unterschied zw. Large und Small
Parsimony, welche Möglichkeiten gibt es bei large Parsimony
-average und worst case bei Boyer-Morre, KMP ect.

= Note :1.0
= Fazit 
Die Prüfung verlief recht angenehm, wie die anderen hier in
der Liste schon beschrieben haben. Man konnte ein Thema
vorschlagen mit dem es losgehen sollte, und Prof.Leser hat
viele Hilfestellungen gegeben, wenn man nicht drauf kam.

Nr.PrüferFach
257 Leser Prof. Bioinformatik

Protokoll

= Datum der Prüfung
12.04.2007

= Benötigte Lernzeit als  Empfehlung
2 Wochen, ist fast zu knapp

= Verwendete Materialien  (Bücher, Skripte etc...)
VL-Folien, Gusfield, Internet

= "Atmosphäre" der Prüfung /  Verhalten der Beisitzer
sachlich und professionell (pünktlich, freundlich, Getränke  und Snacks im Angebot)

= Prüfungsfragen
Zwei Gerüchte die offensichtlich nicht immer stimmen:  
1. Biologische Fragen fallen eben doch
2. Das Startthema kann man sich nicht immer aussuchen  

Die Fragen:  
1. Wie wird aus einem Gen ein Protein?  das wollte er schon genauer wissen als ich es wusste  
2. Z-Box  die Fakten aus den Folien(komplexität,z-werte,l,r...)  man sollte das aber unbedingt mal per Hand gemacht haben,  ich konnte das dann nicht und musste leider shiften  
3.Keyword trees mit beispiel durchexerzieren  
4.Aproximatives matching  -editabstand  -Rekursionsgleichung (sehr detailliert)  -Komplexität Hyperwürfel erklären ((2^k-1)*n^k)  
5.BLAST  -Parameter  -Effekt beim Schwellwert verändern  -BLAST2  
und die Zeit war um (30 min.)    

= Note
3.0

= Fazit (Gute/schlechte Prüfung , angemessene Benotung etc...)
Die Prüfung fing ziemlich schlecht an, da ich nicht mit der   biologischen Einstiegsfrage gerechnet habe.  Auch die Z-Boxgeschichte war sehr unangenehm.  Ich habe darauf spekuliert, dass ich die Startfrage selbst  wählen könne und demzufolge leider ein paar Lernlücken  gehabt.  Aber im Gegensatz zu allen anderen meiner bisherigen   Prüfungen lief es von Frage zu Frage besser, was wirklich  für den Prüfer spricht, er blieb sachlich und war nicht  persönlich angegriffen durch meine Lücken, was man nicht  von allen Profs behaupten kann.  Fazit: Guter Prüfer, der sich aber nicht hinters Licht  führen lässt=>alles lernen      

Nr.PrüferFach
355 Leser Prof. Bioinformatik

Protokoll

= Datum der Prüfung
Ende WiSe 07/08

(Die anderen Protokolle hier sind schon etwas älter, daher
wollte ich mal was aktuelles schreiben und andere
Wichtigkeiten loswerden...)

= Benötigte Lernzeit als Empfehlung

Vorbereitungszeit sind 7-10 Tage ausreichend. Aber
entscheidend ist, nicht nur in dieser VL sondern ganz
allgemein: "Lernzeit" ist die VL-Zeit! Die 7-10 Tage sind
Auffrischungszeit und
Mittel-und-Kurzzeit-Gedächtnis-Vollstopfzeit und nichts anderes.

= Verwendete Materialien (Bücher, Skripte etc...)

Der Foliensatz reicht aus, auch wenn man dazu in der VL
gewesen sein muss/sollte (mental!). Siehe auch oben unter
"Lernzeit". Gusfield (das in der VL empfohlene Buch) eignet
sich gut zum Gegenchecken.

= "Atmosphäre" der Prüfung / Verhalten der Beisitzer

Wie gehabt angenehm, vorher 5-10min Smalltalk zum Auflockern
und Nervosität-nehmen. Beisitzer komplett silent, lächelt
aber ständig und insbesondere wenn man versucht, witzig zu
sein. Zusammen mit ständiger Freundlichkeit des Prüfers
genau die Atmosphäre die man sich wünscht. 

(Insbesondere wenn der Vordermann rauskommt mit der
Bemerkung "auf Lücke lernen war keine gute Idee", was einen
wiederum eher bestärkt wenn man sich auf alles vorbereitet
hat..)

= Prüfungsfragen

* Einstiegsbereich war zum Selbstaussuchen, bei mir exaktes
Matching. Also Z-Box bis in`s letzte Detail, Definition,
Suche, Berechnung; hat alles eine Weile gedauert obwohl ich
dauer-geredet hab - schließlich gibt`s da einiges zu
erzählen; kleine Fangfrage ("Braucht man das `$`?");
Komplexitätsbetrachtung;

* Allgemeine Fragen rund über exakte Verfahren, also welche
kennen wir noch, wie schnell sind die, welcher ist der
schnellste, wie geht`s noch schneller im Average Case (GSR
beim BM weglassen)...

* Großer Sprung zur Gene Prediction. Was gibt es da für
Möglichkeiten, Gene zu finden (mRNA rausfischen und ESTs
angucken; alles komplett sequenzieren und HMM-Zirkus machen;
komplettes Genom mit bekanntem Genom alignieren)

* HMM, was ist das, was für Probleme gibt es und wie heißen
die jeweiligen Lösungen. Alle drei (Viterbi, Forward-Alg.,
Baum-Welch) erklären, recht detailliert insb. Viterbi.

* MSA, was gibt es da für Möglichkeiten (naiv, SoP,
Center-Star, Baum-orientiert); auf alle drei mal kurz
eingehen; SoP konkreter, d.h. wie funktioniert das Verfahren
; Komplexitätsbetrachtung dazu; ClustalW kurz überblicken.

* Distanzbasierte Phylogenie durch ClustalW nur kurz
angerissen (wie baut man z.B. einen Baum - er wollte nur die
beiden Begriffe UPGMA und Neighbo(u)r Joining hören)

* Schluss war viel früher als gedacht...

Allgemein gilt: "Detailliert" heißt nicht "Formel
hinschreiben". Es geht darum zu wissen was da passiert. Wenn
 man das erklärt, reicht das schon. Ich habe keine einzige
Formel während der ganzen Prüfung aufgeschrieben - wenn man
Details erklärt hat (z.B. Viterbi-Alg. anhand einer
abstrakten Skizze), würden die sich zwar von selbst ergeben,
aber ich habe vergebens darauf gewartet, dass er mich mal
auffordert, eine wirklich hinzuschreiben. Also: Formeln
nicht zum Hinschreiben lernen, sondern höchstens zum dran
erinnern, wie das Verfahren ging und als Double-Check.

= Note (Optional)

Sehr gut.

= Fazit (Gute/schlechte Prüfung , angemessene Benotung etc...)

Prüfung lief wunderbar.. Hab einmal zu schnell geantwortet,
kurz Nachdenken hilft (siehe oben mit dem `$`, das ist da
natürlich nur aus didaktischen Gründen; mir fiel spontan
kein Grund ein warum man das braucht, aber man übersieht in
einer Prüfung ja gern mal was, daher kam mir das verdächtig
vor und ich hatte also meine Arbeitshypothese auf
`$`-Verteidigung - lies mich aber dann überzeugen, weil
seine Argumentation schlüssig klang und keine Lücke
offenbarte, die für mich ein Fingerzeig auf ein Argument für
meinen Standpunkt gewesen wäre). Ansonsten ist es ein
flüssiges Gespräch, wenn man Prof. Lesers Tempo
hinterherkommen kann und schnell genug die Stichworte und
Ideen in den Strom reinschießt die er will. (Heißt nicht,
dass er sich ggf. langsamerem Tempo anpasst, vielleicht war
ich selbst schuld...) Aber auch da wo es in die Tiefe geht
lässt er einen nicht allein sondern lässt es interaktiv,
sodass man sich nicht verzettelt. (Die Interaktivität
beinhaltet dabei sowohl Hilfen als auch versteckte Checks ob
man das da grad nur so sagt oder weiß was man redet...)

So, genug geschrieben.

Nr.PrüferFach
356 Leser Prof. Bioinformatik

Protokoll

= Datum der Prüfung
04.April 2008

= Vorlesung

Erst Mal ein paar Worte zur Vorlesung:

Das war mit Abstand die beste Vorlesung, die ich bisher an
der Humboldt Uni gehört habe. Der Stoff war eher viel als
wenig(aber hielt sich noch im Rahmen), dafür nicht
schwierig, bzw. von Prof. Leser immer dem
Schwierigkeitsniveau entsprechend vorgetragen.
Das einzige Manko waren der Umfang der Übungen, wobei es
auch am eigenen Anspruch lag bei den Wettbewerben möglichst
gut abzuschneiden und deshalb das Programmieren Ausmaße
annahmen, die diese Vorlesung zur Aufwendigsten des
Semesters machten.


= Benötigte Lernzeit als Empfehlung

Es hängt natürlich entschieden davon ab, was mensch schon im
Semester gelernt hat. Für mich wären die hier genannten
Zeiten deutlich zu gering gewesen. 10 Tage reichen für den
Stoff, auch wenn jemand schon ganz okay mitgelernt hat,
einfach nicht aus. Vor allem da Prof. Leser wirklich
potentiell alle Details abfragt. Ich habe wohl vier Wochen
gelernt, davon drei Wochen komplette Lerntage. Also für
jemanden, der gut mitgelernt hat, dürften 2 Wochen so
reichen, für jemanden, der sich den Stoff from scratch
aneignen muss, sollte eher 5+x Wochen ansetzen.


= Verwendete Materialien (Bücher, Skripte etc...)

Die Folien, für Dinge, die ich nicht verstanden hatte den
Gusfield und für den Biologie-Part Wikipedia.


= "Atmosphäre" der Prüfung / Verhalten der Beisitzer

Die Prüfung setzte die Vorlesung nahtlos fort, eine viel
entspanntere habe ich bisher nicht absolvieren dürfen.
Zuerst gab es volle 10 Minuten Smalltalk über das bisherige
Studium und die absolvierten Prüfungen(er fragte allerdings
nicht nach Noten) und die noch folgenden Vorlesungen.
Der Beisitzer notierte nur.


= Prüfungsfragen

Dann ging es los: ich durfte mir ein Thema auswählen, wo ich
mich für Boyer-Moore entschied. Ich explizierte also die
Good Suffix - und die Bad Character Rule(mit Ansprache der
EBCR, wo er dann intervenierte und mich nach den möglichen
Speicherarten fragte). Er wollte dann die
Apostolico-Giancarlo Variante grob erklärt bekommen,
verzichtete aber auf die Aufzählung der fünf Varianten.
Wollte dann aber zu meinem Leidwesen den Beweis für die
Linearität haben, den ich zwar grob skizzieren, aber nicht
so gut vortragen konnte, wie er das gerne gehabt hätte.
Dieser Teilabschnitt nahm schon einen großen Teil, so ein
Drittel der Prüfungszeit ein.
Dann gab es die allgemeine Frage, was denn jetzt der
schnellste Algorithmus für exaktes Matching ist. Die Frage
war mir zu banal, ich überlegte fieberhaft, ob er denn jetzt
auf Suffix-Trees hinaus wollte. Es dauerte also einen
kleinen Moment bis sich die Konfusion legte und ich darauf
kurz "Boyer-Moore ist sublinear im average case" sagen
konnte und auf die sich anschließende "Warum?"-Frage dies in
aller Kürze erläutern konnte. Er wollte dann von mir den
best-case für Boyer-Moore wissen und auf die Antwort folgte
die Frage nach der Laufzeit in diesem Fall.
Dann passierte etwas, womit ich wahrlich nicht gerechnet
hatte: er fragte, was denn die schnellsten Algorithmen
seien, was ich mir nicht angeguckt hatte, da ich diese eine
Folie für einen reinen Hinweis gehalten hatte, zum Glück
konnte ich allerdings mit meinem Vorlesungswissen noch über
die Boyer-Moore Variante Horspool und den shift-and
Algorithmus parlieren.
Er fragt also wirklich alles und potentiell jede Folie ab.

Dieser ganze Bereich dürfte so 15 Minuten gedauert haben,
nicht weil ich so lange gebraucht hätte, sondern weil er
doch viel nachfragte, was nett war, da eigentlich absehbar
war, dass ich die Fragen ganz gut beantworten könnte.

Dann kamen wir zu Hidden Markov Modellen, wo er erst Mal die
Definition wissen wollte, die ich ihm mehr schlecht als
recht und eher in Abgrenzung zum normalen MM unterbreitete.
Es folgte die Frage nach der Ordnung der MK und wie sie
durch eine MK der Ordnung eins simuliert werden könne. Das
konnte ich ihm dann auch so grob beschreiben, auf die sich
anschließende Frage, wie sich dann die MK erster Ordnung
vergrößert viel mir leider nichts ein, bzw. das was mir
einfiel und richtig gewesen wäre, behielt ich für mich.
Er wollte dann die Frage beantwortet haben, was man denn mit
einem solchen Modell machen könnte, also auf den
Forward/Backward und den Viterbi Algorithmus hinaus,
letzteren sollte ich dann auch beschreiben, was mir ganz gut
gelang, ich schrieb dabei dann auch die Formel für die
Dynamische Programmierung auf, was er seinem
Gesichtsausdruck zu Folge nicht erwartete. Ich kriegte sie
aber nicht mehr ganz hin, wo er mich dann mit dem Hinweis
"worüber denn das Maximum geht?" auf die richtige Spur
führte. Er wollte dann noch die Laufzeit des Viterbi wissen,
die ich ihm runterbetete und auch erläutern musste, was ich
dann auch tat.
Es folgte ein Beispiel, wo er dann wissen wollte, wie man
das löst. Es war der Versuch einer kleinen Fangfrage, da
hier nach dem Forward-Algorithmus gefragt war. Mensch sollte
also gut wissen, wofür jetzt welcher Algorithmus ist und
dies aus dem Stehgreif reproduzieren können. 
Im Anschluss wollte er noch den Baum-Welch wissen, wo ich
ihm das EM-Prinzip erläuterte, alles ohne Formeln.
"Das war der schwere Fall, wie sieht denn der einfach aus?"
schloss sich als Frage an, was ich dann mit Maximum
Likelihood und einer groben Erklärung zur Zufriedenheit
beantwortete. 
Es folgte der Biologie-Einschub mit der einzigen Frage, was
denn ein Gen für verschiedene Bereich hat, wo ich ihm nur
was von Introns, Exons und Promotoren vorstammelte, die
Erwähnung von splice-Stellen,... hätte sich dann vielleicht
noch meine Note zum besseren gekippt. Es blieb allerdings
auch die einzige Biologie-Frage und diese stammte auch aus
dem Biologie-Teil seiner Folien.
Dann schlug er die Verbindung zum Multiplen Sequenz
Alignment und zur Anwendung der HMM auf dieses. Nach
kleinerer Konfusion umriss ich eine HMM für Multiples
Sequenz Alignment, es folgte die Frage nach der Anzahl der
Zustände, was ich mit der Länge der Sequenz beantwortete und
dabei die für Deletions und Inserts übersah. Was ich nach
einem kurzen Hinweis aber berichtigte.
Wir kamen dann auf die Frage, nach den Möglichkeiten ein MSA
zu wählen, wo ich dann die drei Zielfunktionen erwähnte, mir
eine aussuchen durfte und Sum-of-Pairs erläuterte. Ich
erwähnte dann Dynamische Programmierung im n-dimensionalen
Raum und grob die Berechnung. Formeln wollte er an dieser
Stelle, wie überall anders auch, nicht sehen. Viel
spannender fand er die Laufzeit und was denn jetzt was
ist(ich hatte vorher von n-Dimensionen gesprochen, in meiner
Formel, aber n für Länge und k für die Dimensionen genommen,
also quasi die Folien rezipiert, was er dann kurz geklärt
haben wollte).
Dann kam der schwächste Teil meiner Prüfung: die Verbindung
von MSA und Phylogenie. Er wollte darauf hinaus, wofür man
ein MSA nutzen könnte für die Phylogenie, ich erläuterte ihm
dann den Neighbor-Joining Algorithmus und wie sich ein Baum
so bauen lässt. Er wollte aber die ganze Zeit auf was viel
trivialeres hinaus: darauf, dass man für die Phylogenie
erstmal die homologen Abschnitte mittels MSA finden muss,
aber dass das Interessante ja der entstehende Baum ist. Auf
ersteres kam ich noch, letzteres war für mich zu banal, als
dass ich es erwähnt hätte. Er wollte von mir also nur ganz
grob die Phylogenie erklärt haben und ich verstand nicht,
worauf er hinaus wollte. Stellt euch also auch auf sehr
einfache Fragen ein. 
Mit seiner Erklärung dazu war dann auch die Prüfung vorbei,
es kam das übliche rein/raus und dann wurde mir die Note
genannt. Sie waren sich nicht ganz einig, während der
Beisitzer für eine 1,3 plädierte, war Prof. Leser eher für
eine 1,7. Die höhere Besoldungsstufe setzte sich durch. Bei
Noten wären beide fair gewesen. Auch wenn es aus dem Text
nicht ganz herauskommt, habe ich doch mehrere Teile recht
souverän vorgetragen. Da ich doch ein paar Mal ins Schwimmen
geriet, lief es dann auf eine der beiden Noten hinaus. Die
Begründung für die schlechtere Note war allerdings etwas
gewöhnungsbedürftig: Es hätte zu lange gedauert, nämlich 40
Minuten statt 30, was ich für eine nicht überzeugende
Begründung halte. Eine 1,7 wäre aber auch inhaltlich
gerechtfertigt gewesen, weshalb ich mich nicht beklagen
kann. Ihr müsst also schon darauf achten schnell
durchzukommen, wie auch immer das anzustellen ist.
Vielleicht häufiger bei Sachen, die klar sind springen, aber
so richtig erschließt es sich mir nicht, wie das gleiche
Pensum auch in 30 Minuten hätte abreißen sollen.
Er fragt gerne den Foliensatz bis zum Ende durch und will
wohl mindestens 4 Foliensätze schaffen.
Festzuhalten bleibt, dass es ihm zu keinem Zeitpunkt auf
ganz genaue Formeln ankam, solange man das Prinzip gut
erklären konnte. Dafür wollte er aber häufig die genaue
Laufzeit und eine Erklärung dafür haben.
Der Biologie-Teil ist marginal, sollte dann aber auch
gekonnt werden. Er wird, nach allem was ich so gehört habe,
nicht den Stoff des Gastdozenten am Anfang abfragen(welche
Wasserstoffbrücke jetzt wie,...), aber so eine grobe
Erklärung von dem, was er auch erwähnt hat(z.B. Gen
Exprimation, PCR,...), solltet ihr können. Setzt euch
vielleicht ein/zwei Tage vor Wikipedia und lernt die
Zusammenhänge. Die Erklärungen des Gastdozenten sind
überdimensioniert und zu sehr auf BiologInnen ausgerichtet
für das, was abgefragt wird.


= Note (Optional)
1,7

= Fazit (Gute/schlechte Prüfung , angemessene Benotung etc...)
Die Prüfung war der best case in Bezug auf den Prüfer, in
Bezug auf mich hätte ich ein paar Sachen ein bißchen
souveräner vortragen können.


So, für die, die bisher durchgehalten haben und für die
anderen auch: Viel Glück für eure Prüfung!

Nr.PrüferFach
357 Leser Prof. Bioinformatik

Protokoll

= Datum der Prüfung
03.04.2008

= Benötigte Lernzeit als Empfehlung
ca. 1-2 Wochen, je nach dem, wie fleißig man im Semester war

= Verwendete Materialien (Bücher, Skripte etc...)
VL-Skript, Gusfield

= "Atmosphäre" der Prüfung / Verhalten der Beisitzer
nette, ruhig Atmosphäre. Prof. Leser macht zu Beginn ein
wenig Small Talk übers Studium

= Prüfungsfragen
Exaktes Matching:
KMP (Suche+Preprocessing) mit Beweis 
Erweiterung von KMP auf Keyword Trees
Definition Keyword Tree
Konstruktion + Suche im Keyword Tree
Failure- und Output-Links
Wie aufwändig ist es, FL + OL zu konstruieren
Phylogenie:
Welche Verfahren gibt es?
Was ist ein Character?
Perfect Phylogeny, was ist das, welche Eigenschaften hat der
Baum?
Small vs. Large Parsimony
Sankoff Algorithmus im Detail erklären, Vektoren für alle
Knoten berechnen
Branch + Bound

= Note (Optional)
2.0

= Fazit (Gute/schlechte Prüfung , angemessene Benotung etc...)
Gute Prüfung, Prof. Leser ist sehr zu empfehlen. Wenn man
mal nicht so richtig weiter weiß, hilft er einem. Die Note
geht in Ordnung, da ich am Ende bei Sankoffs Algorithmus
ziemlich ins Schwimmen geraten bin.

Nr.PrüferFach
527 Leser Prof. Bioinformatik

Protokoll

Datum: 26. August 2011

Lernaufwand: 4 Tage Intensivstudium reichen zur Auffrischung, wenn man im Semester fleißig war

Materialien: VL Folien + Gußmann + Wikipedia + zusätzliche Webseiten

Atmosphäre: Ich war ein wenig verwundert, dass die Prüfung im Büro von Herrn Leser stattfand. Ich bin da eher neutrale Orte für Prüfungen gewohnt. Aber ansonsten entspannt.

Fragen:
   - Exaktes Matching mit Boyer-Moore (selbst gewählt) + BCR + EBCR + weak/strong/super strong GSR + Komplexität(avergage, WC) + Platzverbraucht + was ist das beste

   - Multiples Sequence Alignment + Definition + Komplexität(für optimales MSA) + Sum of Pairs +  Nachteile aus Informatik- und Biologiesicht + ClustalW + Guide Tree + Phylogenitischer Baum

   - Microarrays + so ziemlich alles was man dazu sagen und machen kann

Note: 1.0
Fazit: Fleißig lernen und Enthusiamsmus zeigen. Herr Leser hat einen String an Antworten, den er leider verbirgt. Die Aufgabe ist nun einfach einen eigenen String vorzutragen, der seinem möglichst ähnlich ist und am besten keine Gaps hat. ;)

Nr.PrüferFach
533 Bell Dr. Bioinformatik

Protokoll

= Datum der Prüfung
= Benötigte Lernzeit als Empfehlung
= Verwendete Materialien (Bücher, Skripte etc...)
= \"Atmosphäre\" der Prüfung / Verhalten der Beisitzer
= Prüfungsfragen
= Note (Optional)
= Fazit (Gute/schlechte Prüfung , angemessene Benotung etc...)

Nr.PrüferFach
559 Leser Prof. Bioinformatik

Protokoll

= Datum der Prüfung
3.2012
= Benötigte Lernzeit als Empfehlung
Wenn man in der Vorlesung war reichen 5 Tage
= Verwendete Materialien (Bücher, Skripte etc...)
Vorlesungsfolien + Lernskript von http://www2.informatik.hu-berlin.de/~A. Nonym/
(passwort Lernskript erratbar)
= \"Atmosphäre\" der Prüfung / Verhalten der Beisitzer
Beisitzer sagt nichts, hat nur den Studiausweis überprüft und Notizen gemacht.
Wir haben uns am Anfang über meinen Studiumsfortschritt und gemachte Prüfungen unterhalten, ging aber nicht auf die Prüfungszeit.
= Prüfungsfragen
was ist ein suffix baum
wie baut man einen suffix baum
was kann man mit einem suffix baum machen
was ist ein suffix array
was kann man mit einem suffix array nicht machen was man mit einem suffix baum machen kann

was ist ein MSA
wozu braucht man das
Scoring funktionen: SoP (was wird womit aligniert, komplexität (berechnen und optimum finden)), Center Star, Clustal-W

wozu braucht man blast
was genau tut blast (überlappende teilstücken nehmen und mit substitutionsmatrix bewerten)
was tut blast2 anders (2hit Strategie)

UPGMA kennt niemand, wie heißt das allgemein? (Hierarchisches Clustering)

= Note (Optional)
2.7
= Fazit (Gute/schlechte Prüfung , angemessene Benotung etc...)

Gute Prüfung, viel Hilfe, Querbeet gefragt, bei \"Weiß ich nicht\" wird das Thema gewechselt. Note war dem Wissensstand angemessen.

Mein Tipp:
Zu jedem Thema X die Frage \"Wozu braucht man X und was gibt es da noch\" beantworten können

Nr.PrüferFach
560 Leser Prof. Bioinformatik

Protokoll

= Datum der Prüfung
02.März 2012
= Benötigte Lernzeit als Empfehlung
7 Tage / 80h ohne Vorlesung zu Besuchen, Übungsaufgaben selbst gelöst
= Verwendete Materialien (Bücher, Skripte etc...)
Skript
= \"Atmosphäre\" der Prüfung / Verhalten der Beisitzer
sehr angehme, schon fast familiäre Atmosphäre (10min Fragen zu Studienverlauf etc.) ; Beisitzer war still
= Prüfungsfragen

- z-Box vollständig (komplette Fallunterscheidung; worst, best und avg Komplexität)
- Boyer-Moore, nur nennen und BCR, GSR sagen
- Suche nach mehreren Pattern gleichzeitig? -> Aho-Corasick ausführlich (Wie erstelle ich den Baum? Was muss ich dann machen? -> Failure Links; Was für ein Problem gibt es? -> Manche Matches werden übersehen; Eine hinreichende Bedingung, damit soetwas auftritt? Wie behebe ich das?)
- MSA: Möglichkeiten nennen. -> Frage von mir: Wie hieß das nochmal mit dem Baum?
- Wollen Sie Sum of Pairs oder mit phylogenetischem Baum erklären? -> SoP
- darauf hin SoP sehr aufühlich erklären. Nach meiner verbalen Formulierung malte er einen 1^3 Einträge Würfel und einen Pfad und fragte wie man den einen Abschnitt berechne; man sollte hier auch detailiert wissen wie man den Score für gemischte Match/Mismach/Delete Situationen berechnet
- Alignment von Seqeunz mit einem MSA: Möglichkeiten?
- Profile HMM etwas vertieft. Im Prinzip sagtee er nur ich solle das Bild malen mit den Ins-,Del-,Match- Zuständen

= Note (Optional)
1,3
= Fazit (Gute/schlechte Prüfung , angemessene Benotung etc...)
Ich 2,3 Mal nach einem Namen fragen bzw. nach einem kurzen Stichpunkt zu einem von ihm genannten Namen fragen. Das muss er wohl (korrekterweise) als Prüfungsaufregung gedeutet haben. 
Im Verlauf meiner Erklärungen hatte ich oft leichte Abweichungen zu den von Prof. Leser vorgestellten Verfahren. Wenn ich von ihm eine Auflösung gehört habe, habe ich immer deutlich gemacht inwiefern ich davon grade leicht abgewichen bin, bzw. inwiefern ich genau das gemacht habe. Ich habe hier ehrlich gasagt mit einer deutlich schlechteren Bewertung seinerseits gerechnet. Es bleibt also festzuhalten, dass ein Dialog über seine Vorstellungen und den eigenen Vortrag außerordentlich fair und aufgeschlossen behandelt wird (natürlich sollte man sich hier nicht verrennen).

Nr.PrüferFach
568 Leser Prof. Bioinformatik

Protokoll

= Datum der Prüfung
April 2012

= Benötigte Lernzeit als Empfehlung
10 Tage intensivlernen ohne große Vorkenntnisse

= Verwendete Materialien (Bücher, Skripte etc...)
Skript + Web

= \"Atmosphäre\" der Prüfung / Verhalten der Beisitzer
sehr entspannt mit Unipolitischer Diskussion zur Einstimmung

= Prüfungsfragen
Angefangen mit Wunschthema Phylogeny
 - Unterschiedliche Verfahren
 - Distanzbasiert im Detail
Umschwenken auf MSA
 - Sum of Pair mit Algorithmus
 - Clustal W (hier musste ich leider passen)
Sprung zu Keyword Trees
 - Erstellung/Suche/Komplexität

= Note (Optional)
1.7

= Fazit (Gute/schlechte Prüfung , angemessene Benotung etc...)
harte Prüfung, da ich an vielen Stellen angeeckt bin und mich nicht immer gleich verständlich ausdrücken konnte. Prof. Lesers Hinweise helfen aber am Ende auf den Punkt zu kommen und führen zum Ergebnis. Alles in allem sehr zufrieden mit der Benotung. Wiederspiegelt auch ungefähr meinen Wissensstand

Nr.PrüferFach
753 Leser Prof. Bioinformatik

Protokoll

= Datum der Prüfung
29. Juli 2016

= Benötigte Lernzeit als Empfehlung
2 Wochen

= Verwendete Materialien (Bücher, Skripte etc...)
Skript, Wikipedia

= "Atmosphäre" der Prüfung / Verhalten der Beisitzer
schriftliche Prüfung!

= Prüfungsfragen

AUFGABE 1 (PSWM)

Gegeben: - eine PSWM, 6 Spalten (Positionen), 4 Zeilen (A, C, G, T)
- Sequenz S der Länge 7

a) Welche Sequenz erzeugt den höchsten Score für M? Wie hoch ist die Wahrscheinlichkeit für diese Sequenz, wenn diese unter M entstanden ist?

b) Log Odds Ratio berechnen für alle Subsequenzen von S, die auf M angewendet werden können

c) Was beschreibt das Log Odds Ratio?

AUFGABE 2 (Local Alignment)

Gegeben sind die Scores: Indel -2, Mismatch -1, Match +1

2 Strings der Länge 7 gegeben

a) In gegebener Tabelle mit Algorithmus optimale Local Alignment Score bestimmen

b) alle optimalen Local Alignments angeben (ohne “Überhang” / Zeichen über das Alignment heraus)

c) formale Definition von Dotplots angeben

AUFGABE 3 (BLAST)

a) Was macht BLAST? Warum haben wir es als Heuristik bezeichnet?

b) 2 Strings D1 und D2 gegeben, Penalty für Replacement -1, Match +1, Threshold t=3
Seeds bestimmen, Positionen in D1 und D2 angeben

c) Wie kann man Recall erhöhen durch Änderung von t oder q? Was muss man dafür in Kauf nehmen?

d) Welche 2 entscheidenden Veränderungen wurden zu BLAST2 vorgenommen?

AUFGABE 4 (PPI)

a) Skalenfreie Netzwerke definieren, intuitiv die Struktur erklären

b) In-betwenness Algorithmus in Pseudocode schreiben mit gegebenen Methoden:

shortestPath(s, t) - bestimmt alle kürzesten Pfade zwischen s und t als Liste von Listen
contains(L, s) - bestimmt, ob s in Liste L enthalten

der in-betweennes-Wert bc(v) für alle Knoten v des Graphen berechnet. In-betweennes war in der Aufgabenstellung ausführlich erklärt. 

c) Yeast2Hybrid Verfahren erklären, was will man damit herausfinden?

AUFGABE 5

a) Wie viele Gene hat der Mensch?
Wie viele verschiedene Chromosomen hat eine Frau?
Wie viele Basen hat ihr Genom?

b) Wie viele Aminosäuren hat ein humanes Protein mindestens und durchschnittlich? Was ist Splicing? Was ist differentielles Splicing?

c) Was ist ein Gene Expression Microarray mit Oligoprobes? Was will man damit herausfinden? Warum gibt es mehr Probes als es Gene gibt?

AUFGABE 6 (DBN)

Funktionen gegeben:
fA(B) = not B
fB(C,D) = C or D
fC(A,D) = not A and not D
fD(A,B) = A or B

Anfangszustand 1 / 1 / 1 / 0

a) Tabelle ausfüllen (Folgezustände berechnen)

b) Definieren, was Punktattraktor ist, einen aus dem Beispiel von a) angeben

c) Beweisen, dass jedes DBN mit endlicher Knotenanzahl einen zyklischen Attraktor besitzt.

AUFGABE 7

a) Algorithmus findet 15 Matches, 12 davon sind richtig, insgesamt gäbe es 21 Matches, 400 Einträge in der DB
Precision und Recall bestimmen

b) Algorithmus findet 31 Matches, 29 davon sind richtig, es gibt 30 Matches die nicht erkannt wurden
Precision und Recall bestimmen

Nr.PrüferFach
854 Leser Prof. Bioinformatik

Protokoll

= Datum der Prüfung SS2018

= Prüfungsfragen
1. Stringmatching
Text- und Patternstring gegeben mit P unter T und einem gemarkerten Mismatch.
1.a Angeben, um wieviele Postionen mit der Bad Character Rule geshiftet wird und begründen.
1.b Angeben, um wieviele Postionen mit der Good Suffix Rule geshiftet wird und begründen.
1.c T der Länge 12 und P der Länge 4 angeben, für die der Boyer Moore die minimale Anzahl an Vergleichen benötigt. Die Anzahl der Vergleiche in O-Notation angeben.

2. Sequenzalignment
2.a Lokalen Alignment Score für X=GGCTG und Y=GCTGTA berechnen. InsDel=-2, Mismatches=-1, Matches=1
2.b Worst-Case und Average-Case der Berechnung des lokalen Alignmentscores zweier Sequenzen angeben und begründen. Zu Rande gezogene Basisoperationen angeben.

3. Eiweißfaltung
3.a Drei Effekte nennen und erklären, die in realen Proteinen eine Rolle in der Faltung spielen und die der Chou-Fasman Algorithmus nicht erfasst.
3.b Chou-Fasman auf eine gegebene Aminosäurenabfolge anwenden.

4. PPI
4.a Skalenfreies Netzwerk definieren, intuitiv und als Formel.
4.b Zwei gegebene Graphen, entscheiden ob sie vermutlich skalenfrei/zufällig sind (Ja/Nein ankreuzen).
4.c Algorithmus für Betweennes-Centrality in Pseudocode niederschreiben. Algorithmus war erklärt und es standen zwei Hilfsfunktionen zur Verfügung.

5. Microarrays
5.a 4 spezifische Gründe nennen, warum Messungen vor der Analyse normalisiert werden müssen.
5.b Technologien zur Messung der Genexpression in einer Tabelle charakterisieren. Dabei war nur Microarrays als Eintrag gegeben, zwei weitere Technologien mussten hinzugefügt werden. Für alle drei dann die Spalten 'Quantitativ oder Qualitativ' und 'Anzahl der Gene (niedirg/mittel/hoch)' ausfüllen.
5.c Erklären wie man mit Microarrays Genexpression misst (Teilschritte mit Erklärung).

6. Biostatistik
6.a Tabelle mit p-Value und N gegeben, Bonferroni berechnen.
6.b Zwei Visualisierungsmethoden für Genexpression erklären. Zeichen und erklärende Beschriftung der Achsen ausreichend.
6.c Erklären, warum für die Bestimmung der differentiellen Expression Log-Fold Change und statistische Tests (p-Value, T-Test) kombiniert werden müssen.

7. Bool'sche Netzwerke
7.a Tabelle ausfüllen, Startzustand war 0/0/1/0
Formeln:
fA(B)=B
fB(C,D)=notC and D
fC(A,D)=A or D
fD(A,B)=notA or B
7.b Attraktor und seine Unterarten erklären und beantworten, ob das obige Netzwerk einen hat, und wenn ja, welchen.

Nr.PrüferFach
897 Leser Prof. Bioinformatik

Protokoll

= Datum der Prüfung
01.08.2019

= Benötigte Lernzeit als Empfehlung
2 Wochen (Wenn man gut ist vielleicht nur 1 Woche)

= Verwendete Materialien (Bücher, Skripte etc...)
Habe nur die VL Folien zum lernen verwendet, auch wenn Herr Leser mehrmals betont hat, dass wir Bücher lesen sollten.

= "Atmosphäre" der Prüfung / Verhalten der Beisitzer
Herr Leser hatte erstmal keinen Schlüssel und wir mussten 20 Minuten warten. Sonst war alles normal. (Schriftliche Prüfung eben)

= Prüfungsfragen

1. PSWM (Positon - specific- weight - matrix)

Gegeben war eine PSWM mit folgenden Aufgaben: 

(a) Bestimmen Sie die Sequenzen, welche den höchsten score hat.

(b) Bestimmen Sie den log-odd-score für S=CTGATG im Zusammenhang mit dem Zero-Modell

(c) Beschreiben Sie, wie man eine PSWM bestimmt, wenn man M Sequenzen geben hat und alle eine Länge von q haben.

(d) Wie viele Zeilen und Spalten hat diese PSWM?

2. Alignment
 
(a) Welche Unterschiede gibt es bei der Initialisierung der ersten Zeilen/Spalte, zwischen globalen und lokalen Alignment? Begründen Sie woher dieser Unterschied kommt!

(b) Geben Sie alle lokalen Alignment scores folgender Sequenzen an: S1 = GTACTA , S2 = TAGGTA

(c) Markieren Sie das Backtracking im dotplot und geben sie eine Sequenz an. 

3. BLAST

(a) Welches Problem löst BLAST? Warum ist BLAST eine Heuristik? Kann BLAST mit Fehlern beim Match arbeiten, wenn ja mit welchen?

(b) q = 3, t = 3 und eine Datenbank mit den Sequenzen D1 = ATGCCCTCAT, D2 = CATGCCTG. Wo findet BLAST Seeds mit der Sequenz S = CATGC

4. Biologische Grundkenntnisse

(a) Beschreiben Sie wie genau ein Gen in ein Protein verwandelt wird! Benutzen Sie die richtigen Fachbegriffe! 

(b) Wie viele verschiedene Chromosomen hat eine Frau? Wie viele Gene hat ein Genom? Wie viele Basen hat ein Genom?

(c) 3 Technologien zur Messung von Genexpression nennen und einordnen ob diese Qualitativ/Quantitativ messen und wie viele Gene (viel oder wenig).

(d) Wie arbeiten Genom Assembly? Beschreiben Sie!

5. PPI (protein - protein - interaction)

(a) Definieren Sie ein skalenfreies Netzwerk und beschreiben sie es intuitiv!

(b) Gegeben waren zwei Netzwerke und man musste sagen welches skalenfrei ist und welches zufällig.

(c) Nennen Sie 2 Vorteile und 2 Nachteile vom Massenspektrometer im Bezug auf den Informationsgewinn für PPI!

6. Boolean Netzwerke 

(a) Gegeben war ein leeres System (Tabelle) mit Startzuständen welche auszufüllen war. Außerdem war noch gegeben: f_A(B,D) = notB ^ notD
f_B(A,D) = A v B
f_C(A) = notA
f_D(A,B) = A v D

(b) Befinden sich in (a) ein Punktaktraktor? Geben Sie ihn an!

(c) Beweisen Sie, dass in jedem DBN mit endlicher Knotenanzahl ein zyklischer Attraktor ist!

7. Biostatistik 

(a) Gegeben waren p-Werte und 10 Sequenzen. Bonferoni-Wert musste ausgerechnet werden für die ersten zwei und den letzten. 

(b) Beschreiben sie den Zusammenhang zwischen t-Wert, Nullhypothese und p-Wert! 

(c) Beschreiben sie das Vorgehen eines t-Test in der richtigen Reihenfolge! 

(d) Warum muss für die Bestimmung der Signifikanz der log - fold - change UND die Varianz betrachtet werden?


= Note (Optional)
2,0

= Fazit (Gute/schlechte Prüfung , angemessene Benotung etc...)
Im Nachhinein relativ einfach gegen dass was man normalerweise so schreibt. Es gibt viele Themen, welche miteinander alle kaum was zu tun haben, aber die Abfrage erfolgt eher oberflächlich. Schriftliche Prüfung ist mehr zu empfehlen als eine mündliche (besonders bei Herr Leser). In der Übung lernt man nichts, aber die Vorlesung ist sinnvoll und der Besuch kann einem das lernen am Ende erleichtern. 

Nr.PrüferFach
1046 Leser Prof. Bioinformatik

Protokoll

= Datum der Prüfung
2025-09-23

= Benötigte Lernzeit als Empfehlung
~7 Tage, mehr wenn ihr mit Biologie auf dem Kriegsfuß seid

= Verwendete Materialien (Bücher, Skripte etc...)
Skript, bisschen Wikipedia, bisschen Videos

= "Atmosphäre" der Prüfung / Verhalten der Beisitzer
Bisschen Smalltalk, war eher stressig weil dafür genau Zwei Minuten eingeplant sind, nicht mehr. Eher funktionale Stimmung. Einfach im Büro fühlt sich etwas anti-klimatisch an.


= Prüfungsfragen
Beginn mit Bio-Fragen:
    Wie viele Genome gibt es?
    Wie viele Gene hat der Mensch?
    Wie viele Chromosome?
    Wie viel der DNA wird übersetzt (nur ca. 2%? in mRNA)
    Welche RNAs gibt es noch
    Wie DNA -> Protein?
    Wie viele Aminosäuren gibt es? (20 Stück?)
    Wie werden die ausgelesenen Tripel ({atgc}^3) auf Aminosäuren gemappt? (Mehrere auf die gleichen Säuren?)
    Wie genau funktioniert die Proteinbiosynthese? (Die Schritte nach mRNA)
    ...

Dann Algo-Fragen:
    "Wie sucht man in Texten nach Patterns?" -> Boyer-Moore
        Wie viele Loops hat der Algorithmus, was passiert in der äußeren, was in der inneren
        ! Gleiche Bezeichnungen wie in Folien benutzten (p = Pattern, t = Text?)
        Laufzeit BC (O(T/P)) AvgC (O(T/P)) und WC (T*P?)
    "Wie vergleicht man zwei Strings?" -> Edit-Distance
        Wie funktioniert das mit der Tabelle
        Wie genau berechnet sich d(i,j) in der Tabelle (ruhig die Formel auswendig lernen!)
        Wie genau wird die erste horizontale und vertikale Reihe initialisiert?
        Warum wird die erste horizontale und vertikale Reihe initialisiert?
        Genaue Laufzeit (O(n^2*3?))
    "Wie geht das schnell?" -> BLAST
        Auch wieder genauestens beschreiben
        Woher bekommt BLAST die Seeds (Teilt P in q-größe Stücke auf)
        Wie genau misst BLAST den Score
        Wie genau extendet BLAST Seeds (Methodik und Scoring)?
        ^ Extrem lange nachgebohrt, trotz mehrmals sagen, dass ich es nicht weiß. Jet another similarity score, who cares?
        (Zu BLAST2 sind wir nichtmal gekommen)
        (Zu dem eigentlich interessantem, wie BLAST schnell die Seeds in der DB durch Indexing findet, wollte Leser nichts hören)


= Note (Optional)
3.0

= Fazit (Gute/schlechte Prüfung , angemessene Benotung etc...)
Wir sind nur zu so wenig Themen gekommen, zwei Gründe:

1. Den Bio-Teil hatte ich absolut nicht drauf, mein Fehler.
2. Ich konnte die o.g. Algorithmen absolut nicht detailliert beschreiben, weil ich davon ausgegangen bin, das wir eher über die Laufzeit der Algos reden, nicht tatsächlich, dass ich genau jeden Schritt aufzählen können muss.

Zu den tatsächlich interessanten Sachen sind wir halt gar nicht gekommen.

Nix MSA, nix Boolsche Netzwerke, nix Messmethoden, nix MS/MS Spektren, nix Phylogenetischer Baum, ...

Ich muss auch sagen, dass mich Prof Leser ziemlich stottern hat lassen. Ich hatte dann öfters sagen müssen, weiß ich nicht, und statt das zu akzeptieren, wurde dann probiert mir zu helfen bzw. gebohrt.
Das führte auch dazu, dass ich bei den Algo-Fragen super verunsichert war, weil ich mich bei den Bio-Fragen so gequält habe :(

Nehmt euch eine Uhr mit, um zu gucken, wie das Stoff-zu-Zeit-Verhältniss ist.

Lernen scheint für diese Klausur wichtiger als verstehen.
Wissen nicht in den Folien ist egal und bringt euch nichts für die Prüfung.