Fachschaft Informatik

Prüfungsprotokolle


Prüfungsprotokolle lesen



Protokolle (3 gefunden)

Nr.PrüferFach
985 Akbik, Alan Prof. Dr. Statistik und Data Science für die Informatik

Protokoll

= Datum der Prüfung
22. Juli 2022

= Benötigte Lernzeit als Empfehlung
1 Woche wenn man alle Blätter selbst bearbeitet hat und die Vorlesungen alle gehört/durchgearbeitet hatte (Vor allem, da man ein Blatt mit rein nehmen durfte und dadurch nichts auswendig lernen muss).

= Verwendete Materialien (Bücher, Skripte etc...)
Vorlesungsfolien, Übungsfolien, Aufgabenblätter + Lösungen

= "Atmosphäre" der Prüfung / Verhalten der Beisitzer
Es wurde in drei verschiedenen Räumen geschrieben, also vielleicht sehr unterschiedlich. Ich fand Mario Sänger zwar bemüht die Stimmung zu lockern, aber so richtig gut hat er die Situation nicht gehändelt und ist nicht gerade verständnisvoll auf Nachfragen eingegangen (z.B. ob man schonmal Schmierpapier haben könnte). Sonst aber alles okay.

= Prüfungsfragen
Es gab 90 Punkte verteilt auf 7 Aufgaben. Jede Aufgabe 10-15 Punkte, nur Permutationstest gab mit 20 Punkten mehr. Jede Aufgabe hatte mehrere Teilaufgaben.
90min Zeit. Beidseitig beschriebenes A4 Blatt erlaubt und meiner Meinung nach absolut notwendig für Formeln etc. Taschenrechner war erlaubt und angeblich nicht notwendig. Ich hätte es ohne Taschenrechner nicht gekonnt! Also unbedingt mitnehmen.

Wahrscheinlich habe ich einzelne Teilaufgaben vergessen und ich kann mich auch nicht mehr genau an die Werte/Vorgaben erinnern. Die Aufgabenstellungen waren teilweise recht lang.


Aufgabe 1 (Wahrscheinlichkeitsrechnung)
a) Postleitzahl beginnt mit 1. Wie viele Möglichkeiten gibt es für die restlichen Ziffern wenn 5 stellige Postleizahl.

b) 7 stellige Telefonnummer. Wie viele Möglichkeiten gibt es, wenn keine Zahl mehr als einmal vorkommen kann.

c) Wir Würfeln drei mal. Was ist die Wahrscheinlichkeit, dass die höchste Augenzahl nach drei mal Würfeln genau drei ist.


Aufgabe 2 (Normalverteilung)
(sehr ähnlich zu Blatt 1, Aufgabe 1. Quasi nur andere Werte/Story).
Gegeben war eine Stichprobe mit 9 werten von 46 bis 54
a) Median bestimmen

b) Arithmetisches Mittel, Varianz, Standardabweichung berechnen.

c) Wie hoch ist die Wahrscheinlichkeit, dass mindestens 116 (irgendwas mit Brötchen, weiß nicht mehr) für Mittelwert=120 und Standardabweichung=10. Wie hoch, dass höchstens 124,5. Tabelle für Standardnormalverteilung war gegeben.

d) 90%Perzentil ausrechnen.


Aufgabe 3 (Permuationstest)
Irgendeine Tabelle mit Werten für zwei Gruppen gegeben.

a) Mittelwerte der beiden Gruppen berechnen.

b) Nullhypothese und alternative Hypothese formulieren.

c) Permutationstest durchführen. Ist statistisch signifikant für alpha=0,1?

d) Was wäre wenn Signifikanzniveau höher? Welchen Typ Fehler würde das beeinflussen (Typ I oder Typ II).

e) P-Wert erklären

f) Wann können wir Nullhypothese verwerfen, wann nicht. Also was passiert, wenn P-wert größer und was wenn kleiner als Signifikanzniveau ist.


Aufgabe 4 
Betrug/Kein Betrug Wahrheitsmatrix ausgefüllt gegeben.

a) precision, recall, f1 score berechnen.

b) Wie würde sich auf precison und recall auswirken, wenn Schwellwert für labeln-als-betrug höher liegen würde?

c)Welche Accuracy hätte es wenn alles als "kein Betrug" gelabelt wird?


Aufgabe 5
a) Erwartungswert einer diskreten Zufallsvariable ausrechnen

b) Verteilungen angeben (welche Verteilung und Werte der Verteilung)
- irgendwas mit "wie lang bis zum ersten Erfolg"
- irgendwas mit "wie viele Autos in diesem Zeitabschnitt"


Aufgabe 6
a) Regressionsgerade berechnen.
b) Punkte und Gerade in Koordinatensystem skizzieren.
c) Gegeben ein Punkt, bei dem nur X-Wert bekannt ist. Schätze Y-Wert anhand der Gerade.


Aufgabe 7 (Neuronales Netz)
a) Forward Pass berechnen ohne Aktivierungsfunktion.
b) Softmax berechnen.
c) Cross Entropy Loss berechnen.

= Note (Optional)
Noch nicht bekannt.

= Fazit (Gute/schlechte Prüfung , angemessene Benotung etc...)
Die Aufgaben sind sehr nah an den Übungsblättern. Man konnte sich mit diesen also gut vorbereiten. Da man einen Zettel mit rein nehmen darf, kann man auch alle Formeln und Definitionen notieren. Also rein von den Aufgaben sehr fair und keine bösen Überraschungen. Zeitlich völlig unrealistisch. Ich weiß nicht wie man das alles schaffen soll, auch wenn man auf anhieb bei jeder Aufgabe weiß wie es geht. Außerdem fand ich es sehr irreführend, dass es hieß man brauche keine Taschenrechner. Doch, braucht man! Sonst geht nur noch mehr Zeit verloren und wer kann e hoch irgendwas und ln bitte im Kopf rechnen?
Also insgesamt machbar. Aber schwierig hier sehr gut zu bestehen würde ich sagen.

Nr.PrüferFach
994 Akbik, Alan Prof. Dr. Statistik und Data Science für die Informatik

Protokoll

= Datum der Prüfung 04.10.2022
= Benötigte Lernzeit als Empfehlung 1 Woche wenn man sich mit die Übungsblätter beschäftigt hat, sonst 3 Wochen
= Verwendete Materialien (Bücher, Skripte etc...) Übungsfolien, Vorlesungsfolien
= "Atmosphäre" der Prüfung / Verhalten der Beisitzer
= Prüfungsfragen
Aufgabe 1) 
 gegeben ist ein Sample mit 9 Werte: (ich weiß nicht, ob das genau diese werte 
          waren:  98, 100, 102, 103, 104, 105, 106, 198, 110)
    a) Berechne den Median
    b) Berechne Erwartungswert, Varianz und Standardabweichung
    c) Angenommen Mittelwert = ... , Standardabweichung = ... 
       Berechen die wahrscheinlichkeit für a=>x>=b (wobei a und b 
       unterschiedliche zahlen sind)  --> Gegeben war eine Z-Score Tabelle
    d) Berechne irgendein Parzentil% (weiß nicht mehr genau) 

Aufgabe 2) zu Bootstrabbing:
Gegeben sind 10 zahlen (z.B. 91, 92, 93, 94, 95, 96, 97, 98, 99, 100) und deren Mittelwert

Auch Gegeben: 10 Bootstrapping Samples aus die oberigen Zahlen aber ohne Mittelwerte 

     a) 80% Konfindenzintervall bestimmen (In der Vorlesung haben wir 2 
        Möglichkeiten gelernt, wie man sowas bestimmt, in der Prüfung dürften 
        jeder für sich entscheiden, welche Methode man benutzt) 

     b) Angenommen der richtige Konfindenzintervall ist von 94-97 (auch hier 
        sind die Zahlen ausgedacht, ich kann mich an die richtigen zahlen nicht 
        erinnern) Beschreibe mit eigenen worten, was das bedeutet. 

Aufgabe 3) Zu Naive Baise:
  Ich hab die Aufgabe geskippt und weiß nicht welche Teilaufgaben es gab, es gab 
  aber 2 Klassen, und 4 Texte man musste 
  irgendwelche wahrscheinlichkeiten bestimmen

Aufgabe 4) Zu Buerteilen von Klassifikator: 
           Es gab eine Tabelle mit [Klasse | Vorhersage] 
           Es gab 3 Klassen und man musste für eine dieser Klassen: 
        a) TP , FP, und FN bestimmen
        b) Precision, Recall und F1-Score Bestimmen
        c) Es gab eine Tabelle mit 2 Klassifikatoren zu der 3 Klassen, und da 
           steht der F1 Score von jeder Klasse und noch ein Durchschnitt für 
           beide Klassifikatoren. 
           Aufgabe: Für welchen Klassifikator würdet ihr euch entscheiden. (weiß 
           nicht genau ob ich die Aufgabe richtig beschreibe aber sowas 
           ähnliches war es) xD 

Aufgabe 5) 
Gegeben ist eine Zufallsvariable X
        a) Berechne E(X)
        b) Berechne Var(X) 
        c) (nicht sicher aber ich glaub es war diese Aufgabe):
       c1) Wie lange bis zum ersten Erfolg .. -> welches Verteilungsmodell?
       c2) Gegeben ist irgendwas mit viele dinge (man merkt ich kenn die Aufgabe 
           nicht mehr genau xD) jedes ding hat gleiche wahrscheinlichkeit --> 
           welches Verteilungsmodell?

Aufgabe 6) Zu Newton verfahren: 
           gegeben: f(x) = x^2 -2x + 1
           a) Berechne die Nullstelle.
           b) Schreibe die genaue formel von Newton Verfahren: also: 
              x_n+1= ... 
           c) sei x_0 = 2 Berechne: 
                  1. x_1 =
                  2. x_2 = 
                  3. x_3 =  

Aufgabe 7) zu K-Means: (obwohl ich persönlich fand, dass die Aufgabe fast nichts 
           mit K-Means zu tun hatte) xD 
            
           a) Gegegeben ist eine Tabelle mit unterschiedlichen Daten: 
              [Alter (eine Zahl) | Gehalt (Eine Zahl) | Monatliche Ausgaben 
               (Wenig-Mittel-Viel) - Wohnort (Berlin - Brandenburg - Sonst)] 
            Aufgabe war sowas wie: Gib die Systematik der Skalen 

           b) Die Daten aus der Tabelle jeweils in Vektor schreibweise umwandeln 
              also: Alter = (vektor) , Gehalt = (Vektor)  etc. 

           c) Gegeben sind zwei Punkte x_1 und x_2 mit jeweils ihre Koordinaten
              Aufgabe: Gib die Formel an, für die Abstand zwischen Punkte und 
              berechne den Abstand zwischen x_1 und x_2 

           d) Wann Terminiert der K-Means Algorithmus? Gib ein Beispiel an ( 
              nicht so sicher aber sowas in die Richtung) 
                   
= Note (Optional) noch nicht bekannt 
= Fazit (Gute/schlechte Prüfung , angemessene Benotung etc...) Meiner Meinung nach war die Prüfung angemessen, allerdings gab es für mich viel Zeitdruck und ich war gerade Mal fertig, als die Zeit vorbei war, obwohl ich eine Aufgabe geskippt hab und gar keine Gedanken dazu gemacht hab. Die Aufgaben waren auch zu erwarten (bis auf die Naive Bayes, ich konnte mir nicht vorstellen wie das dran kommt) xD 




Nr.PrüferFach
1013 Akbik, Alan Prof. Dr. Statistik und Data Science für die Informatik

Protokoll

= Datum der Prüfung 28.07.2022
= Benötigte Lernzeit als Empfehlung
1 Woche
= Verwendete Materialien (Bücher, Skripte etc...)
Vorlesungsfolien, Wikipedia, Übungsfolien
= "Atmosphäre" der Prüfung / Verhalten der Beisitzer
Ruhig, 10 Minuten vor Klausurbeginn um Aufgabenstellung zu lesen und evtl. Fragen zu stellen
= Prüfungsfragen

# 1. Kombinatorik 
Wie viele Möglichkeiten gibt es einen Irrlauf in 2n Schritten in 2D durchzuführen und wieder zum Ursprung zurückzukehren?

Wie viele Möglichkeiten gibt es, das Wort "MATHEMATIK" zu schreiben, wenn beide "M" immer zusammen stehen müssen.

Betrieb gegeben: Verhältnis Männer zu Frauen 2:3
Die Wahrscheinlichkeit, dass ein Mann mit dem PkW zur Arbeit kommt liegt bei 80% für Frauen bei 60%. 
- wie hoch ist die Wahrscheinlichkeit, dass ein Mitarbeiter mit dem PkW zur Arbeit kommt
- wie hoch ist die Wahrscheinlichkeit, dass ein Mitarbeiter, der mit dem PkW zur Arbeit kommt, eine Frau ist.

# 2. Gegeben Dichtefunktion f(x): R->R(eele Zahlen)
Im Intervall: -5 bis 0 ist f(x) = m*x+b   (Es waren auf jeden Fall 2 lineare Funktionen der Form mx+b, an m und b errinnere ich micht nicht mehr, Graph ist ein Dreieck von -5 bis +5, spitze bei 0)

Im Intervall: 0 bist 5 ist f(x) = -m*x+b

0 sonst.

- zeigen Sie, dass f(x) eine Dichtefunktion ist
- berechnen Sie den Erwartungswert und Varianz

# 3. Normalverteilung mit \mu = 40 mm und \sigma = 0.04 für Schraubenlängen

- berechnen des Integrals von 39.9 bis 40.1 mm mit Tabelle (wie viele Prozent der Schrauben weichen +-0.1 mm vom Soll-Wert ab?)
- berechnen von 99.1 % Konfidenzintervall 


# 4. Permutationstest:
- Szenario A: 12, 14
- Szenario B: 16, 18

- Permutationstest durchführen
- ist der Unterschied Signifikant für ein Signifikanzniveau von 5%?
- unterschied von Typ-1 und Typ-2 Fehlern
- p Wert intuitiv erklären


# 5. Clustering

4 Features gegeben:
(Alter, Fitness (hoch | mittel | niedrig), Wohnort(Ländlich | Stadt), stunden Benutzungsdauer)


-zu den Features Skalen angeben und z.B. 0=niedrig 1=mittel 2=hoch 
- mit 3 Beispieldaten in Vektor umschreiben
- Angenommen 10.000 Datenpunkte und 40 Iteratioten mit k=5, wie viele Distanzrechnungen für k-means?

# 6. Neuronales Netz 

- Neuronales Netz 3 Gewichte und 1 Bias Gegeben, Akrivierungsfunktion o1 ist die Identität
- Mit Testdaten Transformation durchführen (3 Punkte)
- Squared Mean error berechnen (3 Punkte)
- Schritt größe bei Gradient Descend: Was ist Nachteil von zu kleiner / zu großer Schrittgröße ? (2 Punkte)
- Nachteile von tiefen neuronalen Netzen (2 Punkte)

= Note (Optional)
noch nicht bekannt
= Fazit (Gute/schlechte Prüfung , angemessene Benotung etc...)
- es kommt deutlich mehr vom Teil von Akbik ran als ich dachte, weniger vom ersten Teil