Fachschaft Informatik

Prüfungsprotokolle


Prüfungsprotokolle lesen



Protokolle (4 gefunden)

Nr.PrüferFach
985 Akbik, Alan Prof. Dr. Statistik und Data Science für die Informatik

Protokoll

= Datum der Prüfung
22. Juli 2022

= Benötigte Lernzeit als Empfehlung
1 Woche wenn man alle Blätter selbst bearbeitet hat und die Vorlesungen alle gehört/durchgearbeitet hatte (Vor allem, da man ein Blatt mit rein nehmen durfte und dadurch nichts auswendig lernen muss).

= Verwendete Materialien (Bücher, Skripte etc...)
Vorlesungsfolien, Übungsfolien, Aufgabenblätter + Lösungen

= "Atmosphäre" der Prüfung / Verhalten der Beisitzer
Es wurde in drei verschiedenen Räumen geschrieben, also vielleicht sehr unterschiedlich. Ich fand Mario Sänger zwar bemüht die Stimmung zu lockern, aber so richtig gut hat er die Situation nicht gehändelt und ist nicht gerade verständnisvoll auf Nachfragen eingegangen (z.B. ob man schonmal Schmierpapier haben könnte). Sonst aber alles okay.

= Prüfungsfragen
Es gab 90 Punkte verteilt auf 7 Aufgaben. Jede Aufgabe 10-15 Punkte, nur Permutationstest gab mit 20 Punkten mehr. Jede Aufgabe hatte mehrere Teilaufgaben.
90min Zeit. Beidseitig beschriebenes A4 Blatt erlaubt und meiner Meinung nach absolut notwendig für Formeln etc. Taschenrechner war erlaubt und angeblich nicht notwendig. Ich hätte es ohne Taschenrechner nicht gekonnt! Also unbedingt mitnehmen.

Wahrscheinlich habe ich einzelne Teilaufgaben vergessen und ich kann mich auch nicht mehr genau an die Werte/Vorgaben erinnern. Die Aufgabenstellungen waren teilweise recht lang.


Aufgabe 1 (Wahrscheinlichkeitsrechnung)
a) Postleitzahl beginnt mit 1. Wie viele Möglichkeiten gibt es für die restlichen Ziffern wenn 5 stellige Postleizahl.

b) 7 stellige Telefonnummer. Wie viele Möglichkeiten gibt es, wenn keine Zahl mehr als einmal vorkommen kann.

c) Wir Würfeln drei mal. Was ist die Wahrscheinlichkeit, dass die höchste Augenzahl nach drei mal Würfeln genau drei ist.


Aufgabe 2 (Normalverteilung)
(sehr ähnlich zu Blatt 1, Aufgabe 1. Quasi nur andere Werte/Story).
Gegeben war eine Stichprobe mit 9 werten von 46 bis 54
a) Median bestimmen

b) Arithmetisches Mittel, Varianz, Standardabweichung berechnen.

c) Wie hoch ist die Wahrscheinlichkeit, dass mindestens 116 (irgendwas mit Brötchen, weiß nicht mehr) für Mittelwert=120 und Standardabweichung=10. Wie hoch, dass höchstens 124,5. Tabelle für Standardnormalverteilung war gegeben.

d) 90%Perzentil ausrechnen.


Aufgabe 3 (Permuationstest)
Irgendeine Tabelle mit Werten für zwei Gruppen gegeben.

a) Mittelwerte der beiden Gruppen berechnen.

b) Nullhypothese und alternative Hypothese formulieren.

c) Permutationstest durchführen. Ist statistisch signifikant für alpha=0,1?

d) Was wäre wenn Signifikanzniveau höher? Welchen Typ Fehler würde das beeinflussen (Typ I oder Typ II).

e) P-Wert erklären

f) Wann können wir Nullhypothese verwerfen, wann nicht. Also was passiert, wenn P-wert größer und was wenn kleiner als Signifikanzniveau ist.


Aufgabe 4 
Betrug/Kein Betrug Wahrheitsmatrix ausgefüllt gegeben.

a) precision, recall, f1 score berechnen.

b) Wie würde sich auf precison und recall auswirken, wenn Schwellwert für labeln-als-betrug höher liegen würde?

c)Welche Accuracy hätte es wenn alles als "kein Betrug" gelabelt wird?


Aufgabe 5
a) Erwartungswert einer diskreten Zufallsvariable ausrechnen

b) Verteilungen angeben (welche Verteilung und Werte der Verteilung)
- irgendwas mit "wie lang bis zum ersten Erfolg"
- irgendwas mit "wie viele Autos in diesem Zeitabschnitt"


Aufgabe 6
a) Regressionsgerade berechnen.
b) Punkte und Gerade in Koordinatensystem skizzieren.
c) Gegeben ein Punkt, bei dem nur X-Wert bekannt ist. Schätze Y-Wert anhand der Gerade.


Aufgabe 7 (Neuronales Netz)
a) Forward Pass berechnen ohne Aktivierungsfunktion.
b) Softmax berechnen.
c) Cross Entropy Loss berechnen.

= Note (Optional)
Noch nicht bekannt.

= Fazit (Gute/schlechte Prüfung , angemessene Benotung etc...)
Die Aufgaben sind sehr nah an den Übungsblättern. Man konnte sich mit diesen also gut vorbereiten. Da man einen Zettel mit rein nehmen darf, kann man auch alle Formeln und Definitionen notieren. Also rein von den Aufgaben sehr fair und keine bösen Überraschungen. Zeitlich völlig unrealistisch. Ich weiß nicht wie man das alles schaffen soll, auch wenn man auf anhieb bei jeder Aufgabe weiß wie es geht. Außerdem fand ich es sehr irreführend, dass es hieß man brauche keine Taschenrechner. Doch, braucht man! Sonst geht nur noch mehr Zeit verloren und wer kann e hoch irgendwas und ln bitte im Kopf rechnen?
Also insgesamt machbar. Aber schwierig hier sehr gut zu bestehen würde ich sagen.

Nr.PrüferFach
994 Akbik, Alan Prof. Dr. Statistik und Data Science für die Informatik

Protokoll

= Datum der Prüfung 04.10.2022
= Benötigte Lernzeit als Empfehlung 1 Woche wenn man sich mit die Übungsblätter beschäftigt hat, sonst 3 Wochen
= Verwendete Materialien (Bücher, Skripte etc...) Übungsfolien, Vorlesungsfolien
= "Atmosphäre" der Prüfung / Verhalten der Beisitzer
= Prüfungsfragen
Aufgabe 1) 
 gegeben ist ein Sample mit 9 Werte: (ich weiß nicht, ob das genau diese werte 
          waren:  98, 100, 102, 103, 104, 105, 106, 198, 110)
    a) Berechne den Median
    b) Berechne Erwartungswert, Varianz und Standardabweichung
    c) Angenommen Mittelwert = ... , Standardabweichung = ... 
       Berechen die wahrscheinlichkeit für a=>x>=b (wobei a und b 
       unterschiedliche zahlen sind)  --> Gegeben war eine Z-Score Tabelle
    d) Berechne irgendein Parzentil% (weiß nicht mehr genau) 

Aufgabe 2) zu Bootstrabbing:
Gegeben sind 10 zahlen (z.B. 91, 92, 93, 94, 95, 96, 97, 98, 99, 100) und deren Mittelwert

Auch Gegeben: 10 Bootstrapping Samples aus die oberigen Zahlen aber ohne Mittelwerte 

     a) 80% Konfindenzintervall bestimmen (In der Vorlesung haben wir 2 
        Möglichkeiten gelernt, wie man sowas bestimmt, in der Prüfung dürften 
        jeder für sich entscheiden, welche Methode man benutzt) 

     b) Angenommen der richtige Konfindenzintervall ist von 94-97 (auch hier 
        sind die Zahlen ausgedacht, ich kann mich an die richtigen zahlen nicht 
        erinnern) Beschreibe mit eigenen worten, was das bedeutet. 

Aufgabe 3) Zu Naive Baise:
  Ich hab die Aufgabe geskippt und weiß nicht welche Teilaufgaben es gab, es gab 
  aber 2 Klassen, und 4 Texte man musste 
  irgendwelche wahrscheinlichkeiten bestimmen

Aufgabe 4) Zu Buerteilen von Klassifikator: 
           Es gab eine Tabelle mit [Klasse | Vorhersage] 
           Es gab 3 Klassen und man musste für eine dieser Klassen: 
        a) TP , FP, und FN bestimmen
        b) Precision, Recall und F1-Score Bestimmen
        c) Es gab eine Tabelle mit 2 Klassifikatoren zu der 3 Klassen, und da 
           steht der F1 Score von jeder Klasse und noch ein Durchschnitt für 
           beide Klassifikatoren. 
           Aufgabe: Für welchen Klassifikator würdet ihr euch entscheiden. (weiß 
           nicht genau ob ich die Aufgabe richtig beschreibe aber sowas 
           ähnliches war es) xD 

Aufgabe 5) 
Gegeben ist eine Zufallsvariable X
        a) Berechne E(X)
        b) Berechne Var(X) 
        c) (nicht sicher aber ich glaub es war diese Aufgabe):
       c1) Wie lange bis zum ersten Erfolg .. -> welches Verteilungsmodell?
       c2) Gegeben ist irgendwas mit viele dinge (man merkt ich kenn die Aufgabe 
           nicht mehr genau xD) jedes ding hat gleiche wahrscheinlichkeit --> 
           welches Verteilungsmodell?

Aufgabe 6) Zu Newton verfahren: 
           gegeben: f(x) = x^2 -2x + 1
           a) Berechne die Nullstelle.
           b) Schreibe die genaue formel von Newton Verfahren: also: 
              x_n+1= ... 
           c) sei x_0 = 2 Berechne: 
                  1. x_1 =
                  2. x_2 = 
                  3. x_3 =  

Aufgabe 7) zu K-Means: (obwohl ich persönlich fand, dass die Aufgabe fast nichts 
           mit K-Means zu tun hatte) xD 
            
           a) Gegegeben ist eine Tabelle mit unterschiedlichen Daten: 
              [Alter (eine Zahl) | Gehalt (Eine Zahl) | Monatliche Ausgaben 
               (Wenig-Mittel-Viel) - Wohnort (Berlin - Brandenburg - Sonst)] 
            Aufgabe war sowas wie: Gib die Systematik der Skalen 

           b) Die Daten aus der Tabelle jeweils in Vektor schreibweise umwandeln 
              also: Alter = (vektor) , Gehalt = (Vektor)  etc. 

           c) Gegeben sind zwei Punkte x_1 und x_2 mit jeweils ihre Koordinaten
              Aufgabe: Gib die Formel an, für die Abstand zwischen Punkte und 
              berechne den Abstand zwischen x_1 und x_2 

           d) Wann Terminiert der K-Means Algorithmus? Gib ein Beispiel an ( 
              nicht so sicher aber sowas in die Richtung) 
                   
= Note (Optional) noch nicht bekannt 
= Fazit (Gute/schlechte Prüfung , angemessene Benotung etc...) Meiner Meinung nach war die Prüfung angemessen, allerdings gab es für mich viel Zeitdruck und ich war gerade Mal fertig, als die Zeit vorbei war, obwohl ich eine Aufgabe geskippt hab und gar keine Gedanken dazu gemacht hab. Die Aufgaben waren auch zu erwarten (bis auf die Naive Bayes, ich konnte mir nicht vorstellen wie das dran kommt) xD 




Nr.PrüferFach
1013 Akbik, Alan Prof. Dr. Statistik und Data Science für die Informatik

Protokoll

= Datum der Prüfung 28.07.2022
= Benötigte Lernzeit als Empfehlung
1 Woche
= Verwendete Materialien (Bücher, Skripte etc...)
Vorlesungsfolien, Wikipedia, Übungsfolien
= "Atmosphäre" der Prüfung / Verhalten der Beisitzer
Ruhig, 10 Minuten vor Klausurbeginn um Aufgabenstellung zu lesen und evtl. Fragen zu stellen
= Prüfungsfragen

# 1. Kombinatorik 
Wie viele Möglichkeiten gibt es einen Irrlauf in 2n Schritten in 2D durchzuführen und wieder zum Ursprung zurückzukehren?

Wie viele Möglichkeiten gibt es, das Wort "MATHEMATIK" zu schreiben, wenn beide "M" immer zusammen stehen müssen.

Betrieb gegeben: Verhältnis Männer zu Frauen 2:3
Die Wahrscheinlichkeit, dass ein Mann mit dem PkW zur Arbeit kommt liegt bei 80% für Frauen bei 60%. 
- wie hoch ist die Wahrscheinlichkeit, dass ein Mitarbeiter mit dem PkW zur Arbeit kommt
- wie hoch ist die Wahrscheinlichkeit, dass ein Mitarbeiter, der mit dem PkW zur Arbeit kommt, eine Frau ist.

# 2. Gegeben Dichtefunktion f(x): R->R(eele Zahlen)
Im Intervall: -5 bis 0 ist f(x) = m*x+b   (Es waren auf jeden Fall 2 lineare Funktionen der Form mx+b, an m und b errinnere ich micht nicht mehr, Graph ist ein Dreieck von -5 bis +5, spitze bei 0)

Im Intervall: 0 bist 5 ist f(x) = -m*x+b

0 sonst.

- zeigen Sie, dass f(x) eine Dichtefunktion ist
- berechnen Sie den Erwartungswert und Varianz

# 3. Normalverteilung mit \mu = 40 mm und \sigma = 0.04 für Schraubenlängen

- berechnen des Integrals von 39.9 bis 40.1 mm mit Tabelle (wie viele Prozent der Schrauben weichen +-0.1 mm vom Soll-Wert ab?)
- berechnen von 99.1 % Konfidenzintervall 


# 4. Permutationstest:
- Szenario A: 12, 14
- Szenario B: 16, 18

- Permutationstest durchführen
- ist der Unterschied Signifikant für ein Signifikanzniveau von 5%?
- unterschied von Typ-1 und Typ-2 Fehlern
- p Wert intuitiv erklären


# 5. Clustering

4 Features gegeben:
(Alter, Fitness (hoch | mittel | niedrig), Wohnort(Ländlich | Stadt), stunden Benutzungsdauer)


-zu den Features Skalen angeben und z.B. 0=niedrig 1=mittel 2=hoch 
- mit 3 Beispieldaten in Vektor umschreiben
- Angenommen 10.000 Datenpunkte und 40 Iteratioten mit k=5, wie viele Distanzrechnungen für k-means?

# 6. Neuronales Netz 

- Neuronales Netz 3 Gewichte und 1 Bias Gegeben, Akrivierungsfunktion o1 ist die Identität
- Mit Testdaten Transformation durchführen (3 Punkte)
- Squared Mean error berechnen (3 Punkte)
- Schritt größe bei Gradient Descend: Was ist Nachteil von zu kleiner / zu großer Schrittgröße ? (2 Punkte)
- Nachteile von tiefen neuronalen Netzen (2 Punkte)

= Note (Optional)
noch nicht bekannt
= Fazit (Gute/schlechte Prüfung , angemessene Benotung etc...)
- es kommt deutlich mehr vom Teil von Akbik ran als ich dachte, weniger vom ersten Teil

Nr.PrüferFach
1029 Leser Prof. Statistik und Data Science für die Informatik

Protokoll

= Datum der Prüfung
22.07.2024
= Benötigte Lernzeit als Empfehlung
2-3 Tage, wenn man im Stoff ganz gut mitgekommen ist und die Aufgaben gemacht hat. Sonst min. eine Woche, eher 2.
= Verwendete Materialien (Bücher, Skripte etc...)
Vorlesungsfolien und Übungsfolien
= "Atmosphäre" der Prüfung / Verhalten der Beisitzer
Sehr entspannt.
= Prüfungsfragen
(Es kann sein dass ich einzelne Teilaufgaben vergesse)
#1 Wahrscheinlichkeiten und Kombinatorik
##1 Szenario: 2 maliger Wurf eines fairen 6-seitigen Würfels
-Berechne P(Augenzahl!=7)
-Berechne P(Erster Wurf<Zweiter Wurf)
##2 Ein Flughafen bedient 3 Fluggesellschaften, F1, F2 und F3. 40% der Flüge gehören zu F1 und jeweils 30% zu F2 und F3. Bei F1 kommen 10% der Flüge zu spät und bei F2 und F3 jeweils 20%. Wie viele der Verspäteteten Flüge gehören zu F1.
##3 Gegeben sei die Menge ["a","b","c",1,2,3,4]. Wie viele Möglichkeiten gibt es ein Wort aus 2 Buchstaben und 3 Zahlen zu bilden, wobei Permutationen eines Wortes unterschiedliche Wörter ergeben -> z.B. "a1b23" und "12a3b" zählen einzelnd. 
#2 Verteilungen (Formeln und Wertetabellen für alle Verteilungen war gegeben)
##1 Ein Fußballteam hat eine Elfmeter-Trefferquote von 50%. Nun schießt es beim Elfmeterschießen 4 Mal, wie hoch ist die Chance höchstens ein Tor zu schießen. Nenne zudem die zugrundeliegende Verteilung.
##2 Ein Glühbirnenhersteller produziert Glühbirnen bei denen ein Messwert nach Normalverteilung verteilt ist und den Mittelwert 1000 und die Standardabweichung 10 hat. Bei wie viel Prozent der Glühbirnen liegt der Wert zwischen 980 und 1000.
##3 Definiere den Zentralen Grenzwertsatz und erläutere wann er gilt, bzw. was er aussagt.
#3 Statistische Tests
##1 Es ist eine Wertetabelle mit Wachstumsraten von 2 Pflanzenarten (jeweils 5 Einträge) gegeben. Erstelle Null und Alternativhypothese bezüglich Unterschieden in der Wachstumsrate. Die Frage zielt auf den Ranksumtest ab.
##2 Führe einen Ranksumtest auf den Testdaten bei Signifikanzniveau 0.05 durch. (Tabelle für den Test war für a=0.05 gegeben).
##3 Erkläre Typ-1 Fehler und Typ-2 Fehler an diesem Beispiel und an Null und Alternativhypothese.
#4 Maschinelles Lernen und Classifier
##1 Es ist ein Datensatz und ein Decision Tree gegeben, berechne die Accuracy des Decision Trees auf diesem Datensatz
##2 Es soll ein neuer Datenpunkt mittels des Satzes aus ##1 klassifiziert werden durch KNN mit K=3, stelle den Rechenweg dar.
##3 Es wird overfitting eines Klassifizierers beschrieben. Erkenne wovon die Rede ist, benenne das Phänomen und nenne Methoden mit denen man gegen wirken, bzw. dem vorbeugen kann.
= Note (Optional)
Noch nicht bekannt
= Fazit (Gute/schlechte Prüfung , angemessene Benotung etc...)
Relativ einfach, jedoch war auch wenig Zeit gegeben (75min). Da die Klausur mit Analysis zusammen geschrieben wird, war kein Taschenrechner erlaubt und dementsprechend wurden keine Inhalte mit Exponentialfunktionen oder Logarythmen abgefragt. Mit diesem Wissen hätte man das Lernen auf diese Inhalte beschränken können, was dann das Ziel der Prüfung verfehlt.