Konstrukte
:Generalisierungen
:Involvierte Definitionen
:Veranstaltung
:Referenz
: @thimm2024 (Abschnitt 2.1, Definition 3)
⠀
Definition: Quadratischer Fehler des Linearen Modells
Sei
ein gelabelter Datensatz.
Seiein lineares Modell. Zu Berechnung des quadratischen Fehlers des Linearen Modells bilden wir jetzt noch die Datenmatrix von
: wobei es sich bei Einsen in der ersten Spalte von
um die handelt, die implizit vor dem steht. Wir bezeichnen sie auch als Bias. Der quadratische Fehler des linearen Modells ergibt sich nun durch
Wahrscheinlichkeitstheoretische Herleitung
Sei
Insbesondere bei beobachteten Daten ist es nicht abwegig, davon auszugehen, dass unsere Zielvariablen
Eine Zielvariable
wobei
Für die lineare Regression treffen wir nun noch zwei weitere Annahmen:
sei eine normalverteilte Zufallsvariable sei, also ,- Die Fehler
seien stochastisch unabhängig.
Die Likelihood dafür, einen Fehler der Ausprägung
Stellen wir nun Gleichung
und damit für
Wir bemerken außerdem kurz, dass
Mit den Gleichungen
Halten wir nun die Dichte der Normalverteilung
Unser Ziel ist es auf Basis des Datensatzes
Nach dem Maximum-Likelihood-Ansatz ist genau dasjenige Modell
Die Likelihood-Funktion für ein einziges Merkmal
Die Likelihood-Funktion des gesamten Datensatzes ergibt sich, (da wir angenommen hatten, dass die Fehler
Das optimale Modell erhalten wir also durch
Nach dem Theorem Gradient ist Null im Extremum, erhalten wir das Maximum1 von
Wegen des Produkts müssten wir hier jetzt eigentlich die Produktregel anwenden. Das ist aber ziemlich umständlich. Alternativ können wir auch die Log-Likelihood-Funktion bilden und diese ableiten:
Wir ändern Gleichung
Da
also genau die Minimierung des oben definierten quadratischen Fehler des Modells.
Footnotes
-
… und an sich auch das Minimum, siehe auch Unterscheidung von Maximum und Minimum über die zweite Ableitung. ↩