Konstrukte
:Generalisierungen
:Eigenschaften
:Involvierte Definitionen
:Veranstaltung
: EMLReferenz
: @thimm2024 (Abschnitt 2.2.1, Definition 1)
⠀
Definition: Logistisches Modell
Sei
ein Datenpunkt.
Seidie Sigmoid-Funktion. Als logistisches Modell definieren wir die Funktion
mit wobei
die Parameter von seien. Das Klassifikationsmodell erhalten wir abschließend durch
.
Definition: Logistische Regression
Sei
ein gelabelter Datensatz.
Seiein logistisches Modell.
Seider logistische Fehler des Modells. Die optimalen Parameter
der logistischen Regression erhalten wir durch Das Optimierungsproblem ist konvex, kann aber auch mithilfe numerischer Methoden (bspw. Gradient Descent) effizient gelöst werden.
Anmerkung
Und wenn wir mehrere Klassen haben?
Für den Fall, dass wir mehr als zwei Klassen klassifizieren müssen, teilen wir das Problem in mehrere binäre Klassifikationsprobleme auf.
Für
Klassen lernen wir also und bilden den (one-vs-rest) Mehrklassenklassifikator durch
Achtung: Polynomielle Logistische Regression (nichtlineare Klassen)
Da der Kern des logistischen Modells (nämlich
) im Grunde nur eine lineare Regression ist, kann auch die logistische Regression nur linear separierbare Klassen voneinander trennen. Heißt: die Grenzen sind stets Linien:
Müssen wir Klassen trennen, die nicht linear sind, funktioniert auch die logistische Regression nicht, wie man an dem folgenden Beispiel gut sehen kann:
Um nicht-lineare Klassen zu trennen, können wir jedoch einfach die polynomielle Regression nutzen und erhalten damit in dem Beispiel die folgenden Klassengrenzen:
Logistische Regression mit scikit-learn
In Python erhalten wir ein logistisches Modell durch
Die Gewichte
erhalten wir wie folgt:
reg.intercept_
reg.coef_[0][0]
reg.coef_[0][1]