Involvierte Definitionen
:Veranstaltung
: EMLReferenz
: @thimm2024 (Abschnitt 3.4)
⠀
Proposition: Dichteabschätzung einer Normalverteilung zur Anomalieerkennung
Sei
ein Datensatz normaler Datenpunkte . Sei . Sind die Merkmalsausprägungen der Vektoren
- stochastisch unabhängig voneinander und
- normalverteilt
so klassifizieren wir einen neuen Datenpunkt
als abnormal, wenn für die gemeinsame Dichte gilt:
Ist
die Menge der beobachteten -ten Merkmalsausprägungen, so erhalten wir die gemeinsame Dichte der durch Mithilfe der Dichteabschätzung der Normalverteilung erhalten wir die jeweiligen Merkmalsdichten
durch:
Anmerkung
Dichteabschätzung mit scikit-learn
Die Dichteabschätzung funktioniert in scikit-learn technisch noch etwas anders als hier beschrieben. Wir erhalten sie durch:
Den Mittelwertvektor
und die Kovarianz-Matrix erhalten wir durch:
: detector.location_
: detector.covariance_