Definition: Top-down Induction of Decision Trees (TDIDT)

Sei eine endliche Menge von Klassen.
Sei , wobei die verschiedene endliche Merkmalsräume mit seien.
Sei ein gelabelter (multimengen) Datensatz mit und .
Sei eine rationale Auswahlfunktion.

Als Top-down Induction of Decision Trees (kurz TDIDT) bezeichnen wir einen grundlegenden rekursiven Algorithmus für die Erstellung von Entscheidungsbäumen:

Algorithmus: Top-down Induction of Decision Trees

Eingabe: Datensatz
Ausgabe: Wurzelknoten des gelernten Baumes

:
if “Alle Beispiele in sind als klassifiziert” then
return “Neuer Klassifikationsknoten mit

if “Alle Beispiele in sind als klassifiziert” then
return “Neuer Klassifikationsknoten mit

if “Alle Beispiele in haben identische Merkmalsausprägungen” then
return “Neuer Klassifikationsknoten mit , wobei die
am häufigsten in vorkommende Klasse ist”


“Neuer Entscheidungsknoten mit
for do


return