Als Shallow Parsing (auch Chunking) bezeichnen wir ein NLP-Verfahren zur Identifikation und Markierung zusammenhängender syntaktischer Segmente eines Satzes, ohne eine vollständige syntaktische Analyse durchzuführen.
Chunking baut typischerweise auf den Ergebnissen eines POS-Taggings auf und versucht anschließend, zusammenhängende Satzteile zu identifizieren. Bspw. Nominalphrasen (NP), Verbalphrasen (VP) oder Adjektivphrasen (ADJP).
Gegeben sei ein Satz
sowie eine endliche Menge von Chunk-Tags . Die formale Ausgabe des Chunkings ist dann eine Menge von Tripeln
wobei den Startindex, den Endindex und den Typ des identifizierten Chunks bezeichnet.
Anmerkung
Beispiel: "Semantic search is just great"
Es sei der folgende Satz gegeben:
Semantic search is just great.
Wir führen zunächst ein POS-Tagging durch und erhalten:
Semantic→ Adjektiv (kurz JJ)
search→ Nomen (kurz NN)
is→ Verb (kurz VB)
just→ Adverb (kurz RB)
great→ Adjektiv (JJ)
Hierauf aufbauend führen wir shallow parsing durch und erhalten als Ausgabe: