Definition: Shallow Parsing

Als Shallow Parsing (auch Chunking) bezeichnen wir ein NLP-Verfahren zur Identifikation und Markierung zusammenhängender syntaktischer Segmente eines Satzes, ohne eine vollständige syntaktische Analyse durchzuführen.

Chunking baut typischerweise auf den Ergebnissen eines POS-Taggings auf und versucht anschließend, zusammenhängende Satzteile zu identifizieren. Bspw. Nominalphrasen (NP), Verbalphrasen (VP) oder Adjektivphrasen (ADJP).

Gegeben sei ein Satz

sowie eine endliche Menge von Chunk-Tags . Die formale Ausgabe des Chunkings ist dann eine Menge von Tripeln

wobei den Startindex, den Endindex und den Typ des identifizierten Chunks bezeichnet.

Anmerkung

Beispiel: "Semantic search is just great"

Es sei der folgende Satz gegeben:

Semantic search is just great.

Wir führen zunächst ein POS-Tagging durch und erhalten:

  • Semantic Adjektiv (kurz JJ)
  • search Nomen (kurz NN)
  • is Verb (kurz VB)
  • just Adverb (kurz RB)
  • great Adjektiv (JJ)

Hierauf aufbauend führen wir shallow parsing durch und erhalten als Ausgabe:

NP(Semantic/JJ search/NN)  
VP(is/VB)  
ADJP(just/RB great/JJ)