Definition: Parts-of-Speech-Tagging

Als Part-of-Speech-Tagging (kurz POS-Tagging) bezeichnen wir ein NLP-Verfahren, bei dem die Wörter eines Textes grammatikalischen Kategorien zugeordnet werden.

POS-Tagging bildet eine grundlegende Vorverarbeitungsstufe für viele NLP-Anwendungen, etwa für Parsing, Informationsextraktion oder semantische Analyse.

Für das Erkennen der Wortarten werden i.d.R. Verfahren des maschinellen Lernens eingesetzt, die den linguistischen Kontext des Wortes berücksichtigen.

Formal ist es es das Ziel des POS-Tagging, jedem Wort eines Satzes

die passende Wortklasse aus einer endlichen Menge möglicher Wortklassen (bspw. Nomen, Verben, Adjektive, …) zuzuordnen.