Analyse von Textdaten

Analyse von Textdaten#

In diesem Teil der Schulung wird die Analyse von Textdaten mithilfe verschiedener Python-Bibliotheken behandelt. Dies umfasst:

Einführung in die Python-Bibliotheken NLTK und Gensim
Tokenisierung und Stemming
Alternative Repräsentationen von Text
Labeling / Named Entity Recognition
Textkategorisierung (Topic Modelling)

Die in der Schulung genutzten Folien zu grundlegenden Begriffen und Konzepten beim Natural Language Processing (NLP) können hier als PDF herunterladen werden.