Analyse von Textdaten

Analyse von Textdaten#

In diesem Teil der Schulung wird die Analyse von Textdaten mithilfe verschiedener Python-Bibliotheken behandelt. Dies umfasst:

  • Einführung in die Python-Bibliotheken NLTK und Gensim

  • Tokenisierung und Stemming

  • Alternative Repräsentationen von Text

  • Labeling / Named Entity Recognition

  • Textkategorisierung (Topic Modelling)

Die in der Schulung genutzten Folien zu grundlegenden Begriffen und Konzepten beim Natural Language Processing (NLP) können hier als PDF herunterladen werden.