Text Mining bezeichnet einen Anwendungsbereich des Data Mining, der sich mit der automatisierten Erkennung von Mustern, Strukturen und Zusammenhängen in Texten natürlicher Sprache beschäftigt. Während das verwandte Feld des Natural Language Processing primär auf das maschinelle Verstehen von Sprache abzielt, liegt der Schwerpunkt beim Text Mining auf der Gewinnung neuer, bisher unbekannter Erkenntnisse aus großen Textsammlungen. Die eingesetzten Verfahren umfassen unter anderem Themenmodellierung, Schlüsselwortextraktion, Clustering von Dokumenten und die Erkennung von Trends über Zeitverläufe hinweg. In der Praxis findet Text Mining Anwendung in Bereichen wie der Analyse wissenschaftlicher Publikationen, der Auswertung von Kundenfeedback, der juristischen Dokumentenrecherche und der Beobachtung medialer Berichterstattung. Die Artikel in dieser Kategorie behandeln die methodischen Grundlagen des Text Mining und stellen konkrete Verfahren zur Mustererkennung in Texten vor. Dabei werden sowohl klassische statistische Methoden als auch moderne Ansätze vorgestellt, die auf Worteinbettungen und neuronalen Netzen basieren.
Text Mining im Überblick - Abgrenzung zu NLP, Kernmethoden und Einsatzgebiete nach Branche und Abteilung.