Om Neuartige Technik zur Textklassifizierung
Text Mining wird auch als Data Mining bezeichnet und bezieht sich auf das Verfahren zur Ableitung hochwertiger Informationen aus Texten. Das Prinzip des Data Mining ist die Aufbereitung von rohen und unstrukturierten Informationen, um aus Texten aussagekräftige Informationen zu gewinnen. In der Regel handelt es sich dabei um die Methode der Strukturierung der Textbeiträge, der Ableitung von Mustern, die in den strukturierten Daten enthalten sind, und schließlich der Auswertung und Analyse der Ergebnisse. Eine Hauptschwierigkeit bei Algorithmen zum Erlernen der Textklassifizierung besteht darin, dass sie viele von Hand gelabelte Beispiele benötigen, um genau zu lernen.
Visa mer