Warum braucht man Data Mining?
Data Mining hilft Unternehmen dabei, extrem große Datenmengen zu analysieren, daraus interessante Muster zu erkennen und im Anschluss die richtigen Entscheidungen zu treffen. Die Vorteile von Data Mining sind: Kundenbedürfnisse erkennen und besser verstehen. Genaue Vorhersagen für die Zukunft erstellen.
Was versteht man unter Data Mining?
Data Mining ist die systematische Anwendung computergestützter Methoden, um in vorhandenen Datenbeständen Muster, Trends oder Zusammenhänge zu finden.
Was braucht man für Data Mining?
Beim Data Mining werden große Datenmengen (Big Data) ausgewertet. Dabei geht man in mehreren Schritten vor, und in jedem Schritt wird Software benötigt. Beispielsweise, um die Daten aus verschiedenen Quellen (z.B. Datenbanken) in eine einzige zusammenzuführen. Skripte helfen, Daten zu bereinigen oder zu codieren.
Was sind die Aufgabenstellungen des Data-Mining?
Typische Aufgabenstellungen des Data-Mining sind: Klassifikation: bisher nicht Klassen zugeordnete Elemente werden den bestehenden Klassen zugeordnet. Assoziationsanalyse: Identifizierung von Zusammenhängen und Abhängigkeiten in den Daten in Form von Regeln wie „Aus A und B folgt normalerweise C“.
Welche Methoden werden im Big Data Mining angewandt?
Vor allem im Big Data Mining werden Methoden der künstlichen Intelligenz angewandt, um Muster implizit zu identifizieren. Hierbei wird meist initial auf Methoden des Unsupervised Learnings zugegriffen. Clustering zum Beispiel erlaubt es, Gruppen mit ähnlichem Verhalten zu identifizieren.
Was ist das Herzstück des Data Mining?
Das Herzstück des Data Mining ist jedoch die Anwendung von Machine Learning. Vor allem im Big Data Mining werden Methoden der künstlichen Intelligenz angewandt, um Muster implizit zu identifizieren. Hierbei wird meist initial auf Methoden des Unsupervised Learnings zugegriffen.
Welche Ansätze helfen bei der Analyse der Daten?
Klassifikation, Assoziationsanalyse und Regressionsanalyse (zum Teil auch die Clusteranalyse) liefern zudem abstraktere Modelle der Daten. Mit Hilfe dieser Ansätze wird sowohl die Analyse der Daten als auch beispielsweise deren Visualisierung (durch Stichproben und geringere Komplexität) vereinfacht.