|
|
Datenbergbau befindet sich an der Überfahrt der unterschiedlichen Disziplinen. Seine Wurzeln sollen in den Datenanalysetechniken gefunden werden, die ursprünglich der Hauptzweck der Studie von Statistiken waren. Die grundlegenden Ideen an der Grundlage der Schätzungtheorie, Klassifikation, das Sammeln, Theorie probierend, sind in der Tat noch einer der Hauptbestandteile des Datenbergbaus. Aber andere Methoden und Techniken sind dem Toolbox des Datenanalytikers hinzugefügt worden und die Begrenzungen auf die klassischen parametrischen Statistiken mit komplizierteren Modellen verlängert und erreichen ihre Reife mit dem tatsächlichen Zustand des Wissens auf Entscheidung Bäumen, neurale Netze, Unterstützungsvektormaschinen, um einige gerade zu erwähnen. Zusätzlich hat die Notwendigkeit, große Körper von Daten zu organisieren und zu handhaben die Entwicklung der Informatiktechniken für Datenbankmanagement, Frage Optimierung, optimale Kodierung von Algorithmen und andere Aufgaben, die dem Speichern der Informationen im Speicher der Computer und der leistungsfähigen Durchführung von Algorithmen gewidmet werden erfordert.
Ein allgemeines eingetragenes Warenzeichen der modernen Annäherungen ist die Formalisierung der Schätzung und der Klassifikationprobleme, die im Datenbergbau als mathematische Optimierung Probleme entstehen, und der Gebrauch von gleichbleibenden algorithmischen Techniken, optimale Lösungen für diese Probleme festzustellen. Solcher methodologischer Rahmen ist stark durch angewandte Mathematik und Unternehmensforschung (ODER), eine wissenschaftliche Disziplin gekennzeichnet worden durch eine tiefe Integration der mathematischen Theorie und praktische Probleme gestützt worden. Ein bedeutender Beweis der Rolle ODER in des Datenbergbaus ist der Beitrag, daß nichtlineare und Ganzzahl Optimierung Methoden zur Lösung der Störung Reduzierungfunktionen gegeben haben, die optimiert werden müssen, um neurale Netze auszubilden und vektormaschinen zu stützen. Analog sind die Ganzzahlplanungsrechnung und die kombinatorische Optimierung groß verwendet worden, um die Probleme zu lösen, die in der Kennzeichnung der synthetischen rule-based Klassifikationmodelle und in der Vorwähler der optimalen Teilmengen Eigenschaften in den großen Datensätzen entstehen.
Trotz seiner starken methodologischen Kennzeichnung kann Datenbergbau nicht ohne ein tiefes Verständnis vom semantischen jedes spezifischen Problems, das erfolgreich angewendet werden häufig die Kundenbezogenheit der vorhandenen Methoden oder die Entwicklung Anzeige der hoc Techniken erfordert, teilweise basiert auf bereits vorhandenen Algorithmen. Gewissermaßen ist die reale Herausforderung, die der gewinnenpraktiker der Daten gegenüberstellen muß, die Vorwähler, unter vielen unterschiedlichen Methoden und Annäherungen, von dem, das beste Serves der Bereich der Aufgabe betrachteten und häufig setzt einen Kompromiß zwischen der Kompliziertheit des gewählten Modells und seiner Verallgemeinerungfähigkeit fest.
Online: 522 users browsing the articles directory
|
|