Estrazione mineraria di dati come scienza pratica

  

L'estrazione mineraria di dati è situata all'incrocio delle discipline differenti. Le relative radici devono essere trovate nelle tecniche di analisi di dati che erano originalmente l'obiettivo principale dello studio sulle statistiche. Le idee fondamentali alla base della teoria di valutazione, la classificazione, ragruppare, provante la teoria, sono ancora effettivamente uno degli ingredienti principali di estrazione mineraria di dati. Ma altri metodi e tecniche sono stati aggiunti al toolbox dell'analista di dati, estendente i limiti delle statistiche parametriche classiche con i modelli più complessi, raggiungenti la loro maturità con il reale dichiarano di conoscenza sugli alberi di decisione, le reti neurali, macchine di vettore di sostegno, per accennare appena alcuni. In più, la necessità di organizzare e controllare i grandi enti dei dati ha richiesto lo schieramento delle tecniche di informatica per l'amministrazione della base di dati, l'ottimizzazione di domanda, la codificazione ottimale delle procedure ed altre mansioni dedicate ad immagazzinare delle informazioni nella memoria dei calcolatori ed all'esecuzione efficiente delle procedure.

Un marchio comune dei metodi moderni è la formalizzazione della valutazione e dei problemi di classificazione che presentano nell'estrazione mineraria di dati come problemi matematici di ottimizzazione e l'uso delle tecniche algoritmiche costanti determinare le soluzioni ottimali per questi problemi. Tale struttura metodologica è stata sostenuta fortemente tramite ricerca applicata di funzionamenti e di matematica (O), una disciplina scientifica è stata caratterizzata tramite un'integrazione profonda della teoria matematica e problemi pratici. Una prova significativa del ruolo di O in estrazione mineraria di dati è il contributo che i metodi di numero intero e non lineari di ottimizzazione hanno dato alla soluzione delle funzioni di minimizzazione di errore che devono essere ottimizzate per addestrare le reti neurali e per sostenere le macchine di vettore. Analogamente, la programmazione di numero intero e l'ottimizzazione combinatoria in gran parte sono state usate per risolvere i problemi che presentano nell'identificazione dei modelli basati sulla norma sintetici di classificazione e nella selezione dei sottoinsiemi ottimali delle caratteristiche nei grandi gruppi di dati.

Malgrado la relativa descrizione metodologica forte, l'estrazione mineraria di dati non può essere applicata con successo senza una comprensione profonda del semantico di ogni problema specifico, che richiede spesso l'adattamento dei metodi attuali o lo sviluppo delle tecniche ad-hoc, parzialmente basato sulle procedure già attuali. In parte, la sfida reale che il professionista estraente di dati deve affrontare è la selezione, fra molti metodi e metodi differenti, di quello che i serv migliori la portata dell'operazione hanno considerato, valutanti spesso un compromesso fra la complessità del modello scelto e la relativa possibilità di generalizzazione.

ciò è un articolo aggiunto da Ralph Dawson


Diniego: Il nostro Web site non è responsabile delle informazioni contenute da questo articolo. Questo articolo in nessun modo riflette le viste, le opinioni, i pensieri o la credenza del personale dell'indice degli articoli.

Avviso di traduzione: L'articolo "estrazione mineraria di dati come scienza pratica" è stato tradotto usando un servizio di traduzione automatizzato. Chiediamo scusa francamente per tutti gli errori di traduzione che hanno accaduto. Grazie per capire.

Online: 474 users browsing the articles directory