Exploitation de données comme Science pratique

  

L'exploitation de données est située au croisement de différentes disciplines. Ses racines doivent être trouvées dans les techniques d'analyse de données qui étaient à l'origine l'objet principal de l'étude des statistiques. Les idées fondamentales à la base de la théorie d'évaluation, classification, grouper, prélevant la théorie, sont toujours en effet l'un des ingrédients principaux de l'exploitation de données. Mais d'autres méthodes et techniques ont été ajoutées à la boîte à outils de l'analyste de données, prolongeant les limites des statistiques paramétriques classiques avec des modèles plus complexes, atteignant leur maturité avec l'état réel de la connaissance sur des arbres de décision, réseaux neurologiques, machines de vecteur de soutien, pour mentionner juste quelques uns. En outre, la nécessité d'organiser et contrôler de grands corps des données a exigé l'déploiement des techniques d'informatique pour la gestion de base de données, l'optimisation de question, codage optimal des algorithmes, et autre charge consacré au stock de l'information dans la mémoire des ordinateurs et à l'exécution efficace des algorithmes.

Une marque déposée commune des approches modernes est la formalisation de l'évaluation et des problèmes de classification surgissant dans l'exploitation de données en tant que problèmes mathématiques d'optimisation, et l'utilisation de à techniques algorithmiques conformées de déterminer les solutions optimales pour ces problèmes. Un tel cadre méthodologique a été fortement soutenu par des mathématiques et recherche opérationnelle appliquées (OU), une discipline scientifique a été caractérisé par une intégration profonde de théorie mathématique et des problèmes pratiques. Une évidence significative du rôle OU dans de l'exploitation de données est la contribution que les méthodes non-linéaires et de nombre entier d'optimisation ont donné à la solution des fonctions de minimisation d'erreur qui doivent être optimisées pour former les réseaux neurologiques et pour soutenir des machines de vecteur. De façon analogue, la programmation de nombre entier et l'optimisation combinatoire ont été en grande partie employées pour résoudre des problèmes surgissant dans l'identification des modèles basés sur les règles synthétiques de classification et dans le choix des sous-ensembles optimaux de dispositifs dans de grands ensembles de données.

En dépit de sa caractérisation méthodologique forte, l'exploitation de données ne peut pas être avec succès appliquée sans arrangement profond du sémantique de chaque problème spécifique, qui exige souvent la personnalisation des méthodes existantes ou le développement des techniques ad hoc, partiellement basé sur des algorithmes déjà existants. _ dans une certaine mesure some extent, le vrai défi qui le donnée extraire praticien devoir relever être le choix, parmi beaucoup de différent méthode et approche, le celui qui meilleur service le portée le charger considérer, souvent évaluer un compromis entre le complexité le choisir modèle et son généralisation possibilité.

c'est un article supplémentaire par Ralph Dawson


Déni : Notre site Web n'est pas responsable de l'information contenue par cet article. Cet article reflète nullement les vues, les avis, les pensées ou la croyance du personnel d'annuaire d'articles.

Notification de traduction : L'article "exploitation de données comme Science pratique" a été traduit en utilisant un service de traduction automatisé. Nous faisons des excuses sincèrement pour toutes les erreurs de traduction qui se sont produites. Merci de l'arrangement.

Online: 522 users browsing the articles directory