Explotación minera de los datos como ciencia práctica

  

La explotación minera de los datos está situada en la travesía de diversas disciplinas. Sus raíces deben ser encontradas en las técnicas del análisis de datos que eran originalmente el objeto principal del estudio de la estadística. Las ideas fundamentales en la base de la teoría de la valoración, clasificación, el arracimar, muestreando teoría, siguen siendo de hecho uno de los ingredientes principales de la explotación minera de los datos. Pero otros métodos y técnicas se han agregado a la caja de herramientas del analista de los datos, ampliando los límites de la estadística paramétrica clásica con modelos más complejos, alcanzando su madurez con el estado real del conocimiento en los árboles de la decisión, redes de los nervios, máquinas del vector de la ayuda, apenas para mencionar algunos. Además, la necesidad de organizar y de manejar cuerpos grandes de datos ha requerido el despliegue de las técnicas de la informática para la gerencia de la base de datos, la optimización de la pregunta, la codificación óptima de algoritmos, y otras tareas dedicadas a almacenar de la información en la memoria de computadoras y a la ejecución eficiente de algoritmos.

Una marca registrada común de los acercamientos modernos es la formalización de la valoración y de los problemas de la clasificación que se presentan en la explotación minera de los datos como problemas matemáticos de la optimización, y el uso de técnicas algorítmicas constantes de determinar las soluciones óptimas para estos problemas. Tal marco metodológico ha sido apoyado fuertemente por la investigación aplicada de las matemáticas y de operaciones (O), una disciplina científica ha sido caracterizado por una integración profunda de la teoría matemática y los problemas prácticos. Una evidencia significativa del papel O en de la explotación minera de los datos es la contribución que los métodos no lineales y del número entero de la optimización han dado a la solución de las funciones de la minimización del error que necesitan ser optimizadas para entrenar a redes de los nervios y para apoyar las máquinas del vector. Análogo, la programación de número entero y la optimización combinatoria se han utilizado en gran parte para solucionar los problemas que se presentaban en la identificación de los modelos basados en las reglas sintéticos de la clasificación y en la selección de subconjuntos óptimos de características en datasets grandes.

A pesar de su caracterización metodológica fuerte, la explotación minera de los datos no se puede aplicar con éxito sin una comprensión profunda del semántico de cada problema específico, que requiere a menudo el arreglo para requisitos particulares de métodos existentes o el desarrollo de las técnicas hoc del anuncio, basado parcialmente en algoritmos ya existentes. A un cierto grado, el desafío verdadero a que el médico que mina de los datos tiene que hacer frente es la selección, entre muchos diversos métodos y acercamientos, de el que los mejores servicios el alcance de la tarea consideraban, determinando a menudo un compromiso entre la complejidad del modelo elegido y su capacidad de la generalización.

esto es un artículo agregado por Ralph Dawson


Negación: Nuestro Web site no es responsable de la información contenida por este artículo. Este artículo de ninguna manera refleja las vistas, las opiniones, los pensamientos o la creencia del personal del directorio de los artículos.

Aviso de la traducción: El artículo "explotación minera de los datos como ciencia práctica" fue traducido usando un servicio de traducción automatizado. Nos disculpamos sinceramente por cualquier error de la traducción que ocurriera. Gracias por entender.

Online: 492 users browsing the articles directory