|
|
A mineração dos dados é ficada situada no cruzamento de disciplinas diferentes. Suas raizes devem ser encontradas nas técnicas da análise de dados que eram originalmente o objeto principal do estudo dos statistics. As idéias fundamentais na base da teoria do estimation, classificação, aglomerar-se, provando a teoria, são certamente ainda um dos ingredientes principais da mineração dos dados. Mas outros métodos e técnicas foram adicionados ao toolbox do analista dos dados, estendendo os limites dos statistics paramétricos classical com modelos mais complexos, alcançando sua maturidade com o estado real do conhecimento em árvores da decisão, redes neural, máquinas do vetor da sustentação, para mencionar apenas alguns. Além, a necessidade organizar e controlar corpos grandes dos dados requereu a distribuição de técnicas da informática de para a gerência da base de dados, o optimization da pergunta, o coding optimal dos algoritmos, e as outras tarefas devotadas a armazenar da informação na memória dos computadores e à execução eficiente dos algoritmos.
Uma marca registrada comum das aproximações modernas é o formalization do estimation e dos problemas da classificação que levantam-se na mineração dos dados como problemas matemáticos do optimization, e o uso de técnicas algorítmicas consistentes determinar soluções optimal para estes problemas. Tal estrutura methodological foi suportada fortemente por pesquisa aplicada da matemática e de operações (OU), uma disciplina científica foi caracterizada por uma integração profunda da teoria matemática e problemas práticos. Uma evidência significativa do papel OU na mineração dos dados é a contribuição que os métodos não-lineares e do inteiro do optimization deram à solução das funções do minimization do erro que necessitam optimized para treinar redes neural e para suportar máquinas do vetor. Analogously, a programação de inteiro e o optimization combinatorial foram usados pela maior parte resolver os problemas que levantam-se na identificação de modelos rule-based sintéticos da classificação e na seleção de subconjuntos optimal das características em séries de dados grandes.
Apesar de sua caracterização methodological forte, a mineração dos dados não pode com sucesso ser aplicada sem uma compreensão profunda do semântico de cada problema específico, que requer frequentemente o customization de métodos existentes ou o desenvolvimento de técnicas hoc do anúncio, baseado parcialmente em algoritmos já existentes. A alguma extensão, o desafio real que o practitioner minando dos dados tem que enfrentar é a seleção, entre muitos métodos e aproximações diferentes, de esse que os mais melhores saques o espaço da tarefa consideraram, avaliando frequentemente um acordo entre a complexidade do modelo escolhido e sua potencialidade da generalização.
Online: 492 users browsing the articles directory
|
|