-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathData-Mining.txt
63 lines (46 loc) · 4.63 KB
/
Data-Mining.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
Data Mining - Mineração de dados
1 - Introdução.
- Necessária devido ao constante crescimento de dados tornando inviavel a consulta pelos metodos convesionais (SQL).
- Mineração de dados geralmente é tida pelo processo análise matemática para derivar padrões e tendências nos dados afim de encontra informações ocultas em uma base de dados.
- Metodo tradicional de acesso a um banco de dados:
- O acesso é pré-definido pela lingagem SQL, com uma saida que consiste em um dado do banco que satisfaça a consulta e necessariamente precisa ser um subconjunto do banco.
______ SQL ________ ____
| |------->| (SGBD) | |(BD)|
|client| | DBMS |<------->| DB |
|______|<-------|________| |____|
results
- Metodo Minerado de acesso a dados:
- Query(consulta): A consulta não precisa ser bem formada ou precisamente declarada. A mineração de dados pode não estar exatamente certo sobre o que você quer ver.
- Data(dado): O dado acessado é geralmente uma versão diferente original do banco operado. Os dado são limpos e modificados para melhor apoiar o processo de mineração.
- Output(saida): O dado resultado da consulta pela mineração de dados provevelmente não eh um subconjunto do bando de dados. A saida é a analise de alguns conteudos da base de dados.
- A mineração de dados envolve diversos e distintos algoritmos para a realização de uma tarefa. Todos estes algoritmos tentam encaixar um modelo para o dado. Os algoritmos examinam o dado e determina um modelo mais apropriado para o dado previamente examinado. Algoritmos de mineração de dados podem ser caracterizados como consistindo de três partes:
- Modelo: O propósito do algoritmo é se adequar o modelo a uma determinado dado.
- Preferencia: Alguns critérios devem ser usados de forma a adequar um modelo ao outro.
- Pesquisa: Todos os algoritmos requerem alguma tecnica de pesquisa de dados.
- Data mining.
|
|====> Previsivo (Predictive):
| |
| |===> Classificação.
| |
| |===> Regreção.
| |
| |===> Análise de séries temporais.
| |
| |===> Previsão.
|
|====> Descritivo (Descriptive):
|
|===> Agrupamento(clustering).
|
|===> Sumarização.
|
|===> Regras de associação.
|
|===> Localização de sequencias.
- Modelo preditivo: Um modelo preditivo faz uma previsão sobre os valores dos dados usando os resultados encontrados de um dado diferente. Modelagem preditiva pode ser feita com base no uso de outros históricos de dados.
- Modelo Descritivo: Um modelo descritivo identifica padrões ou relações nos dados. Diferente do modelo preditivo, o modelo descritivo serve como uma forma para explorar as propriedades de um dado examinado, não prevr novas propriedades.
1.1 - Tarefas basicas da mineraçãode dados: Cada uma das tarefas à serem expanadas não necessariamente são individuais, podem ser combinadas em aplicações de mineração mais sofisticadas.
- Classificação: Classifica os dados em grupos ou classes predefinidos. É muitas vezes referida como aprendizagem supervisionada porque as classes são determinadas antes de examinar os dados. Os algoritmos de classificação exigem que as classes sejam definidas com base em valores de atributo dos dados. Reconhecimento de padrões é um tipo de classificação em que um padrão de entrada é classificado em uma de várias classes com base em sua similaridade com essas classes predefinidas.
- EXEMPLO: Uma estação de rastreamento de segurança do aeroporto é usada para determinar se os passageiros são terroristas ou criminosos em potencial. Para fazer isso, o rosto de cada passageiro é digitalizado e seu padrão básico (distancia entre os olhos, tamanho e forma da boca, forma da cabeça, etc) é identificado. Esse padrão é comparado a entradas em um banco de dados para ver se ele corresponde a qualquer padrão que está associado com criminosos conhecidos.
- Regreção: Regressão é usada para mapear um item de dados para uma variável preditora de valor real. Na realidade, a regressão envolve a aprendizagem da função que faz este mapeamento.