[1] O documento discute a classificação dos sistemas de mineração de dados quanto ao tipo de base de dados, incluindo bases de dados relacionais, data warehouses, transacionais, temporais, espaciais, multimídia e da World Wide Web. [2] É explicado que a mineração de dados pode ser aplicada a qualquer tipo de dados significativos e vários exemplos de aplicações em cada tipo de base de dados são apresentados. [3] Links adicionais com conjuntos de dados públicos para mineração são fornecidos no final.
Este documento fornece um resumo de um documento sobre data mining. [1] Apresenta os tópicos principais da data mining, incluindo introdução, background, funções, processo e técnicas. [2] Discutem exemplos de aplicações como vendas, marketing e bancos. [3] Fornece uma introdução geral sobre o que é data mining e como pode ser usado para extrair padrões de comportamento em grandes conjuntos de dados.
Um data warehouse é um repositório de informações projetado para facilitar a análise de dados e relatórios. Ele inclui ferramentas para extrair, transformar e carregar dados de sistemas operacionais para análise. A modelagem dimensional é a abordagem de modelagem de dados mais comum em data warehouses, representando dados por meio de fatos, dimensões e hierarquias.
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharepccdias
- O documento discute Big Data e Mineração de Dados, abordando o que é Big Data, sua infraestrutura e aplicações, e a pós-graduação em Banco de Dados e Mineração de Dados oferecida pela UniSEB.
O documento discute conceitos básicos de modelagem multidimensional, incluindo tomada de decisão gerencial, sistemas de apoio à decisão, data warehouse, data mart, granularidade e ETL. É apresentado o processo de extração, transformação e carga de dados, além de exemplos de questões e modelos de negócios multidimensionais.
O documento discute o processo de data mining, incluindo suas definições, funções, técnicas e aplicações. Resume que data mining extrai padrões de dados para gerar conhecimento útil para tomada de decisão, utilizando técnicas como árvores de decisão, redes neurais e regras indutivas. Apresenta também exemplos de como empresas aplicaram com sucesso data mining.
O documento discute como consumir e minerar dados abertos usando software livre. Ele aborda: 1) o que são dados abertos e seus tipos; 2) a plataforma Pentaho para mineração de dados; e 3) uma demonstração prática usando a ferramenta WEKA para classificação de dados.
O documento discute a descoberta de conhecimento em bases de dados e mineração de dados. Apresenta os conceitos, o processo de KDD, métodos de mineração de dados e exemplos de aplicações. Explica como a análise de grandes volumes de dados pode extrair padrões úteis para tomada de decisões em diversas áreas como marketing, bancos e saúde.
Diminuição do volume do acervo: ações
Atividades de descrição: identificar conceitos e gerenciar informações
Gerenciar informações digitais: metadados, o documento arquivístico digital, anatomia do objeto digital, e-Arq, SIGAD, sistemas de GD e de Descrição Arquivística
Difusão de arquivos
Revisão para a Avaliação Individual
Este documento fornece um resumo de um documento sobre data mining. [1] Apresenta os tópicos principais da data mining, incluindo introdução, background, funções, processo e técnicas. [2] Discutem exemplos de aplicações como vendas, marketing e bancos. [3] Fornece uma introdução geral sobre o que é data mining e como pode ser usado para extrair padrões de comportamento em grandes conjuntos de dados.
Um data warehouse é um repositório de informações projetado para facilitar a análise de dados e relatórios. Ele inclui ferramentas para extrair, transformar e carregar dados de sistemas operacionais para análise. A modelagem dimensional é a abordagem de modelagem de dados mais comum em data warehouses, representando dados por meio de fatos, dimensões e hierarquias.
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharepccdias
- O documento discute Big Data e Mineração de Dados, abordando o que é Big Data, sua infraestrutura e aplicações, e a pós-graduação em Banco de Dados e Mineração de Dados oferecida pela UniSEB.
O documento discute conceitos básicos de modelagem multidimensional, incluindo tomada de decisão gerencial, sistemas de apoio à decisão, data warehouse, data mart, granularidade e ETL. É apresentado o processo de extração, transformação e carga de dados, além de exemplos de questões e modelos de negócios multidimensionais.
O documento discute o processo de data mining, incluindo suas definições, funções, técnicas e aplicações. Resume que data mining extrai padrões de dados para gerar conhecimento útil para tomada de decisão, utilizando técnicas como árvores de decisão, redes neurais e regras indutivas. Apresenta também exemplos de como empresas aplicaram com sucesso data mining.
O documento discute como consumir e minerar dados abertos usando software livre. Ele aborda: 1) o que são dados abertos e seus tipos; 2) a plataforma Pentaho para mineração de dados; e 3) uma demonstração prática usando a ferramenta WEKA para classificação de dados.
O documento discute a descoberta de conhecimento em bases de dados e mineração de dados. Apresenta os conceitos, o processo de KDD, métodos de mineração de dados e exemplos de aplicações. Explica como a análise de grandes volumes de dados pode extrair padrões úteis para tomada de decisões em diversas áreas como marketing, bancos e saúde.
Diminuição do volume do acervo: ações
Atividades de descrição: identificar conceitos e gerenciar informações
Gerenciar informações digitais: metadados, o documento arquivístico digital, anatomia do objeto digital, e-Arq, SIGAD, sistemas de GD e de Descrição Arquivística
Difusão de arquivos
Revisão para a Avaliação Individual
1) O documento discute Knowledge Discovery Database (KDD) e Data Mining (DM), explicando que KDD é o processo geral de extração de conhecimento de dados enquanto DM se refere especificamente à etapa de descoberta de padrões.
2) O processo de KDD inclui seleção, pré-processamento, transformação, mineração de dados e interpretação. As tarefas comuns de KDD incluem regras de associação, classificação e agrupamento.
3) Exemplos demonstram como técnicas de DM podem ser us
Aprendizado de máquina.
Mineração de dados e big data.
Dados, informação e conhecimento.
Análise de dados e estatística.
Armazenamento analítico.
Processos de mineração de dados.
Tarefas de aprendizado de máquina.
Aplicação: crimes financeiros.
Apresentação de trabalho para a disciplina de Inteligencia Computacional.
Instituto Federal de Educação, Ciência e Tecnologia do Ceará
IFCE - Curso de Engenharia da Computação.
O documento discute como a capacidade de armazenar grandes volumes de dados permitiu o acesso a informações sem necessidade de livros físicos e como ferramentas de busca ampliam nossa compreensão. Também apresenta o conceito de data mining como a exploração de dados em busca de padrões consistentes para detectar novos subconjuntos de informações.
O documento descreve uma palestra sobre a utilização da ferramenta Pentaho Data Mining para realizar análise preditiva em dados de e-commerce. O palestrante apresenta casos de uso bem-sucedidos e mal-sucedidos de mineração de dados em empresas de comércio eletrônico e discute as vantagens da personalização de recomendações para os clientes. Ele também fornece uma introdução aos conceitos e processos básicos de mineração de dados.
O documento discute mineração de dados, que é o processo de extrair padrões úteis de grandes quantidades de dados armazenados em bancos de dados. A mineração de dados envolve pré-processamento, a aplicação de algoritmos e técnicas para extrair modelos de dados, e pós-processamento para interpretar os resultados. Alguns tipos comuns de mineração de dados incluem classificação, clusterização, detecção de associações e anomalias.
O documento propõe uma estrutura para organização de dados em um data lake dividido em diferentes zonas de acordo com o tipo e finalidade dos dados, facilitando a governança e localização dos dados para uso. A estrutura sugerida inclui zonas para dados brutos, de referência, transformados e avançadas análises.
- O documento apresenta os conceitos básicos de banco de dados e sistemas de gerenciamento de banco de dados, incluindo suas funções e componentes.
- São descritas as vantagens de usar bancos de dados em sistemas de uma organização complexa, como uma universidade, evitando problemas como redundância e dificuldade de manutenção.
- São explicadas as principais funções de um SGBD, como métodos de acesso, integridade, segurança, concorrência e independência.
Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...Marcos Vinicius Fidelis
O documento descreve Marcos Vinicius Fidelis, professor e analista de informática que pesquisa e usa o Pentaho Data Mining (anteriormente conhecido como WEKA) desde 1999. Ele também é entusiasta de software livre e código aberto.
Este documento apresenta um laboratório de banco de dados. Apresenta o professor Franklin Correia e sua formação, além de conceitos básicos sobre banco de dados, como o que é um banco de dados, como eram armazenados os dados antes, funções básicas de um sistema gerenciador de banco de dados e exemplos práticos.
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Marcos Vinicius Fidelis
Este documento fornece uma introdução ao processo de construção de classificadores para mineração de dados. Discute conceitos como classificação, regressão, agrupamento e detecção de desvios. Apresenta ferramentas como Weka e Pentaho para desenvolvimento de modelos preditivos e avaliação de algoritmos de aprendizado de máquina.
OLAP fornece às organizações uma forma flexível e rápida de acessar, visualizar e analisar dados corporativos. OLAP organiza informações em cubos multidimensionais para facilitar análises complexas. Os sistemas OLAP ajudam os executivos a tomar decisões estratégicas mais rapidamente com base em informações detalhadas e agregadas.
1. Com o aumento de volumes de dados, ferramentas como data mining são necessárias para analisar dados de forma otimizada e extrair conhecimento e padrões. 2. Técnicas como descoberta de padrões sequenciais, redes neurais e algoritmos genéticos podem ser usadas para data mining. 3. Data mining tem aplicações em diversas áreas como marketing, finanças e saúde para apoiar tomadas de decisão.
O documento apresenta os fundamentos da mineração de dados educacionais, discutindo tópicos como introdução à área, bases de dados, pré-processamento, tipos de estudos, tarefas de mineração como classificação, agrupamento e regras de associação aplicadas a dados educacionais. Conclui ressaltando a importância da área para a pesquisa, mas também desafios relacionados à infraestrutura de coleta de dados nas instituições.
Apresentação que visa demonstrar resumidamente os conceitos básicos de um repositório de dados Data Warehouse. Assim explicando a estrutura e os resultados esperados de um Data Warehouse.
Isc aula 5 - estrutura e organização da informaçãoFábio Andrade
Este documento fornece um resumo sobre bancos de dados. Ele discute o que é um banco de dados, como a informação é organizada em dados, campos, registros e arquivos. Também explica os principais modelos de banco de dados incluindo hierárquico, rede e relacional, e como os SGBDs fornecem abstração, independência de dados e controle de acesso.
O documento resume conceitos fundamentais de mineração de dados, incluindo: 1) Visão geral do processo KDD e das etapas de extração de informações dos dados; 2) Tarefas comuns de mineração de dados como classificação e associação; 3) Técnicas como árvores de decisão e redes neurais. O documento também discute ferramentas como o Weka e aplicações práticas de mineração de dados.
O documento discute mineração de repositórios de software, apresentando: 1) uma introdução sobre data mining e mineração de repositórios de software; 2) exemplos de estudos que mineram históricos de versão para prever mudanças futuras e guiar alterações no código; 3) um estudo que resume recomendações de mineração de repositórios ao longo da última década.
1) O documento apresenta os principais conceitos e arquitetura de soluções de Business Intelligence e Data Warehouse, incluindo introdução aos tópicos de OLTP x OLAP, ciclo de vida de um sistema BI, conceitos de Data Warehouse, modelagem dimensional, ETL e ferramentas como SQL Server Integration Services.
2) São apresentados os principais conceitos de modelagem dimensional como dimensões, fatos, métricas, cubos e arquiteturas de Data Warehouse.
3) A ferramenta SSIS da Microsoft é descrita com foco na arquitetura, princip
1) O documento discute Knowledge Discovery Database (KDD) e Data Mining (DM), explicando que KDD é o processo geral de extração de conhecimento de dados enquanto DM se refere especificamente à etapa de descoberta de padrões.
2) O processo de KDD inclui seleção, pré-processamento, transformação, mineração de dados e interpretação. As tarefas comuns de KDD incluem regras de associação, classificação e agrupamento.
3) Exemplos demonstram como técnicas de DM podem ser us
Aprendizado de máquina.
Mineração de dados e big data.
Dados, informação e conhecimento.
Análise de dados e estatística.
Armazenamento analítico.
Processos de mineração de dados.
Tarefas de aprendizado de máquina.
Aplicação: crimes financeiros.
Apresentação de trabalho para a disciplina de Inteligencia Computacional.
Instituto Federal de Educação, Ciência e Tecnologia do Ceará
IFCE - Curso de Engenharia da Computação.
O documento discute como a capacidade de armazenar grandes volumes de dados permitiu o acesso a informações sem necessidade de livros físicos e como ferramentas de busca ampliam nossa compreensão. Também apresenta o conceito de data mining como a exploração de dados em busca de padrões consistentes para detectar novos subconjuntos de informações.
O documento descreve uma palestra sobre a utilização da ferramenta Pentaho Data Mining para realizar análise preditiva em dados de e-commerce. O palestrante apresenta casos de uso bem-sucedidos e mal-sucedidos de mineração de dados em empresas de comércio eletrônico e discute as vantagens da personalização de recomendações para os clientes. Ele também fornece uma introdução aos conceitos e processos básicos de mineração de dados.
O documento discute mineração de dados, que é o processo de extrair padrões úteis de grandes quantidades de dados armazenados em bancos de dados. A mineração de dados envolve pré-processamento, a aplicação de algoritmos e técnicas para extrair modelos de dados, e pós-processamento para interpretar os resultados. Alguns tipos comuns de mineração de dados incluem classificação, clusterização, detecção de associações e anomalias.
O documento propõe uma estrutura para organização de dados em um data lake dividido em diferentes zonas de acordo com o tipo e finalidade dos dados, facilitando a governança e localização dos dados para uso. A estrutura sugerida inclui zonas para dados brutos, de referência, transformados e avançadas análises.
- O documento apresenta os conceitos básicos de banco de dados e sistemas de gerenciamento de banco de dados, incluindo suas funções e componentes.
- São descritas as vantagens de usar bancos de dados em sistemas de uma organização complexa, como uma universidade, evitando problemas como redundância e dificuldade de manutenção.
- São explicadas as principais funções de um SGBD, como métodos de acesso, integridade, segurança, concorrência e independência.
Pentaho Data Mining - FTSL - Fórum de Tecnologia de Software Livre - Serpro -...Marcos Vinicius Fidelis
O documento descreve Marcos Vinicius Fidelis, professor e analista de informática que pesquisa e usa o Pentaho Data Mining (anteriormente conhecido como WEKA) desde 1999. Ele também é entusiasta de software livre e código aberto.
Este documento apresenta um laboratório de banco de dados. Apresenta o professor Franklin Correia e sua formação, além de conceitos básicos sobre banco de dados, como o que é um banco de dados, como eram armazenados os dados antes, funções básicas de um sistema gerenciador de banco de dados e exemplos práticos.
Construção de Classificadores utilizando Pentaho Data Mining (WEKA) - FTSL 2014 Marcos Vinicius Fidelis
Este documento fornece uma introdução ao processo de construção de classificadores para mineração de dados. Discute conceitos como classificação, regressão, agrupamento e detecção de desvios. Apresenta ferramentas como Weka e Pentaho para desenvolvimento de modelos preditivos e avaliação de algoritmos de aprendizado de máquina.
OLAP fornece às organizações uma forma flexível e rápida de acessar, visualizar e analisar dados corporativos. OLAP organiza informações em cubos multidimensionais para facilitar análises complexas. Os sistemas OLAP ajudam os executivos a tomar decisões estratégicas mais rapidamente com base em informações detalhadas e agregadas.
1. Com o aumento de volumes de dados, ferramentas como data mining são necessárias para analisar dados de forma otimizada e extrair conhecimento e padrões. 2. Técnicas como descoberta de padrões sequenciais, redes neurais e algoritmos genéticos podem ser usadas para data mining. 3. Data mining tem aplicações em diversas áreas como marketing, finanças e saúde para apoiar tomadas de decisão.
O documento apresenta os fundamentos da mineração de dados educacionais, discutindo tópicos como introdução à área, bases de dados, pré-processamento, tipos de estudos, tarefas de mineração como classificação, agrupamento e regras de associação aplicadas a dados educacionais. Conclui ressaltando a importância da área para a pesquisa, mas também desafios relacionados à infraestrutura de coleta de dados nas instituições.
Apresentação que visa demonstrar resumidamente os conceitos básicos de um repositório de dados Data Warehouse. Assim explicando a estrutura e os resultados esperados de um Data Warehouse.
Isc aula 5 - estrutura e organização da informaçãoFábio Andrade
Este documento fornece um resumo sobre bancos de dados. Ele discute o que é um banco de dados, como a informação é organizada em dados, campos, registros e arquivos. Também explica os principais modelos de banco de dados incluindo hierárquico, rede e relacional, e como os SGBDs fornecem abstração, independência de dados e controle de acesso.
O documento resume conceitos fundamentais de mineração de dados, incluindo: 1) Visão geral do processo KDD e das etapas de extração de informações dos dados; 2) Tarefas comuns de mineração de dados como classificação e associação; 3) Técnicas como árvores de decisão e redes neurais. O documento também discute ferramentas como o Weka e aplicações práticas de mineração de dados.
O documento discute mineração de repositórios de software, apresentando: 1) uma introdução sobre data mining e mineração de repositórios de software; 2) exemplos de estudos que mineram históricos de versão para prever mudanças futuras e guiar alterações no código; 3) um estudo que resume recomendações de mineração de repositórios ao longo da última década.
1) O documento apresenta os principais conceitos e arquitetura de soluções de Business Intelligence e Data Warehouse, incluindo introdução aos tópicos de OLTP x OLAP, ciclo de vida de um sistema BI, conceitos de Data Warehouse, modelagem dimensional, ETL e ferramentas como SQL Server Integration Services.
2) São apresentados os principais conceitos de modelagem dimensional como dimensões, fatos, métricas, cubos e arquiteturas de Data Warehouse.
3) A ferramenta SSIS da Microsoft é descrita com foco na arquitetura, princip
2. Mineração de Dados – Aula 3
Resumo
• Objetivo:
– Classificar os sistemas de mineração de dados.
• Conteúdo:
– Classificação quanto ao tipo de base de dados.
• Referências:
– Han, seções 1.3 e 1.6
3. Mineração de Dados – Aula 3
Classificação dos Sistemas de Mineração
• Quanto ao tipo de aplicação a que são dirigidos:
– Marketing, vendas, finanças, manufatura, energia, saúde,...
• Quanto ao tipo de base de dados:
– Relacional, data warehouses, transacional, temporal, espacial,...
• Quanto ao tipo de padrão a ser minerado:
– Classes, conceitos, padrões frequentes, modelos, clusters,...
• Quanto ao tipo de técnicas utilizadas:
– Classificação, predição, clusterização, redes neurais,...
4. Classificação dos Sistemas de Mineração
• De forma geral, mineração de dados pode ser aplicada a qualquer
tipo de dados...
– Desde que os dados sejam significativos para a aplicação desejada
• Quanto ao tipo de Base de Dados
– Base de Dados Relacional
– Data Warehouses
– Base de Dados Transacional
– Base de Dados Objeto-Relacional
– Base de Dados Temporais
– Base de Dados Espaciais
– Base de Dados Multimídia
– World Wide Web
– Flat File
5. Mineração de Dados – Aula 3
Base de Dados Relacional
• Consiste numa coleção de dados inter-relacionados e um
conjunto de programas para gerenciar e acessar esses dados.
• Coleção de tabelas com respectivos atributos e povoadas
com um grande conjunto de tuplas (registros).
• Cada tupla é representada por uma chave.
• As entidades e seus relacionamentos são descritos por meio
do modelo entidade-relacionamento.
• Dados podem ser acessados por queries escritas na
linguagem SQL.
7. Mineração de Dados – Aula 3
Base de Dados Relacional
• Consultas usuais:
– Operação de seleção, junção e projeção
– Ex: Lista de todos os itens que foram vendidos no último trimestre.
– Operação de agregação
– Ex: Total de vendas no último mês de dezembro.
• Mineração de dados:
– Prever risco de crédito de novos clientes baseado na idade, realização de
pagamentos prévios ou rendimentos.
– Acompanhar saída de produtos em promoção em comparação com
períodos anteriores.
OBS: Base de dados relacionais são um dos mais ricos repositórios de
informações disponíveis, e, por isso são uma fonte importante de dados para
a mineração de dados.
8. Mineração de Dados – Aula 3
Data Warehouses
• Repositório de dados coletado a partir de múltiplas fontes,
armazenadas sobre um esquema unificado e que usualmente
reside em um único lugar.
• Data Warehouses são construídos via um processo de
limpeza, integração e transformação dos dados e um
“refreshing” periódico.
• Ferramentas de consulta e análise de dados específicas
ajudam na leitura desse modelo de base de dados.
10. Mineração de Dados – Aula 3
Data Warehouses
• Para facilitar a tomada de decisão os dados são organizados a cerca
de grande temas (cliente, item, fornecedor, etc.).
• Pode armazenar um resumo das transações por tipo de item para cada
loja, ou para cada região de venda
• Os dados são armazenados para fornecer informação a partir de
uma perspectiva histórica.
• Data Warehouses são modelados por uma estrutura
multidimensional onde cada dimensão corresponde a um atributo
ou conjunto de atributo.
• Cada célula armazena o valor de uma medida agregada.
– Ex: soma(valor de venda)
11. Mineração de Dados – Aula 3
Data Warehouses
• A estrutura física de armazenamento pode ser relacional ou
cubo de dados multidimensional.
• Cubos de dados fornecem
uma visão multidimensional
dos dados e permite a
pré-computação e rápido
acesso ao dados sumarizados.
12. Mineração de Dados – Aula 3
Data Warehouses
• Consultas usuais:
– OLAP (On Line Analytical Processing) permitem obter os dados sob
diferentes graus de sumarização (abstração).
– Exemplo: obter o total de vendas por região, por país, etc, a partir de
dados de vendas organizados por cidade.
• Exemplos de operações OLAP incluem drill-down e roll-up, que
permitem que o usuário visualize os dados em diferentes graus de
compactação
• Mineração de Dados:
– Permite a exploração de múltiplas combinações de dimensões em
diferentes níveis de granularidade, possibilitando a descoberta de
padrões mais interessantes que representam o conhecimento
– Descobrir existência de clusters de clientes em diferentes localidades,
ou em diferentes faixas de salário.
14. Mineração de Dados – Aula 3
Base de Dados Transacional
• Consiste num arquivo onde cada registro representa uma
transação.
– Ex: venda ou reserva de passagem
• Uma transação tipicamente inclui
uma identidade única e uma lista
de itens.
• Uma base de dados transacional pode ter outras tabelas
associadas a ela que contenham outras informações a
respeito da mineração
– Ex: Descrição de item, ou informações do vendedor
15. Mineração de Dados – Aula 3
Base de Dados Transacional
• Consultas usuais
– Quantas transações incluem o item I3?
– Mostre-me os itens comprados pelo
Sr. Smith.
• Mineração de Dados:
– Quais itens são mais
vendidos juntos?
Exemplo: cerveja e
fraldas na sexta-feira.
16. Mineração de Dados – Aula 3
Base de Dados Objeto-Relacional
• Combinam os benefícios do modelo Relacional com a
capacidade de modelagem do modelo de Orientação a
Objetos.
• Fornecem suporte para consultas complexas sobre dados
complexos.
• Atendem aos requisitos das novas aplicações e da nova
geração de aplicações de negócios.
• Técnicas de Mineração precisam ser desenvolvidas para lidar
com estruturas complexas de objetos, hierarquias de classes,
herança, etc.
17. Mineração de Dados – Aula 3
Base de Dados Temporais
• Envolvem atributos relacionados a tempo e/ou sequência de
eventos ordenados.
• Exemplos: bolsa de valores, controle de inventário, previsão
do tempo, etc.
• Técnicas de Mineração são utilizadas para encontrar
evoluções dos objetos ou tendências de mudanças
19. Mineração de Dados – Aula 3
Base de Dados Espaciais
• É composto de informações relacionadas ao espaço (mapas
geográfico, imagens médicas ou de satélite).
• Exemplo: concentração de criminalidade, detecção de
doenças, fenômenos meteorológicos, etc.
• Diversas informações podem ser extraídas por meio de
técnicas caracterização, agrupamento, outliers e classificação
de padrões.
21. Mineração de Dados – Aula 3
Base de Dados Multimídia
• É composto de conteúdo de imagens, áudio e vídeos
• Exemplo: aplicações de checagem de linha de produção,
gravações de call center e câmeras de segurança.
• Técnicas de classificação de padrões dominam esta área.
• Abordagens promissoras incluem cubo de dados multimidia,
extração de múltiplas características dos dados de multimídia,
etc.
23. Mineração de Dados – Aula 3
World Wide Web
• Centro de serviço de informações globais para notícias,
anúncios, informações de clientes, gerenciamento financeiro,
educação, governança, comércio eletrônico, etc.
• Padrões de navegação, links patrocinados, redes sociais,
cookies.
• Web Mining
25. Mineração de Dados – Aula 3
Flat File
• Única entrada de várias ferramentas de mineração
• Pode ser criado a partir de BD relacional
– Como a maioria dos SBD relacionais não suportam estruturas
aninhadas, o banco de dados normalmente é salvo em flat file
• Inadequado quando se tem naturalmente:
– muitas relações entre as instancias, ex, famílias
– relações recursivas entre as instancias, ex, ancestral
– dependências existenciais entre atributos, ex, casado, cônjuge
– poucos atributos definidos para todas as instancias
ex, númeroDeRodas e númeroDeMastros para veículos
– aninhamento ou hierarquias de valores para muitos atributos,
ex, nordeste, PE, Recife
26. Mineração de Dados – Aula 3
Flat File
• Arquivo texto:
– Metadados do cabeçalho:
• 1a linha = nome do conceito ou relação a minerar
• Demais linhas = tipo e/ou conjunto de valores possíveis de um
atributo.
– Dados no resto do arquivo:
• cada linha = um exemplo ou instância do conceito a aprender
um registro de uma tabela de BD relacional
separadas em campos por separadores convencionais
• cada campo = um atributo ou propriedade da instância
campo de uma tabela de BD relacional
27. Mineração de Dados – Aula 3
Flat File
% Arff file for the weather data with some numeric features
@relation weather
@attribute outlook { sunny, overcast, rainy }
@attribute temperature numeric
@attribute humidity numeric
@attribute windy { true, false }
@attribute play? { yes, no }
@data
sunny, 85, 85, false, no
sunny, 80, 90, true, no
overcast, 83, 86, false, yes
rainy, 70, 96, false, yes
rainy, 68, 80, false, yes
...
28. Mineração de Dados – Aula 3
Alguns Links
• http://www.kdnuggets.com/datasets/kddcup.html
• http://kdd.ics.uci.edu/
• http://archive.ics.uci.edu/ml/datasets.html
• http://weka.wikispaces.com/Databases
• http://www.kdnuggets.com/datasets/competitions.html
• http://www.kdnuggets.com/datasets/
29. Mineração de Dados – Aula 3
Revisão
• Objetivo:
– Classificar os sistemas de mineração de dados.
• Conteúdo:
– Classificação quanto ao tipo de base de dados.
• Referências:
– Han, seções 1.3 e 1.6
30. Mineração de Dados – Aula 3
Atividades
• Explique através de exemplos as diferenças e similaridades
entre data warehouse e base de dados .
• Os engenhos de busca na web podem ser considerados uma
forma de mineração? Explique.
• Pesquise e relate com detalhes estudos realizados com bases
de dados públicas.