SlideShare uma empresa Scribd logo
Weka – Ferramenta Livre para Mineração de Dados
Acadêmico: Rubem Ventura
Agenda
● O que é Weka?
● Introdução
● Vantagens de Weka
● Sistemas Operacionais
● O Livro da Weka
● Alguns Algorítimos
● Formato .ARFF
● Weka Explorer
O que é Weka?
O que é Weka?
Weka é um Software livre do tipo open source
para mineração de dados, desenvolvido em Java,
dentro das especificações da GPL
(General Public License).
Introdução
Desenvolvido por um grupo de pesquisadores da
Universidade de Waikato, Nova Zelândia em 1993.
Sigla WEKA(Waikato Environment for Knowledge
Analysis) criada por Geoff Holmes .
Em 1997, foi tomada a decisão de reconstruir Weka
do zero em Java, incluindo implementações de
algoritmos de modelagem.
Introdução
Em 2005, Weka recebeu o SIGKDD Data Mining e o
prêmio de serviço de descoberta de conhecimento.
Em 2006, Pentaho Corporation adquiriu a licença
exclusiva para usar o Weka para business intelligence.
Forma a mineração de dados e a componente de análise
preditiva da suíte Pentaho de inteligência empresarial.
Versão Atual: 3.7.12
Introdução
Seu ponto forte é a tarefa de classificação, mas também
é capaz de minerar regras de associação e clusters de
dados.
Pode ser utilizada no modo console ou através da
interface gráfica Weka Explorer.
Ao longo dos anos se consolidou como a ferramenta de
data mining mais utilizada em ambiente acadêmico.
Vantagens de Weka
● Software Livre.
● Portabilidade.
● Uma coleção completa de dados de pré-
processamento e técnicas de modelagem.
● Facilidade de utilização com sua interfaces
gráficas de usuário.
Sistemas Operacionais
● Windows x86
● Mac OS X
● Linux
● Link para Download
http://www.cs.waikato.ac.nz/ml/weka/downloading.html
O Livro da Weka
As características da Weka e as
técnicas nela implementadas são
apresentadas no livro “Data Mining:
Practical Machine Learning Tools and
Techniques”.
• Os autores do livro são os
idealizadores da ferramenta.
Alguns Algorítimos
● Aprendizagem de máquina
● Classificação baseados em redes neurais
● Estatística
● Outros
Formato .ARFF
Um arquivo no formato .ARFF é um arquivo de texto puro,
composto de três partes:
● Relação
● Atributos
● Dados
Formato .ARFF
%comentário
@relation pessoa
@attribute sexo {M,F}
@attribute idade real
@attribute doente {sim, não}
@data
M,17,não
F,15,sim
M,25,nao
F,18,nao
M,22,sim
Weka Explorer
Interface gráfica que permite a execução dos algoritmos
de data mining da Weka de forma interativa.
Weka Explorer
Interface
Onde conseguir mais informações?
● http://weka.pentaho.com/
● http://www.cs.waikato.ac.nz/ml/weka/
● Mineração de Dados - Conceitos, Aplicações e Experimentos com Weka
– http://www.lbd.dcc.ufmg.br/colecoes/erirjes/2004/004.pdf
● Sítio da IBM
– Mineração de dados com WEKA, Parte 1: Introdução e regressão
● http://www.ibm.com/developerworks/br/opensource/library/os-weka1/
– Mineração de dados com o WEKA, Parte 2: Classificação e
armazenamento em cluster
● http://www.ibm.com/developerworks/br/opensource/library/os-weka2/
Considerações finais
Weka é uma ferramenta Flexível
● Diversos Algorítimos
● Permite a descoberta de conhecimento tanto via interface com o usuário
quanto embutida na aplicação do desenvolvedor.
● Pode ser utilizada não somente para Data Mining.
Referências
● Weka 3 - Data Mining with Open Source Machine Learning Software in Java
<http://www.cs.waikato.ac.nz/ml/weka/index.html>
Ian H. Witten; Eibe Frank; Mark A. Hall (2011). "Data Mining: Practical
machine learning tools and techniques, 3rd Edition"
Obrigado =)

Mais conteúdo relacionado

Mais procurados

Java: Classes Abstratas, Anônimas, Interface
Java: Classes Abstratas, Anônimas, InterfaceJava: Classes Abstratas, Anônimas, Interface
Java: Classes Abstratas, Anônimas, Interface
Arthur Emanuel
 
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
Ambiente Livre
 
POO - 21 - Java e Banco de Dados
POO - 21 - Java e Banco de DadosPOO - 21 - Java e Banco de Dados
POO - 21 - Java e Banco de Dados
Ludimila Monjardim Casagrande
 
Aprendendo a Usar o Netbeans
Aprendendo a Usar o NetbeansAprendendo a Usar o Netbeans
Aprendendo a Usar o Netbeans
Tiago Antônio da Silva
 
Diagrama de Atividades - UML
Diagrama de Atividades - UMLDiagrama de Atividades - UML
Diagrama de Atividades - UML
Vinícius Barros
 
Mineração de Dados no Weka - Regressão Linear
Mineração de Dados no Weka -  Regressão LinearMineração de Dados no Weka -  Regressão Linear
Mineração de Dados no Weka - Regressão Linear
João Gabriel Lima
 
Jawsdays2021 Amazon Connect愛について語り尽くす
Jawsdays2021 Amazon Connect愛について語り尽くすJawsdays2021 Amazon Connect愛について語り尽くす
Jawsdays2021 Amazon Connect愛について語り尽くす
Shinya Yamada
 
Introduction to Graph Database
Introduction to Graph DatabaseIntroduction to Graph Database
Introduction to Graph Database
Eric Lee
 
Conceitos Básicos Sobre Analise de Sistemas
Conceitos Básicos Sobre Analise de SistemasConceitos Básicos Sobre Analise de Sistemas
Conceitos Básicos Sobre Analise de Sistemas
Clayton de Almeida Souza
 
[Curso Java Basico - Orientacaoo a Objetos] Aula 24: Classes e atributos
[Curso Java Basico - Orientacaoo a Objetos] Aula 24: Classes e atributos[Curso Java Basico - Orientacaoo a Objetos] Aula 24: Classes e atributos
[Curso Java Basico - Orientacaoo a Objetos] Aula 24: Classes e atributos
Loiane Groner
 
Node.js - #1 - Introdução - Rodrigo Branas
Node.js - #1 - Introdução - Rodrigo BranasNode.js - #1 - Introdução - Rodrigo Branas
Node.js - #1 - Introdução - Rodrigo Branas
Rodrigo Branas
 
Calculadora Cientifica no visualg
Calculadora Cientifica no visualgCalculadora Cientifica no visualg
Calculadora Cientifica no visualg
Denise Marinho
 
AWS Lambda@Edge でできること!
AWS Lambda@Edge でできること!AWS Lambda@Edge でできること!
AWS Lambda@Edge でできること!
Amazon Web Services Japan
 
Intro to r & hadoop
Intro to r & hadoopIntro to r & hadoop
Intro to r & hadoop
Seong-Bok Lee
 
Aula 07 - Diagrama de sequencia
Aula 07 - Diagrama de sequenciaAula 07 - Diagrama de sequencia
Aula 07 - Diagrama de sequencia
Leinylson Fontinele
 
Modelo de Referência OSI
Modelo de Referência OSIModelo de Referência OSI
Modelo de Referência OSI
Alberto Felipe Friderichs Barros
 
Aula1 - Apresentação de Banco de Dados
Aula1 - Apresentação de Banco de DadosAula1 - Apresentação de Banco de Dados
Aula1 - Apresentação de Banco de Dados
Rafael Albani
 
Deploying MongoDB sharded clusters easily with Terraform and Ansible
Deploying MongoDB sharded clusters easily with Terraform and AnsibleDeploying MongoDB sharded clusters easily with Terraform and Ansible
Deploying MongoDB sharded clusters easily with Terraform and Ansible
All Things Open
 
Arrays (vetores) em Java
Arrays (vetores) em JavaArrays (vetores) em Java
Arrays (vetores) em Java
Daniel Brandão
 
Banco de Dados II Aula Prática 1 (Conversão do modelo conceitual para modelo ...
Banco de Dados II Aula Prática 1 (Conversão do modelo conceitual para modelo ...Banco de Dados II Aula Prática 1 (Conversão do modelo conceitual para modelo ...
Banco de Dados II Aula Prática 1 (Conversão do modelo conceitual para modelo ...
Leinylson Fontinele
 

Mais procurados (20)

Java: Classes Abstratas, Anônimas, Interface
Java: Classes Abstratas, Anônimas, InterfaceJava: Classes Abstratas, Anônimas, Interface
Java: Classes Abstratas, Anônimas, Interface
 
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
Escalabilidade Linear com o Banco de Dados NoSQL Apache Cassandra.
 
POO - 21 - Java e Banco de Dados
POO - 21 - Java e Banco de DadosPOO - 21 - Java e Banco de Dados
POO - 21 - Java e Banco de Dados
 
Aprendendo a Usar o Netbeans
Aprendendo a Usar o NetbeansAprendendo a Usar o Netbeans
Aprendendo a Usar o Netbeans
 
Diagrama de Atividades - UML
Diagrama de Atividades - UMLDiagrama de Atividades - UML
Diagrama de Atividades - UML
 
Mineração de Dados no Weka - Regressão Linear
Mineração de Dados no Weka -  Regressão LinearMineração de Dados no Weka -  Regressão Linear
Mineração de Dados no Weka - Regressão Linear
 
Jawsdays2021 Amazon Connect愛について語り尽くす
Jawsdays2021 Amazon Connect愛について語り尽くすJawsdays2021 Amazon Connect愛について語り尽くす
Jawsdays2021 Amazon Connect愛について語り尽くす
 
Introduction to Graph Database
Introduction to Graph DatabaseIntroduction to Graph Database
Introduction to Graph Database
 
Conceitos Básicos Sobre Analise de Sistemas
Conceitos Básicos Sobre Analise de SistemasConceitos Básicos Sobre Analise de Sistemas
Conceitos Básicos Sobre Analise de Sistemas
 
[Curso Java Basico - Orientacaoo a Objetos] Aula 24: Classes e atributos
[Curso Java Basico - Orientacaoo a Objetos] Aula 24: Classes e atributos[Curso Java Basico - Orientacaoo a Objetos] Aula 24: Classes e atributos
[Curso Java Basico - Orientacaoo a Objetos] Aula 24: Classes e atributos
 
Node.js - #1 - Introdução - Rodrigo Branas
Node.js - #1 - Introdução - Rodrigo BranasNode.js - #1 - Introdução - Rodrigo Branas
Node.js - #1 - Introdução - Rodrigo Branas
 
Calculadora Cientifica no visualg
Calculadora Cientifica no visualgCalculadora Cientifica no visualg
Calculadora Cientifica no visualg
 
AWS Lambda@Edge でできること!
AWS Lambda@Edge でできること!AWS Lambda@Edge でできること!
AWS Lambda@Edge でできること!
 
Intro to r & hadoop
Intro to r & hadoopIntro to r & hadoop
Intro to r & hadoop
 
Aula 07 - Diagrama de sequencia
Aula 07 - Diagrama de sequenciaAula 07 - Diagrama de sequencia
Aula 07 - Diagrama de sequencia
 
Modelo de Referência OSI
Modelo de Referência OSIModelo de Referência OSI
Modelo de Referência OSI
 
Aula1 - Apresentação de Banco de Dados
Aula1 - Apresentação de Banco de DadosAula1 - Apresentação de Banco de Dados
Aula1 - Apresentação de Banco de Dados
 
Deploying MongoDB sharded clusters easily with Terraform and Ansible
Deploying MongoDB sharded clusters easily with Terraform and AnsibleDeploying MongoDB sharded clusters easily with Terraform and Ansible
Deploying MongoDB sharded clusters easily with Terraform and Ansible
 
Arrays (vetores) em Java
Arrays (vetores) em JavaArrays (vetores) em Java
Arrays (vetores) em Java
 
Banco de Dados II Aula Prática 1 (Conversão do modelo conceitual para modelo ...
Banco de Dados II Aula Prática 1 (Conversão do modelo conceitual para modelo ...Banco de Dados II Aula Prática 1 (Conversão do modelo conceitual para modelo ...
Banco de Dados II Aula Prática 1 (Conversão do modelo conceitual para modelo ...
 

Destaque

Ferramentas para Mineração de Dados
Ferramentas para Mineração de DadosFerramentas para Mineração de Dados
Ferramentas para Mineração de Dados
Manoel Amaro
 
Boas práticas para aplicativos android
Boas práticas para aplicativos androidBoas práticas para aplicativos android
Boas práticas para aplicativos android
Juliana Akemi
 
Mineração de dados na prática com RapidMiner e Weka
Mineração de dados na prática com RapidMiner e WekaMineração de dados na prática com RapidMiner e Weka
Mineração de dados na prática com RapidMiner e Weka
João Gabriel Lima
 
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
João Gabriel Lima
 
Weka em aplicações java
Weka em aplicações javaWeka em aplicações java
Weka em aplicações java
Marcio Palheta
 
DevCamp 2014 - Mineração de Dados com Weka API - Everton Gago
DevCamp 2014 - Mineração de Dados com Weka API - Everton GagoDevCamp 2014 - Mineração de Dados com Weka API - Everton Gago
DevCamp 2014 - Mineração de Dados com Weka API - Everton Gago
DevCamp Campinas
 
Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011
Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011
Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011
Caio Moreno
 
Weka básico
Weka básicoWeka básico
Weka básico
Lilian Dias
 
Filiação partidária e risco de corrupção de servidores públicos federais
Filiação partidária e risco de corrupção de servidores públicos federaisFiliação partidária e risco de corrupção de servidores públicos federais
Filiação partidária e risco de corrupção de servidores públicos federais
Rommel Carvalho
 
Uso de mineração de dados e textos para cálculo de preços de referência em co...
Uso de mineração de dados e textos para cálculo de preços de referência em co...Uso de mineração de dados e textos para cálculo de preços de referência em co...
Uso de mineração de dados e textos para cálculo de preços de referência em co...
Rommel Carvalho
 
Turbinando sua aplicação com Lucene, Solr e Hibernate Search
Turbinando sua aplicação com Lucene, Solr e Hibernate SearchTurbinando sua aplicação com Lucene, Solr e Hibernate Search
Turbinando sua aplicação com Lucene, Solr e Hibernate Search
Paulo César M Jeveaux
 
Bi2 modelagem e qualidade-carlos barbieri-figuras corrigidas v02
Bi2 modelagem e qualidade-carlos barbieri-figuras corrigidas v02Bi2 modelagem e qualidade-carlos barbieri-figuras corrigidas v02
Bi2 modelagem e qualidade-carlos barbieri-figuras corrigidas v02
Carlos Barbieri
 
Data mining: Auxiliando as empresas na tomada de decisão
Data mining: Auxiliando as empresas na tomada de decisãoData mining: Auxiliando as empresas na tomada de decisão
Data mining: Auxiliando as empresas na tomada de decisão
AntonioEE256
 
Oficina Pentaho
Oficina PentahoOficina Pentaho
Oficina Pentaho
Wesley Seidel
 
KDD e Data Mining
KDD e Data MiningKDD e Data Mining
KDD e Data Mining
Thiago Oliveira
 
Aplicação de técnicas de mineração de textos para classificação automática de...
Aplicação de técnicas de mineração de textos para classificação automática de...Aplicação de técnicas de mineração de textos para classificação automática de...
Aplicação de técnicas de mineração de textos para classificação automática de...
Rommel Carvalho
 
Pesquisa Operacional - Definição e Origem
Pesquisa Operacional - Definição e OrigemPesquisa Operacional - Definição e Origem
Pesquisa Operacional - Definição e Origem
Adriano Maranhão
 
Extração de informações de texto e cálculo de similaridade usando Apache Lucene
Extração de informações de texto e cálculo de similaridade usando Apache LuceneExtração de informações de texto e cálculo de similaridade usando Apache Lucene
Extração de informações de texto e cálculo de similaridade usando Apache Lucene
André Luis Schwerz
 
Text Mining
Text MiningText Mining
Text Mining
dp6
 
Data Mining e Data Warehouse
Data Mining e Data WarehouseData Mining e Data Warehouse
Data Mining e Data Warehouse
JeorgeCarmona
 

Destaque (20)

Ferramentas para Mineração de Dados
Ferramentas para Mineração de DadosFerramentas para Mineração de Dados
Ferramentas para Mineração de Dados
 
Boas práticas para aplicativos android
Boas práticas para aplicativos androidBoas práticas para aplicativos android
Boas práticas para aplicativos android
 
Mineração de dados na prática com RapidMiner e Weka
Mineração de dados na prática com RapidMiner e WekaMineração de dados na prática com RapidMiner e Weka
Mineração de dados na prática com RapidMiner e Weka
 
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
Mineração de Dados com RapidMiner - Um Estudo de caso sobre o Churn Rate em...
 
Weka em aplicações java
Weka em aplicações javaWeka em aplicações java
Weka em aplicações java
 
DevCamp 2014 - Mineração de Dados com Weka API - Everton Gago
DevCamp 2014 - Mineração de Dados com Weka API - Everton GagoDevCamp 2014 - Mineração de Dados com Weka API - Everton Gago
DevCamp 2014 - Mineração de Dados com Weka API - Everton Gago
 
Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011
Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011
Pentaho: Inteligência de Negócios utilizando software livre @Campus Party 2011
 
Weka básico
Weka básicoWeka básico
Weka básico
 
Filiação partidária e risco de corrupção de servidores públicos federais
Filiação partidária e risco de corrupção de servidores públicos federaisFiliação partidária e risco de corrupção de servidores públicos federais
Filiação partidária e risco de corrupção de servidores públicos federais
 
Uso de mineração de dados e textos para cálculo de preços de referência em co...
Uso de mineração de dados e textos para cálculo de preços de referência em co...Uso de mineração de dados e textos para cálculo de preços de referência em co...
Uso de mineração de dados e textos para cálculo de preços de referência em co...
 
Turbinando sua aplicação com Lucene, Solr e Hibernate Search
Turbinando sua aplicação com Lucene, Solr e Hibernate SearchTurbinando sua aplicação com Lucene, Solr e Hibernate Search
Turbinando sua aplicação com Lucene, Solr e Hibernate Search
 
Bi2 modelagem e qualidade-carlos barbieri-figuras corrigidas v02
Bi2 modelagem e qualidade-carlos barbieri-figuras corrigidas v02Bi2 modelagem e qualidade-carlos barbieri-figuras corrigidas v02
Bi2 modelagem e qualidade-carlos barbieri-figuras corrigidas v02
 
Data mining: Auxiliando as empresas na tomada de decisão
Data mining: Auxiliando as empresas na tomada de decisãoData mining: Auxiliando as empresas na tomada de decisão
Data mining: Auxiliando as empresas na tomada de decisão
 
Oficina Pentaho
Oficina PentahoOficina Pentaho
Oficina Pentaho
 
KDD e Data Mining
KDD e Data MiningKDD e Data Mining
KDD e Data Mining
 
Aplicação de técnicas de mineração de textos para classificação automática de...
Aplicação de técnicas de mineração de textos para classificação automática de...Aplicação de técnicas de mineração de textos para classificação automática de...
Aplicação de técnicas de mineração de textos para classificação automática de...
 
Pesquisa Operacional - Definição e Origem
Pesquisa Operacional - Definição e OrigemPesquisa Operacional - Definição e Origem
Pesquisa Operacional - Definição e Origem
 
Extração de informações de texto e cálculo de similaridade usando Apache Lucene
Extração de informações de texto e cálculo de similaridade usando Apache LuceneExtração de informações de texto e cálculo de similaridade usando Apache Lucene
Extração de informações de texto e cálculo de similaridade usando Apache Lucene
 
Text Mining
Text MiningText Mining
Text Mining
 
Data Mining e Data Warehouse
Data Mining e Data WarehouseData Mining e Data Warehouse
Data Mining e Data Warehouse
 

Semelhante a Weka – Ferramenta Livre para Mineração de Dados

Weka - IA
Weka - IAWeka - IA
Weka - IA
Péricles Narbal
 
Python x R: mas e o Weka?
Python x R: mas e o Weka? Python x R: mas e o Weka?
Python x R: mas e o Weka?
pichiliani
 
TDC2016SP - Python x R: mas e o Weka?
TDC2016SP - Python x R: mas e o Weka?TDC2016SP - Python x R: mas e o Weka?
TDC2016SP - Python x R: mas e o Weka?
tdc-globalcode
 
Template_Faculdade_Apache Kafka.pdf
Template_Faculdade_Apache Kafka.pdfTemplate_Faculdade_Apache Kafka.pdf
Template_Faculdade_Apache Kafka.pdf
Valdir Adorni
 
Cacti
CactiCacti
Frameworks em Java
Frameworks em JavaFrameworks em Java
Frameworks em Java
Luis Fernando Pimenta
 
LabTeX Presentation
LabTeX  PresentationLabTeX  Presentation
LabTeX Presentation
Fernando José Capeletto Neto
 
Bi ferramentas olap 1
Bi   ferramentas olap 1Bi   ferramentas olap 1
Bi ferramentas olap 1
Ricardo Sonaglio Albano
 
Projeto Indiana
Projeto IndianaProjeto Indiana
Projeto Indiana
hellequin
 
Ferramentas de monitoramento de redes de computadors
Ferramentas de monitoramento de redes de computadorsFerramentas de monitoramento de redes de computadors
Ferramentas de monitoramento de redes de computadors
UFPA
 
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...
IT4biz IT Solutions
 
Pentaho inteligência de negócios utilizando software livre campus party 2011
Pentaho  inteligência de negócios utilizando software livre   campus party 2011Pentaho  inteligência de negócios utilizando software livre   campus party 2011
Pentaho inteligência de negócios utilizando software livre campus party 2011
Campus Party Brasil
 
Apresentação geral do curso PUC (2).pptx
Apresentação geral do curso PUC (2).pptxApresentação geral do curso PUC (2).pptx
Apresentação geral do curso PUC (2).pptx
VtorCarvalho20
 
Machine Learning Black Boxes
Machine Learning Black BoxesMachine Learning Black Boxes
Machine Learning Black Boxes
Denis Wilson Souza Rosa
 
TDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho Duro
TDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho DuroTDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho Duro
TDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho Duro
tdc-globalcode
 
Desmitificando as aplicações RESTFul usando Django Rest Framework
Desmitificando as aplicações RESTFul usando Django Rest FrameworkDesmitificando as aplicações RESTFul usando Django Rest Framework
Desmitificando as aplicações RESTFul usando Django Rest Framework
Bruno Oliveira
 
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto AlegreInteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
IT4biz IT Solutions
 
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto AlegreInteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
Caio Moreno
 
Flisol 2016 fidelis - Curitiba - PR - Brazil
Flisol 2016   fidelis - Curitiba - PR - BrazilFlisol 2016   fidelis - Curitiba - PR - Brazil
Flisol 2016 fidelis - Curitiba - PR - Brazil
Marcos Vinicius Fidelis
 
Banco de dados
Banco de dadosBanco de dados
Banco de dados
Elaine Cecília Gatto
 

Semelhante a Weka – Ferramenta Livre para Mineração de Dados (20)

Weka - IA
Weka - IAWeka - IA
Weka - IA
 
Python x R: mas e o Weka?
Python x R: mas e o Weka? Python x R: mas e o Weka?
Python x R: mas e o Weka?
 
TDC2016SP - Python x R: mas e o Weka?
TDC2016SP - Python x R: mas e o Weka?TDC2016SP - Python x R: mas e o Weka?
TDC2016SP - Python x R: mas e o Weka?
 
Template_Faculdade_Apache Kafka.pdf
Template_Faculdade_Apache Kafka.pdfTemplate_Faculdade_Apache Kafka.pdf
Template_Faculdade_Apache Kafka.pdf
 
Cacti
CactiCacti
Cacti
 
Frameworks em Java
Frameworks em JavaFrameworks em Java
Frameworks em Java
 
LabTeX Presentation
LabTeX  PresentationLabTeX  Presentation
LabTeX Presentation
 
Bi ferramentas olap 1
Bi   ferramentas olap 1Bi   ferramentas olap 1
Bi ferramentas olap 1
 
Projeto Indiana
Projeto IndianaProjeto Indiana
Projeto Indiana
 
Ferramentas de monitoramento de redes de computadors
Ferramentas de monitoramento de redes de computadorsFerramentas de monitoramento de redes de computadors
Ferramentas de monitoramento de redes de computadors
 
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...
Pentaho: Inteligência de Negócios utilizando Software Livre @ Telefonica Camp...
 
Pentaho inteligência de negócios utilizando software livre campus party 2011
Pentaho  inteligência de negócios utilizando software livre   campus party 2011Pentaho  inteligência de negócios utilizando software livre   campus party 2011
Pentaho inteligência de negócios utilizando software livre campus party 2011
 
Apresentação geral do curso PUC (2).pptx
Apresentação geral do curso PUC (2).pptxApresentação geral do curso PUC (2).pptx
Apresentação geral do curso PUC (2).pptx
 
Machine Learning Black Boxes
Machine Learning Black BoxesMachine Learning Black Boxes
Machine Learning Black Boxes
 
TDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho Duro
TDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho DuroTDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho Duro
TDC2016SP - Machine Learning Black Boxes - Terceirizando o Trabalho Duro
 
Desmitificando as aplicações RESTFul usando Django Rest Framework
Desmitificando as aplicações RESTFul usando Django Rest FrameworkDesmitificando as aplicações RESTFul usando Django Rest Framework
Desmitificando as aplicações RESTFul usando Django Rest Framework
 
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto AlegreInteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
 
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto AlegreInteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
Inteligência de Negócios (BI) utilizando Software Livre @ FISL 12 - Porto Alegre
 
Flisol 2016 fidelis - Curitiba - PR - Brazil
Flisol 2016   fidelis - Curitiba - PR - BrazilFlisol 2016   fidelis - Curitiba - PR - Brazil
Flisol 2016 fidelis - Curitiba - PR - Brazil
 
Banco de dados
Banco de dadosBanco de dados
Banco de dados
 

Weka – Ferramenta Livre para Mineração de Dados

  • 1. Weka – Ferramenta Livre para Mineração de Dados Acadêmico: Rubem Ventura
  • 2. Agenda ● O que é Weka? ● Introdução ● Vantagens de Weka ● Sistemas Operacionais ● O Livro da Weka ● Alguns Algorítimos ● Formato .ARFF ● Weka Explorer
  • 3. O que é Weka?
  • 4. O que é Weka? Weka é um Software livre do tipo open source para mineração de dados, desenvolvido em Java, dentro das especificações da GPL (General Public License).
  • 5. Introdução Desenvolvido por um grupo de pesquisadores da Universidade de Waikato, Nova Zelândia em 1993. Sigla WEKA(Waikato Environment for Knowledge Analysis) criada por Geoff Holmes . Em 1997, foi tomada a decisão de reconstruir Weka do zero em Java, incluindo implementações de algoritmos de modelagem.
  • 6. Introdução Em 2005, Weka recebeu o SIGKDD Data Mining e o prêmio de serviço de descoberta de conhecimento. Em 2006, Pentaho Corporation adquiriu a licença exclusiva para usar o Weka para business intelligence. Forma a mineração de dados e a componente de análise preditiva da suíte Pentaho de inteligência empresarial. Versão Atual: 3.7.12
  • 7. Introdução Seu ponto forte é a tarefa de classificação, mas também é capaz de minerar regras de associação e clusters de dados. Pode ser utilizada no modo console ou através da interface gráfica Weka Explorer. Ao longo dos anos se consolidou como a ferramenta de data mining mais utilizada em ambiente acadêmico.
  • 8. Vantagens de Weka ● Software Livre. ● Portabilidade. ● Uma coleção completa de dados de pré- processamento e técnicas de modelagem. ● Facilidade de utilização com sua interfaces gráficas de usuário.
  • 9. Sistemas Operacionais ● Windows x86 ● Mac OS X ● Linux ● Link para Download http://www.cs.waikato.ac.nz/ml/weka/downloading.html
  • 10. O Livro da Weka As características da Weka e as técnicas nela implementadas são apresentadas no livro “Data Mining: Practical Machine Learning Tools and Techniques”. • Os autores do livro são os idealizadores da ferramenta.
  • 11. Alguns Algorítimos ● Aprendizagem de máquina ● Classificação baseados em redes neurais ● Estatística ● Outros
  • 12. Formato .ARFF Um arquivo no formato .ARFF é um arquivo de texto puro, composto de três partes: ● Relação ● Atributos ● Dados
  • 13. Formato .ARFF %comentário @relation pessoa @attribute sexo {M,F} @attribute idade real @attribute doente {sim, não} @data M,17,não F,15,sim M,25,nao F,18,nao M,22,sim
  • 14. Weka Explorer Interface gráfica que permite a execução dos algoritmos de data mining da Weka de forma interativa.
  • 16. Onde conseguir mais informações? ● http://weka.pentaho.com/ ● http://www.cs.waikato.ac.nz/ml/weka/ ● Mineração de Dados - Conceitos, Aplicações e Experimentos com Weka – http://www.lbd.dcc.ufmg.br/colecoes/erirjes/2004/004.pdf ● Sítio da IBM – Mineração de dados com WEKA, Parte 1: Introdução e regressão ● http://www.ibm.com/developerworks/br/opensource/library/os-weka1/ – Mineração de dados com o WEKA, Parte 2: Classificação e armazenamento em cluster ● http://www.ibm.com/developerworks/br/opensource/library/os-weka2/
  • 17. Considerações finais Weka é uma ferramenta Flexível ● Diversos Algorítimos ● Permite a descoberta de conhecimento tanto via interface com o usuário quanto embutida na aplicação do desenvolvedor. ● Pode ser utilizada não somente para Data Mining.
  • 18. Referências ● Weka 3 - Data Mining with Open Source Machine Learning Software in Java <http://www.cs.waikato.ac.nz/ml/weka/index.html> Ian H. Witten; Eibe Frank; Mark A. Hall (2011). "Data Mining: Practical machine learning tools and techniques, 3rd Edition"