23/05/14 IA - Prof. Paulemir Campos 1
WEKA 3.4.12
UPE – Caruaru – Sistemas de Informação
Disciplina: Inteligência Artificial
Prof.: Paulemir G. Campos
23/05/14 IA - Prof. Paulemir Campos 2
Roteiro da Apresentação
 Introdução
 Download e Instalação
 A Interface Gráfica
 Formato dos Dados
 Bibliografia
23/05/14 IA - Prof. Paulemir Campos 3
Introdução
23/05/14 IA - Prof. Paulemir Campos 4
WEKA – Waikato Environment
for Knowledge Analysis
 Software de Mineração de Dados
escrito em Java;
 Versão adotada: 3.4.12; (Atual: 3.4.15)
 Open Source de acordo com a GNU
(General Public Licence);
 Permite que o usuário execute seus
próprios métodos (em Java).
23/05/14 IA - Prof. Paulemir Campos 5
WEKA – Waikato Environment
for Knowledge Analysis
 Contém ferramentas para:
 Pré-Processamento dos Dados;
 Classificação;
 Regressão;
 Clustering;
 Regras de Associação;
 Visualização, entre outras.
23/05/14 IA - Prof. Paulemir Campos 6
WEKA – Waikato Environment
for Knowledge Analysis
 Possui uma coleção de algoritmos de
aprendizado de máquina prontos para
utilização, tais como:
 Classificação:

Regressão Linear;

Rede MLP e RBF;

Bagging;

Árvores de Decisão ID3 e C4.5 (J48).
23/05/14 IA - Prof. Paulemir Campos 7
WEKA – Waikato Environment
for Knowledge Analysis
 Cluster:

Simples K-Means.
 Regras de Associação:

APRIORI.
 Seleção de Atributos:

Análise de Componentes Principais.
23/05/14 IA - Prof. Paulemir Campos 8
Download e Instalação
23/05/14 IA - Prof. Paulemir Campos 9
Download
 Basta acessar o site:
http://www.cs.waikato.ac.nz/~ml/weka/index.html
 Escolher o instalador disponível para o seu Sistema
Operacional, que pode ser:
 Linux, Mac OS X ou Windows.
 Requerimento:
 Ambiente de Execução Java 1.4.
 Exemplo: No link abaixo, você faz o download automático de
instalador do Weka 3.4.12 já com o ambiente Java 1.4
embutido para Windows.
http://ufpr.dl.sourceforge.net/sourceforge/weka/weka-3-4-12jre.exe
23/05/14 IA - Prof. Paulemir Campos 10
Instalação
 A instalação é bastante simples.
 Depois de efetuar o download, por exemplo,
da versão 3.4.12 para Windows com
ambiente Java 1.4 embutido, basta executar
o instalador e ir seguindo as orientações na
tela.
23/05/14 IA - Prof. Paulemir Campos 11
Interface Gráfica
23/05/14 IA - Prof. Paulemir Campos 12
WEKA GUI
Chooser
 Interfaces Disponíveis:
 Simple CLI
 Explorer
 Experimenter
 KnowledgeFlow
23/05/14 IA - Prof. Paulemir Campos 13
WEKA – Simple CLI
23/05/14 IA - Prof. Paulemir Campos 14
WEKA – Explorer
23/05/14 IA - Prof. Paulemir Campos 15
WEKA – Experimenter
23/05/14 IA - Prof. Paulemir Campos 16
WEKA – KnowledgeFlow
23/05/14 IA - Prof. Paulemir Campos 17
Formato do Dados
23/05/14 IA - Prof. Paulemir Campos 18
Arquivo ARFF
 O principal
formato de
dados
suportado pelo
WEKA 3.4.12 é
o ARFF
(Attribute-
Relation File
Format),
conforme
exemplificado
ao lado.
% 1. Title: Iris Plants Database
@RELATION iris
@ATTRIBUTE sepallength NUMERIC
@ATTRIBUTE sepalwidth NUMERIC
@ATTRIBUTE petallength NUMERIC
@ATTRIBUTE petalwidth NUMERIC
@ATTRIBUTE class {Iris-setosa,Iris-versicolor,Iris-
virginica}
@DATA
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-versicolor
4.7,3.2,1.3,0.2,Iris-virginica
23/05/14 IA - Prof. Paulemir Campos 19
Arquivos de Banco de Dados
 O WEKA 3.4.12 também permite que
você importe os dados via JDBC e
ODBC.
 Exemplo:
 Importando dados do Microsoft Access.
23/05/14 IA - Prof. Paulemir Campos 20
Importando dados do
Microsoft Access
 Passo 1 (No Windows XP Professional)
 Vá até o Painel de Controle->Desempenho
e Manutenção->Ferramentas
Administrativas
 Escolha Fontes de Dados (ODBC)
 Na janela DSN do Usuário, escolha
Adicionar...
 Selecione o driver do Microsoft Access e
clique em Concluir. (Neste ponto você pode
evidentemente escolher um outro driver caso
necessite importar dados de outro banco de
dados)
 Digite o nome da fonte no campo Nome da
23/05/14 IA - Prof. Paulemir Campos 21
Importando dados do
Microsoft Access
 Passo 1 (No Windows XP Professional) -
Continuação
 Na seção Banco de Dados, clique em
Selecionar...
 Selecione o arquivo de banco de dados
desejado e clique em OK
 Clique agora em OK para encerrar seu DSN
 Note que seu DSN é agora listado em Fontes
de Dados do Usuário.
23/05/14 IA - Prof. Paulemir Campos 22
Importando dados do
Microsoft Access
 Passo 2
 Crie um arquivo chamado ‘DatabaseUtils.props’
no diretório corrente do Weka 3.4.12;
 O conteúdo deste arquivo deve ser:
jdbcDriver=sun.jdbc.odbc.JdbcOdbcDriver
jdbcURL=jdbc:odbc:dbname
Onde dbname é o nome que você deu ao seu DSN.
Obs.: Você pode alterar este nome durante a
execução da Interface Explorer do WEKA.
23/05/14 IA - Prof. Paulemir Campos 23
Importando dados do
Microsoft Access
 Passo 3
 Na janela de PreProcess do Explorer WEKA, escolha
Open DB...
 Altere o campo query para lê os dados:
'select * from tablename‘,
onde tablename é o nome da tabela do banco de dados que
você precisa obter os dados.
 Em databaseURL você indica onde os dados serão lidos:
'jdbc:odbc:dbname‘
onde dbname é o mesmo nome que você deu ao DSN do
usuário
 Por fim, clique em OK. Pronto!
23/05/14 IA - Prof. Paulemir Campos 24
Bibliografia
23/05/14 IA - Prof. Paulemir Campos 25
Referências
 Witten, I. H. & Frank, E. Data Mining:
Practical Machine Learning Tools
and Techniques with Java
Implementations. Morgan Kaufmann,
1999.
 http://www.cs.waikato.ac.nz/~ml/weka/index.html

Weka apresentação em slides

  • 1.
    23/05/14 IA -Prof. Paulemir Campos 1 WEKA 3.4.12 UPE – Caruaru – Sistemas de Informação Disciplina: Inteligência Artificial Prof.: Paulemir G. Campos
  • 2.
    23/05/14 IA -Prof. Paulemir Campos 2 Roteiro da Apresentação  Introdução  Download e Instalação  A Interface Gráfica  Formato dos Dados  Bibliografia
  • 3.
    23/05/14 IA -Prof. Paulemir Campos 3 Introdução
  • 4.
    23/05/14 IA -Prof. Paulemir Campos 4 WEKA – Waikato Environment for Knowledge Analysis  Software de Mineração de Dados escrito em Java;  Versão adotada: 3.4.12; (Atual: 3.4.15)  Open Source de acordo com a GNU (General Public Licence);  Permite que o usuário execute seus próprios métodos (em Java).
  • 5.
    23/05/14 IA -Prof. Paulemir Campos 5 WEKA – Waikato Environment for Knowledge Analysis  Contém ferramentas para:  Pré-Processamento dos Dados;  Classificação;  Regressão;  Clustering;  Regras de Associação;  Visualização, entre outras.
  • 6.
    23/05/14 IA -Prof. Paulemir Campos 6 WEKA – Waikato Environment for Knowledge Analysis  Possui uma coleção de algoritmos de aprendizado de máquina prontos para utilização, tais como:  Classificação:  Regressão Linear;  Rede MLP e RBF;  Bagging;  Árvores de Decisão ID3 e C4.5 (J48).
  • 7.
    23/05/14 IA -Prof. Paulemir Campos 7 WEKA – Waikato Environment for Knowledge Analysis  Cluster:  Simples K-Means.  Regras de Associação:  APRIORI.  Seleção de Atributos:  Análise de Componentes Principais.
  • 8.
    23/05/14 IA -Prof. Paulemir Campos 8 Download e Instalação
  • 9.
    23/05/14 IA -Prof. Paulemir Campos 9 Download  Basta acessar o site: http://www.cs.waikato.ac.nz/~ml/weka/index.html  Escolher o instalador disponível para o seu Sistema Operacional, que pode ser:  Linux, Mac OS X ou Windows.  Requerimento:  Ambiente de Execução Java 1.4.  Exemplo: No link abaixo, você faz o download automático de instalador do Weka 3.4.12 já com o ambiente Java 1.4 embutido para Windows. http://ufpr.dl.sourceforge.net/sourceforge/weka/weka-3-4-12jre.exe
  • 10.
    23/05/14 IA -Prof. Paulemir Campos 10 Instalação  A instalação é bastante simples.  Depois de efetuar o download, por exemplo, da versão 3.4.12 para Windows com ambiente Java 1.4 embutido, basta executar o instalador e ir seguindo as orientações na tela.
  • 11.
    23/05/14 IA -Prof. Paulemir Campos 11 Interface Gráfica
  • 12.
    23/05/14 IA -Prof. Paulemir Campos 12 WEKA GUI Chooser  Interfaces Disponíveis:  Simple CLI  Explorer  Experimenter  KnowledgeFlow
  • 13.
    23/05/14 IA -Prof. Paulemir Campos 13 WEKA – Simple CLI
  • 14.
    23/05/14 IA -Prof. Paulemir Campos 14 WEKA – Explorer
  • 15.
    23/05/14 IA -Prof. Paulemir Campos 15 WEKA – Experimenter
  • 16.
    23/05/14 IA -Prof. Paulemir Campos 16 WEKA – KnowledgeFlow
  • 17.
    23/05/14 IA -Prof. Paulemir Campos 17 Formato do Dados
  • 18.
    23/05/14 IA -Prof. Paulemir Campos 18 Arquivo ARFF  O principal formato de dados suportado pelo WEKA 3.4.12 é o ARFF (Attribute- Relation File Format), conforme exemplificado ao lado. % 1. Title: Iris Plants Database @RELATION iris @ATTRIBUTE sepallength NUMERIC @ATTRIBUTE sepalwidth NUMERIC @ATTRIBUTE petallength NUMERIC @ATTRIBUTE petalwidth NUMERIC @ATTRIBUTE class {Iris-setosa,Iris-versicolor,Iris- virginica} @DATA 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-versicolor 4.7,3.2,1.3,0.2,Iris-virginica
  • 19.
    23/05/14 IA -Prof. Paulemir Campos 19 Arquivos de Banco de Dados  O WEKA 3.4.12 também permite que você importe os dados via JDBC e ODBC.  Exemplo:  Importando dados do Microsoft Access.
  • 20.
    23/05/14 IA -Prof. Paulemir Campos 20 Importando dados do Microsoft Access  Passo 1 (No Windows XP Professional)  Vá até o Painel de Controle->Desempenho e Manutenção->Ferramentas Administrativas  Escolha Fontes de Dados (ODBC)  Na janela DSN do Usuário, escolha Adicionar...  Selecione o driver do Microsoft Access e clique em Concluir. (Neste ponto você pode evidentemente escolher um outro driver caso necessite importar dados de outro banco de dados)  Digite o nome da fonte no campo Nome da
  • 21.
    23/05/14 IA -Prof. Paulemir Campos 21 Importando dados do Microsoft Access  Passo 1 (No Windows XP Professional) - Continuação  Na seção Banco de Dados, clique em Selecionar...  Selecione o arquivo de banco de dados desejado e clique em OK  Clique agora em OK para encerrar seu DSN  Note que seu DSN é agora listado em Fontes de Dados do Usuário.
  • 22.
    23/05/14 IA -Prof. Paulemir Campos 22 Importando dados do Microsoft Access  Passo 2  Crie um arquivo chamado ‘DatabaseUtils.props’ no diretório corrente do Weka 3.4.12;  O conteúdo deste arquivo deve ser: jdbcDriver=sun.jdbc.odbc.JdbcOdbcDriver jdbcURL=jdbc:odbc:dbname Onde dbname é o nome que você deu ao seu DSN. Obs.: Você pode alterar este nome durante a execução da Interface Explorer do WEKA.
  • 23.
    23/05/14 IA -Prof. Paulemir Campos 23 Importando dados do Microsoft Access  Passo 3  Na janela de PreProcess do Explorer WEKA, escolha Open DB...  Altere o campo query para lê os dados: 'select * from tablename‘, onde tablename é o nome da tabela do banco de dados que você precisa obter os dados.  Em databaseURL você indica onde os dados serão lidos: 'jdbc:odbc:dbname‘ onde dbname é o mesmo nome que você deu ao DSN do usuário  Por fim, clique em OK. Pronto!
  • 24.
    23/05/14 IA -Prof. Paulemir Campos 24 Bibliografia
  • 25.
    23/05/14 IA -Prof. Paulemir Campos 25 Referências  Witten, I. H. & Frank, E. Data Mining: Practical Machine Learning Tools and Techniques with Java Implementations. Morgan Kaufmann, 1999.  http://www.cs.waikato.ac.nz/~ml/weka/index.html