O documento apresenta o software WEKA para mineração de dados, descrevendo sua introdução, download, instalação, interfaces gráficas, formato de dados suportados e referências bibliográficas.
1. 23/05/14 IA - Prof. Paulemir Campos 1
WEKA 3.4.12
UPE – Caruaru – Sistemas de Informação
Disciplina: Inteligência Artificial
Prof.: Paulemir G. Campos
2. 23/05/14 IA - Prof. Paulemir Campos 2
Roteiro da Apresentação
Introdução
Download e Instalação
A Interface Gráfica
Formato dos Dados
Bibliografia
4. 23/05/14 IA - Prof. Paulemir Campos 4
WEKA – Waikato Environment
for Knowledge Analysis
Software de Mineração de Dados
escrito em Java;
Versão adotada: 3.4.12; (Atual: 3.4.15)
Open Source de acordo com a GNU
(General Public Licence);
Permite que o usuário execute seus
próprios métodos (em Java).
5. 23/05/14 IA - Prof. Paulemir Campos 5
WEKA – Waikato Environment
for Knowledge Analysis
Contém ferramentas para:
Pré-Processamento dos Dados;
Classificação;
Regressão;
Clustering;
Regras de Associação;
Visualização, entre outras.
6. 23/05/14 IA - Prof. Paulemir Campos 6
WEKA – Waikato Environment
for Knowledge Analysis
Possui uma coleção de algoritmos de
aprendizado de máquina prontos para
utilização, tais como:
Classificação:
Regressão Linear;
Rede MLP e RBF;
Bagging;
Árvores de Decisão ID3 e C4.5 (J48).
7. 23/05/14 IA - Prof. Paulemir Campos 7
WEKA – Waikato Environment
for Knowledge Analysis
Cluster:
Simples K-Means.
Regras de Associação:
APRIORI.
Seleção de Atributos:
Análise de Componentes Principais.
8. 23/05/14 IA - Prof. Paulemir Campos 8
Download e Instalação
9. 23/05/14 IA - Prof. Paulemir Campos 9
Download
Basta acessar o site:
http://www.cs.waikato.ac.nz/~ml/weka/index.html
Escolher o instalador disponível para o seu Sistema
Operacional, que pode ser:
Linux, Mac OS X ou Windows.
Requerimento:
Ambiente de Execução Java 1.4.
Exemplo: No link abaixo, você faz o download automático de
instalador do Weka 3.4.12 já com o ambiente Java 1.4
embutido para Windows.
http://ufpr.dl.sourceforge.net/sourceforge/weka/weka-3-4-12jre.exe
10. 23/05/14 IA - Prof. Paulemir Campos 10
Instalação
A instalação é bastante simples.
Depois de efetuar o download, por exemplo,
da versão 3.4.12 para Windows com
ambiente Java 1.4 embutido, basta executar
o instalador e ir seguindo as orientações na
tela.
11. 23/05/14 IA - Prof. Paulemir Campos 11
Interface Gráfica
12. 23/05/14 IA - Prof. Paulemir Campos 12
WEKA GUI
Chooser
Interfaces Disponíveis:
Simple CLI
Explorer
Experimenter
KnowledgeFlow
13. 23/05/14 IA - Prof. Paulemir Campos 13
WEKA – Simple CLI
14. 23/05/14 IA - Prof. Paulemir Campos 14
WEKA – Explorer
15. 23/05/14 IA - Prof. Paulemir Campos 15
WEKA – Experimenter
16. 23/05/14 IA - Prof. Paulemir Campos 16
WEKA – KnowledgeFlow
17. 23/05/14 IA - Prof. Paulemir Campos 17
Formato do Dados
18. 23/05/14 IA - Prof. Paulemir Campos 18
Arquivo ARFF
O principal
formato de
dados
suportado pelo
WEKA 3.4.12 é
o ARFF
(Attribute-
Relation File
Format),
conforme
exemplificado
ao lado.
% 1. Title: Iris Plants Database
@RELATION iris
@ATTRIBUTE sepallength NUMERIC
@ATTRIBUTE sepalwidth NUMERIC
@ATTRIBUTE petallength NUMERIC
@ATTRIBUTE petalwidth NUMERIC
@ATTRIBUTE class {Iris-setosa,Iris-versicolor,Iris-
virginica}
@DATA
5.1,3.5,1.4,0.2,Iris-setosa
4.9,3.0,1.4,0.2,Iris-versicolor
4.7,3.2,1.3,0.2,Iris-virginica
19. 23/05/14 IA - Prof. Paulemir Campos 19
Arquivos de Banco de Dados
O WEKA 3.4.12 também permite que
você importe os dados via JDBC e
ODBC.
Exemplo:
Importando dados do Microsoft Access.
20. 23/05/14 IA - Prof. Paulemir Campos 20
Importando dados do
Microsoft Access
Passo 1 (No Windows XP Professional)
Vá até o Painel de Controle->Desempenho
e Manutenção->Ferramentas
Administrativas
Escolha Fontes de Dados (ODBC)
Na janela DSN do Usuário, escolha
Adicionar...
Selecione o driver do Microsoft Access e
clique em Concluir. (Neste ponto você pode
evidentemente escolher um outro driver caso
necessite importar dados de outro banco de
dados)
Digite o nome da fonte no campo Nome da
21. 23/05/14 IA - Prof. Paulemir Campos 21
Importando dados do
Microsoft Access
Passo 1 (No Windows XP Professional) -
Continuação
Na seção Banco de Dados, clique em
Selecionar...
Selecione o arquivo de banco de dados
desejado e clique em OK
Clique agora em OK para encerrar seu DSN
Note que seu DSN é agora listado em Fontes
de Dados do Usuário.
22. 23/05/14 IA - Prof. Paulemir Campos 22
Importando dados do
Microsoft Access
Passo 2
Crie um arquivo chamado ‘DatabaseUtils.props’
no diretório corrente do Weka 3.4.12;
O conteúdo deste arquivo deve ser:
jdbcDriver=sun.jdbc.odbc.JdbcOdbcDriver
jdbcURL=jdbc:odbc:dbname
Onde dbname é o nome que você deu ao seu DSN.
Obs.: Você pode alterar este nome durante a
execução da Interface Explorer do WEKA.
23. 23/05/14 IA - Prof. Paulemir Campos 23
Importando dados do
Microsoft Access
Passo 3
Na janela de PreProcess do Explorer WEKA, escolha
Open DB...
Altere o campo query para lê os dados:
'select * from tablename‘,
onde tablename é o nome da tabela do banco de dados que
você precisa obter os dados.
Em databaseURL você indica onde os dados serão lidos:
'jdbc:odbc:dbname‘
onde dbname é o mesmo nome que você deu ao DSN do
usuário
Por fim, clique em OK. Pronto!
25. 23/05/14 IA - Prof. Paulemir Campos 25
Referências
Witten, I. H. & Frank, E. Data Mining:
Practical Machine Learning Tools
and Techniques with Java
Implementations. Morgan Kaufmann,
1999.
http://www.cs.waikato.ac.nz/~ml/weka/index.html