SlideShare uma empresa Scribd logo
1 de 36
Técnicas de Mineração de Dados
Socioeconômicos e Educacionais Utilizadas no
Contexto Governamental: Uma Revisão
Sistemática
Francisco J. Nardi1 F.; Aracele G. D. O. Fassbinder2; Ramon G. T. M. D. Silva3
1,2,3 Instituto Federal de Educação, Ciência e Tecnologia do Sul de Minas Gerais
Caixa Postal 02 – 37.890-000 – Muzambinho – MG – Brasil
1. Introdução
 Desejo de se descobrir as técnicas
ideais para Mineração de Dados
Socioeconômicos e Educacionais no
Contexto Governamental.
 A literatura não é tão generosa em
relação a esse tema.
 Através da criação de argumentos
de pesquisa e seleção dos estudos,
em um momento; e da análise
comparativa, estatística e de
resultados, em outro, foi possível
tirar conclusões a respeito das
melhores técnicas, ferramentas e
formas de se realizar a Mineração
de Dados esperada.
2. Metodologia
2.1. Estratégia de pesquisa
 Esta revisão sistemática seguiu o
processo de condução de revisões
sistemáticas definido por
Kitchenham (2004) e foi baseada
em um levantamento total de 99
artigos, publicados de 1996 a 2014.
 As buscas foram realizadas entre
20 e 30 de setembro de 2014 e
procuravam responder à seguinte
pergunta: Quais técnicas de
mineração de dados
socioeconômicos e educacionais
podem ser utilizadas no contexto
governamental?
2. Metodologia
2.1. Estratégia de pesquisa
Figura 1. Artigos publicados por ano
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
Artigos publicados por ano
0
2
4
6
8
10
12
14
16
18
20
22
24
26
28
Artigos publicados por repositório
Figura 2. Artigos publicados por repositório
2. Metodologia
2.2. Seleção dos estudos
 O segundo argumento de pesquisa,
que retornou 937 resultados, foi:
 (Mineração de dados OR data
mining OR inteligência
empresarial OR business
intelligence OR descoberta de
conhecimento OR KDD) AND (IDH
OR IBGE OR IPEA OR INEP OR
censo OR censitário) AND
(governamental OR governo).
 O primeiro argumento de pesquisa,
que retornou 1970 resultados, foi:
 (Mineração de dados OR data
mining OR inteligência
empresarial OR business
intelligence OR descoberta de
conhecimento OR KDD) AND
(socioeconômico OR
socioeducacional OR educacional
OR econômico OR social) AND
(governamental OR governo).
2. Metodologia
2.2. Seleção dos estudos
 Exclusão por resumo (somente
considerados artigos cujos resumos
abordassem assuntos relativos ao
aspecto técnico – técnicas de
mineração de dados em geral, ou
teórico – mineração de dados
socioeconômicos e/ou educacionais
/ no contexto governamental, da
revisão).
 Critérios de exclusão II:
 Exclusão por leitura do artigo na
íntegra.
 Critérios de exclusão I:
 Exclusão por língua (somente
considerados artigos em
português);
 Exclusão por duplicidade (somente
considerado um artigo com mesmo
título);
 Exclusão por título (somente
considerados títulos que
possuíssem ao menos um dos
termos presentes nos argumentos);
3. Resultados e Discussão
Tabela 1. Artigos selecionados como base da revisão sistemática
3. Resultados e Discussão
Tabela 1. Artigos selecionados como base da revisão sistemática
4. Conclusão
 Ferramenta a ser utilizada: WEKA, não
apenas por ser livre, mas por ser robusta e
contar com os principais algoritmos de
mineração de dados;
 Técnicas a serem aplicadas: Árvores de
decisão em conjunto com regras de
associação; primeiramente, deve-se
classificar quais são os grupos de maior
relevância dentre aqueles que estavam sendo
classificados; em seguida, as regras de
associação gerarão conhecimentos
importantes, que, tendo relação ou não com
os grupos de maior relevância, formarão o
alicerce dos resultados obtidos pelos estudos;
 Tipos de trabalho acadêmico: um grande
número de artigos científicos e de
dissertações de mestrado teve como tema a
mineração de dados no contexto
governamental;
 Seção e momento do estudo em que a
mineração deve ser praticada: Na
“Metodologia”, de preferência após a
mineração de dados ter tido uma breve
explanação antes de sua utilização, ou seja,
na Etapa Intermediária da seção;
 Contexto de aplicação: governamental, e
certamente para dados socioeconômicos e
educacionais, uma vez que já foi
demonstrado aqui, na análise dos estudos
envolvendo indicadores sociais, que houve
efetividade na mineração de dados para este
tipo de investigação.
 Portanto, considera-se que se obteve sucesso
na concepção, condução e conclusão desta
revisão sistemática.
5. Referências
 BERRY, M.; LINOFF, G. Data Mining Techniques: for
marketing, sales, and customer relationship management.
Second edition. [S.l.]: Wiley Publishing Inc., 2004.
 BEZERRA, M. L. D. O. et al. Hipertensão em Crianças e
Adolescentes: Revisão Sistemática Sobre Prevalência e
Fatores de Risco. Revista de Enfermagem UFPE Online, Recife,
7(8):5313-22, ago., 2013. Disponível em
<http://www.revista.ufpe.br/revistaenfermagem/index.php/r
evista/article/download/4741/6991>
 CORADINE, L. M. L. C.; LACHTERMACHER, G; COELHO, P. S. S.
Determinação de Fatores Críticos para o IDH-M A Partir de
Técnicas de Mineração de Dados. Disponível em
<http://www.din.uem.br/sbpo/sbpo2007/pdf/arq0096.pdf>
Acessado em 20 de setembro de 2014
 FAYYAD, U. M.; PIATETSKY-SHAPIRO, G; SMYTH, P. From Data
Mining to Knowledge Discovery: An Overview. Knowledge
Discovery and Data Mining, Menlo Park: AAAI Press, 1996.
 GOMES, J. C.; LEVY, A.; LACHTERMACHER. Segmentação do
Censo Educacional 2000 Utilizando Técnicas de Mineração de
Dados. Disponível em
<http://www.researchgate.net/profile/Ariel_Levy/publication
/257946331_SEGMENTAO_DO_CENSO_EDUCACIONAL_2000_UTILI
ZANDO_TCNICAS_DE_MINERAO_DE_DADOS/links/0c9605266fa33
ab6d3000000> Acessado em 22 de setembro de 2014
 KITCHENHAM, B. A. Procedures for Performing Systematic
Reviews. Keele: Keele University, 2004. 33 p. (Tech report
TR/SE-0401).
 LANGE, L. C. Mineração de Dados em Sistema Eficiente de
Iluminação Pública incluindo Parâmetros Sócio-
Comportamentais. Agosto de 2007. 169 folhas. Dissertação
(Mestrado) – Pontifícia Universidade Católica do Rio Grande do
Sul. Porto Alegre, agosto de 2007. Dissertação apresentada ao
Programa de Pós-Graduação de Engenharia Elétrica da
Pontifícia Universidade Católica do Rio Grande do Sul de Porto
Alegre para obtenção do Título de Mestre.
 LUBAMBO, S. W. Processo de Mineração de Dados como Apoio
à Decisão no Controle de Gastos Públicos. Agosto de 2008. 132
folhas. Dissertação (Mestrado) – Universidade Federal de
Pernambuco. Recife, agosto de 2008. Trabalho apresentado à
Pós-Graduação em Ciência da Computação do Centro de
Informática da Universidade Federal de Pernambuco.
5. Referências
 MADEIRA, F. D. Mineração de Dados Educacionais: Um Estudo de
Caso Aplicado ao Processo Seletivo do IFSULDEMINAS. 2013. 132
folhas. Monografia – Instituto Federal de Educação, Ciência e
Tecnologia do Sul de Minas, 2013. Trabalho de Conclusão de Curso
apresentado ao Curso de Ciência da Computação, do Instituto Federal
de Educação Ciência e Tecnologia do Sul de Minas Gerais.
 MALUCELLI et al. Classificação de microáreas de risco com uso de
mineração de dados. Revista Saúde Pública. 44(2):292-300, 2010.
Disponível em: <
http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0034-
89102010000200009 >
 MAXIMO, F. A.; OLIVEIRA; S. R. D. M.; MIRANDA, M. J. D. Uso de regras
de associação para enriquecer o suporte do planejamento agrícola
municipal: estudo de caso. In: CONGRESSO BRASILEIRO DE
AGROINFORMÁTICA, 7, 2009, Viçosa, MG. Viçosa, MG: UFV, 2009.
 MORAES, A. F. Um Modelo Representativo de Conhecimento para
Aplicação da Mineração de Dados no Cadastro Técnico Urbano. 21
de fevereiro de 2013. 79 folhas. Dissertação (Mestrado) – Universidade
Federal de Santa Catarina. Florianópolis, 21 de fevereiro de 2003.
Dissertação apresentada ao Programa de Pós-Graduação em
Engenharia de Produção da Universidade Federal de Santa Catarina.
 MURASSE, C. M.; TSUNODA, D. F. Descoberta de conhecimento a
partir de uma base de indicadores de desenvolvimento social
utilizando WEKA. Disponível em:
<http://www.inf.pucminas.br/sbc2010/anais/pdf/wcge/st01_02.pdf>
Acessado em: 23 de setembro de 2014.
 PICCIRILLI, T. L. Mineração de Dados aplicada à Classificação dos
Contribuintes do ISS. Abril de 2013. 134 folhas. Dissertação
(Mestrado) – Pontifícia Universidade Católica de Goiás. Goiânia, abril
de 2013. Dissertação apresentada ao Programa de Pós-Graduação de
Engenharia de Produção e Sistemas da Pontifícia Universidade Católica
de Goiás de Goiânia para obtenção do Título de Mestre.
 SILVA, A. D. D.; XAVIER; B. M.; GOMES, G. R. R.; FREITAS, M. T. M.
Mineração de Dados aplicada à Base de Dados Tributária Municipal.
In: SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO, 19, 2012, Bauru, SP.
 SILVA, G. C. Mineração de Regras de Associação Aplicada a Dados da
Secretaria Municipal de Saúde de Londrina – PR. Junho de 2004. 94
folhas. Dissertação (Mestrado) – Universidade Federal do Rio Grande
do Sul. Porto Alegre, junho de 2004. Dissertação submetida à
avaliação, como requisito parcial para a obtenção do grau de Mestre
em Ciência da Computação.
 WANGEHEIM, C. G. V.; KOCHANSKI, D.; SAVI, R. Revisão Sistemática
sobre Avaliação de Jogos Voltados para Aprendizagem de
Engenharia de Software no Brasil. Disponível em
<http://www.inf.ufsc.br/~gresse/download/FEES2009-revisao-jogos-
vf.pdf> Acessado em: 23 de setembro de 2014.
Mineração de Dados Sobre o Censo do IBGE de
2010 com Foco no Desenvolvimento
Socioeconômico e Educacional da Região da
AMOG utilizando Técnicas de Árvores de
Decisão e Regras de Associação
Francisco J. Nardi1 F.; Aracele G. D. O. Fassbinder2; Ramon G. T. M. D. Silva3
1,2,3 Instituto Federal de Educação, Ciência e Tecnologia do Sul de Minas Gerais
Caixa Postal 02 – 37.890-000 – Muzambinho – MG – Brasil
1. Introdução
 IBGE
 IPEA
 INEP
 Censo do IBGE de 2010
 AMOG
 Já desde o final do século passado,
a Tecnologia da Informação (TI) na
esfera pública expandiu sua área
de atuação, passando de
ferramenta de auxílio no suporte
administrativo para também
provedora de aplicações
estratégicas nas tomadas de
decisão, como, por exemplo, na
implementação e avaliação de
políticas governamentais (JUNIOR e
QUINTELLA, 2009).
2. Referencial Teórico
2. Referencial Teórico
 Árvores de Decisão
 Regras de Associação
 Weka
3. Metodologia
3.1. Seleção dos dados
3.1.2. Seleção das modalidades de censo relevantes ao estudo
Modalidades excluídas
Censo 2010 (Car. do Entorno)
Censo 2010 (Carac. da População)
Censo 2010 (Carac. Pop. Dom.)
Censo 2010 (Fecundidade)
Censo 2010 (Ind. Soc. Municip.)
Censo 2010 (Migração)
Censo 2010 (Nupcialidade)
Censo 2010 (Pessoas com Deficiência)
Censo 2010 (Religião)
Censo 2010 (Trabalho infantil)
Censo Agropecuário 2006
Estim. da População (2012)
Extr. Veget. e Silvic. (2010)
Frota (2012)
Instit. Financeiras (2012)
Lavoura Permanente (2012)
Lavoura Temporária (2012)
Morbid. Hospitalares (2012)
Pecuária (2012)
Pobr. E Desig. Muni. (2003)
Prod. Agric. Munic. (2007)
Registro Civil (2011)
Repres. Política (2006)
Saneamento Básico (2008)
Serviços de Saúde (2009)
Modalidades selecionadas
Cada. Central de Empresa (2011)
Censo 2010 (CNEFE)
Censo 2010 (Deslocamento)
Censo 2010 (Domicílios)
Censo 2010 (Educação)
Censo 2010 (Famílias)
Censo 2010 (Rendimento)
Censo 2010 (Resu. Ger. Amostra)
Censo 2010 (Sinopse)
Censo 2010 (Trabalho)
Finanças Públicas (2009)
Matr. Docen. e Rede Esc. (2012)
PIB Municipal (2010)
Síntese de Informações
3. Metodologia
3.1. Seleção dos dados
3.1.3. Dificuldades encontradas na seleção dos campos
relevantes ao estudo
 1 – Os dados vinham
desacompanhados da descrição das
variáveis da amostra. Ou seja, o
título de cada campo era o único
parâmetro que se possuía para se
tentar entender o significado ou
importância de um campo.
 2 - Os artigos de referência davam
fundamentação para o tratamento
e processamento dos dados, mas
em nenhum momento mostraram
critérios ou métodos para seleção
eficiente dos dados coletados.
3. Metodologia
3.1. Seleção dos dados
3.1.5. Formação das tabelas contendo os dados-alvo
Nome da tabela Número de campos
Demografia 4
Economia 15
Educação 19
Finanças Públicas 18
Rendimento 14
Nome da cidade Código do IBGE correspondente
Alterosa 310200
Arceburgo 310410
Areado 310430
Bom Jesus da Penha 310760
Botelhos 310840
Cabo Verde 310950
Conceição da Aparecida 311710
Guaranésia 312830
Guaxupé 312870
Jacuí 313480
Juruaia 313690
Monte Belo 314300
Muzambinho 314410
Nova Resende 314510
São Pedro da União 316390
3. Metodologia
3.2. Pré-seleção dos dados
3.2.4. Transformação dos dados
Figura 1. Pessoas de 10 anos ou mais de
idade que Não frequentavam a escola,
Não ocupadas
Figura 2. Domicílios particulares permanentes com
classes de rendimento nominal mensal domiciliar sem
rendimento
3. Metodologia
3.2. Pré-seleção dos dados
3.2.4. Transformação dos dados
3.2.5. Adequação dos dados
Figura 3. Domicílios particulares sem
rendimento divididos em 5 categorias
distintas, devido à reformulação do valor
definido para os intervalos em situações de
concentração de ocorrências em uma mesma categoria
Figura 4. Tabela Demografia convertida
para o formato ARFF
3. Metodologia
3.3. Mineração de dados (processamento)
3.3.1.Cruzamento das tabelas
Combinação Resultado numérico
C6,1 6
C6,2 15
C6,3 20
C6,4 15
C6,5 6
C6,6 1
Total 63
3. Metodologia
3.3. Mineração de dados (processamento)
3.3.2.Definição dos atributos-chave
10. Taxa de docentes por matrícula – ensino médio Atenção escolar dada a
adolescentes e adultos
11. Taxa de despesas orçamentárias – investimento
por habitante
Capacidade de investimento
por habitante da cidade
12. Taxa de receitas orçamentárias realizadas por
habitante
Capacidade de obtenção de
receitas por habitante da
cidade
13. PIB per capita a preços correntes Capacidade de geração de
riquezas por habitante
14. Índice de Desenvolvimento Humano Municipal Índice de desempenho em
educação, longevidade e renda
15. Domicílios com classe de rendimento – 1 a 2
salários mínimos
Proporção de domicílios com
rendimento baixo
16. Domicílios com classe de rendimento – 2 a 5
salários mínimos
Proporção de domicílios com
rendimento médio-baixo /
médio
17. Domicílios com classe de rendimento – 5 a 10
salários mínimos
Proporção de domicílios com
rendimento médio / médio-
alto
18. Valor do rendimento mensal mediano per capita
– rural
Rendimento mediano per
capita rural atingido pela
população
19. Valor do rendimento mensal mediano per capita
– urbano
Rendimento mediano per
capita urbano atingido pela
população
Nº Atributo-chave escolhido Pequena justificativa
1. Domicílios particulares ocupados Capacidade de atração de
moradores da cidade
2. Taxa de empresas por habitante Porte empresarial da
cidade
3. Pessoas – trabalho principal – Empregadores Vocação empreendedora
da população
4. Pessoas – trabalho principal – Conta própria Vocação autônoma da
população
5. Pessoas – trabalho principal – Carteira
assinada
Geração/manutenção de
empregos formais da
cidade
6. População residente alfabetizada Atingimento da educação
em patamar básico
7. Pessoas – Ensino médio completo e superior
incompleto
Atingimento da educação
em patamar médio
8. Pessoas – Ensino superior completo Atingimento da educação
em patamar elevado
9. Taxa de docentes por matrícula – ensino
fundamental
Atenção escolar dada aos
alunos mais jovens e
adolescentes
3. Metodologia
3.3. Mineração de dados (processamento)
3.3.2.Definição dos atributos-chave
3.3.3.2. Utilização do Weka para a geração das árvores
Intervalo numérico Pertence à tabela
1 Demografia
2 a 5 Economia
6 a 10 Educação
11 a 12 Finanças Públicas 1
13 a 14 Finanças Públicas 2
15 a 19 Rendimento
3. Metodologia
3.3. Mineração de dados (processamento)
3.3.2.Definição dos atributos-chave
3.3.3.2. Utilização do Weka para a geração das árvores
3.3.4.1. Utilização do Weka para geração das regras
4. Resultados e Discussão
4.20. Síntese dos conhecimentos adquiridos
 A partir desta tabela, será possível
chegar à conclusão, na próxima
seção do artigo, de quais foram as
relações socioeconômicas e
educacionais encontradas nos
dados minerados da região da
AMOG. Além disso, serão
apresentadas as cidades que
tiveram melhor desempenho
considerando-se a análise dos
atributos-chave deste estudo.
 Enfim, os atributos-chave foram
analisados, um a um, levando em
consideração as árvores de decisão
e as regras de associação, e todo o
conhecimento desejado foi
extraído. A Tabela 10 a seguir
apresenta, de forma organizada,
uma síntese dos conhecimentos
adquiridos.
4. Resultados e Discussão
4.20. Síntese dos conhecimentos adquiridos
4. Resultados e Discussão
4.20. Síntese dos conhecimentos adquiridos
4. Resultados e Discussão
4.20. Síntese dos conhecimentos adquiridos
5. Conclusão
 Remuneração maior que 2 salários
mínimos = Maior número de
domicílios ocupados.
 Maior taxa de docentes 2º grau =
Maior número de empresas.
 Maior instrução = Maior
investimento em indústria = Maior
número de empregadores.
 Maior emprego = Maior número de
carteiras assinadas = Menor número
de autônomos.
 Maior número de domicílios
ocupados = Maior número de
carteiras assinadas = Menor número
de autônomos.
 Maior alfabetização = Remuneração
maior que 2 salários mínimos.
 Remuneração maior que 2 salários
mínimos = Maior taxa de docentes
2º grau = Maior número de
concluintes do 2º grau.
 Maior número de concluintes do 2º
grau = Maior taxa de docentes 2º
grau = Maior número de concluintes
do 3º grau.
5. Conclusão
 Maior taxa de docentes 2º grau =
Remuneração maior que 2
salários mínimos
 Maior despesa por habitante =
Maior PIB per capita
 Maior número de concluintes do
1º grau = Remuneração maior que
2 salários mínimos = Maior
emprego = Maior IDH-M
 Remuneração maior que 2
salários mínimos = Maior taxa de
docentes 1º grau = Maior número
de domicílios ocupados
 Maior IDH-M = Remuneração
maior que 2 salários mínimos.
 Remuneração maior que 5
salários mínimos = Menor número
de autônomos.
5. Conclusão
5. Conclusão
 Guaxupé demonstrou ser a cidade
de maior desenvolvimento
socioeconômico e educacional do
momento, segundo os critérios
deste trabalho. Ela foi seguida de
perto por Juruaia,
Arceburgo/Muzambinho e Areado,
que também obtiveram bons
resultados durante toda a análise.
 Dessa forma, cabe às outras
cidades, tendo elas pontuado ou
não, observar as políticas públicas
implementadas pelas prefeituras
das cidades-destaque,
para que a AMOG possa se desenvolver
em conjunto, e cumprir seu objetivo
de “ampliar e fortalecer a capacidade
administrativa, econômica e social dos
Municípios, prestando-lhes a
assistência técnica, promovendo o
estabelecimento de cooperação
intermunicipal e intergovernamental e
atuando em diversas áreas de
interesse municipal, de acordo com os
recursos financeiros repassados pelos
municípios” (AMOG).
6. Referências
 BERRY, M.; LINOFF, G. Data Mining Techniques: for
marketing, sales, and customer relationship
management. Second edition. [S.l.]: Wiley Publishing
Inc., 2004.
 CORADINE, L. M. L. C.; LACHTERMACHER, G; COELHO, P.
S. S. Determinação de Fatores Críticos para o IDH-M A
Partir de Técnicas de Mineração de Dados. Disponível
em
<http://www.din.uem.br/sbpo/sbpo2007/pdf/arq0096.p
df> Acessado em 20 de setembro de 2014.
 FAYYAD, U. M.; PIATETSKY-SHAPIRO, G; SMYTH, P. From
Data Mining to Knowledge Discovery: An Overview.
Knowledge Discovery and Data Mining, Menlo Park: AAAI
Press, 1996.
 GOMES, J. C.; LEVY, A.; LACHTERMACHER. Segmentação
do Censo Educacional 2000 Utilizando Técnicas de
Mineração de Dados. Disponível em
<http://www.researchgate.net/profile/Ariel_Levy/public
ation/257946331_SEGMENTAO_DO_CENSO_EDUCACIONAL_
2000_UTILIZANDO_TCNICAS_DE_MINERAO_DE_DADOS/links
/0c9605266fa33ab6d3000000> Acessado em 22 de
setembro de 2014.
 LANGE, L. C. Mineração de Dados em Sistema Eficiente
de Iluminação Pública incluindo Parâmetros Sócio-
Comportamentais. Agosto de 2007. 169 folhas.
Dissertação (Mestrado) – Pontifícia Universidade Católica
do Rio Grande do Sul. Porto Alegre, agosto de 2007.
Dissertação apresentada ao Programa de Pós-Graduação
de Engenharia Elétrica da Pontifícia Universidade Católica
do Rio Grande do Sul de Porto Alegre para obtenção do
Título de Mestre.
 LIU, B.; HSU, W. Post-Analysis of Learned Rules. AAAI-
96, p. 828-834, 1996.
 LUBAMBO, S. W. Processo de Mineração de Dados como
Apoio à Decisão no Controle de Gastos Públicos. Agosto
de 2008. 132 folhas. Dissertação (Mestrado) –
Universidade Federal de Pernambuco. Recife, agosto de
2008. Trabalho apresentado à Pós-Graduação em Ciência
da Computação do Centro de Informática da Universidade
Federal de Pernambuco.
 MADEIRA, F. D. Mineração de Dados Educacionais: Um
Estudo de Caso Aplicado ao Processo Seletivo do
IFSULDEMINAS. 2013. 132 folhas. Monografia – Instituto
Federal de Educação, Ciência e Tecnologia do Sul de
Minas, 2013. Trabalho de Conclusão de Curso apresentado
ao Curso de Ciência da Computação, do Instituto Federal
de Educação Ciência e Tecnologia do Sul de Minas Gerais.
6. Referências
 MALUCELLI et al. Classificação de microáreas de risco
com uso de mineração de dados. Revista Saúde Pública.
44(2):292-300, 2010. Disponível em: <
http://www.scielo.br/scielo.php?script=sci_arttext&pid=
S0034-89102010000200009 >
 MAXIMO, F. A.; OLIVEIRA; S. R. D. M.; MIRANDA, M. J. D.
Uso de regras de associação para enriquecer o suporte
do planejamento agrícola municipal: estudo de caso.
In: CONGRESSO BRASILEIRO DE AGROINFORMÁTICA, 7,
2009, Viçosa, MG. Viçosa, MG: UFV, 2009.
 MORAES, A. F. Um Modelo Representativo de
Conhecimento para Aplicação da Mineração de Dados
no Cadastro Técnico Urbano. 21 de fevereiro de 2013.
79 folhas. Dissertação (Mestrado) – Universidade Federal
de Santa Catarina. Florianópolis, 21 de fevereiro de 2003.
Dissertação apresentada ao Programa de Pós-Graduação
em Engenharia de Produção da Universidade Federal de
Santa Catarina.
 MURASSE, C. M.; TSUNODA, D. F. Descoberta de
conhecimento a partir de uma base de indicadores de
desenvolvimento social utilizando WEKA. Disponível em:
<http://www.inf.pucminas.br/sbc2010/anais/pdf/wcge/s
t01_02.pdf> Acessado em: 23 de setembro de 2014.
 PICCIRILLI, T. L. Mineração de Dados aplicada à
Classificação dos Contribuintes do ISS. Abril de 2013.
134 folhas. Dissertação (Mestrado) – Pontifícia
Universidade Católica de Goiás. Goiânia, abril de 2013.
Dissertação apresentada ao Programa de Pós-Graduação
de Engenharia de Produção e Sistemas da Pontifícia
Universidade Católica de Goiás de Goiânia para obtenção
do Título de Mestre.
 SILVA, A. D. D.; XAVIER; B. M.; GOMES, G. R. R.; FREITAS,
M. T. M. Mineração de Dados aplicada à Base de Dados
Tributária Municipal. In: SIMPÓSIO DE ENGENHARIA DE
PRODUÇÃO, 19, 2012, Bauru, SP.
 SILVA, G. C. Mineração de Regras de Associação
Aplicada a Dados da Secretaria Municipal de Saúde de
Londrina – PR. Junho de 2004. 94 folhas. Dissertação
(Mestrado) – Universidade Federal do Rio Grande do Sul.
Porto Alegre, junho de 2004. Dissertação submetida à
avaliação, como requisito parcial para a obtenção do grau
de Mestre em Ciência da Computação.
Agradecimento
 Gostaria de agradecer a todos vocês,
professores de Ciência da Computação do
IFSULDEMINAS Câmpus Muzambinho, que,
durante estes 4 anos e meio que estive
sendo seu aluno, sempre foram exigentes,
atenciosos, dedicados e compreensivos
para comigo e para com minha turma.
 Isso fez com que eu pudesse me dedicar
ao máximo, pois sabia que seria cobrado;
mas também que quando precisasse,
poderia esclarecer minhas dúvidas ou
pedir sugestões; além disso, e mais
importante, contar com a compreensão de
vocês para que eu pudesse trabalhar ou
fazer intercâmbio de forma paralela ao
curso, e isso não me prejudicasse de
maneira alguma.
Agradecimento
 Por isso, espero que a gente se
encontre muito mais vezes, na
área acadêmica ou profissional, e
que os laços que criamos não se
extingam.
 Como forma de retribuição, fico a
sua disposição, para qualquer que
seja o assunto, da mesma forma
que sempre estiveram a minha.
 Muito obrigado,
 Francisco José Nardi Filho.

Mais conteúdo relacionado

Destaque

Analýza systému financování veřejných vysokých škol v České republice v le...
Analýza systému financování veřejných vysokých škol v České republice v le...Analýza systému financování veřejných vysokých škol v České republice v le...
Analýza systému financování veřejných vysokých škol v České republice v le...MŠMT IPN KREDO
 
Zpracování výsledků ankety k SIMS
Zpracování výsledků ankety k SIMSZpracování výsledků ankety k SIMS
Zpracování výsledků ankety k SIMSMŠMT IPN KREDO
 
Ueda 2016 6-diabetes in special populations - mesbah kamel
Ueda 2016 6-diabetes in special populations - mesbah kamelUeda 2016 6-diabetes in special populations - mesbah kamel
Ueda 2016 6-diabetes in special populations - mesbah kamelueda2015
 
Ueda2016 symposium -managing t2 dm with no compromise - khaled el hadidy
Ueda2016 symposium -managing t2 dm with no compromise -  khaled el hadidyUeda2016 symposium -managing t2 dm with no compromise -  khaled el hadidy
Ueda2016 symposium -managing t2 dm with no compromise - khaled el hadidyueda2015
 
Introduction to Entrepreneurial Management - Entrepreneurship 101
Introduction to Entrepreneurial Management - Entrepreneurship 101Introduction to Entrepreneurial Management - Entrepreneurship 101
Introduction to Entrepreneurial Management - Entrepreneurship 101MaRS Discovery District
 
Supplier Cost Recovery By Tavant Technologies
Supplier Cost Recovery By Tavant TechnologiesSupplier Cost Recovery By Tavant Technologies
Supplier Cost Recovery By Tavant TechnologiesTavant Technologies Inc.
 
Sesion5mcmymcd 100129092624-phpapp02
Sesion5mcmymcd 100129092624-phpapp02Sesion5mcmymcd 100129092624-phpapp02
Sesion5mcmymcd 100129092624-phpapp02Teofilo Apaza
 

Destaque (9)

Nada-CV..
Nada-CV..Nada-CV..
Nada-CV..
 
Analýza systému financování veřejných vysokých škol v České republice v le...
Analýza systému financování veřejných vysokých škol v České republice v le...Analýza systému financování veřejných vysokých škol v České republice v le...
Analýza systému financování veřejných vysokých škol v České republice v le...
 
Zpracování výsledků ankety k SIMS
Zpracování výsledků ankety k SIMSZpracování výsledků ankety k SIMS
Zpracování výsledků ankety k SIMS
 
jamal
jamaljamal
jamal
 
Ueda 2016 6-diabetes in special populations - mesbah kamel
Ueda 2016 6-diabetes in special populations - mesbah kamelUeda 2016 6-diabetes in special populations - mesbah kamel
Ueda 2016 6-diabetes in special populations - mesbah kamel
 
Ueda2016 symposium -managing t2 dm with no compromise - khaled el hadidy
Ueda2016 symposium -managing t2 dm with no compromise -  khaled el hadidyUeda2016 symposium -managing t2 dm with no compromise -  khaled el hadidy
Ueda2016 symposium -managing t2 dm with no compromise - khaled el hadidy
 
Introduction to Entrepreneurial Management - Entrepreneurship 101
Introduction to Entrepreneurial Management - Entrepreneurship 101Introduction to Entrepreneurial Management - Entrepreneurship 101
Introduction to Entrepreneurial Management - Entrepreneurship 101
 
Supplier Cost Recovery By Tavant Technologies
Supplier Cost Recovery By Tavant TechnologiesSupplier Cost Recovery By Tavant Technologies
Supplier Cost Recovery By Tavant Technologies
 
Sesion5mcmymcd 100129092624-phpapp02
Sesion5mcmymcd 100129092624-phpapp02Sesion5mcmymcd 100129092624-phpapp02
Sesion5mcmymcd 100129092624-phpapp02
 

Semelhante a Undergraduate Thesis Presentation

Teoria da mudança e o Ciência sem Fronteiras
Teoria da mudança e o Ciência sem FronteirasTeoria da mudança e o Ciência sem Fronteiras
Teoria da mudança e o Ciência sem FronteirasWalnerMamedeJnior
 
Formação em ciência de dados
Formação em ciência de dadosFormação em ciência de dados
Formação em ciência de dadosFernando Palma
 
Análise espacial do perfil dos alunos do ifpi – campus floriano usando técnica...
Análise espacial do perfil dos alunos do ifpi – campus floriano usando técnica...Análise espacial do perfil dos alunos do ifpi – campus floriano usando técnica...
Análise espacial do perfil dos alunos do ifpi – campus floriano usando técnica...Thiago Reis da Silva
 
15.03.26 gestão do conhecimento usando data mining
15.03.26   gestão do conhecimento usando data mining15.03.26   gestão do conhecimento usando data mining
15.03.26 gestão do conhecimento usando data miningTalita Lima
 
Gestão do conhecimento usando data mining
Gestão do conhecimento usando data miningGestão do conhecimento usando data mining
Gestão do conhecimento usando data miningTalita Lima
 
Mineração de Dados Educacionais - potencialidades e desafios
Mineração de Dados Educacionais - potencialidades e desafiosMineração de Dados Educacionais - potencialidades e desafios
Mineração de Dados Educacionais - potencialidades e desafiosAnatalia Saraiva Martins Ramos
 
Fatores que influenciam a predisposição em seguir uma política de segurança d...
Fatores que influenciam a predisposição em seguir uma política de segurança d...Fatores que influenciam a predisposição em seguir uma política de segurança d...
Fatores que influenciam a predisposição em seguir uma política de segurança d...Anatalia Saraiva Martins Ramos
 
Políticas de autoarquivamento em repositórios institucionais brasileiros: est...
Políticas de autoarquivamento em repositórios institucionais brasileiros: est...Políticas de autoarquivamento em repositórios institucionais brasileiros: est...
Políticas de autoarquivamento em repositórios institucionais brasileiros: est...Projeto RCAAP
 
GeoInfo: impactos sociais do repositório de dados de pesquisa da Embrapa
GeoInfo: impactos sociais do repositório de dados de pesquisa da EmbrapaGeoInfo: impactos sociais do repositório de dados de pesquisa da Embrapa
GeoInfo: impactos sociais do repositório de dados de pesquisa da EmbrapaProjeto RCAAP
 
Técnica de mineração de dados uma revisão da literatura
Técnica de mineração de dados uma revisão da literaturaTécnica de mineração de dados uma revisão da literatura
Técnica de mineração de dados uma revisão da literaturaTalita Lima
 
Avaliação e acompanhamento de estudantes das escolas técnicas: A gestão da in...
Avaliação e acompanhamento de estudantes das escolas técnicas: A gestão da in...Avaliação e acompanhamento de estudantes das escolas técnicas: A gestão da in...
Avaliação e acompanhamento de estudantes das escolas técnicas: A gestão da in...Michel Franklin
 
Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...
Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...
Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...Dalton Martins
 
Conepro Sul 2014 - Arquitetura para um Sistema de Gestão de Testes Adaptativo...
Conepro Sul 2014 - Arquitetura para um Sistema de Gestão de Testes Adaptativo...Conepro Sul 2014 - Arquitetura para um Sistema de Gestão de Testes Adaptativo...
Conepro Sul 2014 - Arquitetura para um Sistema de Gestão de Testes Adaptativo...Paulo Manseira
 
2o sadebr-panoramadasredessociaisnoensinosuperiorbrasileiro-110502120241-phpa...
2o sadebr-panoramadasredessociaisnoensinosuperiorbrasileiro-110502120241-phpa...2o sadebr-panoramadasredessociaisnoensinosuperiorbrasileiro-110502120241-phpa...
2o sadebr-panoramadasredessociaisnoensinosuperiorbrasileiro-110502120241-phpa...Camila Micheletti
 
Mecanismos de proteção da privacidade das informações de prontuário eletrônic...
Mecanismos de proteção da privacidade das informações de prontuário eletrônic...Mecanismos de proteção da privacidade das informações de prontuário eletrônic...
Mecanismos de proteção da privacidade das informações de prontuário eletrônic...dgovs_pucrs
 

Semelhante a Undergraduate Thesis Presentation (20)

Teoria da mudança e o Ciência sem Fronteiras
Teoria da mudança e o Ciência sem FronteirasTeoria da mudança e o Ciência sem Fronteiras
Teoria da mudança e o Ciência sem Fronteiras
 
Formação em ciência de dados
Formação em ciência de dadosFormação em ciência de dados
Formação em ciência de dados
 
Análise espacial do perfil dos alunos do ifpi – campus floriano usando técnica...
Análise espacial do perfil dos alunos do ifpi – campus floriano usando técnica...Análise espacial do perfil dos alunos do ifpi – campus floriano usando técnica...
Análise espacial do perfil dos alunos do ifpi – campus floriano usando técnica...
 
15.03.26 gestão do conhecimento usando data mining
15.03.26   gestão do conhecimento usando data mining15.03.26   gestão do conhecimento usando data mining
15.03.26 gestão do conhecimento usando data mining
 
Gestão do conhecimento usando data mining
Gestão do conhecimento usando data miningGestão do conhecimento usando data mining
Gestão do conhecimento usando data mining
 
Mineração de Dados Educacionais - potencialidades e desafios
Mineração de Dados Educacionais - potencialidades e desafiosMineração de Dados Educacionais - potencialidades e desafios
Mineração de Dados Educacionais - potencialidades e desafios
 
Gestão de dados de pesquisa
Gestão de dados de pesquisaGestão de dados de pesquisa
Gestão de dados de pesquisa
 
Plano de dados abertos na Universidade Federal de Pernambuco – UFPE - CONFOA ...
Plano de dados abertos na Universidade Federal de Pernambuco – UFPE - CONFOA ...Plano de dados abertos na Universidade Federal de Pernambuco – UFPE - CONFOA ...
Plano de dados abertos na Universidade Federal de Pernambuco – UFPE - CONFOA ...
 
Extrator Lattes CNPq (Versão SBSI)
Extrator Lattes CNPq (Versão SBSI)Extrator Lattes CNPq (Versão SBSI)
Extrator Lattes CNPq (Versão SBSI)
 
Fatores que influenciam a predisposição em seguir uma política de segurança d...
Fatores que influenciam a predisposição em seguir uma política de segurança d...Fatores que influenciam a predisposição em seguir uma política de segurança d...
Fatores que influenciam a predisposição em seguir uma política de segurança d...
 
Políticas de autoarquivamento em repositórios institucionais brasileiros: est...
Políticas de autoarquivamento em repositórios institucionais brasileiros: est...Políticas de autoarquivamento em repositórios institucionais brasileiros: est...
Políticas de autoarquivamento em repositórios institucionais brasileiros: est...
 
GeoInfo: impactos sociais do repositório de dados de pesquisa da Embrapa
GeoInfo: impactos sociais do repositório de dados de pesquisa da EmbrapaGeoInfo: impactos sociais do repositório de dados de pesquisa da Embrapa
GeoInfo: impactos sociais do repositório de dados de pesquisa da Embrapa
 
Técnica de mineração de dados uma revisão da literatura
Técnica de mineração de dados uma revisão da literaturaTécnica de mineração de dados uma revisão da literatura
Técnica de mineração de dados uma revisão da literatura
 
Avaliação e acompanhamento de estudantes das escolas técnicas: A gestão da in...
Avaliação e acompanhamento de estudantes das escolas técnicas: A gestão da in...Avaliação e acompanhamento de estudantes das escolas técnicas: A gestão da in...
Avaliação e acompanhamento de estudantes das escolas técnicas: A gestão da in...
 
Livro materiais avancados
Livro materiais avancadosLivro materiais avancados
Livro materiais avancados
 
Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...
Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...
Tópicos em Gestão da Informação II - Aula 01 - Desafios atuais da Gestão da I...
 
Conepro Sul 2014 - Arquitetura para um Sistema de Gestão de Testes Adaptativo...
Conepro Sul 2014 - Arquitetura para um Sistema de Gestão de Testes Adaptativo...Conepro Sul 2014 - Arquitetura para um Sistema de Gestão de Testes Adaptativo...
Conepro Sul 2014 - Arquitetura para um Sistema de Gestão de Testes Adaptativo...
 
Mineração de Dados Educacionais
Mineração de Dados Educacionais Mineração de Dados Educacionais
Mineração de Dados Educacionais
 
2o sadebr-panoramadasredessociaisnoensinosuperiorbrasileiro-110502120241-phpa...
2o sadebr-panoramadasredessociaisnoensinosuperiorbrasileiro-110502120241-phpa...2o sadebr-panoramadasredessociaisnoensinosuperiorbrasileiro-110502120241-phpa...
2o sadebr-panoramadasredessociaisnoensinosuperiorbrasileiro-110502120241-phpa...
 
Mecanismos de proteção da privacidade das informações de prontuário eletrônic...
Mecanismos de proteção da privacidade das informações de prontuário eletrônic...Mecanismos de proteção da privacidade das informações de prontuário eletrônic...
Mecanismos de proteção da privacidade das informações de prontuário eletrônic...
 

Último

SLIDE de apresentação de eventos do psdb
SLIDE de apresentação de eventos do psdbSLIDE de apresentação de eventos do psdb
SLIDE de apresentação de eventos do psdbedgleialexandre2
 
TEMPORÁRIOS RM3 ENGENHARIA 2024 ingresso na FAB
TEMPORÁRIOS RM3 ENGENHARIA 2024 ingresso na FABTEMPORÁRIOS RM3 ENGENHARIA 2024 ingresso na FAB
TEMPORÁRIOS RM3 ENGENHARIA 2024 ingresso na FABRevista Sociedade Militar
 
Recurso pensionistas no STJ hospitais militares
Recurso pensionistas no STJ hospitais militaresRecurso pensionistas no STJ hospitais militares
Recurso pensionistas no STJ hospitais militaresRevista Sociedade Militar
 
TEMPORÁRIOS RM3 MÉDICOS 2024 força aérea.pdf
TEMPORÁRIOS RM3 MÉDICOS 2024 força aérea.pdfTEMPORÁRIOS RM3 MÉDICOS 2024 força aérea.pdf
TEMPORÁRIOS RM3 MÉDICOS 2024 força aérea.pdfRevista Sociedade Militar
 
Câncer de mama: pontos que merecem atenção!
Câncer de mama: pontos que merecem atenção!Câncer de mama: pontos que merecem atenção!
Câncer de mama: pontos que merecem atenção!Oncoguia
 
Exército Brasileiro moderação política.pdf
Exército Brasileiro moderação política.pdfExército Brasileiro moderação política.pdf
Exército Brasileiro moderação política.pdfRevista Sociedade Militar
 

Último (6)

SLIDE de apresentação de eventos do psdb
SLIDE de apresentação de eventos do psdbSLIDE de apresentação de eventos do psdb
SLIDE de apresentação de eventos do psdb
 
TEMPORÁRIOS RM3 ENGENHARIA 2024 ingresso na FAB
TEMPORÁRIOS RM3 ENGENHARIA 2024 ingresso na FABTEMPORÁRIOS RM3 ENGENHARIA 2024 ingresso na FAB
TEMPORÁRIOS RM3 ENGENHARIA 2024 ingresso na FAB
 
Recurso pensionistas no STJ hospitais militares
Recurso pensionistas no STJ hospitais militaresRecurso pensionistas no STJ hospitais militares
Recurso pensionistas no STJ hospitais militares
 
TEMPORÁRIOS RM3 MÉDICOS 2024 força aérea.pdf
TEMPORÁRIOS RM3 MÉDICOS 2024 força aérea.pdfTEMPORÁRIOS RM3 MÉDICOS 2024 força aérea.pdf
TEMPORÁRIOS RM3 MÉDICOS 2024 força aérea.pdf
 
Câncer de mama: pontos que merecem atenção!
Câncer de mama: pontos que merecem atenção!Câncer de mama: pontos que merecem atenção!
Câncer de mama: pontos que merecem atenção!
 
Exército Brasileiro moderação política.pdf
Exército Brasileiro moderação política.pdfExército Brasileiro moderação política.pdf
Exército Brasileiro moderação política.pdf
 

Undergraduate Thesis Presentation

  • 1. Técnicas de Mineração de Dados Socioeconômicos e Educacionais Utilizadas no Contexto Governamental: Uma Revisão Sistemática Francisco J. Nardi1 F.; Aracele G. D. O. Fassbinder2; Ramon G. T. M. D. Silva3 1,2,3 Instituto Federal de Educação, Ciência e Tecnologia do Sul de Minas Gerais Caixa Postal 02 – 37.890-000 – Muzambinho – MG – Brasil
  • 2. 1. Introdução  Desejo de se descobrir as técnicas ideais para Mineração de Dados Socioeconômicos e Educacionais no Contexto Governamental.  A literatura não é tão generosa em relação a esse tema.  Através da criação de argumentos de pesquisa e seleção dos estudos, em um momento; e da análise comparativa, estatística e de resultados, em outro, foi possível tirar conclusões a respeito das melhores técnicas, ferramentas e formas de se realizar a Mineração de Dados esperada.
  • 3. 2. Metodologia 2.1. Estratégia de pesquisa  Esta revisão sistemática seguiu o processo de condução de revisões sistemáticas definido por Kitchenham (2004) e foi baseada em um levantamento total de 99 artigos, publicados de 1996 a 2014.  As buscas foram realizadas entre 20 e 30 de setembro de 2014 e procuravam responder à seguinte pergunta: Quais técnicas de mineração de dados socioeconômicos e educacionais podem ser utilizadas no contexto governamental?
  • 4. 2. Metodologia 2.1. Estratégia de pesquisa Figura 1. Artigos publicados por ano 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Artigos publicados por ano 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 Artigos publicados por repositório Figura 2. Artigos publicados por repositório
  • 5. 2. Metodologia 2.2. Seleção dos estudos  O segundo argumento de pesquisa, que retornou 937 resultados, foi:  (Mineração de dados OR data mining OR inteligência empresarial OR business intelligence OR descoberta de conhecimento OR KDD) AND (IDH OR IBGE OR IPEA OR INEP OR censo OR censitário) AND (governamental OR governo).  O primeiro argumento de pesquisa, que retornou 1970 resultados, foi:  (Mineração de dados OR data mining OR inteligência empresarial OR business intelligence OR descoberta de conhecimento OR KDD) AND (socioeconômico OR socioeducacional OR educacional OR econômico OR social) AND (governamental OR governo).
  • 6. 2. Metodologia 2.2. Seleção dos estudos  Exclusão por resumo (somente considerados artigos cujos resumos abordassem assuntos relativos ao aspecto técnico – técnicas de mineração de dados em geral, ou teórico – mineração de dados socioeconômicos e/ou educacionais / no contexto governamental, da revisão).  Critérios de exclusão II:  Exclusão por leitura do artigo na íntegra.  Critérios de exclusão I:  Exclusão por língua (somente considerados artigos em português);  Exclusão por duplicidade (somente considerado um artigo com mesmo título);  Exclusão por título (somente considerados títulos que possuíssem ao menos um dos termos presentes nos argumentos);
  • 7. 3. Resultados e Discussão Tabela 1. Artigos selecionados como base da revisão sistemática
  • 8. 3. Resultados e Discussão Tabela 1. Artigos selecionados como base da revisão sistemática
  • 9. 4. Conclusão  Ferramenta a ser utilizada: WEKA, não apenas por ser livre, mas por ser robusta e contar com os principais algoritmos de mineração de dados;  Técnicas a serem aplicadas: Árvores de decisão em conjunto com regras de associação; primeiramente, deve-se classificar quais são os grupos de maior relevância dentre aqueles que estavam sendo classificados; em seguida, as regras de associação gerarão conhecimentos importantes, que, tendo relação ou não com os grupos de maior relevância, formarão o alicerce dos resultados obtidos pelos estudos;  Tipos de trabalho acadêmico: um grande número de artigos científicos e de dissertações de mestrado teve como tema a mineração de dados no contexto governamental;  Seção e momento do estudo em que a mineração deve ser praticada: Na “Metodologia”, de preferência após a mineração de dados ter tido uma breve explanação antes de sua utilização, ou seja, na Etapa Intermediária da seção;  Contexto de aplicação: governamental, e certamente para dados socioeconômicos e educacionais, uma vez que já foi demonstrado aqui, na análise dos estudos envolvendo indicadores sociais, que houve efetividade na mineração de dados para este tipo de investigação.  Portanto, considera-se que se obteve sucesso na concepção, condução e conclusão desta revisão sistemática.
  • 10. 5. Referências  BERRY, M.; LINOFF, G. Data Mining Techniques: for marketing, sales, and customer relationship management. Second edition. [S.l.]: Wiley Publishing Inc., 2004.  BEZERRA, M. L. D. O. et al. Hipertensão em Crianças e Adolescentes: Revisão Sistemática Sobre Prevalência e Fatores de Risco. Revista de Enfermagem UFPE Online, Recife, 7(8):5313-22, ago., 2013. Disponível em <http://www.revista.ufpe.br/revistaenfermagem/index.php/r evista/article/download/4741/6991>  CORADINE, L. M. L. C.; LACHTERMACHER, G; COELHO, P. S. S. Determinação de Fatores Críticos para o IDH-M A Partir de Técnicas de Mineração de Dados. Disponível em <http://www.din.uem.br/sbpo/sbpo2007/pdf/arq0096.pdf> Acessado em 20 de setembro de 2014  FAYYAD, U. M.; PIATETSKY-SHAPIRO, G; SMYTH, P. From Data Mining to Knowledge Discovery: An Overview. Knowledge Discovery and Data Mining, Menlo Park: AAAI Press, 1996.  GOMES, J. C.; LEVY, A.; LACHTERMACHER. Segmentação do Censo Educacional 2000 Utilizando Técnicas de Mineração de Dados. Disponível em <http://www.researchgate.net/profile/Ariel_Levy/publication /257946331_SEGMENTAO_DO_CENSO_EDUCACIONAL_2000_UTILI ZANDO_TCNICAS_DE_MINERAO_DE_DADOS/links/0c9605266fa33 ab6d3000000> Acessado em 22 de setembro de 2014  KITCHENHAM, B. A. Procedures for Performing Systematic Reviews. Keele: Keele University, 2004. 33 p. (Tech report TR/SE-0401).  LANGE, L. C. Mineração de Dados em Sistema Eficiente de Iluminação Pública incluindo Parâmetros Sócio- Comportamentais. Agosto de 2007. 169 folhas. Dissertação (Mestrado) – Pontifícia Universidade Católica do Rio Grande do Sul. Porto Alegre, agosto de 2007. Dissertação apresentada ao Programa de Pós-Graduação de Engenharia Elétrica da Pontifícia Universidade Católica do Rio Grande do Sul de Porto Alegre para obtenção do Título de Mestre.  LUBAMBO, S. W. Processo de Mineração de Dados como Apoio à Decisão no Controle de Gastos Públicos. Agosto de 2008. 132 folhas. Dissertação (Mestrado) – Universidade Federal de Pernambuco. Recife, agosto de 2008. Trabalho apresentado à Pós-Graduação em Ciência da Computação do Centro de Informática da Universidade Federal de Pernambuco.
  • 11. 5. Referências  MADEIRA, F. D. Mineração de Dados Educacionais: Um Estudo de Caso Aplicado ao Processo Seletivo do IFSULDEMINAS. 2013. 132 folhas. Monografia – Instituto Federal de Educação, Ciência e Tecnologia do Sul de Minas, 2013. Trabalho de Conclusão de Curso apresentado ao Curso de Ciência da Computação, do Instituto Federal de Educação Ciência e Tecnologia do Sul de Minas Gerais.  MALUCELLI et al. Classificação de microáreas de risco com uso de mineração de dados. Revista Saúde Pública. 44(2):292-300, 2010. Disponível em: < http://www.scielo.br/scielo.php?script=sci_arttext&pid=S0034- 89102010000200009 >  MAXIMO, F. A.; OLIVEIRA; S. R. D. M.; MIRANDA, M. J. D. Uso de regras de associação para enriquecer o suporte do planejamento agrícola municipal: estudo de caso. In: CONGRESSO BRASILEIRO DE AGROINFORMÁTICA, 7, 2009, Viçosa, MG. Viçosa, MG: UFV, 2009.  MORAES, A. F. Um Modelo Representativo de Conhecimento para Aplicação da Mineração de Dados no Cadastro Técnico Urbano. 21 de fevereiro de 2013. 79 folhas. Dissertação (Mestrado) – Universidade Federal de Santa Catarina. Florianópolis, 21 de fevereiro de 2003. Dissertação apresentada ao Programa de Pós-Graduação em Engenharia de Produção da Universidade Federal de Santa Catarina.  MURASSE, C. M.; TSUNODA, D. F. Descoberta de conhecimento a partir de uma base de indicadores de desenvolvimento social utilizando WEKA. Disponível em: <http://www.inf.pucminas.br/sbc2010/anais/pdf/wcge/st01_02.pdf> Acessado em: 23 de setembro de 2014.  PICCIRILLI, T. L. Mineração de Dados aplicada à Classificação dos Contribuintes do ISS. Abril de 2013. 134 folhas. Dissertação (Mestrado) – Pontifícia Universidade Católica de Goiás. Goiânia, abril de 2013. Dissertação apresentada ao Programa de Pós-Graduação de Engenharia de Produção e Sistemas da Pontifícia Universidade Católica de Goiás de Goiânia para obtenção do Título de Mestre.  SILVA, A. D. D.; XAVIER; B. M.; GOMES, G. R. R.; FREITAS, M. T. M. Mineração de Dados aplicada à Base de Dados Tributária Municipal. In: SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO, 19, 2012, Bauru, SP.  SILVA, G. C. Mineração de Regras de Associação Aplicada a Dados da Secretaria Municipal de Saúde de Londrina – PR. Junho de 2004. 94 folhas. Dissertação (Mestrado) – Universidade Federal do Rio Grande do Sul. Porto Alegre, junho de 2004. Dissertação submetida à avaliação, como requisito parcial para a obtenção do grau de Mestre em Ciência da Computação.  WANGEHEIM, C. G. V.; KOCHANSKI, D.; SAVI, R. Revisão Sistemática sobre Avaliação de Jogos Voltados para Aprendizagem de Engenharia de Software no Brasil. Disponível em <http://www.inf.ufsc.br/~gresse/download/FEES2009-revisao-jogos- vf.pdf> Acessado em: 23 de setembro de 2014.
  • 12. Mineração de Dados Sobre o Censo do IBGE de 2010 com Foco no Desenvolvimento Socioeconômico e Educacional da Região da AMOG utilizando Técnicas de Árvores de Decisão e Regras de Associação Francisco J. Nardi1 F.; Aracele G. D. O. Fassbinder2; Ramon G. T. M. D. Silva3 1,2,3 Instituto Federal de Educação, Ciência e Tecnologia do Sul de Minas Gerais Caixa Postal 02 – 37.890-000 – Muzambinho – MG – Brasil
  • 13. 1. Introdução  IBGE  IPEA  INEP  Censo do IBGE de 2010  AMOG  Já desde o final do século passado, a Tecnologia da Informação (TI) na esfera pública expandiu sua área de atuação, passando de ferramenta de auxílio no suporte administrativo para também provedora de aplicações estratégicas nas tomadas de decisão, como, por exemplo, na implementação e avaliação de políticas governamentais (JUNIOR e QUINTELLA, 2009).
  • 15. 2. Referencial Teórico  Árvores de Decisão  Regras de Associação  Weka
  • 16. 3. Metodologia 3.1. Seleção dos dados 3.1.2. Seleção das modalidades de censo relevantes ao estudo Modalidades excluídas Censo 2010 (Car. do Entorno) Censo 2010 (Carac. da População) Censo 2010 (Carac. Pop. Dom.) Censo 2010 (Fecundidade) Censo 2010 (Ind. Soc. Municip.) Censo 2010 (Migração) Censo 2010 (Nupcialidade) Censo 2010 (Pessoas com Deficiência) Censo 2010 (Religião) Censo 2010 (Trabalho infantil) Censo Agropecuário 2006 Estim. da População (2012) Extr. Veget. e Silvic. (2010) Frota (2012) Instit. Financeiras (2012) Lavoura Permanente (2012) Lavoura Temporária (2012) Morbid. Hospitalares (2012) Pecuária (2012) Pobr. E Desig. Muni. (2003) Prod. Agric. Munic. (2007) Registro Civil (2011) Repres. Política (2006) Saneamento Básico (2008) Serviços de Saúde (2009) Modalidades selecionadas Cada. Central de Empresa (2011) Censo 2010 (CNEFE) Censo 2010 (Deslocamento) Censo 2010 (Domicílios) Censo 2010 (Educação) Censo 2010 (Famílias) Censo 2010 (Rendimento) Censo 2010 (Resu. Ger. Amostra) Censo 2010 (Sinopse) Censo 2010 (Trabalho) Finanças Públicas (2009) Matr. Docen. e Rede Esc. (2012) PIB Municipal (2010) Síntese de Informações
  • 17. 3. Metodologia 3.1. Seleção dos dados 3.1.3. Dificuldades encontradas na seleção dos campos relevantes ao estudo  1 – Os dados vinham desacompanhados da descrição das variáveis da amostra. Ou seja, o título de cada campo era o único parâmetro que se possuía para se tentar entender o significado ou importância de um campo.  2 - Os artigos de referência davam fundamentação para o tratamento e processamento dos dados, mas em nenhum momento mostraram critérios ou métodos para seleção eficiente dos dados coletados.
  • 18. 3. Metodologia 3.1. Seleção dos dados 3.1.5. Formação das tabelas contendo os dados-alvo Nome da tabela Número de campos Demografia 4 Economia 15 Educação 19 Finanças Públicas 18 Rendimento 14 Nome da cidade Código do IBGE correspondente Alterosa 310200 Arceburgo 310410 Areado 310430 Bom Jesus da Penha 310760 Botelhos 310840 Cabo Verde 310950 Conceição da Aparecida 311710 Guaranésia 312830 Guaxupé 312870 Jacuí 313480 Juruaia 313690 Monte Belo 314300 Muzambinho 314410 Nova Resende 314510 São Pedro da União 316390
  • 19. 3. Metodologia 3.2. Pré-seleção dos dados 3.2.4. Transformação dos dados Figura 1. Pessoas de 10 anos ou mais de idade que Não frequentavam a escola, Não ocupadas Figura 2. Domicílios particulares permanentes com classes de rendimento nominal mensal domiciliar sem rendimento
  • 20. 3. Metodologia 3.2. Pré-seleção dos dados 3.2.4. Transformação dos dados 3.2.5. Adequação dos dados Figura 3. Domicílios particulares sem rendimento divididos em 5 categorias distintas, devido à reformulação do valor definido para os intervalos em situações de concentração de ocorrências em uma mesma categoria Figura 4. Tabela Demografia convertida para o formato ARFF
  • 21. 3. Metodologia 3.3. Mineração de dados (processamento) 3.3.1.Cruzamento das tabelas Combinação Resultado numérico C6,1 6 C6,2 15 C6,3 20 C6,4 15 C6,5 6 C6,6 1 Total 63
  • 22. 3. Metodologia 3.3. Mineração de dados (processamento) 3.3.2.Definição dos atributos-chave 10. Taxa de docentes por matrícula – ensino médio Atenção escolar dada a adolescentes e adultos 11. Taxa de despesas orçamentárias – investimento por habitante Capacidade de investimento por habitante da cidade 12. Taxa de receitas orçamentárias realizadas por habitante Capacidade de obtenção de receitas por habitante da cidade 13. PIB per capita a preços correntes Capacidade de geração de riquezas por habitante 14. Índice de Desenvolvimento Humano Municipal Índice de desempenho em educação, longevidade e renda 15. Domicílios com classe de rendimento – 1 a 2 salários mínimos Proporção de domicílios com rendimento baixo 16. Domicílios com classe de rendimento – 2 a 5 salários mínimos Proporção de domicílios com rendimento médio-baixo / médio 17. Domicílios com classe de rendimento – 5 a 10 salários mínimos Proporção de domicílios com rendimento médio / médio- alto 18. Valor do rendimento mensal mediano per capita – rural Rendimento mediano per capita rural atingido pela população 19. Valor do rendimento mensal mediano per capita – urbano Rendimento mediano per capita urbano atingido pela população Nº Atributo-chave escolhido Pequena justificativa 1. Domicílios particulares ocupados Capacidade de atração de moradores da cidade 2. Taxa de empresas por habitante Porte empresarial da cidade 3. Pessoas – trabalho principal – Empregadores Vocação empreendedora da população 4. Pessoas – trabalho principal – Conta própria Vocação autônoma da população 5. Pessoas – trabalho principal – Carteira assinada Geração/manutenção de empregos formais da cidade 6. População residente alfabetizada Atingimento da educação em patamar básico 7. Pessoas – Ensino médio completo e superior incompleto Atingimento da educação em patamar médio 8. Pessoas – Ensino superior completo Atingimento da educação em patamar elevado 9. Taxa de docentes por matrícula – ensino fundamental Atenção escolar dada aos alunos mais jovens e adolescentes
  • 23. 3. Metodologia 3.3. Mineração de dados (processamento) 3.3.2.Definição dos atributos-chave 3.3.3.2. Utilização do Weka para a geração das árvores Intervalo numérico Pertence à tabela 1 Demografia 2 a 5 Economia 6 a 10 Educação 11 a 12 Finanças Públicas 1 13 a 14 Finanças Públicas 2 15 a 19 Rendimento
  • 24. 3. Metodologia 3.3. Mineração de dados (processamento) 3.3.2.Definição dos atributos-chave 3.3.3.2. Utilização do Weka para a geração das árvores 3.3.4.1. Utilização do Weka para geração das regras
  • 25. 4. Resultados e Discussão 4.20. Síntese dos conhecimentos adquiridos  A partir desta tabela, será possível chegar à conclusão, na próxima seção do artigo, de quais foram as relações socioeconômicas e educacionais encontradas nos dados minerados da região da AMOG. Além disso, serão apresentadas as cidades que tiveram melhor desempenho considerando-se a análise dos atributos-chave deste estudo.  Enfim, os atributos-chave foram analisados, um a um, levando em consideração as árvores de decisão e as regras de associação, e todo o conhecimento desejado foi extraído. A Tabela 10 a seguir apresenta, de forma organizada, uma síntese dos conhecimentos adquiridos.
  • 26. 4. Resultados e Discussão 4.20. Síntese dos conhecimentos adquiridos
  • 27. 4. Resultados e Discussão 4.20. Síntese dos conhecimentos adquiridos
  • 28. 4. Resultados e Discussão 4.20. Síntese dos conhecimentos adquiridos
  • 29. 5. Conclusão  Remuneração maior que 2 salários mínimos = Maior número de domicílios ocupados.  Maior taxa de docentes 2º grau = Maior número de empresas.  Maior instrução = Maior investimento em indústria = Maior número de empregadores.  Maior emprego = Maior número de carteiras assinadas = Menor número de autônomos.  Maior número de domicílios ocupados = Maior número de carteiras assinadas = Menor número de autônomos.  Maior alfabetização = Remuneração maior que 2 salários mínimos.  Remuneração maior que 2 salários mínimos = Maior taxa de docentes 2º grau = Maior número de concluintes do 2º grau.  Maior número de concluintes do 2º grau = Maior taxa de docentes 2º grau = Maior número de concluintes do 3º grau.
  • 30. 5. Conclusão  Maior taxa de docentes 2º grau = Remuneração maior que 2 salários mínimos  Maior despesa por habitante = Maior PIB per capita  Maior número de concluintes do 1º grau = Remuneração maior que 2 salários mínimos = Maior emprego = Maior IDH-M  Remuneração maior que 2 salários mínimos = Maior taxa de docentes 1º grau = Maior número de domicílios ocupados  Maior IDH-M = Remuneração maior que 2 salários mínimos.  Remuneração maior que 5 salários mínimos = Menor número de autônomos.
  • 32. 5. Conclusão  Guaxupé demonstrou ser a cidade de maior desenvolvimento socioeconômico e educacional do momento, segundo os critérios deste trabalho. Ela foi seguida de perto por Juruaia, Arceburgo/Muzambinho e Areado, que também obtiveram bons resultados durante toda a análise.  Dessa forma, cabe às outras cidades, tendo elas pontuado ou não, observar as políticas públicas implementadas pelas prefeituras das cidades-destaque, para que a AMOG possa se desenvolver em conjunto, e cumprir seu objetivo de “ampliar e fortalecer a capacidade administrativa, econômica e social dos Municípios, prestando-lhes a assistência técnica, promovendo o estabelecimento de cooperação intermunicipal e intergovernamental e atuando em diversas áreas de interesse municipal, de acordo com os recursos financeiros repassados pelos municípios” (AMOG).
  • 33. 6. Referências  BERRY, M.; LINOFF, G. Data Mining Techniques: for marketing, sales, and customer relationship management. Second edition. [S.l.]: Wiley Publishing Inc., 2004.  CORADINE, L. M. L. C.; LACHTERMACHER, G; COELHO, P. S. S. Determinação de Fatores Críticos para o IDH-M A Partir de Técnicas de Mineração de Dados. Disponível em <http://www.din.uem.br/sbpo/sbpo2007/pdf/arq0096.p df> Acessado em 20 de setembro de 2014.  FAYYAD, U. M.; PIATETSKY-SHAPIRO, G; SMYTH, P. From Data Mining to Knowledge Discovery: An Overview. Knowledge Discovery and Data Mining, Menlo Park: AAAI Press, 1996.  GOMES, J. C.; LEVY, A.; LACHTERMACHER. Segmentação do Censo Educacional 2000 Utilizando Técnicas de Mineração de Dados. Disponível em <http://www.researchgate.net/profile/Ariel_Levy/public ation/257946331_SEGMENTAO_DO_CENSO_EDUCACIONAL_ 2000_UTILIZANDO_TCNICAS_DE_MINERAO_DE_DADOS/links /0c9605266fa33ab6d3000000> Acessado em 22 de setembro de 2014.  LANGE, L. C. Mineração de Dados em Sistema Eficiente de Iluminação Pública incluindo Parâmetros Sócio- Comportamentais. Agosto de 2007. 169 folhas. Dissertação (Mestrado) – Pontifícia Universidade Católica do Rio Grande do Sul. Porto Alegre, agosto de 2007. Dissertação apresentada ao Programa de Pós-Graduação de Engenharia Elétrica da Pontifícia Universidade Católica do Rio Grande do Sul de Porto Alegre para obtenção do Título de Mestre.  LIU, B.; HSU, W. Post-Analysis of Learned Rules. AAAI- 96, p. 828-834, 1996.  LUBAMBO, S. W. Processo de Mineração de Dados como Apoio à Decisão no Controle de Gastos Públicos. Agosto de 2008. 132 folhas. Dissertação (Mestrado) – Universidade Federal de Pernambuco. Recife, agosto de 2008. Trabalho apresentado à Pós-Graduação em Ciência da Computação do Centro de Informática da Universidade Federal de Pernambuco.  MADEIRA, F. D. Mineração de Dados Educacionais: Um Estudo de Caso Aplicado ao Processo Seletivo do IFSULDEMINAS. 2013. 132 folhas. Monografia – Instituto Federal de Educação, Ciência e Tecnologia do Sul de Minas, 2013. Trabalho de Conclusão de Curso apresentado ao Curso de Ciência da Computação, do Instituto Federal de Educação Ciência e Tecnologia do Sul de Minas Gerais.
  • 34. 6. Referências  MALUCELLI et al. Classificação de microáreas de risco com uso de mineração de dados. Revista Saúde Pública. 44(2):292-300, 2010. Disponível em: < http://www.scielo.br/scielo.php?script=sci_arttext&pid= S0034-89102010000200009 >  MAXIMO, F. A.; OLIVEIRA; S. R. D. M.; MIRANDA, M. J. D. Uso de regras de associação para enriquecer o suporte do planejamento agrícola municipal: estudo de caso. In: CONGRESSO BRASILEIRO DE AGROINFORMÁTICA, 7, 2009, Viçosa, MG. Viçosa, MG: UFV, 2009.  MORAES, A. F. Um Modelo Representativo de Conhecimento para Aplicação da Mineração de Dados no Cadastro Técnico Urbano. 21 de fevereiro de 2013. 79 folhas. Dissertação (Mestrado) – Universidade Federal de Santa Catarina. Florianópolis, 21 de fevereiro de 2003. Dissertação apresentada ao Programa de Pós-Graduação em Engenharia de Produção da Universidade Federal de Santa Catarina.  MURASSE, C. M.; TSUNODA, D. F. Descoberta de conhecimento a partir de uma base de indicadores de desenvolvimento social utilizando WEKA. Disponível em: <http://www.inf.pucminas.br/sbc2010/anais/pdf/wcge/s t01_02.pdf> Acessado em: 23 de setembro de 2014.  PICCIRILLI, T. L. Mineração de Dados aplicada à Classificação dos Contribuintes do ISS. Abril de 2013. 134 folhas. Dissertação (Mestrado) – Pontifícia Universidade Católica de Goiás. Goiânia, abril de 2013. Dissertação apresentada ao Programa de Pós-Graduação de Engenharia de Produção e Sistemas da Pontifícia Universidade Católica de Goiás de Goiânia para obtenção do Título de Mestre.  SILVA, A. D. D.; XAVIER; B. M.; GOMES, G. R. R.; FREITAS, M. T. M. Mineração de Dados aplicada à Base de Dados Tributária Municipal. In: SIMPÓSIO DE ENGENHARIA DE PRODUÇÃO, 19, 2012, Bauru, SP.  SILVA, G. C. Mineração de Regras de Associação Aplicada a Dados da Secretaria Municipal de Saúde de Londrina – PR. Junho de 2004. 94 folhas. Dissertação (Mestrado) – Universidade Federal do Rio Grande do Sul. Porto Alegre, junho de 2004. Dissertação submetida à avaliação, como requisito parcial para a obtenção do grau de Mestre em Ciência da Computação.
  • 35. Agradecimento  Gostaria de agradecer a todos vocês, professores de Ciência da Computação do IFSULDEMINAS Câmpus Muzambinho, que, durante estes 4 anos e meio que estive sendo seu aluno, sempre foram exigentes, atenciosos, dedicados e compreensivos para comigo e para com minha turma.  Isso fez com que eu pudesse me dedicar ao máximo, pois sabia que seria cobrado; mas também que quando precisasse, poderia esclarecer minhas dúvidas ou pedir sugestões; além disso, e mais importante, contar com a compreensão de vocês para que eu pudesse trabalhar ou fazer intercâmbio de forma paralela ao curso, e isso não me prejudicasse de maneira alguma.
  • 36. Agradecimento  Por isso, espero que a gente se encontre muito mais vezes, na área acadêmica ou profissional, e que os laços que criamos não se extingam.  Como forma de retribuição, fico a sua disposição, para qualquer que seja o assunto, da mesma forma que sempre estiveram a minha.  Muito obrigado,  Francisco José Nardi Filho.