1Data Webhouse CEB-INEPProjeto de Iniciação Cientifica-UFMS/CPCXFernando Maia da Mota (Orientando)Profa. MSc. Leila Lisian...
Apresentação• Fernando Maia daMota(fernandomaia.eti.br)• Graduando em Sistemas de Informaçãopela UFMS - Campus Coxim• Atua...
Agenda3• Motivação• Avaliações INEP• Fontes de Informação• Objetivo• Data Webhouse CEB-INEP• Dificuldades e Limitações• Co...
MOTIVAÇÃOComo tornar os dados dos Sistemas deAvaliação do Brasil (INEP/MEC) ”maisacessíveis e transparentes” aos gestorese...
Caderno: Qualidade da Educação - OEstado de São Paulo (29 de Abril de2007)• Segundo pesquisa do Ibope em Julho/2006 (4.002...
Avaliações INEP• Censo Escolar(CEB): levantamento de informações estatístico-educacionais realizado anualmente;• Censo Sup...
Avaliações INEP• Sistema Nacional de Avaliação da Educação Superior(SINAES):Formado por três componentes principais: avali...
Fontes de Informação• Relatórios em formato PDF (website do INEP ou depesquisas) [INEP,2010]– Difícil cruzamento de dados•...
ObjetivoDefinir e Implementar uma plataforma aberta ebaseada em Software Livre na Internet intituladaWeb-PIDE (http://webp...
10• Meta: INTEGRAR diversas ferramentas implantadasno INEP por uma solução integrada e centralizada... +
Projetos de Pesquisa• O projeto Webpide é composto por váriosprojetos sendo um deles a avaliação e ostestes com as ferrame...
Técnicas e Ferramentas para oProjeto de Data Warehouse• 2007/2008- Estudo e Avaliação dasFerramentas– Pentaho é escolhida ...
Técnicas e Ferramentas para oProjeto de Data Warehouse• 2008 / 2009 – Desenvolvimento DataWebhouse SAEB– Criação do primei...
Estrutura base CEB14
ETL- Etapa 115• Carregar os dados em tabelas de um bancode dados.– SGBD PostgreSQL• INEP.sql- Contém a estrutura das tabel...
Ferramenta DEAR: Data ExtractorASCII to Relational16
DEAR17Aplicação que faz a leitura dos arquivos SAS [JAVA,2010]
Informações da Base• Cluster com mais de 10GB de dados• Grande variação de dados ao longo dosanos de pesquisa18
19Definição do Modelo Multidimensional• Definiu-se a tabela que contém osdados do censo escolar, por estarpresente em todo...
20Cubo EstrelaCubo Estrela CEB-INEP [JUDE,2010]
ETL- Etapa 2Carga das Dimensões e Fato•Carga das dimensões feito através de script SQL•Carga Fato– Look-up das dimensões a...
BI-Server Pentaho [PENTAHO,2010]22
PSW- Mapeamento do Cubo emXML23
Data Webhouse CEB-INEP24
Número de Instituições porRegião e Ano25
Número de Professores em Sala deAula por Região e Ano26
Número de Matriculas na Pré-escolana cidade de Alvaraes-AM (MDX)27
Número de Matriculas na Pré-escolapor Geografia(Ano de 1996)28
Dificuldades e Limitações• Compreender e analisar os dados e aconsistência dos mesmos: estruturas eformatos (.sas, .pdf, ....
Considerações Finais30• Importância da Integração das Bases de Dados doINEP (CEB-INEP);• Disponibilização dos Dados Educac...
Referências• INEP - Instituto Nacional de Estudos e Pesquisas EducacionaisAnísio Teixeira. - http://www.inep.gov.br• TURIN...
CONTATOSFernando Maiamota.fernandomaia@gmail.comwww.fernandomaia.eti.brLeila Lisiane Rossileilalrossi@gmail.comMarcelo Aug...
Próximos SlideShares
Carregando em…5
×

Data Webhouse CEB/INEP

591 visualizações

Publicada em

Publicada em: Tecnologia
0 comentários
0 gostaram
Estatísticas
Notas
  • Seja o primeiro a comentar

  • Seja a primeira pessoa a gostar disto

Sem downloads
Visualizações
Visualizações totais
591
No SlideShare
0
A partir de incorporações
0
Número de incorporações
1
Ações
Compartilhamentos
0
Downloads
5
Comentários
0
Gostaram
0
Incorporações 0
Nenhuma incorporação

Nenhuma nota no slide

Data Webhouse CEB/INEP

  1. 1. 1Data Webhouse CEB-INEPProjeto de Iniciação Cientifica-UFMS/CPCXFernando Maia da Mota (Orientando)Profa. MSc. Leila Lisiane Rossi (Orientadora)Prof. Dr. Marcelo Augusto Santos Turine(Coordenador Projeto Web-Pide)
  2. 2. Apresentação• Fernando Maia daMota(fernandomaia.eti.br)• Graduando em Sistemas de Informaçãopela UFMS - Campus Coxim• Atua no Laboratório de Suporte eDesenvolvimento (LSD)• Aluno de Iniciação Científica• Analista de BI2
  3. 3. Agenda3• Motivação• Avaliações INEP• Fontes de Informação• Objetivo• Data Webhouse CEB-INEP• Dificuldades e Limitações• Considerações Finais• Referências• Perguntas
  4. 4. MOTIVAÇÃOComo tornar os dados dos Sistemas deAvaliação do Brasil (INEP/MEC) ”maisacessíveis e transparentes” aos gestoreseducacionais, educadores/pesquisadorese comunidade em geral a fim de melhorara qualidade da Educação Brasileira4
  5. 5. Caderno: Qualidade da Educação - OEstado de São Paulo (29 de Abril de2007)• Segundo pesquisa do Ibope em Julho/2006 (4.002entrevistados) 29% não conhecem os exames deavaliação do INEP/MEC– “Os dados dos sistemas de avaliação são um instrumentopoderoso. Mas há professores que não sabem como ler eter acesso”.– “Não sei como ‘fuçar’ os dados de maneira a incrementarmeu trabalho ou conhecer minha realidade”– “Como comparar minha escola com outras bemposicionadas para melhoria da educação. Não é nossocostume e não tem ninguém na minha escola que nosajude”– “Oportunidades para aprender com os dados”5
  6. 6. Avaliações INEP• Censo Escolar(CEB): levantamento de informações estatístico-educacionais realizado anualmente;• Censo Superior: coleta anualmente uma série de dados doensino superior no País tanto na modalidade presencial como adistância;• Avaliação dos Cursos de Graduação: é utilizado pelo MEC parao reconhecimento ou renovação de reconhecimento doscursos de graduação;• Avaliação Institucional: análise das informações prestadospelas Instituições de Ensino Superior (IES) no FormulárioEletrônico e a verificação, in loco, da realidade institucional,dos seus cursos de graduação e de pós-graduação, dapesquisa e da extensão;6
  7. 7. Avaliações INEP• Sistema Nacional de Avaliação da Educação Superior(SINAES):Formado por três componentes principais: avaliação dasinstituições, dos cursos e do desempenho dos estudantes.• Exame Nacional do Ensino Médio (ENEM): exame de saídafacultativo aos que já concluíram e aos concluintes do ensinomédio;• Exame Nacional Para Certificação de Competências(ENCCEJA): Avaliação nacional para jovens e adultos que nãopuderam concluir os estudos na idade própria;• Sistema Nacional de Avaliação da Educação Básica (SAEB):pesquisa por amostragem, do ensino fundamental e médio,realizada a cada dois anos.7
  8. 8. Fontes de Informação• Relatórios em formato PDF (website do INEP ou depesquisas) [INEP,2010]– Difícil cruzamento de dados• Consultas personalizadas em várias ferramentasdiferentes– Apenas dados do Censo Escolar e Censo da EducaçãoSuperior• Microdados em formato ASCII (disponível em CD-Rom e download)– Necessita de sistema de leitura e conhecimento técnico:SAS ou SPSS, por exemplo8Esse quadro dificultasubstancialmente areutilização de taisinformações para a tomada dedecisão na gestão pública
  9. 9. ObjetivoDefinir e Implementar uma plataforma aberta ebaseada em Software Livre na Internet intituladaWeb-PIDE (http://webpide.ledes.net) paraintegrar, organizar e disponibilizar os dadoseducacionais do INEP por meio de umalinguagem simples e padronizada (altaacessibilidade e usabilidade)9
  10. 10. 10• Meta: INTEGRAR diversas ferramentas implantadasno INEP por uma solução integrada e centralizada... +
  11. 11. Projetos de Pesquisa• O projeto Webpide é composto por váriosprojetos sendo um deles a avaliação e ostestes com as ferramentas a serem usadaspara criação dos Data Webhouses que irãocompor a plataforma Web-PIDE.Técnicas e Ferramentas para o Projeto de DataWarehouse: Estudo de Caso para a Base deDados Educacional do Projeto Webpide11
  12. 12. Técnicas e Ferramentas para oProjeto de Data Warehouse• 2007/2008- Estudo e Avaliação dasFerramentas– Pentaho é escolhida por ser a melhor soluçãoopen-source entre todas as pesquisadas.12
  13. 13. Técnicas e Ferramentas para oProjeto de Data Warehouse• 2008 / 2009 – Desenvolvimento DataWebhouse SAEB– Criação do primeiro DW do projeto para abase do SAEB• 2009/2010 - Desenvolvimento Data WebhouseCEB-INEP– BI-Server.• Controle de Acesso• Evolução Visual• Usuário pode criar visões próprias e salva-las no portal.13
  14. 14. Estrutura base CEB14
  15. 15. ETL- Etapa 115• Carregar os dados em tabelas de um bancode dados.– SGBD PostgreSQL• INEP.sql- Contém a estrutura das tabelas– Criação da ferramenta DEAR para leitura dosarquivos:• SAS- Contém o inicio e fim de cada campodado(Alguns Arquivos corrompidos)• Microdados- Arquivos TXT em formatoASCII com dados brutos
  16. 16. Ferramenta DEAR: Data ExtractorASCII to Relational16
  17. 17. DEAR17Aplicação que faz a leitura dos arquivos SAS [JAVA,2010]
  18. 18. Informações da Base• Cluster com mais de 10GB de dados• Grande variação de dados ao longo dosanos de pesquisa18
  19. 19. 19Definição do Modelo Multidimensional• Definiu-se a tabela que contém osdados do censo escolar, por estarpresente em todos os anos dapesquisa, sendo assim variante notempo, conceito primordial de um DW• Mapeamento detalhado dos camposdesta tabela, para a construção de ummodelo com alto nível de granularidade
  20. 20. 20Cubo EstrelaCubo Estrela CEB-INEP [JUDE,2010]
  21. 21. ETL- Etapa 2Carga das Dimensões e Fato•Carga das dimensões feito através de script SQL•Carga Fato– Look-up das dimensões através de store procedures• GetGeografia(região do Brasil, UF, Município,Zona Escolar), retorna o id do registro quesatisfaz a estas condições na tabela dimensãoGeografia– A fato foi carregada utilizando script sql insert/select[PostgreSQL,2010]21
  22. 22. BI-Server Pentaho [PENTAHO,2010]22
  23. 23. PSW- Mapeamento do Cubo emXML23
  24. 24. Data Webhouse CEB-INEP24
  25. 25. Número de Instituições porRegião e Ano25
  26. 26. Número de Professores em Sala deAula por Região e Ano26
  27. 27. Número de Matriculas na Pré-escolana cidade de Alvaraes-AM (MDX)27
  28. 28. Número de Matriculas na Pré-escolapor Geografia(Ano de 1996)28
  29. 29. Dificuldades e Limitações• Compreender e analisar os dados e aconsistência dos mesmos: estruturas eformatos (.sas, .pdf, .txt);• Capacidade HD/Ferramenta Banco Dados29
  30. 30. Considerações Finais30• Importância da Integração das Bases de Dados doINEP (CEB-INEP);• Disponibilização dos Dados Educacionais INEP naWeb permitindo consultas analiticas online (OLAP);• Facilidade do INEP na tomada de decisão para aadoção de Políticas Educacionais;• Uso de tecnologias de código aberto para odesenvolvimento de softwares do governo federal;• Participação de pesquisadores de Universidadespúblicas no projeto (UFMS / UFScar);
  31. 31. Referências• INEP - Instituto Nacional de Estudos e Pesquisas EducacionaisAnísio Teixeira. - http://www.inep.gov.br• TURINE M.A.S.et al. - Projeto de Pesquisa EDITAL no.001/2006/INEP/CAPES Web-PIDE: Uma Plataforma aberta deIntegração e avaliação de Dados Educacionais, 2006• PENTAHO, Pentaho Open Source Business Intelligence -http://www.pentaho.com, 2010• JUDE, Jude Design & Communications - //http://jude.change-vision.com, 2010• PostgreSQL - http://www.postgresql.org, 2010• JAVA, Sun Microsystems - http://www.sun.com, 2010• Caio Moreno de Souza - http://blog.professorcoruja.com31
  32. 32. CONTATOSFernando Maiamota.fernandomaia@gmail.comwww.fernandomaia.eti.brLeila Lisiane Rossileilalrossi@gmail.comMarcelo Augusto dos Santos Turinemturine@gmail.com32

×