2. A Mineração de Dados (MD) é usada para transformar grandes volumes de dados
em informações significativas para o planejamento, a gestão e a tomada de decisão
nas mais diversas áreas de conhecimento.
3. Medicina
•Ex: prever paciente com maior probabilidade de contrair uma doença
específica, com base nos dados históricos dos pacientes
Telecomunicações
•Ex: identificar fraudes em ligações telefônicas, dentre um enorme
número de ligações efetuadas pelos clientes
Mercado financeiro
•Ex: prever as ações que estarão em alta na bolsa de valores, em função
do histórico de preços das ações e valores de índices financeiros
Abordaremos, a seguir, aplicações de MD na área de Educação
4. Fonte: http://www.educationaldatamining.org/proceedings
A base da MDE é composta de
modelos, tarefas, métodos e
algoritmos usados para explorar
conjuntos de dados de larga escala de
ambientes educacionais com objetivo
de descobrir padrões descritivos e
predições que forneçam informações
sobre o contexto em que os alunos
aprendem os quais ajudem a
compreender e melhorar o ensino e a
aprendizagem.
5. Esse campo de conhecimento teve início
em 2005 com o Workshop ‘Educational
Data Mining’ em Pittsburg, como evento
satélite da 20th National Conference on
Artificial Intelligence (AAAI-05)
Outros workshops seguiram-se e uma
Conferência anual exclusiva para MDE
foi criada em 2008, em Montreal
Em 2009, foi criado um periódico
específico: Journal of Educational Data
Mining, mantido pela EDM Society
Há livros publicados, por ex: “Data
mining in E- learning”e “Handbook of
Educational Data Mining”
MD
E
A MDE faz parte do campo da Analítica de Aprendizagem (Learning Analytics)
como um dos seus métodos, ao lado da Aprendizagem de máquina e da Análise
estatística.
6.
7. Educação offline
• Análises em dados de desempenho/comportamento do aluno, currículo etc
Aprendizado eletrônico (e-learning) e Sistema de Gestão da
Aprendizagem (LMS)
• Análises de dados armazenados em ambientes virtuais de aprendizagem,
como Moodle ou Blackboard, ou de MOOCs.
Sistemas Tutores Inteligentes e Sistemas Hipermídias
Adaptativos
• Aplicados sobre dados de sistemas que se adaptam a cada estudante, aos
cursos e aos modelos de usuário etc.
[Romero, Ventura, 2010]
11. INSTITUIÇÃO
APRENDIZ
IMEDIATO ADIADOHora de usar os dados
Locus de controle e
autoridade
Ex: sistemas
adaptativos; tutoria
automática;
intervenções de ensino
síncrona
Ex: sistemas de intervenção;
sistema de alerta precoce de
retenção; intervenções de
ensino assíncrona mudanças
de nível institucional
Ex: feedback em testes
online
Ex: apresentação de
dados individuais ou
agregados para reflexão
Powell, 2012
12. Alunos
Auto-reflexão, comparações de coortes, aprendizagem automatizada etc
Professores
Retenção, progressão, satisfação/experiência dos alunos etc.
Desenvolvedores de curso
Design para o sucesso; avaliação, conteúdo, estratégias de ensino etc
Dirigentes
Retenção, progressão, eficiência, controle interno de indicadores do MEC, INEP,
Capes etc
Pesquisadores
Pedagogia, modelos, teoria etc.
A MDE não fornece respostas para os PORQUÊS, mas oferece pistas que podem
ser validadas por análises qualitativas.
13. Que alunos preferem qual sequência de assuntos para que eles possam aprender
mais efetivamente?
Que ações do aluno indicam satisfação e engajamento com o curso EaD?
Quais são as melhores características de cursos online em termos de atingir uma
aprendizagem mais efetiva?
Que ações dos alunos estão associadas com um melhor aprendizado e maior
desempenho acadêmico?
Como os alunos aprendem?
Como desenvolver sistemas educacionais mais eficazes?
Que abordagem instrucional (ex. aprendizagem individual ou colaborativa)
proporciona melhores benefícios educacionais ao aluno?
Qual a matéria de maior impacto?
Quem mais interage?
Qual perfil de quem mais colabora?
O que fazem quando estão logados no site?
O que foi mais útil / efetivo na aquisição de novas competências?
14. Prever o desempenho e comportamento futuro da
aprendizagem do aluno e propor modelos pedagógicos que
melhor se alinhem com esse comportamento
Encontrar sequência de instruções ótimas e adaptadas
para cada aluno
Melhorar a satisfação do aluno, diplomação, retenção e
diminuir a evasão de curso e abandono de disciplina
Verificar se o aluno está desmotivado, confuso ou com
problema e, assim, personalizar o ambiente e os métodos
de ensino para oferecer melhores condições de
aprendizagem.
15. Integração com Dados Abertos
Personalização da Aprendizagem
Infraestrutura para Mineração de Dados Educacionais
Integrando MDE e Internet das Coisas (IoT)
Mineração de dados em jogos educacionais, MOOCs e Sistemas Tutores
Inteligentes
Integrando MDE e Analítica de Aprendizagem (Learning Analytics)
Mineração de dados na aprendizagem social e colaborativa
Adaptação de técnicas analíticas de recuperação de informação, sistemas
de recomendação, análise de redes sociais, mineração de opinião para o
domínio educativo
Metodologias que aplicam uma técnica utilizada anteriormente para um
novo domínio, ou que reavaliam um conjunto de dados existente com uma
nova técnica.
16. Complexidade dos comportamentos de aprendizagem
Coletar e integrar todos os dados obtidos de diversas plataformas de
aprendizagem e de vários dispositivos
Definir as perguntas se deve fazer aos dados para obter as respostas úteis
na mineração dos dados educacionais
Estabelecer a modelagem mais adequada
Desenvolver competências de interpretação e pensamento crítico
Convencer os stakeholders de que poderiam se beneficiar dos resultados
obtidos através do uso de técnicas de MDE
Garantir e preservar a privacidade
Fazer análise preditiva com ética
Dispor de conjuntos de dados públicos de referência para MDE
17. Baker, R.S. .d., Barnes, Beck, .E. Eds. Educational Data Mining. 1st International Conference on Educational Data Mining,
Proceedings. Montreal, Quebec, Canada. June 20-21, 2008.
Beck, J, Proceedings of Association for the Advancement of Artificial Intelligence 2005 workshop on Educational Data Mining,
2005.
Conference Proceedings of International Conference on Educational Data Mining
http://www.educationaldatamining.org/proceedings
Fayyad, U.; Piatetsky-Shapiro, G.; Smyth, P.. The KDD process for extracting useful knowledge from volumes of data.
Communications of the ACM, v. 39, n. 11, p. 27-34, 1996.
Manhães, L. M. B., Cruz, S.M.S., Zimbrão, G., et. al. Identificação dos Fatores que Influenciam a Evasão em Cursos de
Graduação Através de Sistemas Baseados em Mineração de Dados: Uma Abordagem Quantitativa. Anais do VIII Simpósio
Brasileiro de Sistemas de Informação (SBSI 2012), pp. 468-479, 2012.
Peña-Ayala, A. Educational data mining: A survey and a data mining-based analysis of recent works. Expert systems with
applications, v. 41, n. 4, p. 1432-1462, 2014.
Powell, S. Explaining learning analytics to colleagues https://stephenp.net/2012/04/17/explaining-learning-analytics-to-
colleagues/
Rodrigues, R.L; Ramos, J.L.C.; Silva, J.C.S. A literatura brasileira sobre mineração de dados educacionais. 3o. Congresso
Brasileiro de Informática na Educação (CBIE), 2014.
Romero, C.; Ventura, S. Data Mining in E-Learning, WIT Press, 2006.
Romero, C.; Ventura, S. Educational data mining: a review of the state of the art. IEEE Transactions on Systems, Man, and
Cybernetics, Part C: Applications and Reviews, vol. 40, n. 6, p. 601-618, 2010.
Romero, C.; Ventura, S. Handbook of Educational Data Mining, CRC Press, 2010.
Planilha compartilhada de coleta de dados de artigos em EDM publicados no Brasil: http://bit.ly/mdeBrasil
http://www.educationaldatamining.org/proceedings
http://blog.originlearning.com/understanding-educational-data-mining/
http://www.devmedia.com.br/mineracao-de-dados-educacionais-usando-kdd-parte-2/29142
http://www.slideshare.net/krice100/educational-data-mining-in-program-evaluation-lessons-learned
Notas do Editor
O grande volume de dados gerado pelo uso intensivo de dados vem ultrapassando a capacidade humana de interpretar e compreender tanta informação.
Isso impulsionou o desenvolvimento do KDD (Knowledge Discovery in Database), que é baseado na busca, análise e interpretação de padrões úteis, retirados de grandes bases de dados.
A Mineração de Dados (MD) é uma das etapas principais dentro do KDD, originada da Estatística, Inteligência Artificial e Banco de Dados.
A MD é usada para transformar grandes volumes de dados em informações significativas para o planejamento, a gestão e a tomada de decisão nas mais diversas áreas de conhecimento.
Mineração de dados é parte de um processo que tem como entrada uma base de dados e como saída um conhecimento [Fayyad et al, 1996]
Outras áreas de aplicação: Educação, Marketing, Agronegócios, Indústria, retail sales, bioinformatics, and counter-terrorism.
Outras áreas de conhecimento: Visualização
Está inerentemente dentro da categoria denominada “Análise de Dados Secundários”
Methods from the psychometrics literature are often integrated with methods from the machine learning and data mining literatures to achieve this goal.
For example, in mining data about how students choose to use educational software, it may be worthwhile to simultaneously consider data at the keystroke level, answer level, session level, student level, classroom level, and school level. Issues of time, sequence, and context also play important roles in the study of educational data.
Alguns chamam de tarefas da MD – depois escolha de um algoritmo, o qual depende basicamente dos atributos disponíveis.
Modelos preditivos: (baseado no artigo de Leandro Silva (workshop de 2014)
Classificação de dados é quando o atributo especial da base de treinamento é formando por uma categoria.
No contexto de educação, um processo de classificação poderia ser feito para prever se o aluno merece ou não uma bolsa de estudos, se ele está apto para participar de um intercambio, se ele se formará no prazo ou não e etc. Apesar dos exemplos serem com apenas duas classes, a classificação ainda pode ser feita para múltiplas classes.
Previsão de séries é o nome dado quando o atributo especial é um valor contínuo. No contexto de educação, a previsão poderia ser feita para inferir a nota do aluno em uma disciplina, a nota média do aluno no final do curso, a quantidade de faltas no final de um semestre, dentre outros.
Análise de agrupamento: a descoberta poderia ser útil para descobrir estilos de aprendizado dos alunos, disciplinas de interesses comuns e muitas outras aplicações
Regra de associação: alunos aprovados na disciplina A também é aprovado na disciplina B ou aprovado em A e B também é aprovado na disciplina C. Ou então, aluno que acerta uma questão X na prova também acerta a Y e assim por diante
Descoberta com modelos: este modelo, um determinado aprendiz pode estar em dois contexto: não aprendeu um determinado assunto ou aprendeu este assunto. Há uma probabilidade p(T) de haver uma transição entre o estado de Não-Aprendido para o estado de Aprendido.
Em ambos os estados, trabalha-se com duas probabilidades:
▪ p(G): probabilidade do aprendiz responder corretamente um grupo de questões dado que não aprendeu o conteúdo (por exemplo, o aluno “chutou” a resposta);
▪ p(S): probabilidade do aprendiz responder corretamente um grupo de questões dado que aprendeu o conteúdo.
Adicionalmente, há uma quarta probabilidade, p(L0), que especifica a probabilidade de um aprendiz possuir um conhecimento (um conhecimento prévio, por
exemplo) no estado de aprendizado de um determinado conteúdo.
Destilação de dados resume e apresenta os dados de maneira útil, interativa e com apelo visual para favorecer a identificação e classificação de padrões por seres humanos. Um exemplo típico desta técnica são as bem-conhecidas curvas de aprendizagem que mostra que o aprendizado aumenta com a experiência.
A predição é um processo que depende de uma janela de tempo. Existem, essencialmente, três janelas de tempo importantes em MDE (Silva, e Silva, 2014) :
▪ Exatamente agora ou agora: o estudante está usando o ambiente neste momento ?
▪ Futuro próximo: um estudante que usou o ambiente há pouco tempo desenvolveu habilidades para a próxima unidade ?
▪ Futuro: qual será a nota do estudante no próximo ENEM/ENADE ?
Com a expansão dos cursos EaD e híbridos, as técnicas de mineração de dados servirão para explorar padrões de dados para investigar questões desse tipo.
Todo esse processo acontece em um ciclo. Veja como: Imagine um aluno que faz logon no LMS e navega pelo material de aprendizagem, durante o qual ele também interage com os sistemas on-line na forma de cliques e entradas de texto. No back-end, o LMS armazena informações detalhadas sobre o comportamento do aluno em um banco de dados que é usado para prever o desempenho futuro do aluno. Estas previsões e feedback são exibidos em um painel visual que torna a informação fácil de compreender para instrutores e formadores. A próxima vez que o aluno entra em seu LMS, o LMS já conhece seus atributos relacionados à aprendizagem e, portanto, o material de aprendizagem é apresentado com base em seu nível de desempenho e interesse. O papel do treinador é intervir e ajudar quando necessário. Tal sistema tem uma vantagem de duas vias. Por um lado, dá um melhor controle aos alunos, o que é especialmente importante no local de trabalho onde os alunos são adultos, funcionários maduros. Por outro lado, permite que o professor seja um facilitador do aprendizado, para que ele possa contribuir mais para o design de conteúdo inteligente.
http://blog.originlearning.com/understanding-educational-data-mining/