SlideShare uma empresa Scribd logo
1 de 28
Baixar para ler offline
Inteligência Artificial
na Educação
Prof. Dr. Seiji Isotani
Clustering
Nesta aula, aprenderemos alguns
conceitos básicos sobre Clustering e
como usá-los no Orange
Início
Clustering é uma técnica de Mineração de Dados (MD) que
visa encontrar grupos de dados (em um determinado
conjunto de dados) de forma automática, segundo um certo
grau de semelhança. Cada grupo de dados formado pode ser
chamado de cluster.
Clustering
Existem diversos algoritmos de clustering e cada um visa
maximizar a similaridade de dados dentro de um mesmo
cluster e minimizar a similaridade entre dados de clusters
diferentes. Cada algoritmo calcula a silhueta (Silhouette
score) para verificar a distância entre os elementos no
cluster. Os clusters formados podem então ser validados,
interpretados e analisados por um especialista da área.
Clustering
Neste curso, focaremos no algoritmo K-means por ser um
dos mais difundidos e utilizados. O agrupamento pode ser
utilizado para encontrar padrões em conjuntos de dados e
nos permite explorar diversas características
simultaneamente, diferente das RAs e ABs.
Clustering
Consideramos que o professor Seiji quer saber as
características dos alunos que abandonaram ou continuaram
com o curso de uma determinada turma. Para isso, ele criou
uma planilha com 3 variáveis sendo: Se o aluno tem
computador em casa (Sim / Não), a situação do aluno
(Aprovado / Reprovado) e o status do curso (Continuou /
Abandonou)
Exemplo prático
Considerando isso, como podemos ajudar o professor Seiji a
encontrar as seguintes informações:
Que grupos poderiam ser formados usando o agrupamento?
Exemplo prático
Vamos utilizar o Orange e as funções
k-Means e Visualize para resolver esse
problema
Início
É hora de praticar
Na interface padrão do Orange,
vamos criar um novo workflow
clicando na opção NEW
É hora de praticar
Na interface inicial, cliquem
na opção FILE.
É hora de praticar
O arquivo irá aparecer no
nosso workflow. Ao colocar
o mouse por cima,
podemos verificar que ele
não possui nenhum input.
É hora de praticar
Ao clicar no FILE dentro do
nosso workflow, uma nova
tela irá aparecer onde
iremos abrir o arquivo
desejado (no nosso caso, o
arquivo a ser aberto será o
que está em anexo nos
exemplos ORANGE -
FREQUÊNCIA E
NOTAS.XLSX).
É hora de praticar
Agora vamos abrir a aba
Unsupervised, e chamar o
item k-Means, fazendo a
ligação com o nosso File
É hora de praticar
A função k-Means por
padrão define um número
fixo de clusters como 3,
mas isso pode ser alterado
pelo usuário.
É hora de praticar
Também é possível
escolher a quantidade de
cluster e visualizar, em
tempo real, a silhueta de
cada cluster a fim de
identificar o número de
clusters ideal para serem
analisados.
É hora de praticar
Informação importante sobre a silhueta do cluster:
- Pode variar entre [-1,1] onde:
- -1 significa que os dados estão
incorretos ou errados
- 0 significa sobreposição dos
dados
- 1 significa que os conjuntos estão
bem distintos
Neste exemplo, podemos ver que com 3 clusters a
silhueta já está num valor aceitável para análise
(> 0,6)
É hora de praticar
A visualização dos clusters pode ser
feita de duas formas: textual ou
gráfica. De forma textual, podemos
chamar a função Data Table, onde é
possível visualizar uma tabela
contendo o Cluster e a silhueta
daquele dado.
É hora de praticar
A visualização gráfica pode ser feita
por meio de um Scatter Plot (aba
Visualize)
É hora de praticar
Uma vez que não temos valores
numéricos nos dados que estão
sendo analisados atualmente,
podemos classificar os clusters de
acordo com a silhueta. Também
podemos pintar, modificar a forma e
as legendas com base nos clusters
(Color, Shape, Label), assim como
visualizar o tamanho do cluster
através da sua silhueta.
É hora de praticar
Também é possível fazer uma
análise mais aprofundada, através
de sentenças lógicas através da
função Select Rows, da aba Data.
É hora de praticar
Nesta função, podemos definir
diversas condições lógicas como,
por exemplo, verificar as colunas
onde: Tem computador em casa =
Sim; Situação = Aprovado; e Status
do curso = Continuou (Podemos
adicionar mais condições no botão
Add Condition).
É hora de praticar
Em seguida, fazemos a ligação da
função Select Rows com o Scatter
Plot e...
É hora de praticar
Podemos verificar os grupos e qual o
Cluster, que atende as nossas
condições, está marcado no gráfico
É hora de praticar
A partir disso, o professor Seiji
conseguiu identificar que um grupo
de alunos que abandonou a
disciplina foi reprovado e não tinham
computador em casa e foram
reprovados (C2); enquanto outro
grupo de alunos que continuaram o
curso era formado majoritariamente
por alunos que possuem computador
em casa e foram aprovados (C3)
Com isto, aprendemos como criar e
analisar clusters utilizando o Orange
Início
Clustering na educação com Orange

Mais conteúdo relacionado

Último

CRUZADINHA - Leitura e escrita dos números
CRUZADINHA   -   Leitura e escrita dos números CRUZADINHA   -   Leitura e escrita dos números
CRUZADINHA - Leitura e escrita dos números Mary Alvarenga
 
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEMCOMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEMVanessaCavalcante37
 
Manual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envioManual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envioManuais Formação
 
PROGRAMA DE AÇÃO 2024 - MARIANA DA SILVA MORAES.pdf
PROGRAMA DE AÇÃO 2024 - MARIANA DA SILVA MORAES.pdfPROGRAMA DE AÇÃO 2024 - MARIANA DA SILVA MORAES.pdf
PROGRAMA DE AÇÃO 2024 - MARIANA DA SILVA MORAES.pdfMarianaMoraesMathias
 
GÊNERO TEXTUAL - TIRINHAS - Charges - Cartum
GÊNERO TEXTUAL - TIRINHAS - Charges - CartumGÊNERO TEXTUAL - TIRINHAS - Charges - Cartum
GÊNERO TEXTUAL - TIRINHAS - Charges - CartumAugusto Costa
 
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptxSlides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptxLuizHenriquedeAlmeid6
 
Noções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdfNoções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdflucassilva721057
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...azulassessoria9
 
Literatura Brasileira - escolas literárias.ppt
Literatura Brasileira - escolas literárias.pptLiteratura Brasileira - escolas literárias.ppt
Literatura Brasileira - escolas literárias.pptMaiteFerreira4
 
Livro O QUE É LUGAR DE FALA - Autora Djamila Ribeiro
Livro O QUE É LUGAR DE FALA  - Autora Djamila RibeiroLivro O QUE É LUGAR DE FALA  - Autora Djamila Ribeiro
Livro O QUE É LUGAR DE FALA - Autora Djamila RibeiroMarcele Ravasio
 
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdfPortfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdfjanainadfsilva
 
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxSlides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxLuizHenriquedeAlmeid6
 
Transformações isométricas.pptx Geometria
Transformações isométricas.pptx GeometriaTransformações isométricas.pptx Geometria
Transformações isométricas.pptx Geometriajucelio7
 
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...licinioBorges
 
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)Mary Alvarenga
 
A horta do Senhor Lobo que protege a sua horta.
A horta do Senhor Lobo que protege a sua horta.A horta do Senhor Lobo que protege a sua horta.
A horta do Senhor Lobo que protege a sua horta.silves15
 
o ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdfo ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdfCamillaBrito19
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...azulassessoria9
 
A poesia - Definições e Característicass
A poesia - Definições e CaracterísticassA poesia - Definições e Característicass
A poesia - Definições e CaracterísticassAugusto Costa
 
Descreve o conceito de função, objetos, imagens, domínio e contradomínio.
Descreve o conceito de função, objetos, imagens, domínio e contradomínio.Descreve o conceito de função, objetos, imagens, domínio e contradomínio.
Descreve o conceito de função, objetos, imagens, domínio e contradomínio.Vitor Mineiro
 

Último (20)

CRUZADINHA - Leitura e escrita dos números
CRUZADINHA   -   Leitura e escrita dos números CRUZADINHA   -   Leitura e escrita dos números
CRUZADINHA - Leitura e escrita dos números
 
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEMCOMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
COMPETÊNCIA 1 DA REDAÇÃO DO ENEM - REDAÇÃO ENEM
 
Manual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envioManual da CPSA_1_Agir com Autonomia para envio
Manual da CPSA_1_Agir com Autonomia para envio
 
PROGRAMA DE AÇÃO 2024 - MARIANA DA SILVA MORAES.pdf
PROGRAMA DE AÇÃO 2024 - MARIANA DA SILVA MORAES.pdfPROGRAMA DE AÇÃO 2024 - MARIANA DA SILVA MORAES.pdf
PROGRAMA DE AÇÃO 2024 - MARIANA DA SILVA MORAES.pdf
 
GÊNERO TEXTUAL - TIRINHAS - Charges - Cartum
GÊNERO TEXTUAL - TIRINHAS - Charges - CartumGÊNERO TEXTUAL - TIRINHAS - Charges - Cartum
GÊNERO TEXTUAL - TIRINHAS - Charges - Cartum
 
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptxSlides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
Slides Lição 5, CPAD, Os Inimigos do Cristão, 2Tr24, Pr Henrique.pptx
 
Noções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdfNoções de Farmacologia - Flávia Soares.pdf
Noções de Farmacologia - Flávia Soares.pdf
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
 
Literatura Brasileira - escolas literárias.ppt
Literatura Brasileira - escolas literárias.pptLiteratura Brasileira - escolas literárias.ppt
Literatura Brasileira - escolas literárias.ppt
 
Livro O QUE É LUGAR DE FALA - Autora Djamila Ribeiro
Livro O QUE É LUGAR DE FALA  - Autora Djamila RibeiroLivro O QUE É LUGAR DE FALA  - Autora Djamila Ribeiro
Livro O QUE É LUGAR DE FALA - Autora Djamila Ribeiro
 
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdfPortfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
Portfolio_Trilha_Meio_Ambiente_e_Sociedade.pdf
 
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptxSlides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
Slides Lição 04, Central Gospel, O Tribunal De Cristo, 1Tr24.pptx
 
Transformações isométricas.pptx Geometria
Transformações isométricas.pptx GeometriaTransformações isométricas.pptx Geometria
Transformações isométricas.pptx Geometria
 
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
11oC_-_Mural_de_Portugues_4m35.pptxTrabalho do Ensino Profissional turma do 1...
 
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
Grupo Tribalhista - Música Velha Infância (cruzadinha e caça palavras)
 
A horta do Senhor Lobo que protege a sua horta.
A horta do Senhor Lobo que protege a sua horta.A horta do Senhor Lobo que protege a sua horta.
A horta do Senhor Lobo que protege a sua horta.
 
o ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdfo ciclo do contato Jorge Ponciano Ribeiro.pdf
o ciclo do contato Jorge Ponciano Ribeiro.pdf
 
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
PROVA - ESTUDO CONTEMPORÂNEO E TRANSVERSAL: LEITURA DE IMAGENS, GRÁFICOS E MA...
 
A poesia - Definições e Característicass
A poesia - Definições e CaracterísticassA poesia - Definições e Característicass
A poesia - Definições e Característicass
 
Descreve o conceito de função, objetos, imagens, domínio e contradomínio.
Descreve o conceito de função, objetos, imagens, domínio e contradomínio.Descreve o conceito de função, objetos, imagens, domínio e contradomínio.
Descreve o conceito de função, objetos, imagens, domínio e contradomínio.
 

Destaque

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthThinkNow
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfmarketingartwork
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024Neil Kimberley
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)contently
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024Albert Qian
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsKurio // The Social Media Age(ncy)
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Search Engine Journal
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summarySpeakerHub
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next Tessa Mero
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentLily Ray
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best PracticesVit Horky
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project managementMindGenius
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...RachelPearson36
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Applitools
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at WorkGetSmarter
 

Destaque (20)

How Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental HealthHow Race, Age and Gender Shape Attitudes Towards Mental Health
How Race, Age and Gender Shape Attitudes Towards Mental Health
 
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdfAI Trends in Creative Operations 2024 by Artwork Flow.pdf
AI Trends in Creative Operations 2024 by Artwork Flow.pdf
 
Skeleton Culture Code
Skeleton Culture CodeSkeleton Culture Code
Skeleton Culture Code
 
PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024PEPSICO Presentation to CAGNY Conference Feb 2024
PEPSICO Presentation to CAGNY Conference Feb 2024
 
Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)Content Methodology: A Best Practices Report (Webinar)
Content Methodology: A Best Practices Report (Webinar)
 
How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024How to Prepare For a Successful Job Search for 2024
How to Prepare For a Successful Job Search for 2024
 
Social Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie InsightsSocial Media Marketing Trends 2024 // The Global Indie Insights
Social Media Marketing Trends 2024 // The Global Indie Insights
 
Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024Trends In Paid Search: Navigating The Digital Landscape In 2024
Trends In Paid Search: Navigating The Digital Landscape In 2024
 
5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary5 Public speaking tips from TED - Visualized summary
5 Public speaking tips from TED - Visualized summary
 
ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd ChatGPT and the Future of Work - Clark Boyd
ChatGPT and the Future of Work - Clark Boyd
 
Getting into the tech field. what next
Getting into the tech field. what next Getting into the tech field. what next
Getting into the tech field. what next
 
Google's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search IntentGoogle's Just Not That Into You: Understanding Core Updates & Search Intent
Google's Just Not That Into You: Understanding Core Updates & Search Intent
 
How to have difficult conversations
How to have difficult conversations How to have difficult conversations
How to have difficult conversations
 
Introduction to Data Science
Introduction to Data ScienceIntroduction to Data Science
Introduction to Data Science
 
Time Management & Productivity - Best Practices
Time Management & Productivity -  Best PracticesTime Management & Productivity -  Best Practices
Time Management & Productivity - Best Practices
 
The six step guide to practical project management
The six step guide to practical project managementThe six step guide to practical project management
The six step guide to practical project management
 
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
 
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
Unlocking the Power of ChatGPT and AI in Testing - A Real-World Look, present...
 
12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work12 Ways to Increase Your Influence at Work
12 Ways to Increase Your Influence at Work
 
ChatGPT webinar slides
ChatGPT webinar slidesChatGPT webinar slides
ChatGPT webinar slides
 

Clustering na educação com Orange

  • 1.
  • 4. Nesta aula, aprenderemos alguns conceitos básicos sobre Clustering e como usá-los no Orange Início
  • 5. Clustering é uma técnica de Mineração de Dados (MD) que visa encontrar grupos de dados (em um determinado conjunto de dados) de forma automática, segundo um certo grau de semelhança. Cada grupo de dados formado pode ser chamado de cluster. Clustering
  • 6. Existem diversos algoritmos de clustering e cada um visa maximizar a similaridade de dados dentro de um mesmo cluster e minimizar a similaridade entre dados de clusters diferentes. Cada algoritmo calcula a silhueta (Silhouette score) para verificar a distância entre os elementos no cluster. Os clusters formados podem então ser validados, interpretados e analisados por um especialista da área. Clustering
  • 7. Neste curso, focaremos no algoritmo K-means por ser um dos mais difundidos e utilizados. O agrupamento pode ser utilizado para encontrar padrões em conjuntos de dados e nos permite explorar diversas características simultaneamente, diferente das RAs e ABs. Clustering
  • 8. Consideramos que o professor Seiji quer saber as características dos alunos que abandonaram ou continuaram com o curso de uma determinada turma. Para isso, ele criou uma planilha com 3 variáveis sendo: Se o aluno tem computador em casa (Sim / Não), a situação do aluno (Aprovado / Reprovado) e o status do curso (Continuou / Abandonou) Exemplo prático
  • 9. Considerando isso, como podemos ajudar o professor Seiji a encontrar as seguintes informações: Que grupos poderiam ser formados usando o agrupamento? Exemplo prático
  • 10. Vamos utilizar o Orange e as funções k-Means e Visualize para resolver esse problema Início
  • 11. É hora de praticar Na interface padrão do Orange, vamos criar um novo workflow clicando na opção NEW
  • 12. É hora de praticar Na interface inicial, cliquem na opção FILE.
  • 13. É hora de praticar O arquivo irá aparecer no nosso workflow. Ao colocar o mouse por cima, podemos verificar que ele não possui nenhum input.
  • 14. É hora de praticar Ao clicar no FILE dentro do nosso workflow, uma nova tela irá aparecer onde iremos abrir o arquivo desejado (no nosso caso, o arquivo a ser aberto será o que está em anexo nos exemplos ORANGE - FREQUÊNCIA E NOTAS.XLSX).
  • 15. É hora de praticar Agora vamos abrir a aba Unsupervised, e chamar o item k-Means, fazendo a ligação com o nosso File
  • 16. É hora de praticar A função k-Means por padrão define um número fixo de clusters como 3, mas isso pode ser alterado pelo usuário.
  • 17. É hora de praticar Também é possível escolher a quantidade de cluster e visualizar, em tempo real, a silhueta de cada cluster a fim de identificar o número de clusters ideal para serem analisados.
  • 18. É hora de praticar Informação importante sobre a silhueta do cluster: - Pode variar entre [-1,1] onde: - -1 significa que os dados estão incorretos ou errados - 0 significa sobreposição dos dados - 1 significa que os conjuntos estão bem distintos Neste exemplo, podemos ver que com 3 clusters a silhueta já está num valor aceitável para análise (> 0,6)
  • 19. É hora de praticar A visualização dos clusters pode ser feita de duas formas: textual ou gráfica. De forma textual, podemos chamar a função Data Table, onde é possível visualizar uma tabela contendo o Cluster e a silhueta daquele dado.
  • 20. É hora de praticar A visualização gráfica pode ser feita por meio de um Scatter Plot (aba Visualize)
  • 21. É hora de praticar Uma vez que não temos valores numéricos nos dados que estão sendo analisados atualmente, podemos classificar os clusters de acordo com a silhueta. Também podemos pintar, modificar a forma e as legendas com base nos clusters (Color, Shape, Label), assim como visualizar o tamanho do cluster através da sua silhueta.
  • 22. É hora de praticar Também é possível fazer uma análise mais aprofundada, através de sentenças lógicas através da função Select Rows, da aba Data.
  • 23. É hora de praticar Nesta função, podemos definir diversas condições lógicas como, por exemplo, verificar as colunas onde: Tem computador em casa = Sim; Situação = Aprovado; e Status do curso = Continuou (Podemos adicionar mais condições no botão Add Condition).
  • 24. É hora de praticar Em seguida, fazemos a ligação da função Select Rows com o Scatter Plot e...
  • 25. É hora de praticar Podemos verificar os grupos e qual o Cluster, que atende as nossas condições, está marcado no gráfico
  • 26. É hora de praticar A partir disso, o professor Seiji conseguiu identificar que um grupo de alunos que abandonou a disciplina foi reprovado e não tinham computador em casa e foram reprovados (C2); enquanto outro grupo de alunos que continuaram o curso era formado majoritariamente por alunos que possuem computador em casa e foram aprovados (C3)
  • 27. Com isto, aprendemos como criar e analisar clusters utilizando o Orange Início