Um Panorama das Pesquisas em 
Análise de Dados em Andamento na 
UFPB 
Alexandre Duarte 
alexandre[.@]ci.ufpb.br
Ciência 
Financiamento de Pesquisa e Mérito Científico 
Política 
Eleições, Eleitores e Eleitos
Financiamento 
de Pesquisa e 
Mérito 
Científico
Financiamento de Pesquisa e Mérito 
Científico: Edital Universal
Financiamento de Pesquisa e Mérito 
Científico: Edital Universal 
Fato #1: 10 dos 51 Comitês concentram 40% dos projetos 
aprovados 
Fato #2: O Comitê da Computação foi o 9º mais 
contemplado em 2014 (3,2%)
Financiamento de Pesquisa e Mérito 
Científico: Edital Universal
Financiamento de Pesquisa e Mérito 
Científico: Edital Universal 
Fato #3: 20 instituições concentram 52.7% de todos os 
projetos universais aprovados em 2014 
Fato #4: 20 instituições concentram 72.7% de todos os 
projetos universais aprovados em 2014 na Computação
Financiamento de Pesquisa e Mérito 
Científico: Bolsas de Produtividade 
7% 
6% 
5% 
4% 
3% 
2% 
1% 
0% 
Percentual de Bolsas em Andamento 
Distribuição das Bolsas de Produtividade em Pesquisa por Área 
Área
Financiamento de Pesquisa e Mérito 
Científico: Bolsas de Produtividade 
7% 
6% 
5% 
4% 
3% 
2% 
1% 
0% 
Percentual de Bolsas em Andamento 
Distribuição das Bolsas de Produtividade em Pesquisa por Área 
Fato #5: 10 (das 105) áreas concentram 35% das bolsas de 
produtividade em pesquisa do CNPq 
Área 
35%
18.00% 
16.00% 
14.00% 
12.00% 
10.00% 
8.00% 
6.00% 
4.00% 
2.00% 
0.00% 
Percentual de Bolsas em Andamento 
Financiamento de Pesquisa e Mérito 
Científico: Bolsas de Produtividade 
Distribuição das Bolsas de Produtividade em Pesquisa por Instituição 
Instituição
18.00% 
16.00% 
14.00% 
12.00% 
10.00% 
8.00% 
6.00% 
4.00% 
2.00% 
0.00% 
Percentual de Bolsas em Andamento 
Financiamento de Pesquisa e Mérito 
Científico: Bolsas de Produtividade 
Distribuição das Bolsas de Produtividade em Pesquisa por Instituição 
Fato #6: 10 (das 334) instituições contempladas concentram 
52% dos bolsistas de produtividade em pesquisa do CNPq 
Instituição 
52%
Financiamento de Pesquisa e Mérito 
Científico: Bolsas de Produtividade 
12.0% 
10.0% 
8.0% 
6.0% 
4.0% 
2.0% 
0.0% 
Percentual de Bolsas em Andamento 
Distribuição das Bolsas de Produtividade em Pesquisa da área de 
Computação por Instituição 
Instituição
Financiamento de Pesquisa e Mérito 
Científico: Bolsas de Produtividade 
12.0% 
10.0% 
8.0% 
6.0% 
4.0% 
2.0% 
0.0% 
Percentual de Bolsas em Andamento 
Distribuição das Bolsas de Produtividade em Pesquisa da área de 
Computação por Instituição 
Fato #7: 7 (das 63) instituições contempladas concentram 
50% dos bolsistas de produtividade em pesquisa do CNPq 
na área da Computação 
Instituição 
50%
Motivação 
COMO EXPLICAR QUANTITATIVAMENTE 
TAIS CONCENTRAÇÕES?
“Diz-me com quem andas e dir-te-ei quem és. Saiba eu com que te 
ocupas e saberei também no que te poderás tornar.” 
Goethe
Financiamento de 
Pesquisa e Mérito 
Científico: Redes 
de Colaboração 
Profundidade 1: 70 nós e 137 arestas
Financiamento de 
Pesquisa e Mérito 
Científico: Redes 
de Colaboração 
Profundidade 2: 982 nós e 2821 arestas
Financiamento de 
Pesquisa e Mérito 
Científico: Redes 
de Colaboração 
Profundidade 2: 7784 nós e 25797 arestas
Financiamento de Pesquisa e Mérito 
Científico: Projetos em Andamento 
• Predição do Sucesso Científico de Pesquisadores 
Através de Métricas de Análise de Redes Sociais 
(Ayslânya Wanderley) 
• Contando a História da Pós-Graduação no Brasil (Luiz 
Carlos) 
• Quem sou eu no Mundo Acadêmico: Um Sistema 
para Visualização Comparativa de Produção Científica 
(José Leandro)
Predição do Sucesso Científico de Pesquisadores Através de Métricas de 
Análise de Redes Sociais 
É POSSÍVEL PREVER O DESEMPENHO DE UM PESQUISADOR 
POR MEIO DE SUA INTERAÇÃO EM UMA REDE DE 
COLABORAÇÃO CIENTÍFICA?
Predição do Sucesso Científico de Pesquisadores Através de 
Métricas de Análise de Redes Sociais: Metodologia
Predição do Sucesso Científico de Pesquisadores Através de 
Métricas de Análise de Redes Sociais: Modelo Preditivo 
Estimativa Desvio Padrão Teste de Wald P-Valor Limite Inferior Limite Superior 
Intercepto 2,944618 0,763316674 3,857662275 0,0001 1,448544747 4,440691128 
Authority -6,73936 2,407871902 -2,79888634 0,0051 -11,45870198 -2,020017567 
Degree_Centrality 0,017243 0,007735031 2,229224744 0,0258 0,00208274 0,032403506 
PageRank -4,83117 1,681259247 -2,873540896 0,0041 -8,126374773 -1,535959629 
Clustering_Coefficient -4,29246 1,218407018 -3,523010611 0,0004 -6,680494725 -1,904426979 
Matriz de Confusão a 
Observado 
Status_Pesquisador = 0 Status_Pesquisador = 1 
Predito 
Status_Pesquisador = 0 193 (TN) 58 (FN) 
Status_Pesquisador = 1 74 (FP) 209 (TP) 
Desempenho % 
Sensibilidade 78,3 
Especificidade 72,3 
VPP 73,9 
VPN 76,9 
Acurácia 75,3 
a O ponto de corte é 0,5
Contando a História da Pós-Graduação no Brasil 
COMO EVOLUÍRAM OS PROGRAMAS DE PÓS-GRADUAÇÃO 
NO BRASIL AO LONGO DOS ANOS?
Contando a História da Pós-Graduação 
no Brasil 
A network framework of cultural history 
Maximilian Schich, Chaoming Song, Yong-Yeol Ahn, Alexander Mirsky, Mauro Martino, Albert-László Barabási, Dirk Helbing 
Science 1 August 2014: vol. 345 no. 6196 pp. 558-562 DOI: 10.1126/science.1240064
Contando a História da Pós-Graduação 
no Brasil 
• Caracterizar a evolução histórica da formação de 
pesquisadores e dos programas de pós-graduação no 
Brasil 
• Identificar os centros de influência nas diferentes área 
de pesquisa no País 
• Fazer uma análise da correlação entre o local/período 
de formação dos pesquisadores e o conceito dos 
programas de pós-graduação onde estes pesquisadores 
atuam 
• Status: 
• Baixamos o Lattes! (3.9 milhões de currículos em XML) 
• Começando a extração (e normalização) dos dados
Contando a História da Pós-Graduação 
no Brasil
Quem sou eu no Mundo Acadêmico 
UM SISTEMA PARA VISUALIZAÇÃO COMPARATIVA DE 
PRODUÇÃO CIENTÍFICA
Quem sou eu no mundo acadêmico? 
• Desenvolvimento de uma ferramenta para comparação visual 
de currículos lattes 
• Permitir diferentes tipos de análises (visuais) a partir de 
conjuntos de currículos lattes 
• Detecção de tendências 
• Detecção de outliers 
• Superposição de currículos 
• Possíveis sub-conjuntos de interesse 
• Bolsistas de Produtividade 
• Pesquisadores de uma determinada área/idade/instituição/programa de pós 
• Status 
• Começando a extração dos dados
Ciência 
Financiamento de Pesquisa e Mérito Científico 
Política 
Eleições, Eleitores e Eleitos
Eleições, Eleitores e 
Eleitos
Não vote nos Parentes 
Fonte: “Clãs políticos no Congresso Nacional“ - ONG Transparência Brasil
Não vote nos Parentes 
• Correlação = -0.34 (Pearson) 
Coeficiente de Correlação = -0.34 (pearson)
Não vote nos Parentes 
• Correlação = -0.62 (Pearson) 
Coeficiente de Correlação = -0.34 (pearson)
Não vote nos Parentes 
• Correlação = 0.77 (Pearson) 
Coeficiente de Correlação = -0.34 (pearson)
Não vote nos Parentes 
• Somos pobres, subdesenvolvidos e analfabetos 
porque alimentamos as oligarquias 
• Alimentamos as oligarquias porque somos 
pobres, subdesenvolvidos e analfabetos 
• Correlação não implica em causalidade
Quem são os nossos Candidatos?
Quem são os nossos Candidatos?
Quem são os nossos Candidatos?
Quem são os nossos Candidatos?
Quem são os nossos Candidatos?
Quem são os nossos Candidatos?
Quem são os nossos Candidatos?
Política + Religião = ?
Política + Religião = ?
Política + Religião = ?
Política + Religião = ?
Política + Religião = ? 
Se com um crescimento de 1.76% no número de candidatos líderes religiosos de 2006 para 
2010 o número de eleitos nesta área aumentou em 91.7%, o que vai acontecer em 2014, 
com um contingente 34.73% maior de líderes religiosos disputando cargos eletivos ?
Política + Religião = ?
Eleições, Eleitores e Eleitos: Projetos 
em Andamento 
• Coesão Parlamentar: Uma ferramenta para analisar 
mudanças na coesão entre parlamentares em 
votações nominais (Vitor Baptista) 
• Infografia Interativa utilizando Dados Eleitorais (Lucas 
Lacerda, Filipe Araújo e Ed Porto) 
• Um Mapeamento da Genealogia Política no Brasil 
(Maria Clara)
Coesão Parlamentar: Uma ferramenta para analisar mudanças na coesão 
entre parlamentares em votações nominais 
É POSSÍVEL IDENTIFICAR EVENTOS 
POLÍTICOS SIGNIFICATIVOS ATRAVÉS DO 
MONITORAMENTO DA COESÃO 
PARLAMENTAR ?
Coesão Parlamentar: Questões de pesquisa 
• É possível identificar mudanças na coesão 
parlamentar baseando-se nos resultados das 
votações da Câmara? 
• Escândalos, manifestações populares e 
eventos históricos impactam, de alguma 
forma, a coesão parlamentar?
Coesão Parlamentar: Metodologia 
• Extração e mineração de dados através de 
uma API da página da Câmara dos Deputados 
• Criação de API própria para otimizar coleta de 
dados relevantes 
• Criação de um grafo não direcional com 
arestas ponderadas pelo Índice de Rice 
• Criação de uma ferramenta de visualização 
para os dados
Coesão Parlamentar: Estudo de caso - 
Mensalão
Coesão Parlamentar: Estudo de caso - 
Mensalão 
2001
Coesão Parlamentar: Estudo de caso - 
Mensalão 
2002
Coesão Parlamentar: Estudo de caso - 
Mensalão 
2003
Infografia Interativa utilizando Dados Eleitorais 
INFORMAÇÃO É LEGAL! 
INFORMAÇÃO INTERATIVA É AINDA 
MAIS LEGAL!
Infografia Interativa utilizando Dados 
Eleitorais
Infografia Interativa utilizando Dados 
Eleitorais
Infografia Interativa utilizando Dados 
Eleitorais
Infografia Interativa utilizando Dados 
Eleitorais
Um Mapeamento da Genealogia Política no Brasil 
DESCOBRINDO A REDE GENEALÓGICA 
DOS POLÍTICOS BRASILEIROS
Um Mapeamento da Genealogia 
Política no Brasil 
? 
Crowdsourcing!
Um Mapeamento da Genealogia 
Política no Brasil
LABORATÓRIO DE TRANSPARÊNCIA 
PÚBLICA E BUSINESS ANALYTICS
Laboratório de Transparência Pública e 
Business Analytics 
• LABTRANSP (Nome em construção!) 
– 21/11/2014 
• Parceria da UFPB (Departamento de 
Tecnologia em Gestão, Departamento de 
Finanças e Contabilidade+ Centro de 
Informática) com a OnCase 
• Treinamento Pentaho e seleção de bolsistas 
em Dezembro/2014 e Janeiro/2015
Obrigado! 
alexandre@c 
i.ufpb.br

Panorama de Pesquisas em Análise de Dados na UFPB

  • 1.
    Um Panorama dasPesquisas em Análise de Dados em Andamento na UFPB Alexandre Duarte alexandre[.@]ci.ufpb.br
  • 3.
    Ciência Financiamento dePesquisa e Mérito Científico Política Eleições, Eleitores e Eleitos
  • 4.
    Financiamento de Pesquisae Mérito Científico
  • 5.
    Financiamento de Pesquisae Mérito Científico: Edital Universal
  • 6.
    Financiamento de Pesquisae Mérito Científico: Edital Universal Fato #1: 10 dos 51 Comitês concentram 40% dos projetos aprovados Fato #2: O Comitê da Computação foi o 9º mais contemplado em 2014 (3,2%)
  • 7.
    Financiamento de Pesquisae Mérito Científico: Edital Universal
  • 8.
    Financiamento de Pesquisae Mérito Científico: Edital Universal Fato #3: 20 instituições concentram 52.7% de todos os projetos universais aprovados em 2014 Fato #4: 20 instituições concentram 72.7% de todos os projetos universais aprovados em 2014 na Computação
  • 9.
    Financiamento de Pesquisae Mérito Científico: Bolsas de Produtividade 7% 6% 5% 4% 3% 2% 1% 0% Percentual de Bolsas em Andamento Distribuição das Bolsas de Produtividade em Pesquisa por Área Área
  • 10.
    Financiamento de Pesquisae Mérito Científico: Bolsas de Produtividade 7% 6% 5% 4% 3% 2% 1% 0% Percentual de Bolsas em Andamento Distribuição das Bolsas de Produtividade em Pesquisa por Área Fato #5: 10 (das 105) áreas concentram 35% das bolsas de produtividade em pesquisa do CNPq Área 35%
  • 11.
    18.00% 16.00% 14.00% 12.00% 10.00% 8.00% 6.00% 4.00% 2.00% 0.00% Percentual de Bolsas em Andamento Financiamento de Pesquisa e Mérito Científico: Bolsas de Produtividade Distribuição das Bolsas de Produtividade em Pesquisa por Instituição Instituição
  • 12.
    18.00% 16.00% 14.00% 12.00% 10.00% 8.00% 6.00% 4.00% 2.00% 0.00% Percentual de Bolsas em Andamento Financiamento de Pesquisa e Mérito Científico: Bolsas de Produtividade Distribuição das Bolsas de Produtividade em Pesquisa por Instituição Fato #6: 10 (das 334) instituições contempladas concentram 52% dos bolsistas de produtividade em pesquisa do CNPq Instituição 52%
  • 13.
    Financiamento de Pesquisae Mérito Científico: Bolsas de Produtividade 12.0% 10.0% 8.0% 6.0% 4.0% 2.0% 0.0% Percentual de Bolsas em Andamento Distribuição das Bolsas de Produtividade em Pesquisa da área de Computação por Instituição Instituição
  • 14.
    Financiamento de Pesquisae Mérito Científico: Bolsas de Produtividade 12.0% 10.0% 8.0% 6.0% 4.0% 2.0% 0.0% Percentual de Bolsas em Andamento Distribuição das Bolsas de Produtividade em Pesquisa da área de Computação por Instituição Fato #7: 7 (das 63) instituições contempladas concentram 50% dos bolsistas de produtividade em pesquisa do CNPq na área da Computação Instituição 50%
  • 15.
    Motivação COMO EXPLICARQUANTITATIVAMENTE TAIS CONCENTRAÇÕES?
  • 16.
    “Diz-me com quemandas e dir-te-ei quem és. Saiba eu com que te ocupas e saberei também no que te poderás tornar.” Goethe
  • 17.
    Financiamento de Pesquisae Mérito Científico: Redes de Colaboração Profundidade 1: 70 nós e 137 arestas
  • 18.
    Financiamento de Pesquisae Mérito Científico: Redes de Colaboração Profundidade 2: 982 nós e 2821 arestas
  • 19.
    Financiamento de Pesquisae Mérito Científico: Redes de Colaboração Profundidade 2: 7784 nós e 25797 arestas
  • 20.
    Financiamento de Pesquisae Mérito Científico: Projetos em Andamento • Predição do Sucesso Científico de Pesquisadores Através de Métricas de Análise de Redes Sociais (Ayslânya Wanderley) • Contando a História da Pós-Graduação no Brasil (Luiz Carlos) • Quem sou eu no Mundo Acadêmico: Um Sistema para Visualização Comparativa de Produção Científica (José Leandro)
  • 21.
    Predição do SucessoCientífico de Pesquisadores Através de Métricas de Análise de Redes Sociais É POSSÍVEL PREVER O DESEMPENHO DE UM PESQUISADOR POR MEIO DE SUA INTERAÇÃO EM UMA REDE DE COLABORAÇÃO CIENTÍFICA?
  • 22.
    Predição do SucessoCientífico de Pesquisadores Através de Métricas de Análise de Redes Sociais: Metodologia
  • 23.
    Predição do SucessoCientífico de Pesquisadores Através de Métricas de Análise de Redes Sociais: Modelo Preditivo Estimativa Desvio Padrão Teste de Wald P-Valor Limite Inferior Limite Superior Intercepto 2,944618 0,763316674 3,857662275 0,0001 1,448544747 4,440691128 Authority -6,73936 2,407871902 -2,79888634 0,0051 -11,45870198 -2,020017567 Degree_Centrality 0,017243 0,007735031 2,229224744 0,0258 0,00208274 0,032403506 PageRank -4,83117 1,681259247 -2,873540896 0,0041 -8,126374773 -1,535959629 Clustering_Coefficient -4,29246 1,218407018 -3,523010611 0,0004 -6,680494725 -1,904426979 Matriz de Confusão a Observado Status_Pesquisador = 0 Status_Pesquisador = 1 Predito Status_Pesquisador = 0 193 (TN) 58 (FN) Status_Pesquisador = 1 74 (FP) 209 (TP) Desempenho % Sensibilidade 78,3 Especificidade 72,3 VPP 73,9 VPN 76,9 Acurácia 75,3 a O ponto de corte é 0,5
  • 24.
    Contando a Históriada Pós-Graduação no Brasil COMO EVOLUÍRAM OS PROGRAMAS DE PÓS-GRADUAÇÃO NO BRASIL AO LONGO DOS ANOS?
  • 25.
    Contando a Históriada Pós-Graduação no Brasil A network framework of cultural history Maximilian Schich, Chaoming Song, Yong-Yeol Ahn, Alexander Mirsky, Mauro Martino, Albert-László Barabási, Dirk Helbing Science 1 August 2014: vol. 345 no. 6196 pp. 558-562 DOI: 10.1126/science.1240064
  • 26.
    Contando a Históriada Pós-Graduação no Brasil • Caracterizar a evolução histórica da formação de pesquisadores e dos programas de pós-graduação no Brasil • Identificar os centros de influência nas diferentes área de pesquisa no País • Fazer uma análise da correlação entre o local/período de formação dos pesquisadores e o conceito dos programas de pós-graduação onde estes pesquisadores atuam • Status: • Baixamos o Lattes! (3.9 milhões de currículos em XML) • Começando a extração (e normalização) dos dados
  • 27.
    Contando a Históriada Pós-Graduação no Brasil
  • 28.
    Quem sou euno Mundo Acadêmico UM SISTEMA PARA VISUALIZAÇÃO COMPARATIVA DE PRODUÇÃO CIENTÍFICA
  • 29.
    Quem sou euno mundo acadêmico? • Desenvolvimento de uma ferramenta para comparação visual de currículos lattes • Permitir diferentes tipos de análises (visuais) a partir de conjuntos de currículos lattes • Detecção de tendências • Detecção de outliers • Superposição de currículos • Possíveis sub-conjuntos de interesse • Bolsistas de Produtividade • Pesquisadores de uma determinada área/idade/instituição/programa de pós • Status • Começando a extração dos dados
  • 30.
    Ciência Financiamento dePesquisa e Mérito Científico Política Eleições, Eleitores e Eleitos
  • 31.
  • 32.
    Não vote nosParentes Fonte: “Clãs políticos no Congresso Nacional“ - ONG Transparência Brasil
  • 33.
    Não vote nosParentes • Correlação = -0.34 (Pearson) Coeficiente de Correlação = -0.34 (pearson)
  • 34.
    Não vote nosParentes • Correlação = -0.62 (Pearson) Coeficiente de Correlação = -0.34 (pearson)
  • 35.
    Não vote nosParentes • Correlação = 0.77 (Pearson) Coeficiente de Correlação = -0.34 (pearson)
  • 36.
    Não vote nosParentes • Somos pobres, subdesenvolvidos e analfabetos porque alimentamos as oligarquias • Alimentamos as oligarquias porque somos pobres, subdesenvolvidos e analfabetos • Correlação não implica em causalidade
  • 37.
    Quem são osnossos Candidatos?
  • 38.
    Quem são osnossos Candidatos?
  • 39.
    Quem são osnossos Candidatos?
  • 40.
    Quem são osnossos Candidatos?
  • 41.
    Quem são osnossos Candidatos?
  • 42.
    Quem são osnossos Candidatos?
  • 43.
    Quem são osnossos Candidatos?
  • 44.
  • 45.
  • 46.
  • 47.
  • 48.
    Política + Religião= ? Se com um crescimento de 1.76% no número de candidatos líderes religiosos de 2006 para 2010 o número de eleitos nesta área aumentou em 91.7%, o que vai acontecer em 2014, com um contingente 34.73% maior de líderes religiosos disputando cargos eletivos ?
  • 49.
  • 50.
    Eleições, Eleitores eEleitos: Projetos em Andamento • Coesão Parlamentar: Uma ferramenta para analisar mudanças na coesão entre parlamentares em votações nominais (Vitor Baptista) • Infografia Interativa utilizando Dados Eleitorais (Lucas Lacerda, Filipe Araújo e Ed Porto) • Um Mapeamento da Genealogia Política no Brasil (Maria Clara)
  • 51.
    Coesão Parlamentar: Umaferramenta para analisar mudanças na coesão entre parlamentares em votações nominais É POSSÍVEL IDENTIFICAR EVENTOS POLÍTICOS SIGNIFICATIVOS ATRAVÉS DO MONITORAMENTO DA COESÃO PARLAMENTAR ?
  • 52.
    Coesão Parlamentar: Questõesde pesquisa • É possível identificar mudanças na coesão parlamentar baseando-se nos resultados das votações da Câmara? • Escândalos, manifestações populares e eventos históricos impactam, de alguma forma, a coesão parlamentar?
  • 53.
    Coesão Parlamentar: Metodologia • Extração e mineração de dados através de uma API da página da Câmara dos Deputados • Criação de API própria para otimizar coleta de dados relevantes • Criação de um grafo não direcional com arestas ponderadas pelo Índice de Rice • Criação de uma ferramenta de visualização para os dados
  • 54.
    Coesão Parlamentar: Estudode caso - Mensalão
  • 55.
    Coesão Parlamentar: Estudode caso - Mensalão 2001
  • 56.
    Coesão Parlamentar: Estudode caso - Mensalão 2002
  • 57.
    Coesão Parlamentar: Estudode caso - Mensalão 2003
  • 58.
    Infografia Interativa utilizandoDados Eleitorais INFORMAÇÃO É LEGAL! INFORMAÇÃO INTERATIVA É AINDA MAIS LEGAL!
  • 59.
  • 60.
  • 61.
  • 62.
  • 63.
    Um Mapeamento daGenealogia Política no Brasil DESCOBRINDO A REDE GENEALÓGICA DOS POLÍTICOS BRASILEIROS
  • 64.
    Um Mapeamento daGenealogia Política no Brasil ? Crowdsourcing!
  • 65.
    Um Mapeamento daGenealogia Política no Brasil
  • 66.
    LABORATÓRIO DE TRANSPARÊNCIA PÚBLICA E BUSINESS ANALYTICS
  • 67.
    Laboratório de TransparênciaPública e Business Analytics • LABTRANSP (Nome em construção!) – 21/11/2014 • Parceria da UFPB (Departamento de Tecnologia em Gestão, Departamento de Finanças e Contabilidade+ Centro de Informática) com a OnCase • Treinamento Pentaho e seleção de bolsistas em Dezembro/2014 e Janeiro/2015
  • 68.

Notas do Editor

  • #24 Sensibilidade = proporção de previsões corretas entre os verdadeiramente bolsistas: TP / (TP + FN) Especificidade = proporção de previsões corretas entre os verdadeiramente não-bolsistas: TN / (TN + FP) VPP = proporção de previsões corretas entre os apontados como bolsistas: TP / (TP + FP) VPN = proporção de previsões corretas entre os apontados como não-bolsistas: TN / (TN + FN) Acurácia = previsões corretas entre as previsões realizadas : (TN + TP) / (TN + TP + FN + FP)
  • #53 Observamos que em situações como escândalos políticos e manifestações populares geram discussões e dividem opiniões entre os parlamentares. No caso do mensalão, por exemplo, muitos parlamentares tentaram desassociar dos acusados para preservar seus nomes. Sabendo disso, e utilizando-se dos dados das votações nominais na Câmara, disponíveis na Internet, mas de difícil visualização, propomos desenvolver uma ferramenta de visualização de dados que tentasse identificar se tais eventos, de fato, influenciam na coesão parlamentar, e se seria possível descobrir isso apenas utilizando-se desses dados.
  • #68 OnCase: Business Intelligence, Business Analisys - Pentaho