Mineração de Dados
Estudos de Caso
Luis Paulo Vieira Braga
lpbraga@geologia.ufrj.br
Page  2
ESTUDOS DE CASO (DENGUE)
Page  3
ESTUDOS DE CASO (DENGUE)
 Introdução
 A dengue é objeto da maior campanha de saúde pública do Brasil,
que se concentra no controle do vetor Ae. aegypti. Este mosquito
está adaptado a se reproduzir nos ambientes doméstico e
peridoméstico, em recipientes onde se armazenam água potável e
recipientes descartáveis comumente encontrados nos lixos das
cidades onde se acumula água de chuvas. A dengue está presente
em todos os 27 estados da Federação, distribuída por 3.794
municípios. O Brasil contribui com cerca de 60% das notificações da
dengue nas Américas.
Page  4
ESTUDOS DE CASO (DENGUE)
 A introdução seqüencial de diferentes sorotipos do vírus da dengue
contribui para pressionar a incidência desta doença. Em 1981, os
sorotipos DEN-1 e DEN 4 foram os primeiros a serem isolados em
uma epidemia de dengue ocorrida Boa Vista, Estado de Roraima.
Após um silêncio epidemiológico, o sorotipo DEN-1 invadiu o
Sudeste, tendo como porta de entrada a cidade do Rio de Janeiro, e
o Nordeste, entrando pelas capitais dos estados de Alagoas, Ceará,
Pernambuco, Bahia e Minas Gerais, em 1986-1987. A partir daí,
espalhou-se por todo o país.
Page  5
ESTUDOS DE CASO (DENGUE)
 Os sorotipos DEN-2 emergiu em 1990-1991, e o DEN-3 em 2001-2002.
No momento, estes três sorotipos circulam simultaneamente em 24
estados da Federação, contribuindo para a incidência das formas
graves da dengue (dengue hemorrágica e síndrome do choque da
dengue) nas cidades onde se registram epidemias sequenciais por
pelo menos dois sorotipos diferentes. Por outro lado, também a
virulência das linhagens epidêmica pode ser algumas vezes o
determinante principal das formas complicadas e das formas
hemorrágicas.
Page  6
ESTUDOS DE CASO (DENGUE)
 A progressão da dengue depende de condições ecológicas e socio-
ambientais que facilitam a dispersão do vetor. Na ausência de uma
vacina eficaz, o controle da transmissão do vírus da dengue requer
o esforço conjunto de toda a sociedade no combate ao vetor. Dada a
extraordinária capacidade de adaptação do Ae. aegypti ao ambiente,
esta tarefa nem sempre produz resultados previsíveis.
Page  7
ESTUDOS DE CASO (DENGUE)
 No presente paradigma da Saúde Pública, a dengue é um problema
que vem sendo abordado em termos populacionais e ambientais.
Não se tem abordado o problema em termos dos perfis ou padrões
de pacientes expostos ao vírus da dengue. Assim, é preciso
identificar, numa massa de dados referentes a pacientes
caracterizados por um conjunto de parâmetros comuns, o perfil ou
perfis dos indivíduos acometidos pela dengue e dos que, apesar de
expostos ao vetor, não forma infectados pelo vírus da dengue.
Page  8
ESTUDOS DE CASO (DENGUE)
 Trata-se, portanto, de classificar os casos identificando classes de
perfis ou padrões (estabelecer um modelo descritivo), bem como
predizer, a partir de um conjunto de atributos (ou histórico dos
indivíduos), qual ou quais indivíduos serão “targets” para a infecção
pelo vírus da dengue, se exposto ao mesmo. Está claro que tais
resultados são pertinentes à população em estudo, pois os atributos
usados para descrever seus indivíduos não são universais, mas
locais.
Page  9
ESTUDOS DE CASO (DENGUE)
 Este tipo de investigação é conhecido como “mineração de dados”
(Data Mining), e não é ainda usada correntemente na saúde pública
de nosso país. Acreditamos que a introdução da tecnologia de Data
Mining possa otimizar as tomadas de decisões referentes à
prevenção da dengue e outros agravos identificando os perfis dos
indivíduos alvos para as ações de saúde pública, segundo a região e
condições em que os dados foram colhidos.
Page  10
ESTUDOS DE CASO (DENGUE)
 O instrumento de coleta de dados é um formulário com 87 campos
Page  11
ESTUDOS DE CASO (DENGUE)
 O paciente ao procurar o serviço de saúde com suspeita de dengue,
passa pela etapa de identificação – campos 1 a 25, em seguida se
submete um exame clínico – campos 26 a 41, podendo ou não ser
encaminhado para atendimento(internação) campos 42 a 48 ou para
exames de laboratório – campos 49 a 70. Nos exames de laboratório
a primeira bateria refere-se à sorologia. Se o resultado for negativo,
a hipótese de dengue é descartada, senão vai para a etapa seguinte
que é o isolamento viral. Caso se confirme, passa para a
patologia(histopatologia e imunohistopatologia). As conclusões
compreendem os campos 71 a 82. Cabendo ainda um campo livre
para observações e a identificação do investigador.
Page  12
ESTUDOS DE CASO (DENGUE)
Exemplo de um modelo descritivo
Ana Carolina Carioca, Fabiane Cirino, Renata Souza Bueno
Page  13
ESTUDOS DE CASO (DENGUE)
Page  14
ESTUDOS DE CASO (DENGUE)
Page  15
ESTUDOS DE CASO (DENGUE)
Page  16
ESTUDOS DE CASO (DENGUE)
Page  17
ESTUDOS DE CASO (DENGUE)
Page  18
ESTUDOS DE CASO (DENGUE)
Page  19
ESTUDOS DE CASO (DENGUE)
Page  20
ESTUDOS DE CASO (DENGUE)
Page  21
ESTUDOS DE CASO (DENGUE)
Page  22
ESTUDOS DE CASO (DENGUE)
Page  23
ESTUDOS DE CASO (DENGUE)
Page  24
ESTUDOS DE CASO (DENGUE)
Page  25
ESTUDOS DE CASO (DENGUE)
Page  26
ESTUDOS DE CASO (DENGUE)
Page  27
ESTUDOS DE CASO (DENGUE)
Page  28
ESTUDOS DE CASO (DENGUE)
Page  29
ESTUDOS DE CASO (DENGUE)
Page  30
ESTUDOS DE CASO (DENGUE)
Page  31
ESTUDOS DE CASO (DENGUE)
Page  32
ESTUDOS DE CASO (DENGUE)
Page  33
ESTUDOS DE CASO (DENGUE)
 Ajustar um modelo preditivo para o diagnóstico de dengue;
 Usar o modelo ajustado para diagnosticar novos casos a partir
somente dos dados clínicos;
 Reduzir os custos com exame de sangue para diagnóstico
positivo ou negativo de dengue.
Exemplo de um Modelo Preditivo*
Marcelo Marinho Lacerda Andrade, Mariana Belmar da Costa
B. de Mello, Thiago Batalha Nunes
* Apresentado na XXX Jornada Iniciacão Científica da UFRJ
OBJETIVOS
Page  34
ESTUDOS DE CASO (DENGUE)
 Antes do cálculo do modelo, foi necessário tratar os dados
fornecidos pelo Sistema de Informação de Agravos de
Notificação (SINAN) do Ministério da Saúde.
Etapas do tratamento:
1) Exclusão de variáveis;
2) Dados errados;
3) Dados faltantes (missings);
4) Significância das variáveis.
 Após o tratamento, houve redução na quantidade de variáveis de
75,86% nos casos de 2001 e 2002 (redução de 87 para 21
variáveis).
TRATAMENTO DOS DADOS
Page  35
ESTUDOS DE CASOS (DENGUE)
Page  36
ESTUDOS DE CASO (DENGUE)
 Variável resposta: ID_DG_NOT (Diagnóstico Dengue)
 Variáveis preditivas (dados clínicos):
Variáveis dos bancos de dados 2001-2002 após o tratamento
Page  37
ESTUDOS DE CASO (DENGUE)
Page  38
ESTUDOS DE CASO (DENGUE)
Page  39
ESTUDOS DE CASO (DENGUE)
Page  40
ESTUDOS DE CASO (DENGUE)
Page  41
ESTUDOS DE CASO (DENGUE)
Page  42
ESTUDOS DE CASO (DENGUE)
Page  43
ESTUDOS DE CASO (DENGUE)
Mineração de Dados
Recursos
Luis Paulo Vieira Braga
lpbraga@geologia.ufrj.br
RECURSOS
Introducción a la minería de datos, Orallo; Quintana e Ramirez,
Prentice Hall
Data Mining: Concepts and Techniques, Han; Kamber,
Morgan Kaufman
RECURSOS
intmindat.blogspot.com
RECURSOS
RECURSOS
http://archive.ics.uci.edu/ml/
RECURSOS
RECURSOS
RECURSOS
RECURSOS

IEncontroestudos de caso

  • 1.
    Mineração de Dados Estudosde Caso Luis Paulo Vieira Braga lpbraga@geologia.ufrj.br
  • 2.
    Page  2 ESTUDOSDE CASO (DENGUE)
  • 3.
    Page  3 ESTUDOSDE CASO (DENGUE)  Introdução  A dengue é objeto da maior campanha de saúde pública do Brasil, que se concentra no controle do vetor Ae. aegypti. Este mosquito está adaptado a se reproduzir nos ambientes doméstico e peridoméstico, em recipientes onde se armazenam água potável e recipientes descartáveis comumente encontrados nos lixos das cidades onde se acumula água de chuvas. A dengue está presente em todos os 27 estados da Federação, distribuída por 3.794 municípios. O Brasil contribui com cerca de 60% das notificações da dengue nas Américas.
  • 4.
    Page  4 ESTUDOSDE CASO (DENGUE)  A introdução seqüencial de diferentes sorotipos do vírus da dengue contribui para pressionar a incidência desta doença. Em 1981, os sorotipos DEN-1 e DEN 4 foram os primeiros a serem isolados em uma epidemia de dengue ocorrida Boa Vista, Estado de Roraima. Após um silêncio epidemiológico, o sorotipo DEN-1 invadiu o Sudeste, tendo como porta de entrada a cidade do Rio de Janeiro, e o Nordeste, entrando pelas capitais dos estados de Alagoas, Ceará, Pernambuco, Bahia e Minas Gerais, em 1986-1987. A partir daí, espalhou-se por todo o país.
  • 5.
    Page  5 ESTUDOSDE CASO (DENGUE)  Os sorotipos DEN-2 emergiu em 1990-1991, e o DEN-3 em 2001-2002. No momento, estes três sorotipos circulam simultaneamente em 24 estados da Federação, contribuindo para a incidência das formas graves da dengue (dengue hemorrágica e síndrome do choque da dengue) nas cidades onde se registram epidemias sequenciais por pelo menos dois sorotipos diferentes. Por outro lado, também a virulência das linhagens epidêmica pode ser algumas vezes o determinante principal das formas complicadas e das formas hemorrágicas.
  • 6.
    Page  6 ESTUDOSDE CASO (DENGUE)  A progressão da dengue depende de condições ecológicas e socio- ambientais que facilitam a dispersão do vetor. Na ausência de uma vacina eficaz, o controle da transmissão do vírus da dengue requer o esforço conjunto de toda a sociedade no combate ao vetor. Dada a extraordinária capacidade de adaptação do Ae. aegypti ao ambiente, esta tarefa nem sempre produz resultados previsíveis.
  • 7.
    Page  7 ESTUDOSDE CASO (DENGUE)  No presente paradigma da Saúde Pública, a dengue é um problema que vem sendo abordado em termos populacionais e ambientais. Não se tem abordado o problema em termos dos perfis ou padrões de pacientes expostos ao vírus da dengue. Assim, é preciso identificar, numa massa de dados referentes a pacientes caracterizados por um conjunto de parâmetros comuns, o perfil ou perfis dos indivíduos acometidos pela dengue e dos que, apesar de expostos ao vetor, não forma infectados pelo vírus da dengue.
  • 8.
    Page  8 ESTUDOSDE CASO (DENGUE)  Trata-se, portanto, de classificar os casos identificando classes de perfis ou padrões (estabelecer um modelo descritivo), bem como predizer, a partir de um conjunto de atributos (ou histórico dos indivíduos), qual ou quais indivíduos serão “targets” para a infecção pelo vírus da dengue, se exposto ao mesmo. Está claro que tais resultados são pertinentes à população em estudo, pois os atributos usados para descrever seus indivíduos não são universais, mas locais.
  • 9.
    Page  9 ESTUDOSDE CASO (DENGUE)  Este tipo de investigação é conhecido como “mineração de dados” (Data Mining), e não é ainda usada correntemente na saúde pública de nosso país. Acreditamos que a introdução da tecnologia de Data Mining possa otimizar as tomadas de decisões referentes à prevenção da dengue e outros agravos identificando os perfis dos indivíduos alvos para as ações de saúde pública, segundo a região e condições em que os dados foram colhidos.
  • 10.
    Page  10 ESTUDOSDE CASO (DENGUE)  O instrumento de coleta de dados é um formulário com 87 campos
  • 11.
    Page  11 ESTUDOSDE CASO (DENGUE)  O paciente ao procurar o serviço de saúde com suspeita de dengue, passa pela etapa de identificação – campos 1 a 25, em seguida se submete um exame clínico – campos 26 a 41, podendo ou não ser encaminhado para atendimento(internação) campos 42 a 48 ou para exames de laboratório – campos 49 a 70. Nos exames de laboratório a primeira bateria refere-se à sorologia. Se o resultado for negativo, a hipótese de dengue é descartada, senão vai para a etapa seguinte que é o isolamento viral. Caso se confirme, passa para a patologia(histopatologia e imunohistopatologia). As conclusões compreendem os campos 71 a 82. Cabendo ainda um campo livre para observações e a identificação do investigador.
  • 12.
    Page  12 ESTUDOSDE CASO (DENGUE) Exemplo de um modelo descritivo Ana Carolina Carioca, Fabiane Cirino, Renata Souza Bueno
  • 13.
    Page  13 ESTUDOSDE CASO (DENGUE)
  • 14.
    Page  14 ESTUDOSDE CASO (DENGUE)
  • 15.
    Page  15 ESTUDOSDE CASO (DENGUE)
  • 16.
    Page  16 ESTUDOSDE CASO (DENGUE)
  • 17.
    Page  17 ESTUDOSDE CASO (DENGUE)
  • 18.
    Page  18 ESTUDOSDE CASO (DENGUE)
  • 19.
    Page  19 ESTUDOSDE CASO (DENGUE)
  • 20.
    Page  20 ESTUDOSDE CASO (DENGUE)
  • 21.
    Page  21 ESTUDOSDE CASO (DENGUE)
  • 22.
    Page  22 ESTUDOSDE CASO (DENGUE)
  • 23.
    Page  23 ESTUDOSDE CASO (DENGUE)
  • 24.
    Page  24 ESTUDOSDE CASO (DENGUE)
  • 25.
    Page  25 ESTUDOSDE CASO (DENGUE)
  • 26.
    Page  26 ESTUDOSDE CASO (DENGUE)
  • 27.
    Page  27 ESTUDOSDE CASO (DENGUE)
  • 28.
    Page  28 ESTUDOSDE CASO (DENGUE)
  • 29.
    Page  29 ESTUDOSDE CASO (DENGUE)
  • 30.
    Page  30 ESTUDOSDE CASO (DENGUE)
  • 31.
    Page  31 ESTUDOSDE CASO (DENGUE)
  • 32.
    Page  32 ESTUDOSDE CASO (DENGUE)
  • 33.
    Page  33 ESTUDOSDE CASO (DENGUE)  Ajustar um modelo preditivo para o diagnóstico de dengue;  Usar o modelo ajustado para diagnosticar novos casos a partir somente dos dados clínicos;  Reduzir os custos com exame de sangue para diagnóstico positivo ou negativo de dengue. Exemplo de um Modelo Preditivo* Marcelo Marinho Lacerda Andrade, Mariana Belmar da Costa B. de Mello, Thiago Batalha Nunes * Apresentado na XXX Jornada Iniciacão Científica da UFRJ OBJETIVOS
  • 34.
    Page  34 ESTUDOSDE CASO (DENGUE)  Antes do cálculo do modelo, foi necessário tratar os dados fornecidos pelo Sistema de Informação de Agravos de Notificação (SINAN) do Ministério da Saúde. Etapas do tratamento: 1) Exclusão de variáveis; 2) Dados errados; 3) Dados faltantes (missings); 4) Significância das variáveis.  Após o tratamento, houve redução na quantidade de variáveis de 75,86% nos casos de 2001 e 2002 (redução de 87 para 21 variáveis). TRATAMENTO DOS DADOS
  • 35.
    Page  35 ESTUDOSDE CASOS (DENGUE)
  • 36.
    Page  36 ESTUDOSDE CASO (DENGUE)  Variável resposta: ID_DG_NOT (Diagnóstico Dengue)  Variáveis preditivas (dados clínicos): Variáveis dos bancos de dados 2001-2002 após o tratamento
  • 37.
    Page  37 ESTUDOSDE CASO (DENGUE)
  • 38.
    Page  38 ESTUDOSDE CASO (DENGUE)
  • 39.
    Page  39 ESTUDOSDE CASO (DENGUE)
  • 40.
    Page  40 ESTUDOSDE CASO (DENGUE)
  • 41.
    Page  41 ESTUDOSDE CASO (DENGUE)
  • 42.
    Page  42 ESTUDOSDE CASO (DENGUE)
  • 43.
    Page  43 ESTUDOSDE CASO (DENGUE)
  • 44.
    Mineração de Dados Recursos LuisPaulo Vieira Braga lpbraga@geologia.ufrj.br
  • 46.
  • 47.
    Introducción a laminería de datos, Orallo; Quintana e Ramirez, Prentice Hall Data Mining: Concepts and Techniques, Han; Kamber, Morgan Kaufman RECURSOS
  • 48.
  • 49.
  • 50.
  • 51.
  • 52.
  • 53.