SlideShare uma empresa Scribd logo
1 de 12
Ferramenta: 
FEBRL 
Luciano Silva Leite 
Pedro de Vasconcellos 
Rachel Gonçalves de Castro
Roteiro 
• Introdução 
– Motivação 
– Record Linkage Process 
• FEBRL 
• Instalação 
• Funcionalidades 
• Demonstração 
• Pontos positivos 
• Pontos negativos 
• Conclusão 
• Referências 
22/11/2014 Universidade Federal do Rio de Janeiro 1
Motivação 
• Data Linkage na área de saúde 
• Funções limitadas 
• “Caixas Pretas” 
• Usuários com pouca experiência em 
programação 
0225/11/2014 Universidade Federal do Rio de Janeiro 2
Record Linkage Process 
05/11/2014 
Universidade Federal do Rio de Janeiro 4 
22/Universidade Federal do Rio de Janeiro 3
FEBRL 
• Freely Extensible Biomedical Record Linkage 
• Open Source 
• Desenvolvido pelo Australian National 
University Data Mining Group 
• Versão: 0.4.2 (2011) 
• Python 
05/11/2014 
22/11/2014 Universidade Federal do Rio de Janeiro 4
Instalação 
• Dependências: 
– Python 2.6 ou 2.7 
– PyGTK 
– Matplotlib 
– libsvm 
05/11/2014 
22/11/2014 Universidade Federal do Rio de Janeiro 5
Funcionalidades 
• Padronização 
• Deduplicação 
• Linkagem 
• Geocodificação 
05/11/2014 
22/11/2014 Universidade Federal do Rio de Janeiro 6
Demonstração 
05/11/2014 
22/11/2014 Universidade Federal do Rio de Janeiro 7
Pontos positivos 
• Grátis 
• Open source 
• Multiplataforma 
• Flexibilidade 
• Quantidade de técnicas disponíveis 
• Boa documentação e publicações 
05/11/2014 
22/11/2014 Universidade Federal do Rio de Janeiro 8
Pontos negativos 
• Dificuldade de escalabilidade (memória 
necessária e tempo de processamento) 
• Tratamento dos dados combinados 
• Ausência de interface gráfica em algumas funções 
• Sem acesso direto a sistemas de bancos de dados 
• Suporte precário 
• Comunidade pequena 
• Complexidade da instalação 
05/11/2014 
22/11/2014 Universidade Federal do Rio de Janeiro 9
Conclusão 
• Boa para projetos pequenos 
• Alta configurabilidade 
• Exige conhecimento do usuário sobre os 
algoritmos 
05/11/2014 
22/11/2014 Universidade Federal do Rio de Janeiro 10
Referências 
[1] Christen, P. “Febrl - A Freely Available Record Linkage System with a 
Graphical User Interface”. The Australian National University, Canberra, 
Australia, 2008. 
[2] Christen, P. “Febrl - A Open Source Data Cleaning, Deduplication 
and Record Linkage System with a Graphical User Interface”. The 
Australian National University, Canberra, Australia, 2008. 
[3] Christen, P. “Development and User Experiences of an Open Source 
Data Cleaning, Deduplication and Record Linkage System”. The 
Australian National University, Canberra, Australia, s/a. 
[4] Christen, P. “Febrl - Freely extensible biomedical record linkage”. 
Conferences in Research and Practice in Information Technology 
(CRPIT), vol. 80, Wollongong, Australia, 2008. 
05/11/2014 
22/11/2014 Universidade Federal do Rio de Janeiro 11

Mais conteúdo relacionado

Destaque

Destaque (20)

Design de Interação - Capítulo 8 - Design, Prototipação e Construção -
Design de Interação - Capítulo 8 - Design, Prototipação e Construção - Design de Interação - Capítulo 8 - Design, Prototipação e Construção -
Design de Interação - Capítulo 8 - Design, Prototipação e Construção -
 
Modelos de Cor
Modelos de CorModelos de Cor
Modelos de Cor
 
Curso de Java - Antonio Alves - Aula 01
Curso de Java - Antonio Alves - Aula 01Curso de Java - Antonio Alves - Aula 01
Curso de Java - Antonio Alves - Aula 01
 
Managing Innovation - 3rd edition – Capítulos 10 e 11
Managing Innovation - 3rd edition – Capítulos 10 e 11Managing Innovation - 3rd edition – Capítulos 10 e 11
Managing Innovation - 3rd edition – Capítulos 10 e 11
 
Trabalhando com Chromakey
Trabalhando com ChromakeyTrabalhando com Chromakey
Trabalhando com Chromakey
 
Sistema gerenciadores de bancos de dados
Sistema gerenciadores de bancos de dadosSistema gerenciadores de bancos de dados
Sistema gerenciadores de bancos de dados
 
Edición de Video - Sony Vegas Pro
Edición de Video - Sony Vegas Pro Edición de Video - Sony Vegas Pro
Edición de Video - Sony Vegas Pro
 
Lógica de programação em java
Lógica de programação em javaLógica de programação em java
Lógica de programação em java
 
Modelos de Cor
Modelos de Cor Modelos de Cor
Modelos de Cor
 
Curso de java - Antonio Alves - aula 04
Curso de java - Antonio Alves -  aula 04Curso de java - Antonio Alves -  aula 04
Curso de java - Antonio Alves - aula 04
 
Escopo de variaveis
Escopo de variaveisEscopo de variaveis
Escopo de variaveis
 
Bluetooth Low Energy
Bluetooth Low EnergyBluetooth Low Energy
Bluetooth Low Energy
 
O computador e a contracultura
O computador e a contraculturaO computador e a contracultura
O computador e a contracultura
 
Curso de Java - Antonio Alves - Aula 03
Curso de Java - Antonio Alves - Aula 03Curso de Java - Antonio Alves - Aula 03
Curso de Java - Antonio Alves - Aula 03
 
Edição e Montagem - Aulas 6 e 7
Edição e Montagem - Aulas 6 e 7Edição e Montagem - Aulas 6 e 7
Edição e Montagem - Aulas 6 e 7
 
Multimedia
MultimediaMultimedia
Multimedia
 
Microsoft Word Avanzado UASF
Microsoft Word Avanzado UASFMicrosoft Word Avanzado UASF
Microsoft Word Avanzado UASF
 
Teoria das cores aplicada ao design
Teoria das cores aplicada ao designTeoria das cores aplicada ao design
Teoria das cores aplicada ao design
 
Adobe illustrator vetorizacao - aula 08
Adobe illustrator   vetorizacao - aula 08Adobe illustrator   vetorizacao - aula 08
Adobe illustrator vetorizacao - aula 08
 
Introdução ao designer gráfico aula 01
Introdução ao designer gráfico   aula 01Introdução ao designer gráfico   aula 01
Introdução ao designer gráfico aula 01
 

Semelhante a FEBRL

Apresentação sigeted
Apresentação sigetedApresentação sigeted
Apresentação sigeted
Jelson Santos
 
IN1008 Aspectos de Qualidade na Modelagem de Dados Monica Rafael (1).ppt
IN1008 Aspectos de Qualidade na Modelagem de Dados Monica Rafael (1).pptIN1008 Aspectos de Qualidade na Modelagem de Dados Monica Rafael (1).ppt
IN1008 Aspectos de Qualidade na Modelagem de Dados Monica Rafael (1).ppt
Rafael Rodrigues de Souza
 
Visualização de dados
Visualização de dadosVisualização de dados
Visualização de dados
lrmodesto
 
Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...
Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...
Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...
Fernando Maia da Mota
 
ESTUDO DE MAPEAMENTO OBJETO-RELACIONAL COM FRAMEWORK HIBERNATE
ESTUDO DE MAPEAMENTO OBJETO-RELACIONAL COM FRAMEWORK HIBERNATEESTUDO DE MAPEAMENTO OBJETO-RELACIONAL COM FRAMEWORK HIBERNATE
ESTUDO DE MAPEAMENTO OBJETO-RELACIONAL COM FRAMEWORK HIBERNATE
Fernando A. Barbeiro Campos
 
3º Apresentação Intercalar
3º Apresentação Intercalar3º Apresentação Intercalar
3º Apresentação Intercalar
Grupo3ProjBliblio
 

Semelhante a FEBRL (20)

Grids computacionais
Grids computacionaisGrids computacionais
Grids computacionais
 
Integrar uma Rede de Repositórios no Ecossistema de Gestão de Ciência Naciona...
Integrar uma Rede de Repositórios no Ecossistema de Gestão de Ciência Naciona...Integrar uma Rede de Repositórios no Ecossistema de Gestão de Ciência Naciona...
Integrar uma Rede de Repositórios no Ecossistema de Gestão de Ciência Naciona...
 
Acesso aberto a dados de pesquisa no Brasil
Acesso aberto a dados de pesquisa no BrasilAcesso aberto a dados de pesquisa no Brasil
Acesso aberto a dados de pesquisa no Brasil
 
O NoSQL e o Relacional: Uma Análise
O NoSQL e o Relacional: Uma AnáliseO NoSQL e o Relacional: Uma Análise
O NoSQL e o Relacional: Uma Análise
 
Gestão de dados de investigação da recolha até ao depósito: Uma abordagem bas...
Gestão de dados de investigação da recolha até ao depósito: Uma abordagem bas...Gestão de dados de investigação da recolha até ao depósito: Uma abordagem bas...
Gestão de dados de investigação da recolha até ao depósito: Uma abordagem bas...
 
AllViXM - Initial presentation
AllViXM - Initial presentationAllViXM - Initial presentation
AllViXM - Initial presentation
 
XI Café e CODE - Provocações do Mestre
XI Café e CODE - Provocações do MestreXI Café e CODE - Provocações do Mestre
XI Café e CODE - Provocações do Mestre
 
Apresentação sigeted
Apresentação sigetedApresentação sigeted
Apresentação sigeted
 
IN1008 Aspectos de Qualidade na Modelagem de Dados Monica Rafael (1).ppt
IN1008 Aspectos de Qualidade na Modelagem de Dados Monica Rafael (1).pptIN1008 Aspectos de Qualidade na Modelagem de Dados Monica Rafael (1).ppt
IN1008 Aspectos de Qualidade na Modelagem de Dados Monica Rafael (1).ppt
 
Visualização de dados
Visualização de dadosVisualização de dados
Visualização de dados
 
Jornadas 2016: PTCRIS_Parte II
Jornadas 2016: PTCRIS_Parte IIJornadas 2016: PTCRIS_Parte II
Jornadas 2016: PTCRIS_Parte II
 
Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...
Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...
Uma Estratégia para Publicação dos Dados da Base do CEB-INEP/MEC no Padrão Li...
 
Os Repositórios no Ciclo de vida dos dados - workflows de curadoria, publicaç...
Os Repositórios no Ciclo de vida dos dados - workflows de curadoria, publicaç...Os Repositórios no Ciclo de vida dos dados - workflows de curadoria, publicaç...
Os Repositórios no Ciclo de vida dos dados - workflows de curadoria, publicaç...
 
ESTUDO DE MAPEAMENTO OBJETO-RELACIONAL COM FRAMEWORK HIBERNATE
ESTUDO DE MAPEAMENTO OBJETO-RELACIONAL COM FRAMEWORK HIBERNATEESTUDO DE MAPEAMENTO OBJETO-RELACIONAL COM FRAMEWORK HIBERNATE
ESTUDO DE MAPEAMENTO OBJETO-RELACIONAL COM FRAMEWORK HIBERNATE
 
2019-2 - BD I - Aula 01 A - Plano De Ensino
2019-2 - BD I - Aula 01 A - Plano De Ensino2019-2 - BD I - Aula 01 A - Plano De Ensino
2019-2 - BD I - Aula 01 A - Plano De Ensino
 
Gestão de Dados: Sobreposições ou Convergências entre Infraestruturas?
Gestão de Dados: Sobreposições ou Convergências entre Infraestruturas?Gestão de Dados: Sobreposições ou Convergências entre Infraestruturas?
Gestão de Dados: Sobreposições ou Convergências entre Infraestruturas?
 
Diretrizes OpenAire para Repositórios de Dados, Repositórios de Literatura e ...
Diretrizes OpenAire para Repositórios de Dados, Repositórios de Literatura e ...Diretrizes OpenAire para Repositórios de Dados, Repositórios de Literatura e ...
Diretrizes OpenAire para Repositórios de Dados, Repositórios de Literatura e ...
 
Avaliação de software em open source para a gestão da Biblioteca UNL no Campu...
Avaliação de software em open source para a gestão da Biblioteca UNL no Campu...Avaliação de software em open source para a gestão da Biblioteca UNL no Campu...
Avaliação de software em open source para a gestão da Biblioteca UNL no Campu...
 
3º Apresentação Intercalar
3º Apresentação Intercalar3º Apresentação Intercalar
3º Apresentação Intercalar
 
Diretrizes OpenAire para repositorios
Diretrizes OpenAire para repositorios Diretrizes OpenAire para repositorios
Diretrizes OpenAire para repositorios
 

FEBRL

  • 1. Ferramenta: FEBRL Luciano Silva Leite Pedro de Vasconcellos Rachel Gonçalves de Castro
  • 2. Roteiro • Introdução – Motivação – Record Linkage Process • FEBRL • Instalação • Funcionalidades • Demonstração • Pontos positivos • Pontos negativos • Conclusão • Referências 22/11/2014 Universidade Federal do Rio de Janeiro 1
  • 3. Motivação • Data Linkage na área de saúde • Funções limitadas • “Caixas Pretas” • Usuários com pouca experiência em programação 0225/11/2014 Universidade Federal do Rio de Janeiro 2
  • 4. Record Linkage Process 05/11/2014 Universidade Federal do Rio de Janeiro 4 22/Universidade Federal do Rio de Janeiro 3
  • 5. FEBRL • Freely Extensible Biomedical Record Linkage • Open Source • Desenvolvido pelo Australian National University Data Mining Group • Versão: 0.4.2 (2011) • Python 05/11/2014 22/11/2014 Universidade Federal do Rio de Janeiro 4
  • 6. Instalação • Dependências: – Python 2.6 ou 2.7 – PyGTK – Matplotlib – libsvm 05/11/2014 22/11/2014 Universidade Federal do Rio de Janeiro 5
  • 7. Funcionalidades • Padronização • Deduplicação • Linkagem • Geocodificação 05/11/2014 22/11/2014 Universidade Federal do Rio de Janeiro 6
  • 8. Demonstração 05/11/2014 22/11/2014 Universidade Federal do Rio de Janeiro 7
  • 9. Pontos positivos • Grátis • Open source • Multiplataforma • Flexibilidade • Quantidade de técnicas disponíveis • Boa documentação e publicações 05/11/2014 22/11/2014 Universidade Federal do Rio de Janeiro 8
  • 10. Pontos negativos • Dificuldade de escalabilidade (memória necessária e tempo de processamento) • Tratamento dos dados combinados • Ausência de interface gráfica em algumas funções • Sem acesso direto a sistemas de bancos de dados • Suporte precário • Comunidade pequena • Complexidade da instalação 05/11/2014 22/11/2014 Universidade Federal do Rio de Janeiro 9
  • 11. Conclusão • Boa para projetos pequenos • Alta configurabilidade • Exige conhecimento do usuário sobre os algoritmos 05/11/2014 22/11/2014 Universidade Federal do Rio de Janeiro 10
  • 12. Referências [1] Christen, P. “Febrl - A Freely Available Record Linkage System with a Graphical User Interface”. The Australian National University, Canberra, Australia, 2008. [2] Christen, P. “Febrl - A Open Source Data Cleaning, Deduplication and Record Linkage System with a Graphical User Interface”. The Australian National University, Canberra, Australia, 2008. [3] Christen, P. “Development and User Experiences of an Open Source Data Cleaning, Deduplication and Record Linkage System”. The Australian National University, Canberra, Australia, s/a. [4] Christen, P. “Febrl - Freely extensible biomedical record linkage”. Conferences in Research and Practice in Information Technology (CRPIT), vol. 80, Wollongong, Australia, 2008. 05/11/2014 22/11/2014 Universidade Federal do Rio de Janeiro 11

Notas do Editor

  1. Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
  2. Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
  3. Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
  4. Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
  5. Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
  6. Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
  7. Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
  8. Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
  9. Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
  10. Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema