Ferramenta: 
FEBRL 
Luciano Silva Leite 
Pedro de Vasconcellos 
Rachel Gonçalves de Castro
Roteiro 
• Introdução 
– Motivação 
– Record Linkage Process 
• FEBRL 
• Instalação 
• Funcionalidades 
• Demonstração 
• Pontos positivos 
• Pontos negativos 
• Conclusão 
• Referências 
22/11/2014 Universidade Federal do Rio de Janeiro 1
Motivação 
• Data Linkage na área de saúde 
• Funções limitadas 
• “Caixas Pretas” 
• Usuários com pouca experiência em 
programação 
0225/11/2014 Universidade Federal do Rio de Janeiro 2
Record Linkage Process 
05/11/2014 
Universidade Federal do Rio de Janeiro 4 
22/Universidade Federal do Rio de Janeiro 3
FEBRL 
• Freely Extensible Biomedical Record Linkage 
• Open Source 
• Desenvolvido pelo Australian National 
University Data Mining Group 
• Versão: 0.4.2 (2011) 
• Python 
05/11/2014 
22/11/2014 Universidade Federal do Rio de Janeiro 4
Instalação 
• Dependências: 
– Python 2.6 ou 2.7 
– PyGTK 
– Matplotlib 
– libsvm 
05/11/2014 
22/11/2014 Universidade Federal do Rio de Janeiro 5
Funcionalidades 
• Padronização 
• Deduplicação 
• Linkagem 
• Geocodificação 
05/11/2014 
22/11/2014 Universidade Federal do Rio de Janeiro 6
Demonstração 
05/11/2014 
22/11/2014 Universidade Federal do Rio de Janeiro 7
Pontos positivos 
• Grátis 
• Open source 
• Multiplataforma 
• Flexibilidade 
• Quantidade de técnicas disponíveis 
• Boa documentação e publicações 
05/11/2014 
22/11/2014 Universidade Federal do Rio de Janeiro 8
Pontos negativos 
• Dificuldade de escalabilidade (memória 
necessária e tempo de processamento) 
• Tratamento dos dados combinados 
• Ausência de interface gráfica em algumas funções 
• Sem acesso direto a sistemas de bancos de dados 
• Suporte precário 
• Comunidade pequena 
• Complexidade da instalação 
05/11/2014 
22/11/2014 Universidade Federal do Rio de Janeiro 9
Conclusão 
• Boa para projetos pequenos 
• Alta configurabilidade 
• Exige conhecimento do usuário sobre os 
algoritmos 
05/11/2014 
22/11/2014 Universidade Federal do Rio de Janeiro 10
Referências 
[1] Christen, P. “Febrl - A Freely Available Record Linkage System with a 
Graphical User Interface”. The Australian National University, Canberra, 
Australia, 2008. 
[2] Christen, P. “Febrl - A Open Source Data Cleaning, Deduplication 
and Record Linkage System with a Graphical User Interface”. The 
Australian National University, Canberra, Australia, 2008. 
[3] Christen, P. “Development and User Experiences of an Open Source 
Data Cleaning, Deduplication and Record Linkage System”. The 
Australian National University, Canberra, Australia, s/a. 
[4] Christen, P. “Febrl - Freely extensible biomedical record linkage”. 
Conferences in Research and Practice in Information Technology 
(CRPIT), vol. 80, Wollongong, Australia, 2008. 
05/11/2014 
22/11/2014 Universidade Federal do Rio de Janeiro 11

FEBRL

  • 1.
    Ferramenta: FEBRL LucianoSilva Leite Pedro de Vasconcellos Rachel Gonçalves de Castro
  • 2.
    Roteiro • Introdução – Motivação – Record Linkage Process • FEBRL • Instalação • Funcionalidades • Demonstração • Pontos positivos • Pontos negativos • Conclusão • Referências 22/11/2014 Universidade Federal do Rio de Janeiro 1
  • 3.
    Motivação • DataLinkage na área de saúde • Funções limitadas • “Caixas Pretas” • Usuários com pouca experiência em programação 0225/11/2014 Universidade Federal do Rio de Janeiro 2
  • 4.
    Record Linkage Process 05/11/2014 Universidade Federal do Rio de Janeiro 4 22/Universidade Federal do Rio de Janeiro 3
  • 5.
    FEBRL • FreelyExtensible Biomedical Record Linkage • Open Source • Desenvolvido pelo Australian National University Data Mining Group • Versão: 0.4.2 (2011) • Python 05/11/2014 22/11/2014 Universidade Federal do Rio de Janeiro 4
  • 6.
    Instalação • Dependências: – Python 2.6 ou 2.7 – PyGTK – Matplotlib – libsvm 05/11/2014 22/11/2014 Universidade Federal do Rio de Janeiro 5
  • 7.
    Funcionalidades • Padronização • Deduplicação • Linkagem • Geocodificação 05/11/2014 22/11/2014 Universidade Federal do Rio de Janeiro 6
  • 8.
    Demonstração 05/11/2014 22/11/2014Universidade Federal do Rio de Janeiro 7
  • 9.
    Pontos positivos •Grátis • Open source • Multiplataforma • Flexibilidade • Quantidade de técnicas disponíveis • Boa documentação e publicações 05/11/2014 22/11/2014 Universidade Federal do Rio de Janeiro 8
  • 10.
    Pontos negativos •Dificuldade de escalabilidade (memória necessária e tempo de processamento) • Tratamento dos dados combinados • Ausência de interface gráfica em algumas funções • Sem acesso direto a sistemas de bancos de dados • Suporte precário • Comunidade pequena • Complexidade da instalação 05/11/2014 22/11/2014 Universidade Federal do Rio de Janeiro 9
  • 11.
    Conclusão • Boapara projetos pequenos • Alta configurabilidade • Exige conhecimento do usuário sobre os algoritmos 05/11/2014 22/11/2014 Universidade Federal do Rio de Janeiro 10
  • 12.
    Referências [1] Christen,P. “Febrl - A Freely Available Record Linkage System with a Graphical User Interface”. The Australian National University, Canberra, Australia, 2008. [2] Christen, P. “Febrl - A Open Source Data Cleaning, Deduplication and Record Linkage System with a Graphical User Interface”. The Australian National University, Canberra, Australia, 2008. [3] Christen, P. “Development and User Experiences of an Open Source Data Cleaning, Deduplication and Record Linkage System”. The Australian National University, Canberra, Australia, s/a. [4] Christen, P. “Febrl - Freely extensible biomedical record linkage”. Conferences in Research and Practice in Information Technology (CRPIT), vol. 80, Wollongong, Australia, 2008. 05/11/2014 22/11/2014 Universidade Federal do Rio de Janeiro 11

Notas do Editor

  • #4 Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
  • #5 Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
  • #6 Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
  • #7 Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
  • #8 Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
  • #9 Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
  • #10 Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
  • #11 Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
  • #12 Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
  • #13 Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema