O documento descreve a ferramenta FEBRL, um sistema de código aberto para limpeza, deduplicação e vinculação de registros desenvolvido na Austrália. Apresenta as funcionalidades, demonstração, pontos positivos e negativos do FEBRL.
2. Roteiro
• Introdução
– Motivação
– Record Linkage Process
• FEBRL
• Instalação
• Funcionalidades
• Demonstração
• Pontos positivos
• Pontos negativos
• Conclusão
• Referências
22/11/2014 Universidade Federal do Rio de Janeiro 1
3. Motivação
• Data Linkage na área de saúde
• Funções limitadas
• “Caixas Pretas”
• Usuários com pouca experiência em
programação
0225/11/2014 Universidade Federal do Rio de Janeiro 2
4. Record Linkage Process
05/11/2014
Universidade Federal do Rio de Janeiro 4
22/Universidade Federal do Rio de Janeiro 3
5. FEBRL
• Freely Extensible Biomedical Record Linkage
• Open Source
• Desenvolvido pelo Australian National
University Data Mining Group
• Versão: 0.4.2 (2011)
• Python
05/11/2014
22/11/2014 Universidade Federal do Rio de Janeiro 4
6. Instalação
• Dependências:
– Python 2.6 ou 2.7
– PyGTK
– Matplotlib
– libsvm
05/11/2014
22/11/2014 Universidade Federal do Rio de Janeiro 5
7. Funcionalidades
• Padronização
• Deduplicação
• Linkagem
• Geocodificação
05/11/2014
22/11/2014 Universidade Federal do Rio de Janeiro 6
9. Pontos positivos
• Grátis
• Open source
• Multiplataforma
• Flexibilidade
• Quantidade de técnicas disponíveis
• Boa documentação e publicações
05/11/2014
22/11/2014 Universidade Federal do Rio de Janeiro 8
10. Pontos negativos
• Dificuldade de escalabilidade (memória
necessária e tempo de processamento)
• Tratamento dos dados combinados
• Ausência de interface gráfica em algumas funções
• Sem acesso direto a sistemas de bancos de dados
• Suporte precário
• Comunidade pequena
• Complexidade da instalação
05/11/2014
22/11/2014 Universidade Federal do Rio de Janeiro 9
11. Conclusão
• Boa para projetos pequenos
• Alta configurabilidade
• Exige conhecimento do usuário sobre os
algoritmos
05/11/2014
22/11/2014 Universidade Federal do Rio de Janeiro 10
12. Referências
[1] Christen, P. “Febrl - A Freely Available Record Linkage System with a
Graphical User Interface”. The Australian National University, Canberra,
Australia, 2008.
[2] Christen, P. “Febrl - A Open Source Data Cleaning, Deduplication
and Record Linkage System with a Graphical User Interface”. The
Australian National University, Canberra, Australia, 2008.
[3] Christen, P. “Development and User Experiences of an Open Source
Data Cleaning, Deduplication and Record Linkage System”. The
Australian National University, Canberra, Australia, s/a.
[4] Christen, P. “Febrl - Freely extensible biomedical record linkage”.
Conferences in Research and Practice in Information Technology
(CRPIT), vol. 80, Wollongong, Australia, 2008.
05/11/2014
22/11/2014 Universidade Federal do Rio de Janeiro 11
Notas do Editor
Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema
Data Linkage na área de saúde: detectar reações adversas a remédios, reduzir custos, descobrir fraudes no sistema