Este documento descreve a carreira de um cientista de dados na área da saúde digital. Ele detalha seu histórico acadêmico e profissional, incluindo pesquisas em grandes empresas de tecnologia e agora na Philips. O documento também explica conceitos como ciência de dados, saúde digital, inteligência artificial na saúde e projetos em Unidades de Terapia Intensiva remotas.
A carreira de cientista de dados para a saúde digital
1. A carreira de cientista de dados para
saúde digital
Dr. Mauro Pichiliani, Researcher/Data Scientist
mauro.pichiliani@philips.com, @pichiliani
2. Sumário
2
Minha carreira
Ciência de dados
Cientista de dados
Saúde digital
AI em saúde digital
Projetos em UTI remota
3. Histórico acadêmico e profissional
3
Escola Técnica Oswaldo Cruz: técnico em processamento de dados (1995 - 1998)
Faculdade São Judas Tadeu: bacharel em ciência da computação (1998 - 2002)
– Foco no mercado de trabalho
Instituto de Tecnologia da Aeronáutica (ITA): Mestrado em ciência da computação (2002 - 2006)
– Pesquisa na área de sistemas colaborativos
ITA/USP/UNC: Doutorado em ciência da computação (2010 - 2016)
– Pesquisa na área de sistemas colaborativos/engenharia de software
– Projeto com financiamento da FAPESP
– Doutorado sanduíche (Ciência sem fronteiras) na Universidade da Carolina do Norte (EUA)
Pesquisa em Big techs:
– IBM Research (2016 - 2022)
– Samsung Research (2022 - 2023)
– Philips Enterprise Informatics (2023 - )
5. Carreira de pesquisador/cientista
5
Pesquisa em computação no Brasil geralmente é feita dentro da universidade
Algumas empresas possuem laboratórios de pesquisa aplicada:
– Melhoria de produtos/serviços internos
– Patentes
– Projeto de inovação
– Compliance com órgãos regulatórios
Institutos possuem linhas de pesquisa mais teóricas/ciência de base
Pesquisa geralmente é aplicada para problemas do mundo real, mas:
– Contribuições científicas e acadêmicas (papers) são importantes!
– Projetos seguem linhas de pesquisa de interesse da instituição
– Sem pesquisa, possivelmente não teríamos diversos gadgets onipresentes
7. O que é ciência de dados
7
Ciência de dados é mais um termo usado para descrever o processo de transformação de dados
em conhecimento (Loukides, 2016)
“Ciência de dados é um campo interdisciplinar sobre métodos científicos, processos e sistemas
usados para extrair conhecimento ou insights a partir dados de diversos formatos” [1]
“Ciência de dados é um ‘conceito para unificar estatística, análise de dados e métodos
relacionados’ de modo a ‘compreender e analisar fenômenos atuais’ com dados” [2]
[1] Dhar, V. (2013). “Data science and prediction”. Ref: https://dl.acm.org/doi/10.1145/2500499
[2] Hayashi, Chikio (1998). “What is Data Science?”. Ref:
https://link.springer.com/chapter/10.1007/978-4-431-65950-1_3
11. O que o mercado espera - Requisitos
11
Requisitos e qualificação (pleno):
Requisitos e qualificação (sênior):
12. O que o mercado espera - Responsabilidades
12
Responsabilidades (pleno):
Responsabilidades (sênior):
13. Saúde digital (digital health)
13
A aplicação das tecnologias de informação na área da saúde possui diversas frentes:
Clínica (chatbots, diagnóstico)
Terapêutica (descoberta de novas drogas)
Hospitalar (IA para Electronic Medical Records e Electronic Health Records)
Saúde pessoal (Wearables)
Genômica (descoberta de propensão a doenças)
Diversas empresas de tecnologia estão investido também. Exemplo:
Samsung Digital Health
AWS Health Data Portfolio
Microsoft Healthcare
Philips Healthcare
15. AI na saúde
15
Principais aplicações da AI na área da saúde:
Diagnóstico mais preciso e rápido
Aliviar a carga de trabalho de profissionais da saúde (automação)
Prever necessidades futuras de saúde (recursos hospitalares)
Descoberta e testes de novos medicamentos
Formação de novos profissionais
Desafios:
Caraterísticas dos dados: faltantes, incompletos, inconsistentes
Questões operacionais de adoção da tecnologia
Pouca margem para erros
Processos regulatórios
+ desafios comuns de AI (viés, privacidade, discriminação, transparência)
16. Gen AI na saúde
16
Generative AI: tecnologia capaz de gerar dados que se parecem muito com o conteúdo gerado
por seres humanos
Exemplos mais comuns: ChatGPT, BARD, DALL-E
Usos de Gen AI na saúde:
Escrita e sumarização de manuais e documentação técnica
Geração de dados sintéticos (texto e imagem)
Chatbots para a saúde (dúvidas, terapias baseadas em conversa, burocracia)
Automação de processos manuais (checagem de documentação)
Auxílio de diagnóstico (suportando especialistas na escrita do laudo)
Gerenciamento de conhecimento técnico (sumarização de referências)
17. Projetos em UTI remota
17
Ambiente de UTI (Unidade de Terapia Intensiva) possui dados em abundância:
Monitoração cardiorrespiratória contínua
Exames de laboratório
Anotações médicas e da enfermagem
Plataforma PhysioNet (physionet.org): datasets públicos e anonimizados com dados de UTI
Graças à pandemia o uso de UTIs remotas se intensificou
Neste contexto diversos usos de AI são propostos:
Prever progresso da doença
Predição de intervenção (ex: intubação)
Predição de choques (anafiláticos, cardiogênico, hipovolêmico)
LOS (Length of Stay): Tempo de duração na UTI
Probabilidade de retorno para a UTI depois de alta