Uma inves*gação dosdesafios no ciclo
de vida do aprendizado de máquina e a
importância do MLOps: Um Survey
AUTORES:
Bruno Faus2no
Alinne Souza
Lincoln Costa
Francisco Carlos Souza
MLOPS
• Cultura queunifica a as a*vidades de desenvolvimento com as operacionais
• Ciclo de vida de AM
3
4.
OBJETIVO
MLOps pode o2mizaro ciclo de vida de
AM por meio de prá2cas, automação de
processos e estrutura.
Iden2ficar os desafios enfrentados pelos
profissionais de ciência de dados durante
o ciclo de vida de AM, contemplando
desde o desenvolvimento até a
implantação de modelos em produção.
4
5.
SURVEY
Analisar desenvolvimento deprodutos centrados em AM com o
propósito de iden2ficar os desafios enfrentados e como o MLOps
pode minimizar esses desafios do ponto de vista de profissionais que
atuam na área de ciência de dados no contexto de ciclo de vida de
AM."
5
6.
Questões de Pesquisa
QP1- Qual perfil dos profissionais atuantes na área de ciência de
dados e da empresa na qual trabalham?
QP2 - Quais são as principais a=vidades desempenhadas pelos
profissionais atuantes na área de ciência de dados nas empresas?
QP3 - Quais desafios são enfrentados durante o ciclo de vida de
AM?
6
7.
Etapas da Condução
Públicoalvo: 66
profissionais que
atuam na área de
ciência de dados
Ques.onário: 25
questões
Condução de um
survey piloto
Período: 29 de Junho
a 5 de Agosto de
2022
Análise quan.ta.va:
estaAsBca descriBva
Análise qualita.va:
análise de discurso e
visualização de
dados
7
8.
Resultados
QP1 - Qualperfil dos profissionais atuantes na área de ciência de dados e da empresa na qual trabalham?
Nível
Cargo
8
9.
Resultados
QP1 - Qualperfil dos profissionais atuantes na área de ciência de dados e da empresa na qual trabalham?
Porte das Empresas
Classificação das Empresas
37% não possuem equipes
dedicadas à implantação de
modelos de AM em produção.
23% são de SoAware
26% prestam Serviços Financeiros
9
10.
Resultados
64% sempre realizama
Limpeza e transformação
dos dados
47% sempre realizam a
Coleta de dados
QP2 - Quais são as principais a=vidades desempenhadas pelos profissionais atuantes na área de ciência de
dados nas empresas?
10
11.
Resultados
• 56% desenvolvemnovos modelos
• 86% implantam modelos em produção
• 45% tem até no máximo 5 modelos em
produção
• 19% tem de 6 a 10 modelos em
produção
• 40% não fazem Monitoramento de
modelos em ambiente de produção
• 43% não fazem automação do processo
de treinamento de modelos
QP2 - Quais são as principais a=vidades desempenhadas pelos profissionais atuantes na área de ciência de
dados nas empresas?
11
12.
Resultados
QP3 - Quaisdesafios são enfrentados durante o ciclo de vida de AM?
81% dados necessários
insuficiente ou
incompletos
53% dificuldade no
versionamento de
datasets
12
13.
Considerações Finais
A implantaçãoe sustentação de modelos em
produção é dificultosa pois os profissionais
desenvolvem os algoritmos e disponibilizam em
formato de script
Reprodu.bilidade de
experimentos
Disponibilização em
formato de serviço
Retreino de modelos
Construção de
pipelines de
integração con.nua
e entrega conLnua
PRÁTICAS DE MLOPs
13
14.
Trabalhos Futuros
Desenvolver umestudo de caso sobre a experiência na
implementação das prá8cas de MLOps
Conduzir uma inves8gação aprofundada sobre os
impactos da gestão de dados eficiente como parte do
ciclo de vida de Aprendizado de Máquina.
14
15.
Uma inves*gação dosdesafios no ciclo
de vida do aprendizado de máquina e a
importância do MLOps: Um Survey
AUTORES:
Bruno Faus2no
Alinne Souza
Lincoln Costa
Francisco Carlos Souza