Uma inves*gação dos desafios no ciclo
de vida do aprendizado de máquina e a
importância do MLOps: Um Survey
AUTORES:
Bruno Faus2no
Alinne Souza
Lincoln Costa
Francisco Carlos Souza
CONTEXTUALIZAÇÃO
Inteligência Ar.ficial
Alto volume de dados
Algoritmos robustos
2
MLOPS
• Cultura que unifica a as a*vidades de desenvolvimento com as operacionais
• Ciclo de vida de AM
3
OBJETIVO
MLOps pode o2mizar o ciclo de vida de
AM por meio de prá2cas, automação de
processos e estrutura.
Iden2ficar os desafios enfrentados pelos
profissionais de ciência de dados durante
o ciclo de vida de AM, contemplando
desde o desenvolvimento até a
implantação de modelos em produção.
4
SURVEY
Analisar desenvolvimento de produtos centrados em AM com o
propósito de iden2ficar os desafios enfrentados e como o MLOps
pode minimizar esses desafios do ponto de vista de profissionais que
atuam na área de ciência de dados no contexto de ciclo de vida de
AM."
5
Questões de Pesquisa
QP1 - Qual perfil dos profissionais atuantes na área de ciência de
dados e da empresa na qual trabalham?
QP2 - Quais são as principais a=vidades desempenhadas pelos
profissionais atuantes na área de ciência de dados nas empresas?
QP3 - Quais desafios são enfrentados durante o ciclo de vida de
AM?
6
Etapas da Condução
Público alvo: 66
profissionais que
atuam na área de
ciência de dados
Ques.onário: 25
questões
Condução de um
survey piloto
Período: 29 de Junho
a 5 de Agosto de
2022
Análise quan.ta.va:
estaAsBca descriBva
Análise qualita.va:
análise de discurso e
visualização de
dados
7
Resultados
QP1 - Qual perfil dos profissionais atuantes na área de ciência de dados e da empresa na qual trabalham?
Nível
Cargo
8
Resultados
QP1 - Qual perfil dos profissionais atuantes na área de ciência de dados e da empresa na qual trabalham?
Porte das Empresas
Classificação das Empresas
37% não possuem equipes
dedicadas à implantação de
modelos de AM em produção.
23% são de SoAware
26% prestam Serviços Financeiros
9
Resultados
64% sempre realizam a
Limpeza e transformação
dos dados
47% sempre realizam a
Coleta de dados
QP2 - Quais são as principais a=vidades desempenhadas pelos profissionais atuantes na área de ciência de
dados nas empresas?
10
Resultados
• 56% desenvolvem novos modelos
• 86% implantam modelos em produção
• 45% tem até no máximo 5 modelos em
produção
• 19% tem de 6 a 10 modelos em
produção
• 40% não fazem Monitoramento de
modelos em ambiente de produção
• 43% não fazem automação do processo
de treinamento de modelos
QP2 - Quais são as principais a=vidades desempenhadas pelos profissionais atuantes na área de ciência de
dados nas empresas?
11
Resultados
QP3 - Quais desafios são enfrentados durante o ciclo de vida de AM?
81% dados necessários
insuficiente ou
incompletos
53% dificuldade no
versionamento de
datasets
12
Considerações Finais
A implantação e sustentação de modelos em
produção é dificultosa pois os profissionais
desenvolvem os algoritmos e disponibilizam em
formato de script
Reprodu.bilidade de
experimentos
Disponibilização em
formato de serviço
Retreino de modelos
Construção de
pipelines de
integração con.nua
e entrega conLnua
PRÁTICAS DE MLOPs
13
Trabalhos Futuros
Desenvolver um estudo de caso sobre a experiência na
implementação das prá8cas de MLOps
Conduzir uma inves8gação aprofundada sobre os
impactos da gestão de dados eficiente como parte do
ciclo de vida de Aprendizado de Máquina.
14
Uma inves*gação dos desafios no ciclo
de vida do aprendizado de máquina e a
importância do MLOps: Um Survey
AUTORES:
Bruno Faus2no
Alinne Souza
Lincoln Costa
Francisco Carlos Souza

Apresentação Artigo Computer on the Beach.pdf

  • 1.
    Uma inves*gação dosdesafios no ciclo de vida do aprendizado de máquina e a importância do MLOps: Um Survey AUTORES: Bruno Faus2no Alinne Souza Lincoln Costa Francisco Carlos Souza
  • 2.
  • 3.
    MLOPS • Cultura queunifica a as a*vidades de desenvolvimento com as operacionais • Ciclo de vida de AM 3
  • 4.
    OBJETIVO MLOps pode o2mizaro ciclo de vida de AM por meio de prá2cas, automação de processos e estrutura. Iden2ficar os desafios enfrentados pelos profissionais de ciência de dados durante o ciclo de vida de AM, contemplando desde o desenvolvimento até a implantação de modelos em produção. 4
  • 5.
    SURVEY Analisar desenvolvimento deprodutos centrados em AM com o propósito de iden2ficar os desafios enfrentados e como o MLOps pode minimizar esses desafios do ponto de vista de profissionais que atuam na área de ciência de dados no contexto de ciclo de vida de AM." 5
  • 6.
    Questões de Pesquisa QP1- Qual perfil dos profissionais atuantes na área de ciência de dados e da empresa na qual trabalham? QP2 - Quais são as principais a=vidades desempenhadas pelos profissionais atuantes na área de ciência de dados nas empresas? QP3 - Quais desafios são enfrentados durante o ciclo de vida de AM? 6
  • 7.
    Etapas da Condução Públicoalvo: 66 profissionais que atuam na área de ciência de dados Ques.onário: 25 questões Condução de um survey piloto Período: 29 de Junho a 5 de Agosto de 2022 Análise quan.ta.va: estaAsBca descriBva Análise qualita.va: análise de discurso e visualização de dados 7
  • 8.
    Resultados QP1 - Qualperfil dos profissionais atuantes na área de ciência de dados e da empresa na qual trabalham? Nível Cargo 8
  • 9.
    Resultados QP1 - Qualperfil dos profissionais atuantes na área de ciência de dados e da empresa na qual trabalham? Porte das Empresas Classificação das Empresas 37% não possuem equipes dedicadas à implantação de modelos de AM em produção. 23% são de SoAware 26% prestam Serviços Financeiros 9
  • 10.
    Resultados 64% sempre realizama Limpeza e transformação dos dados 47% sempre realizam a Coleta de dados QP2 - Quais são as principais a=vidades desempenhadas pelos profissionais atuantes na área de ciência de dados nas empresas? 10
  • 11.
    Resultados • 56% desenvolvemnovos modelos • 86% implantam modelos em produção • 45% tem até no máximo 5 modelos em produção • 19% tem de 6 a 10 modelos em produção • 40% não fazem Monitoramento de modelos em ambiente de produção • 43% não fazem automação do processo de treinamento de modelos QP2 - Quais são as principais a=vidades desempenhadas pelos profissionais atuantes na área de ciência de dados nas empresas? 11
  • 12.
    Resultados QP3 - Quaisdesafios são enfrentados durante o ciclo de vida de AM? 81% dados necessários insuficiente ou incompletos 53% dificuldade no versionamento de datasets 12
  • 13.
    Considerações Finais A implantaçãoe sustentação de modelos em produção é dificultosa pois os profissionais desenvolvem os algoritmos e disponibilizam em formato de script Reprodu.bilidade de experimentos Disponibilização em formato de serviço Retreino de modelos Construção de pipelines de integração con.nua e entrega conLnua PRÁTICAS DE MLOPs 13
  • 14.
    Trabalhos Futuros Desenvolver umestudo de caso sobre a experiência na implementação das prá8cas de MLOps Conduzir uma inves8gação aprofundada sobre os impactos da gestão de dados eficiente como parte do ciclo de vida de Aprendizado de Máquina. 14
  • 15.
    Uma inves*gação dosdesafios no ciclo de vida do aprendizado de máquina e a importância do MLOps: Um Survey AUTORES: Bruno Faus2no Alinne Souza Lincoln Costa Francisco Carlos Souza