Globalcode – Open4education
Trilha – Agile & Agile Coaching
Jorge Improissi
Agile Coach - GFT
Globalcode – Open4education
• Agile Coach BAC GFT Brasil
• Análise e Desenvolvimento de sistemas (UCB)
• MBA – Liderança, Inovação e Gestão 4.0 (PUC-RS)
• Pós em Psicologia Organizacional e Gestão de Pessoas
(PUC-RS)
• Idealizador e apresentador do AGILE TO THE PEOPLE
PODCAST
• CSM, CSD, SAFe SA 5, KMP, KCP, Management 3.0,
Flight Levels, CTFL, CPRE
Jorge Improissi
Agile Coach - BAC
jorge.improissi@gft.com
Globalcode – Open4education
O desafio do ágil
em um time de
Machine Learning
Dificuldades e Aprendizados
Dezembro 2022
Globalcode – Open4education
Agenda
• Contexto
• Método de Trabalho para Machine Learning
• Responsabilidades por papéis
• Desafios
• Aprendizados
Globalcode – Open4education
CONTEXTO
Globalcode – Open4education
Contexto
• Área PLD/PCF grande Sistema de
Cooperativas do Brasil;
• Elevado número de Falsos-Positivos
de fraudes em boletos;
• Processo 100% manual;
• Demanda Top-Down;
Globalcode – Open4education
Método de
Trabalho para
Machine
Learning
Globalcode – Open4education
O que é
Machine
Learning?
Globalcode – Open4education
Machine Learning
O aprendizado de máquina (em inglês, machine
learning) é um método de análise de dados que
automatiza a construção de modelos analíticos. É
um ramo da inteligência artificial baseado na ideia
de que sistemas podem aprender com dados,
identificar padrões e tomar decisões com o mínimo
de intervenção humana.
Globalcode – Open4education
Data Mining
“O data mining é, de uma forma muito simples,
definido pela procura de relações, padrões e
tendências escondidas em conjuntos de dados de
grandes dimensões, sendo caracterizado pela
capacidade para lidar com o aumento de dados de
negócio e aceleradas alterações no mercado” (Han
e Kamber, 2006)
Globalcode – Open4education
Processos Ágeis
“Os processos ágeis são tipicamente caracterizados
pela sua flexibilidade, capacidade de adaptação e
partilha de conhecimento, permitindo uma abordagem
iterativa, evolutiva e incremental ao desenvolvimento,
uma entrega rápida do produto, priorização dos
requisitos, envolvimento ativo dos clientes, redução do
custo e do tempo, melhoria na qualidade do software e
o aumento da probabilidade de sucesso de um
projeto.” (Keith, 2012)
Globalcode – Open4education
CRISP-DM
A metodologia CRISP-DM (Cross Industry Standard
Process for Data mining) fornece uma visão geral do
ciclo de vida de um projeto de data mining. Contém as
fases do projeto, as tarefas respectivas e os seus
outputs. O ciclo de vida de um projeto de data mining,
nesta metodologia, é decomposto em seis fases.
(Chapman et al., 2010).
As setas indicam as dependências mais importantes e
frequentes entre as fases. Dependendo do projeto e dos
resultados obtidos numa determinada fase, pode ser
necessário retroceder para uma fase anterior.
Assumindo que o projeto não é cancelado durante a
implementação, o processo não é terminado até que
uma solução chegue à última fase do ciclo.
Globalcode – Open4education
SCRUM-DM
A metodologia SCRUM-DM consiste numa
associação da metodologia ágil Scrum como
metodologia para a gestão do trabalho, e da
metodologia CRISP-DM como estratégia a seguir
no desenvolvimento de um projeto de data mining.
O CRISP-DM foi dividido e adaptado ao Scrum,
sendo o Scrum-DM, à semelhança do CRISP-DM
iniciado por uma fase de Entendimento do
Negócio, onde é realizada a análise dos objetivos e
do negócio, e finalizado por uma fase de
Deployment, onde é realizada a integração dos
resultados do data mining.
O desenvolvimento é realizado na fase de Sprint,
estando contempladas as fases de Entendimento
dos Dados, Preparação dos Dados, Modelagem e
Avaliação do CRISP-DM.
Globalcode – Open4education
Ciclo de Desenvolvimento
SCRUM
Globalcode – Open4education
Ciclo de Desenvolvimento
KANBAN
Globalcode – Open4education
Artefatos
Globalcode – Open4education
Responsabilidad
es por papéis
Globalcode – Open4education
Responsabilidades
PAPEL RESPONSABILIDADES
Product Owner • Identificar e clarificar as necessidades dos stakeholders;
• Representar os stakeholders;
• Definir objetivos e requisitos para o projeto, e colocá-los na
forma de Data Mining Stories;
• Gerir o Product Backlog durante todo o projeto;
• Definir o objetivo para cada Sprint;
• Estar disponível para a equipa; Respeitar os limites de cada
Sprint;
• Rever os resultados de cada Sprint.
Globalcode – Open4education
Responsabilidades
PAPEL RESPONSABILIDADES
Scrum Master • Guiar a equipa e o Product Owner na aplicação da metodologia;
• Ser o especialista na aplicação da metodologia;
• Ajudar a remover impedimentos que a equipa encontre no
desenvolvimento;
• Proteger a equipa de influências externas;
• Apoiar a equipa enquanto se organiza a si mesma;
• Facilitar a aplicação da metodologia; Encorajar a equipa a
melhorar as práticas de desenvolvimento.
Globalcode – Open4education
Responsabilidades
PAPEL RESPONSABILIDADES
DevTeam • Apoiar a definição das Data Mining Stories;
• Definir e comprometer-se com as tarefas para cada Sprint;
• Comprometer-se com a entrega do objetivo do Sprint,
respeitando os critérios de aceitação;
• Desenvolver o que está especificado no Product Backlog.
Globalcode – Open4education
Responsabilidades
“Os produtos são construídos por equipes de
pessoas, e os métodos ágeis se concentram nas
pessoas sobre os processos. A ciência de dados
é uma disciplina ampla, abrangendo análise,
design, desenvolvimento e pesquisa. Os papéis
dos membros da equipe Agile Data Science,
definidos em um espectro do cliente às
operações” – Russell Jurney
Globalcode – Open4education
Responsabilidades
“Para permanecermos ágeis, devemos
abraçar e nos adaptar a essas novas
condições. Devemos adotar mudanças de
acordo com as metodologias enxutas para
nos mantermos produtivos. Várias
mudanças em particular tornam possível o
retorno à agilidade(...)
Em Agile Data Science, uma pequena
equipe de generalistas usa ferramentas
escaláveis ​​e de alto nível e plataformas
para refinar iterativamente os dados em
estados de valor cada vez mais altos.” –
Russell Jurney
Globalcode – Open4education
Conclusão
A metodologia proposta associa a metodologia ágil
Scrum para a gestão de trabalho, o CRISP-DM para o
desenvolvimento de projetos de data mining.
Possibilitando a inspeção contínua do
desenvolvimento do projeto executado pela equipe,
conferindo aos resultados a visibilidade necessária
para que erros ou desalinhamentos com os objetivos
possam ser retificados pouco depois de acontecerem.
Globalcode – Open4education
Conclusão
O SCRUM-DM torna visíveis disfunções e
impedimentos que estão impedindo a eficácia da
equipe, para que possam ser eliminados. A
metodologia permite também uma maior adaptação
a alterações nos objetivos, incentivando o feedback
constante do cliente durante todo o processo de
desenvolvimento.
Globalcode – Open4education
O modelo
proposto deu
certo?
Globalcode – Open4education
NÃO!
Globalcode – Open4education
DESAFIOS
O que nos impediu de
termos êxito?
Globalcode – Open4education
O que nos impediu de termos êxito?
EXPERTISE
CASCATEAMENTO
DESCONHECIMENTO
DO NEGÓCIO
O NEGÓCIO NÃO SABIA COMO SE
COMUNICAR COM A EQUIPE DE DADOS!
Pessoas de negócio não sabiam
comunicar o que queriam e não
entendiam o que era o produto gerado
pelos profissionais de dados.
AS FASES DO CRISP-DM
“CASCATEAVAM” O SCRUM!
Levamos um período grande para
tangibilizar resultados trazendo as fases
do CRISP-DM para o timebox do Scrum.
CONHECIMENTO EM DADOS ERA
LIMITADO!
Os profissionais de dados se atinham
em informações da disciplina, enquanto
desenvolvedores focavam em codificar.
Não falavam a mesma língua!
DEPENDÊNCIAS
DE OUTRAS
ÁREAS
PROJETO
DEPARTAMENTAL
PERFIS
COMPARTILHADOS
PROFISSIONAIS ATUANDO EM MEIO-
PERÍODO!
Membros da equipe não conseguiam ter
dedicação ao projeto, tendo constantes
mudanças de contextos.
Trazendo o dilema: em qual prioridade
atuar?
PROJETO GUIADO POR VAIDADES!
O projeto era tocado de forma impulsiva,
sem tempo para aprendizado, o que
causou muito ruído interno entre time e
stakeholders.
ÁREAS IMPORTANTES NÃO
COLABORANDO ENTRE SI!
Os dados essenciais para o
desenvolvimento do aprendizado de
máquina vinha de várias áreas, que se
viam como concorrentes e não
parceiras.
Globalcode – Open4education
Aprendizados
Globalcode – Open4education
“SOFTWARE ÁGIL NÃO É CIÊNCIA DE DADOS ÁGIL.” –
RUSSELL JURNEY
Globalcode – Open4education
“NA CIÊNCIA DE DADOS, AO CONTRÁRIO DA ENGENHARIA
DE SOFTWARE, O CÓDIGO NEM SEMPRE DEVE SER BOM;
ISTO DEVE SER EVENTUALMENTE BOM. ISSO SIGNIFICA
QUE ALGUMA DÍVIDA TÉCNICA INICIAL É ACEITÁVEL,
DESDE QUE NÃO SEJA EXCESSIVO. ” – RUSSELL JURNEY
Globalcode – Open4education
Gestão por resultados
auxiliando as metas
Globalcode – Open4education
• Exemplo para nosso contexto PCF/ML
-----------------------------
OBJETIVO: diminuir fraude em contas de cooperados (Boletos)
KR 1 - Diminuir para 30% a incidência de falso/positivo nos
casos analisados
KR 2 - Automatizar 20% do processo de análise de fraudes
-------------------------------
Globalcode – Open4education
O que podemos trazer para nosso contexto
PCF/ML
 Identificadas dependências, trazer pessoas
das áreas para uma reunião semanal para
alinhamento da comunicação;
 Evitar o campo “Bloqueio” nos nossos fluxos,
forçando o envolvimento rápido dos
responsáveis que possam ‘desobstruir’ essa
parada do fluxo.
Globalcode – Open4education
Gestão de Fluxo
Globalcode – Open4education
UPSTREAM & DOWNSTREAM
O que é?
Upstream são as etapas do fluxo de trabalho que
tem o objetivo de amadurecer e validar ideias antes
de aplicá-las no mundo real.
Já o downstream se refere à todas as etapas
seguintes do fluxo de trabalho a partir do backlog de
itens gerados no upstream.
Globalcode – Open4education
UPSTREAM & DOWNSTREAM
Globalcode – Open4education
UPSTREAM & DOWNSTREAM
Globalcode – Open4education
UPSTREAM & DOWNSTREAM
Globalcode – Open4education
Ganhos rápidos
Colaboração entre áreas
relacionadas
Melhor comunicação entre
negócio x TI X Data
Disponibilidade em tempo
integral dos profissionais
necessários
Melhor definição de objetivos
da squad
Globalcode – Open4education
E hoje? Modelos de aprendizado rodando para
os processos antifraudes em: boleto,
TED e PIX.
Aplicando melhorias.
APRENDIZADO DE MÁQUINA
Modelo mistura ML com Regra de
negócio, com o objetivo de reduzir os
falsos-positivos.
AUTOMAÇÃO DO PROCESSO
A equipe reconhece que o modelo feito
empiricamente em 2020, muito se
assemelha às práticas sugeridas pelo
modelo Agile Data Science 2.0.
APLICAÇÃO DO MODELO
AGILE DATA SCIENCE
Globalcode – Open4education
A cultura influencia
os contextos,
analisar as melhores
práticas habilitam o
êxito, ou o fracasso,
de nossas iniciativas.
Globalcode – Open4education
Obrigado e até a próxima!

O desafio do ágil em um time de Machine Learning

  • 1.
    Globalcode – Open4education Trilha– Agile & Agile Coaching Jorge Improissi Agile Coach - GFT
  • 2.
    Globalcode – Open4education •Agile Coach BAC GFT Brasil • Análise e Desenvolvimento de sistemas (UCB) • MBA – Liderança, Inovação e Gestão 4.0 (PUC-RS) • Pós em Psicologia Organizacional e Gestão de Pessoas (PUC-RS) • Idealizador e apresentador do AGILE TO THE PEOPLE PODCAST • CSM, CSD, SAFe SA 5, KMP, KCP, Management 3.0, Flight Levels, CTFL, CPRE Jorge Improissi Agile Coach - BAC jorge.improissi@gft.com
  • 3.
    Globalcode – Open4education Odesafio do ágil em um time de Machine Learning Dificuldades e Aprendizados Dezembro 2022
  • 4.
    Globalcode – Open4education Agenda •Contexto • Método de Trabalho para Machine Learning • Responsabilidades por papéis • Desafios • Aprendizados
  • 5.
  • 6.
    Globalcode – Open4education Contexto •Área PLD/PCF grande Sistema de Cooperativas do Brasil; • Elevado número de Falsos-Positivos de fraudes em boletos; • Processo 100% manual; • Demanda Top-Down;
  • 7.
    Globalcode – Open4education Métodode Trabalho para Machine Learning
  • 8.
    Globalcode – Open4education Oque é Machine Learning?
  • 9.
    Globalcode – Open4education MachineLearning O aprendizado de máquina (em inglês, machine learning) é um método de análise de dados que automatiza a construção de modelos analíticos. É um ramo da inteligência artificial baseado na ideia de que sistemas podem aprender com dados, identificar padrões e tomar decisões com o mínimo de intervenção humana.
  • 10.
    Globalcode – Open4education DataMining “O data mining é, de uma forma muito simples, definido pela procura de relações, padrões e tendências escondidas em conjuntos de dados de grandes dimensões, sendo caracterizado pela capacidade para lidar com o aumento de dados de negócio e aceleradas alterações no mercado” (Han e Kamber, 2006)
  • 11.
    Globalcode – Open4education ProcessosÁgeis “Os processos ágeis são tipicamente caracterizados pela sua flexibilidade, capacidade de adaptação e partilha de conhecimento, permitindo uma abordagem iterativa, evolutiva e incremental ao desenvolvimento, uma entrega rápida do produto, priorização dos requisitos, envolvimento ativo dos clientes, redução do custo e do tempo, melhoria na qualidade do software e o aumento da probabilidade de sucesso de um projeto.” (Keith, 2012)
  • 12.
    Globalcode – Open4education CRISP-DM Ametodologia CRISP-DM (Cross Industry Standard Process for Data mining) fornece uma visão geral do ciclo de vida de um projeto de data mining. Contém as fases do projeto, as tarefas respectivas e os seus outputs. O ciclo de vida de um projeto de data mining, nesta metodologia, é decomposto em seis fases. (Chapman et al., 2010). As setas indicam as dependências mais importantes e frequentes entre as fases. Dependendo do projeto e dos resultados obtidos numa determinada fase, pode ser necessário retroceder para uma fase anterior. Assumindo que o projeto não é cancelado durante a implementação, o processo não é terminado até que uma solução chegue à última fase do ciclo.
  • 13.
    Globalcode – Open4education SCRUM-DM Ametodologia SCRUM-DM consiste numa associação da metodologia ágil Scrum como metodologia para a gestão do trabalho, e da metodologia CRISP-DM como estratégia a seguir no desenvolvimento de um projeto de data mining. O CRISP-DM foi dividido e adaptado ao Scrum, sendo o Scrum-DM, à semelhança do CRISP-DM iniciado por uma fase de Entendimento do Negócio, onde é realizada a análise dos objetivos e do negócio, e finalizado por uma fase de Deployment, onde é realizada a integração dos resultados do data mining. O desenvolvimento é realizado na fase de Sprint, estando contempladas as fases de Entendimento dos Dados, Preparação dos Dados, Modelagem e Avaliação do CRISP-DM.
  • 14.
    Globalcode – Open4education Ciclode Desenvolvimento SCRUM
  • 15.
    Globalcode – Open4education Ciclode Desenvolvimento KANBAN
  • 16.
  • 17.
  • 18.
    Globalcode – Open4education Responsabilidades PAPELRESPONSABILIDADES Product Owner • Identificar e clarificar as necessidades dos stakeholders; • Representar os stakeholders; • Definir objetivos e requisitos para o projeto, e colocá-los na forma de Data Mining Stories; • Gerir o Product Backlog durante todo o projeto; • Definir o objetivo para cada Sprint; • Estar disponível para a equipa; Respeitar os limites de cada Sprint; • Rever os resultados de cada Sprint.
  • 19.
    Globalcode – Open4education Responsabilidades PAPELRESPONSABILIDADES Scrum Master • Guiar a equipa e o Product Owner na aplicação da metodologia; • Ser o especialista na aplicação da metodologia; • Ajudar a remover impedimentos que a equipa encontre no desenvolvimento; • Proteger a equipa de influências externas; • Apoiar a equipa enquanto se organiza a si mesma; • Facilitar a aplicação da metodologia; Encorajar a equipa a melhorar as práticas de desenvolvimento.
  • 20.
    Globalcode – Open4education Responsabilidades PAPELRESPONSABILIDADES DevTeam • Apoiar a definição das Data Mining Stories; • Definir e comprometer-se com as tarefas para cada Sprint; • Comprometer-se com a entrega do objetivo do Sprint, respeitando os critérios de aceitação; • Desenvolver o que está especificado no Product Backlog.
  • 21.
    Globalcode – Open4education Responsabilidades “Osprodutos são construídos por equipes de pessoas, e os métodos ágeis se concentram nas pessoas sobre os processos. A ciência de dados é uma disciplina ampla, abrangendo análise, design, desenvolvimento e pesquisa. Os papéis dos membros da equipe Agile Data Science, definidos em um espectro do cliente às operações” – Russell Jurney
  • 22.
    Globalcode – Open4education Responsabilidades “Parapermanecermos ágeis, devemos abraçar e nos adaptar a essas novas condições. Devemos adotar mudanças de acordo com as metodologias enxutas para nos mantermos produtivos. Várias mudanças em particular tornam possível o retorno à agilidade(...) Em Agile Data Science, uma pequena equipe de generalistas usa ferramentas escaláveis ​​e de alto nível e plataformas para refinar iterativamente os dados em estados de valor cada vez mais altos.” – Russell Jurney
  • 23.
    Globalcode – Open4education Conclusão Ametodologia proposta associa a metodologia ágil Scrum para a gestão de trabalho, o CRISP-DM para o desenvolvimento de projetos de data mining. Possibilitando a inspeção contínua do desenvolvimento do projeto executado pela equipe, conferindo aos resultados a visibilidade necessária para que erros ou desalinhamentos com os objetivos possam ser retificados pouco depois de acontecerem.
  • 24.
    Globalcode – Open4education Conclusão OSCRUM-DM torna visíveis disfunções e impedimentos que estão impedindo a eficácia da equipe, para que possam ser eliminados. A metodologia permite também uma maior adaptação a alterações nos objetivos, incentivando o feedback constante do cliente durante todo o processo de desenvolvimento.
  • 25.
    Globalcode – Open4education Omodelo proposto deu certo?
  • 26.
  • 27.
    Globalcode – Open4education DESAFIOS Oque nos impediu de termos êxito?
  • 28.
    Globalcode – Open4education Oque nos impediu de termos êxito? EXPERTISE CASCATEAMENTO DESCONHECIMENTO DO NEGÓCIO O NEGÓCIO NÃO SABIA COMO SE COMUNICAR COM A EQUIPE DE DADOS! Pessoas de negócio não sabiam comunicar o que queriam e não entendiam o que era o produto gerado pelos profissionais de dados. AS FASES DO CRISP-DM “CASCATEAVAM” O SCRUM! Levamos um período grande para tangibilizar resultados trazendo as fases do CRISP-DM para o timebox do Scrum. CONHECIMENTO EM DADOS ERA LIMITADO! Os profissionais de dados se atinham em informações da disciplina, enquanto desenvolvedores focavam em codificar. Não falavam a mesma língua! DEPENDÊNCIAS DE OUTRAS ÁREAS PROJETO DEPARTAMENTAL PERFIS COMPARTILHADOS PROFISSIONAIS ATUANDO EM MEIO- PERÍODO! Membros da equipe não conseguiam ter dedicação ao projeto, tendo constantes mudanças de contextos. Trazendo o dilema: em qual prioridade atuar? PROJETO GUIADO POR VAIDADES! O projeto era tocado de forma impulsiva, sem tempo para aprendizado, o que causou muito ruído interno entre time e stakeholders. ÁREAS IMPORTANTES NÃO COLABORANDO ENTRE SI! Os dados essenciais para o desenvolvimento do aprendizado de máquina vinha de várias áreas, que se viam como concorrentes e não parceiras.
  • 29.
  • 30.
    Globalcode – Open4education “SOFTWAREÁGIL NÃO É CIÊNCIA DE DADOS ÁGIL.” – RUSSELL JURNEY
  • 31.
    Globalcode – Open4education “NACIÊNCIA DE DADOS, AO CONTRÁRIO DA ENGENHARIA DE SOFTWARE, O CÓDIGO NEM SEMPRE DEVE SER BOM; ISTO DEVE SER EVENTUALMENTE BOM. ISSO SIGNIFICA QUE ALGUMA DÍVIDA TÉCNICA INICIAL É ACEITÁVEL, DESDE QUE NÃO SEJA EXCESSIVO. ” – RUSSELL JURNEY
  • 32.
    Globalcode – Open4education Gestãopor resultados auxiliando as metas
  • 33.
    Globalcode – Open4education •Exemplo para nosso contexto PCF/ML ----------------------------- OBJETIVO: diminuir fraude em contas de cooperados (Boletos) KR 1 - Diminuir para 30% a incidência de falso/positivo nos casos analisados KR 2 - Automatizar 20% do processo de análise de fraudes -------------------------------
  • 34.
    Globalcode – Open4education Oque podemos trazer para nosso contexto PCF/ML  Identificadas dependências, trazer pessoas das áreas para uma reunião semanal para alinhamento da comunicação;  Evitar o campo “Bloqueio” nos nossos fluxos, forçando o envolvimento rápido dos responsáveis que possam ‘desobstruir’ essa parada do fluxo.
  • 35.
  • 36.
    Globalcode – Open4education UPSTREAM& DOWNSTREAM O que é? Upstream são as etapas do fluxo de trabalho que tem o objetivo de amadurecer e validar ideias antes de aplicá-las no mundo real. Já o downstream se refere à todas as etapas seguintes do fluxo de trabalho a partir do backlog de itens gerados no upstream.
  • 37.
  • 38.
  • 39.
  • 40.
    Globalcode – Open4education Ganhosrápidos Colaboração entre áreas relacionadas Melhor comunicação entre negócio x TI X Data Disponibilidade em tempo integral dos profissionais necessários Melhor definição de objetivos da squad
  • 41.
    Globalcode – Open4education Ehoje? Modelos de aprendizado rodando para os processos antifraudes em: boleto, TED e PIX. Aplicando melhorias. APRENDIZADO DE MÁQUINA Modelo mistura ML com Regra de negócio, com o objetivo de reduzir os falsos-positivos. AUTOMAÇÃO DO PROCESSO A equipe reconhece que o modelo feito empiricamente em 2020, muito se assemelha às práticas sugeridas pelo modelo Agile Data Science 2.0. APLICAÇÃO DO MODELO AGILE DATA SCIENCE
  • 42.
    Globalcode – Open4education Acultura influencia os contextos, analisar as melhores práticas habilitam o êxito, ou o fracasso, de nossas iniciativas.
  • 43.