O documento descreve o Marvin AI, um projeto open source para entregar e gerenciar projetos de machine learning de forma simplificada através da abstração e padronização. O projeto visa superar desafios como a necessidade de times multidisciplinares caros e a dificuldade de levar modelos de ML para produção. O Marvin AI é composto por engines, toolboxes, artefatos e executores de engines para suportar todo o ciclo de vida de projetos de ML de forma reprodutível e escalável.
3. Desafios em projetos de Machine Learning
Os conhecimentos para
entender, pesquisar, criar e
entregar projetos de ML são
muitos e muito distintos.
Ter um time com todos estes
perfis torna o projeto mais
caro!
4. Desafios em projetos de Machine Learning
A maioria dos cientistas de
dados (tipo A) não tem os skills
de engenharia de software
necessários para construir
soluções para produção.
Bons profissionais do tipo B são
unicórnios!
5. Desafios em projetos de Machine Learning
Quanto mais rápido terminamos
a primeira versão, mais rápido
podemos iniciar o processo de
melhorias.
Ter um MVP rapidamente é
estratégico para o sucesso do
projeto!
6. Desafios em projetos de Machine Learning
O código é prototipado
localmente em um Notebook
(algo como uma IDE interativa)
em qualquer linguagem.
Os modelos são gerados com
datasets de teste e não são
escaláveis para a produção.
7. Desafios em projetos de Machine Learning
Como simplificar o processo de
exploração, construção, teste e
implantação de projetos de machine
learning de forma reproduzível?
10. Marvin???
● Inicio na B2W Digital em 2016 para atender problemas internos
● Lançado como código aberto em 09/2017 com a licença Apache 2
● Artigo publicado na conferência Papis.io (Boston) em 09/2017*
● Quatro versões lançadas desde 09/2017
● Meetup criado em 01/2018
● Primeira versão do projeto de AutoML em 05/2018
● Aceito pela Apache S. F. para incubação em 08/2018**
● Comunidade está crescendo...
* http://proceedings.mlr.press/v82/miguel18a.html
** http://incubator.apache.org/projects/marvin.html
11. Marvin AI: Atributos de Qualidade
Para Cientistas de Dados:
● Interoperabilidade - suporte a diferentes linguagens de programação
● Usabilidade - acelerar e simplificar o processo de criação de modelos
Para Administradores:
● Gerenciabilidade - simplificar o processo de deploy e gestão distribuído
● Escalabilidade - suporte de cargas pequenas a cargas intensivas
Para Devs Marvin:
● Modificável - permite melhorias e versões constantes
● Manutenibilidade - para todos os tipos de devs (iniciantes a experts)
13. Engine - Projeto em uma linguagem específica que contem o código fonte
relacionado ao modelo de ML. É a implementação do padrão DASFE.
Toolbox - Conjunto de CLI’s, utilitários, classes, bibliotecas específicos de cada
linguagem, que da suporte a todo o processo de exploração, desenvolvimento, teste e
entrega de uma engine.
Artefatos - São arquivos que são persistidos e versionados durante o processo de
criação e treinamento do modelo de machine learning.
Engine Executor - Implementação de abstração arquitetônica em torno da
Engine, como paralelismo, distribuição, controle de versão, APIs, disponibilidade e
assim por diante.
Marvin AI: Componentes Principais
17. Artificial Intelligence Platform
Fork no Github.com/marvin-ai
e contribua!
Estamos contratando! Entre em
contato com
recrutamento.bitsp@b2wdigital.com