Apresentação geral sobre IA + Deep Learning para o evento TecTalks da AmBev. Aborda os principais resultados recentes que a comunidade científica alcançou, e também resultados refletidos no valuation de companhias abertas. Por fim, dado que o ecossistema de ferramentas está disponível a todos, tenta responder à pergunta: quais serão as companhias mais aptas a transformar a ciência de dados em vantagem competitiva?
2. A humanidade vive hoje sua 4ª grande transformação.
Revoluções
1ª Revolução
Industrial
Séc. XVIII
Domínio sobre a natureza
– Máquinas a vapor
3ª Revolução
Industrial
1970-2010
Domínio sobre a
automação de tarefas –
Informática
?
Hiperconectividade
Domínio sobre a energia
elétrica – Linhas de
Produção
Domínio sobre o
aprendizado – Inteligência
Artificial
2ª Revolução
Industrial
Séc. XX
4ª Revolução
Industrial
2010-hoje
The Law of Accelerating
Returns – Ray Kurzweil200 anos 70 anos 40 anos 10 anos?Duração de cada ciclo:
Recurso principal: Natural Energético Conhecimento Dados
2
3. Esta é a verdadeira transformação
que mudou as regras do jogo.
Conhecimento → Dados
3
4. Todos os anos equipes de pesquisadores de “visão computacional” das maiores universidades do mundo competem com seus
algoritmos na ImageNET – Large Scale Visual Recognition Challenge.
Em 2012, no entanto, os pesquisadores da universidade de Toronto utilizaram pela primeira vez uma abordagem 100%
baseada em dados, e não nos conhecimentos e expertise acumulados até então.
Deixaram de programar explicitamente as regras que caracterizavam um focinho, por exemplo, e passaram a confiar apenas
nas regras (“features”) que seu próprio algoritmo aprendia.
Liderados por Geoffrey Hinton, a equipe foi a primeira na história a utilizar Redes Neurais Artificiais Profundas (Deep Learning),
em uma tarefa de visão computacional.
Localizar objetos e classificá-los entre 1.000 categorias.
Competição Anual – ImageNET 2012
Hierarquia de categorias
4
5. O time baseado em Deep Learning foi o primeiro a alcançar um
erro inferior a 25%.
À partir de 2012 todas as equipes passaram a trabalhar apenas
com Deep Learning.
Apenas 5 anos depois, 29 dos 38 times atingiram um erro
inferior a 5%.
Algo completamente impensável apenas
alguns anos atrás.
Localizar objetos e classificá-los entre 1.000 categorias.
Competição Anual – ImageNET 2012
Evolução do erro YoY
5
6. A nova transformação digital – baseada em dados – transforma a busca por resolver os problemas na busca por ensinar
programas de computador a resolver os problemas.
Ensinar a solucionar é o novo grande desafio.
A nova fronteira da eficiência
A nova fronteira dos ganhos de eficiência, no entanto, derivam do uso de uma fonte cada vez maior de dados (BIG DATA).
Analisar estes dados e encontrar os problemas deixou de ser uma tarefa humanamente possível.
As companhias devem agora construir estruturas internas que apoiem e incentivem o aprendizado automático de seus
problemas.
Deixamos de perguntar:
“Qual é o principal fator que faz meu cliente comprar?”
E passamos a perguntar:
“Quais dados são necessários para que nosso modelo possa continuamente aprender os principais fatores de conversão de
nossos clientes, e otimizar nossas campanhas automaticamente?”
“Como eu ensino um algoritmo a resolver este problema?”
6
7. Aprender implica generalizar conhecimento.
Por que ensinar é melhor que resolver?
1
Relacionar múltiplas fontes de dados
simultaneamente, com frequências diferentes,
origens diferentes e contextos diferentes.
Quebrar a barreira da departamentalização.
2
Ao invés de resolvermos um problema,
passamos a ensinar os algoritmos a resolver
classes de problemas. Generalização ao invés
de especialização.
3
Os profissionais são mais eficientes quando
gerenciam apenas pela exceção. Algoritmos
treinados podem ajudar a apontar os casos
especiais que merecem atenção, enquanto
lidam com os casos normais.
4
Uma companhia é escalável apenas quando
consegue escalar o seu conhecimento sobre o
que faz de melhor. Ensinar pessoas sempre
foi necessário, e agora devemos ensinar os
algoritmos.
5
Valor. Ensinando os algoritmos, sua
companhia passa a valorizar os seus dados e
o conhecimento adquirido na operação.
6
O Ensino contínuo dos algoritmos permite
criar uma operação que está sempre se
adaptando às mudanças do mercado – já
que estas mudanças afetarão os dados que os
alimentam.
7
9. 9
Nunca produzimos tantos dados.
Nunca foi tão barato armazená-los.
I.A.: Por que agora?
http://www.aberdeeninvestment.com/
https://www.infragistics.com
13. 13
Reinforcement Learning – Jogos de Atari
Deep Learn – Onde estamos?
http://nvidia.com
Jogos de Atari onde um “jogador” baseado
em Deep Learning já atingiu um nível
super-humano:
14. 14
Generative Adversarial Network - CelebGAN
Deep Learn – Onde estamos?
Retratos de celebridades que nunca existiram – foram
“alucinadas” por uma rede neural artificial.
https://www.technologyreview.com/the-download/609290/meet-the-fake-celebrities-dreamed-up-by-ai/
16. Uma operação baseada em Ciência de
Dados se reflete na avaliação da
companhia.
Valuation
16
17. Criação do Luiza Labs marcou a disrupção nos resultados da companhia.
O Magazine Luiza começou a construir, em
2014, uma área de tecnologia separada da
operação tradicional.
Esta área ficou encarregada de desenvolver e
integrar as novas tecnologias de e-
commerce, big data e computação para
dispositivos móveis.
Também criou seu aplicativo e integrou as
aquisições de empresas para gerenciamento
de recomendações e de marketplaces.
Case: Magazine Luiza
9562
8366 8563
10052
1877 2062
2723
4157
2014 2015 2016 2017
Lojas Físicas E-commerce
Criação do Luizalabs
Faturamento em Milhões de Reais
17
18. Criação do Luiza Labs marcou a disrupção nos resultados da companhia.
Principais iniciativas:
Case: Magazine Luiza
Marketplace
Data Science/BigData
Social
App Mobile
18
19. O uso de algoritmos de recomendação permitiu sua escalabilidade.
O Spotify criou em 2012 seu primeiro time
de data Science, voltado para a criação de
um motor de recomendação de músicas para
seus assinantes.
Em 2018 o Spotify fez o seu filing para o IPO.
Neste documento está registrado que:
• 30% de tudo que é ouvido pelo Spotify hoje
em dia (2018) vem de listas (playlists)
criadas e curadas por algoritmos.
• “a key differentiating factor between Spotify
and other music content providers is our
ability to predict music that our Users
will enjoy.”
• Os algoritmos efetivamente se tornaram
uma vantagem competitiva da companhia.
Case: Spotify
0,5 1 1,5 2,53 4 5 6
10
12,5
15
20
30
3940
50
57
60
65
jul/10
jan/11
jul/11
jan/12
jul/12
jan/13
jul/13
jan/14
jul/14
jan/15
jul/15
jan/16
jul/16
jan/17
jul/17
Milhões de Assinantes (Pagos)
19
20. ORION: On-Road Integrated Optimization and Navigation
Problema: encontrar a melhor rota que passe
por um número de destinos e retorne à origem.
10 destinos: >3,6 milhões de possibilidades
16 destinos: >20 trilhões
Motoristas da UPS têm que visitar pelo menos
100 destinos/dia. Como resolver?
Projeto de longo prazo (10 anos) em
planejamento e criação de rotas otimizadas para
entregas.
Impacto em 55.000 motoristas, com uma
estimativa de redução de custos da ordem de
$400M/ano.
Peça fundamental (backbone) da estratégia de
dados e analytics da UPS, que agora passa a
integrar canais online, e outras inovações para
de estoque, tracking, etc.
Case: UPS
20
https://www.ups.com/us/en/services/knowledge-center/article.page?name=orion-the-algorithm-proving-that-left-isn-t-right&kid=aa3710c2
25. 25
Analytics – Resultados
O segredo não é mais o algoritmo. É a cultura.
A infraestrutura está acessível a
todas as companhias.
Os algoritmos e frameworks estão
acessíveis a todas as companhias.
Quem irá se beneficiar mais com I.A.
nos próximos anos?
Quem tiver:
Sonho, gente e cultura.
26. 26
Analytics – Resultados
Sonho, gente e cultura.
Sonho porque não adianta desenvolver o
algoritmo pelo algoritmo. É necessário
seguir uma visão maior.
Gente porque mais do que nunca é
necessário unir times interdisciplinares para
resolver problemas complexos com o uso
de tecnologia.
Cultura porque os algoritmos não vão
aprender sozinhos – vão aprender com o
time.