SlideShare uma empresa Scribd logo
1 de 29
Baixar para ler offline
Data Pipelines com AWS
Glue & AWS Step-Functions
● Alexsandro Francisco
● Engenheiro de Dados no
Stoodi
● Graduando em Computação
● dev, robótica, maker,
pln/ml/ia, dados
Apresentação
alexsandr0x
Alexsandr0x
alexsandr0x.github.io
medium.com/stoodi
jobs.kenoby.com/stoodi
Apresentação
● Desafios dentro do Stoodi
● Conhecendo o Glue
● Identificando problemas
● Conhecendo o Step-Functions
○ Executando o job por chamada direta
○ Executando um job por Lambda Function
● Expandindo as possibilidades
● Dicas
Introdução
22 milhões de
visualizações em
nossos vídeos
Desafios dentro do Stoodi
18 mil vídeos em nossa
plataforma
3 milhões de usuários
na plataforma Stoodi
0.5 milhão de usuários
na plataforma Eligis
● Empresa com cultura
Data Driven
● Dados de eventos dos
usuários na plataforma
Desafios dentro do Stoodi
● Data Warehouse
(Redshift)
● Plataforma de analytics
para todos os
colaboradores
● ETL em Batch dos
principais dados usados
● OBT para facilitar uso
para todos
● Data Lake no AWS S3
com todos os dados
● Pipeline usando AWS
Glue
“O AWS Glue é um serviço de
extração, transformação e carga
(ETL) gerenciado que facilita a
preparação e a carga de dados para
análises pelos clientes. [...]” - AWS
Conhecendo o Glue
● Cuida do cluster Spark para você
● Data Catalog mapeia todas as suas tabelas
● Jobs cobrados por:
tempo de execução * dpu (data processing unit)
● Triggers para facilitar a orquestração de
múltiplos jobs (já falaremos deles...)
Conhecendo o Glue
● Conexões: Redshift, AWS RDS, (outros por
JDBC)
● Crawler: CSV, JSON, Parquet e ORC, no
DynamoDB
● Jobs Spark em Python ou Scala
● Shell script python com numpy, sklearn,
pandas, boto3, etc...
Conhecendo o Glue
Conhecendo o Glue
Conhecendo o Glue
Orquestrando o seus jobs
com triggers:
● Execução do seu job
através de
agendamento ou
término de um job
anterior
● Podemos organizar
com Workflow
Com triggers conseguimos
fazer:
Identificando problemas
Mas não conseguimos:
Ou executar uma função
lambda:
Identificando problemas
Nem mandar um email para
a equipe de dados:
“AWS Step Functions makes it easy
to coordinate the components of
distributed applications as a series
of steps in a visual workflow.” -
AWS
Conhecendo o Step-Functions
Conhecendo o Step-Functions
● Foco em sistemas
distribuídos e
microsserviços
● Mas nada nos impede
de usar para orquestrar
pipelines de dados!
Executando o job por chamada direta
A definição da sua
state-machine é feita
em ASL (Amazon
States Language).
A state-machine
aparece de forma
visual para facilitar
sua vida.
Executando o job por chamada direta
Os “galhos” dentro do
tracejado são rodados em
paralelo
‘UpdateDB’ pode retornar
um status que leva a ‘last
level’ ou ‘simple level’
‘CWMetric’ roda
apenas quando todos
os ramos na etapa
paralela terminarem
Problema Resolvido?
Executando o job por chamada direta
Poucas ferramentas
integradas, não
temos todo o leque
da AWS
Podemos concentrar
todas as chamadas na
AWS Lambda!
Executando um job por Lambda Function
amzn.to/2mITqn6
Executando um job por Lambda Function
Activities. na prática,
tornam a step-function em
uma API, onde a transição
das etapas é feita através de
código. Dessa forma
podemos usar código em
AWS Lambda para
orquestrar nosso pipeline!
Executando um job por Lambda Function
Executando um job por Lambda Function
Pipeline roda diariamente
através de um evento
Step Functions orquestra
múltiplos jobs.
A Lambda inicia os jobs e
trata potenciais erros
Lambda inicializa e persiste o
status dos jobs do AWS Glue
no DynamoDB.
Com a lambda podemos chamar
qualquer serviço aws como resposta
Executando um job por Lambda Function
Agora conseguimos rodar
paralelo!
Expandindo as possibilidades
Expandindo as possibilidades
Dicas !
https://bit.ly/2p6Ob1j
AWS Glue ⊂ Spark!
Dicas !
github.com/sakazuki/step-functions-draw.io
Dúvidas?
Estamos contratando!
● Data Engineer
○ Pleno
● Dev Backend
○ Pleno
○ Senior
● Dev Mobile
○ Pleno
○ Senior
https://jobs.kenoby.com/stoodi

Mais conteúdo relacionado

Mais procurados

Baixo Acoplamento e Alta Coesão
Baixo Acoplamento e Alta CoesãoBaixo Acoplamento e Alta Coesão
Baixo Acoplamento e Alta Coesãocelodemelo
 
Arquitetura Serverless para Machine Learning
Arquitetura Serverless para Machine LearningArquitetura Serverless para Machine Learning
Arquitetura Serverless para Machine LearningFelipe Santos
 
AWS Experience Fortaleza: Escalando sua aplicação Web com Beanstalk
AWS Experience Fortaleza: Escalando sua aplicação Web com BeanstalkAWS Experience Fortaleza: Escalando sua aplicação Web com Beanstalk
AWS Experience Fortaleza: Escalando sua aplicação Web com BeanstalkAmazon Web Services LATAM
 
LocalStack - TDC Porto Alegre 2020
LocalStack - TDC Porto Alegre 2020LocalStack - TDC Porto Alegre 2020
LocalStack - TDC Porto Alegre 2020Roberto Alves
 
Laravel + OAuth 2.0 Server
Laravel + OAuth 2.0 ServerLaravel + OAuth 2.0 Server
Laravel + OAuth 2.0 ServerDaniel Satiro
 
Campus Party - Desenvolvendo com ASP.NET MVC e jQuery
Campus Party - Desenvolvendo com ASP.NET MVC e jQueryCampus Party - Desenvolvendo com ASP.NET MVC e jQuery
Campus Party - Desenvolvendo com ASP.NET MVC e jQueryAlexandre Tarifa
 
DevOps - melhores práticas e integração contínua
DevOps - melhores práticas e integração contínuaDevOps - melhores práticas e integração contínua
DevOps - melhores práticas e integração contínuaAmazon Web Services LATAM
 
Codificando Night Week 2017 - Migrando seu banco de dados para a nuvem
Codificando Night Week 2017 - Migrando seu banco de dados para a nuvemCodificando Night Week 2017 - Migrando seu banco de dados para a nuvem
Codificando Night Week 2017 - Migrando seu banco de dados para a nuvemMarcos Freccia
 
Laravel 5
Laravel 5Laravel 5
Laravel 5DevMT
 
Arquitetura Funcional em Microservices
Arquitetura Funcional em MicroservicesArquitetura Funcional em Microservices
Arquitetura Funcional em MicroservicesNubank
 
Angular 2, TypeScript e Além
Angular 2, TypeScript e AlémAngular 2, TypeScript e Além
Angular 2, TypeScript e AlémAndre Baltieri
 
Devfest Cerrado: Angular 2
Devfest Cerrado: Angular 2 Devfest Cerrado: Angular 2
Devfest Cerrado: Angular 2 Loiane Groner
 
Banco temporal Influxdb + Grafana: Operando sua Plataforma
Banco temporal Influxdb + Grafana: Operando sua PlataformaBanco temporal Influxdb + Grafana: Operando sua Plataforma
Banco temporal Influxdb + Grafana: Operando sua PlataformaCelso Crivelaro
 

Mais procurados (19)

Baixo Acoplamento e Alta Coesão
Baixo Acoplamento e Alta CoesãoBaixo Acoplamento e Alta Coesão
Baixo Acoplamento e Alta Coesão
 
Arquitetura Serverless para Machine Learning
Arquitetura Serverless para Machine LearningArquitetura Serverless para Machine Learning
Arquitetura Serverless para Machine Learning
 
AWS Experience Fortaleza: Escalando sua aplicação Web com Beanstalk
AWS Experience Fortaleza: Escalando sua aplicação Web com BeanstalkAWS Experience Fortaleza: Escalando sua aplicação Web com Beanstalk
AWS Experience Fortaleza: Escalando sua aplicação Web com Beanstalk
 
Mvc
MvcMvc
Mvc
 
LocalStack - TDC Porto Alegre 2020
LocalStack - TDC Porto Alegre 2020LocalStack - TDC Porto Alegre 2020
LocalStack - TDC Porto Alegre 2020
 
Laravel + OAuth 2.0 Server
Laravel + OAuth 2.0 ServerLaravel + OAuth 2.0 Server
Laravel + OAuth 2.0 Server
 
Campus Party - Desenvolvendo com ASP.NET MVC e jQuery
Campus Party - Desenvolvendo com ASP.NET MVC e jQueryCampus Party - Desenvolvendo com ASP.NET MVC e jQuery
Campus Party - Desenvolvendo com ASP.NET MVC e jQuery
 
Laravel 5
Laravel 5Laravel 5
Laravel 5
 
DevOps - melhores práticas e integração contínua
DevOps - melhores práticas e integração contínuaDevOps - melhores práticas e integração contínua
DevOps - melhores práticas e integração contínua
 
Codificando Night Week 2017 - Migrando seu banco de dados para a nuvem
Codificando Night Week 2017 - Migrando seu banco de dados para a nuvemCodificando Night Week 2017 - Migrando seu banco de dados para a nuvem
Codificando Night Week 2017 - Migrando seu banco de dados para a nuvem
 
Laravel 5
Laravel 5Laravel 5
Laravel 5
 
Oracle T Opgsql
Oracle T OpgsqlOracle T Opgsql
Oracle T Opgsql
 
PHP no Google AppEngine
PHP no Google AppEnginePHP no Google AppEngine
PHP no Google AppEngine
 
Arquitetura Funcional em Microservices
Arquitetura Funcional em MicroservicesArquitetura Funcional em Microservices
Arquitetura Funcional em Microservices
 
Angular 2, TypeScript e Além
Angular 2, TypeScript e AlémAngular 2, TypeScript e Além
Angular 2, TypeScript e Além
 
Devfest Cerrado: Angular 2
Devfest Cerrado: Angular 2 Devfest Cerrado: Angular 2
Devfest Cerrado: Angular 2
 
Banco temporal Influxdb + Grafana: Operando sua Plataforma
Banco temporal Influxdb + Grafana: Operando sua PlataformaBanco temporal Influxdb + Grafana: Operando sua Plataforma
Banco temporal Influxdb + Grafana: Operando sua Plataforma
 
LT Ansible
LT AnsibleLT Ansible
LT Ansible
 
Meetup #17
Meetup #17Meetup #17
Meetup #17
 

Semelhante a Data Pipelines com AWS Glue & Step Functions

Serverless Framework - Creating serverless applications
Serverless Framework - Creating serverless applicationsServerless Framework - Creating serverless applications
Serverless Framework - Creating serverless applicationsWallison Marra
 
Arquitetura executável: Documentando e automatizando a comunicação da equipe ...
Arquitetura executável: Documentando e automatizando a comunicação da equipe ...Arquitetura executável: Documentando e automatizando a comunicação da equipe ...
Arquitetura executável: Documentando e automatizando a comunicação da equipe ...WeOp - The Operations Summit
 
Roadshow TOTVS RM 2010 v.11.0
Roadshow TOTVS RM 2010 v.11.0Roadshow TOTVS RM 2010 v.11.0
Roadshow TOTVS RM 2010 v.11.0Andre Bretas
 
Construindo pipelines com Azure DevOps
Construindo pipelines com Azure DevOpsConstruindo pipelines com Azure DevOps
Construindo pipelines com Azure DevOpsCamila Carrera
 
Desenvolvimento Ágil de Aplicações Java na Nuvem com o AWS Elastic Beanstalk
Desenvolvimento Ágil de Aplicações Java na Nuvem com o AWS Elastic BeanstalkDesenvolvimento Ágil de Aplicações Java na Nuvem com o AWS Elastic Beanstalk
Desenvolvimento Ágil de Aplicações Java na Nuvem com o AWS Elastic BeanstalkAmazon Web Services LATAM
 
Escalabilidade para sua solução na Nuvem da AWS de um para centenas de milhõe...
Escalabilidade para sua solução na Nuvem da AWS de um para centenas de milhõe...Escalabilidade para sua solução na Nuvem da AWS de um para centenas de milhõe...
Escalabilidade para sua solução na Nuvem da AWS de um para centenas de milhõe...Amazon Web Services LATAM
 
De A a Zabbix - I Congresso de Ciências Exatas e Tecnológicas
De A a Zabbix - I Congresso de Ciências Exatas e TecnológicasDe A a Zabbix - I Congresso de Ciências Exatas e Tecnológicas
De A a Zabbix - I Congresso de Ciências Exatas e TecnológicasAndré Déo
 
Acelerando a entrega de software com as ferramentas de desenvolvimento da AWS
Acelerando a entrega de software com as ferramentas de desenvolvimento da AWSAcelerando a entrega de software com as ferramentas de desenvolvimento da AWS
Acelerando a entrega de software com as ferramentas de desenvolvimento da AWSAmazon Web Services LATAM
 
Webinar: Introdução à Distribuição Contínua na AWS
Webinar: Introdução à Distribuição Contínua na AWSWebinar: Introdução à Distribuição Contínua na AWS
Webinar: Introdução à Distribuição Contínua na AWSAmazon Web Services LATAM
 
Novidades da API do Windows 7 usando o Delphi 2010
Novidades da API do Windows 7 usando o Delphi 2010Novidades da API do Windows 7 usando o Delphi 2010
Novidades da API do Windows 7 usando o Delphi 2010Bernardo Porto
 
Webinar Melhores práticas e lições aprendidas com aplicações sem servidor
Webinar Melhores práticas e lições aprendidas com aplicações sem servidorWebinar Melhores práticas e lições aprendidas com aplicações sem servidor
Webinar Melhores práticas e lições aprendidas com aplicações sem servidorAmazon Web Services LATAM
 
TDC2018SP | Trilha Serverless - Resolvendo problemas do dia a dia com Slack e...
TDC2018SP | Trilha Serverless - Resolvendo problemas do dia a dia com Slack e...TDC2018SP | Trilha Serverless - Resolvendo problemas do dia a dia com Slack e...
TDC2018SP | Trilha Serverless - Resolvendo problemas do dia a dia com Slack e...tdc-globalcode
 
Resolvendo problemas do dia a dia com slack e serverless.
Resolvendo problemas do dia  a dia com slack e serverless.Resolvendo problemas do dia  a dia com slack e serverless.
Resolvendo problemas do dia a dia com slack e serverless.Aline Oliveira Dias
 
Melhores práticas de CI/CD na construção de aplicações modernas
Melhores práticas de CI/CD na construção de aplicações modernasMelhores práticas de CI/CD na construção de aplicações modernas
Melhores práticas de CI/CD na construção de aplicações modernasAmazon Web Services LATAM
 
Construindo APIs com Amazon API Gateway e AWS Lambda
Construindo APIs com Amazon API Gateway e AWS LambdaConstruindo APIs com Amazon API Gateway e AWS Lambda
Construindo APIs com Amazon API Gateway e AWS LambdaAmazon Web Services LATAM
 
Construindo APIs com Amazon API Gateway e AWS Lambda
Construindo APIs com Amazon API Gateway e AWS LambdaConstruindo APIs com Amazon API Gateway e AWS Lambda
Construindo APIs com Amazon API Gateway e AWS LambdaAmazon Web Services LATAM
 
Construindo APIs com Amazon API Gateway e AWS Lambda
Construindo APIs com Amazon API Gateway e AWS LambdaConstruindo APIs com Amazon API Gateway e AWS Lambda
Construindo APIs com Amazon API Gateway e AWS LambdaAmazon Web Services LATAM
 
Dev401 novos recursos do microsoft visual basic 2010
Dev401 novos recursos do microsoft visual basic 2010Dev401 novos recursos do microsoft visual basic 2010
Dev401 novos recursos do microsoft visual basic 2010Alexandre Tarifa
 
Pangea - Plataforma digital com Google Cloud Platform
Pangea - Plataforma digital com Google Cloud PlatformPangea - Plataforma digital com Google Cloud Platform
Pangea - Plataforma digital com Google Cloud PlatformAndré Paulovich
 

Semelhante a Data Pipelines com AWS Glue & Step Functions (20)

Serverless Framework - Creating serverless applications
Serverless Framework - Creating serverless applicationsServerless Framework - Creating serverless applications
Serverless Framework - Creating serverless applications
 
Continuous Deployment e DevOps na Nuvem
Continuous Deployment e DevOps na NuvemContinuous Deployment e DevOps na Nuvem
Continuous Deployment e DevOps na Nuvem
 
Arquitetura executável: Documentando e automatizando a comunicação da equipe ...
Arquitetura executável: Documentando e automatizando a comunicação da equipe ...Arquitetura executável: Documentando e automatizando a comunicação da equipe ...
Arquitetura executável: Documentando e automatizando a comunicação da equipe ...
 
Roadshow TOTVS RM 2010 v.11.0
Roadshow TOTVS RM 2010 v.11.0Roadshow TOTVS RM 2010 v.11.0
Roadshow TOTVS RM 2010 v.11.0
 
Construindo pipelines com Azure DevOps
Construindo pipelines com Azure DevOpsConstruindo pipelines com Azure DevOps
Construindo pipelines com Azure DevOps
 
Desenvolvimento Ágil de Aplicações Java na Nuvem com o AWS Elastic Beanstalk
Desenvolvimento Ágil de Aplicações Java na Nuvem com o AWS Elastic BeanstalkDesenvolvimento Ágil de Aplicações Java na Nuvem com o AWS Elastic Beanstalk
Desenvolvimento Ágil de Aplicações Java na Nuvem com o AWS Elastic Beanstalk
 
Escalabilidade para sua solução na Nuvem da AWS de um para centenas de milhõe...
Escalabilidade para sua solução na Nuvem da AWS de um para centenas de milhõe...Escalabilidade para sua solução na Nuvem da AWS de um para centenas de milhõe...
Escalabilidade para sua solução na Nuvem da AWS de um para centenas de milhõe...
 
De A a Zabbix - I Congresso de Ciências Exatas e Tecnológicas
De A a Zabbix - I Congresso de Ciências Exatas e TecnológicasDe A a Zabbix - I Congresso de Ciências Exatas e Tecnológicas
De A a Zabbix - I Congresso de Ciências Exatas e Tecnológicas
 
Acelerando a entrega de software com as ferramentas de desenvolvimento da AWS
Acelerando a entrega de software com as ferramentas de desenvolvimento da AWSAcelerando a entrega de software com as ferramentas de desenvolvimento da AWS
Acelerando a entrega de software com as ferramentas de desenvolvimento da AWS
 
Webinar: Introdução à Distribuição Contínua na AWS
Webinar: Introdução à Distribuição Contínua na AWSWebinar: Introdução à Distribuição Contínua na AWS
Webinar: Introdução à Distribuição Contínua na AWS
 
Novidades da API do Windows 7 usando o Delphi 2010
Novidades da API do Windows 7 usando o Delphi 2010Novidades da API do Windows 7 usando o Delphi 2010
Novidades da API do Windows 7 usando o Delphi 2010
 
Webinar Melhores práticas e lições aprendidas com aplicações sem servidor
Webinar Melhores práticas e lições aprendidas com aplicações sem servidorWebinar Melhores práticas e lições aprendidas com aplicações sem servidor
Webinar Melhores práticas e lições aprendidas com aplicações sem servidor
 
TDC2018SP | Trilha Serverless - Resolvendo problemas do dia a dia com Slack e...
TDC2018SP | Trilha Serverless - Resolvendo problemas do dia a dia com Slack e...TDC2018SP | Trilha Serverless - Resolvendo problemas do dia a dia com Slack e...
TDC2018SP | Trilha Serverless - Resolvendo problemas do dia a dia com Slack e...
 
Resolvendo problemas do dia a dia com slack e serverless.
Resolvendo problemas do dia  a dia com slack e serverless.Resolvendo problemas do dia  a dia com slack e serverless.
Resolvendo problemas do dia a dia com slack e serverless.
 
Melhores práticas de CI/CD na construção de aplicações modernas
Melhores práticas de CI/CD na construção de aplicações modernasMelhores práticas de CI/CD na construção de aplicações modernas
Melhores práticas de CI/CD na construção de aplicações modernas
 
Construindo APIs com Amazon API Gateway e AWS Lambda
Construindo APIs com Amazon API Gateway e AWS LambdaConstruindo APIs com Amazon API Gateway e AWS Lambda
Construindo APIs com Amazon API Gateway e AWS Lambda
 
Construindo APIs com Amazon API Gateway e AWS Lambda
Construindo APIs com Amazon API Gateway e AWS LambdaConstruindo APIs com Amazon API Gateway e AWS Lambda
Construindo APIs com Amazon API Gateway e AWS Lambda
 
Construindo APIs com Amazon API Gateway e AWS Lambda
Construindo APIs com Amazon API Gateway e AWS LambdaConstruindo APIs com Amazon API Gateway e AWS Lambda
Construindo APIs com Amazon API Gateway e AWS Lambda
 
Dev401 novos recursos do microsoft visual basic 2010
Dev401 novos recursos do microsoft visual basic 2010Dev401 novos recursos do microsoft visual basic 2010
Dev401 novos recursos do microsoft visual basic 2010
 
Pangea - Plataforma digital com Google Cloud Platform
Pangea - Plataforma digital com Google Cloud PlatformPangea - Plataforma digital com Google Cloud Platform
Pangea - Plataforma digital com Google Cloud Platform
 

Data Pipelines com AWS Glue & Step Functions

  • 1. Data Pipelines com AWS Glue & AWS Step-Functions
  • 2. ● Alexsandro Francisco ● Engenheiro de Dados no Stoodi ● Graduando em Computação ● dev, robótica, maker, pln/ml/ia, dados Apresentação alexsandr0x Alexsandr0x alexsandr0x.github.io medium.com/stoodi jobs.kenoby.com/stoodi
  • 4. ● Desafios dentro do Stoodi ● Conhecendo o Glue ● Identificando problemas ● Conhecendo o Step-Functions ○ Executando o job por chamada direta ○ Executando um job por Lambda Function ● Expandindo as possibilidades ● Dicas Introdução
  • 5. 22 milhões de visualizações em nossos vídeos Desafios dentro do Stoodi 18 mil vídeos em nossa plataforma 3 milhões de usuários na plataforma Stoodi 0.5 milhão de usuários na plataforma Eligis
  • 6. ● Empresa com cultura Data Driven ● Dados de eventos dos usuários na plataforma Desafios dentro do Stoodi ● Data Warehouse (Redshift) ● Plataforma de analytics para todos os colaboradores ● ETL em Batch dos principais dados usados ● OBT para facilitar uso para todos ● Data Lake no AWS S3 com todos os dados ● Pipeline usando AWS Glue
  • 7. “O AWS Glue é um serviço de extração, transformação e carga (ETL) gerenciado que facilita a preparação e a carga de dados para análises pelos clientes. [...]” - AWS Conhecendo o Glue
  • 8. ● Cuida do cluster Spark para você ● Data Catalog mapeia todas as suas tabelas ● Jobs cobrados por: tempo de execução * dpu (data processing unit) ● Triggers para facilitar a orquestração de múltiplos jobs (já falaremos deles...) Conhecendo o Glue
  • 9. ● Conexões: Redshift, AWS RDS, (outros por JDBC) ● Crawler: CSV, JSON, Parquet e ORC, no DynamoDB ● Jobs Spark em Python ou Scala ● Shell script python com numpy, sklearn, pandas, boto3, etc... Conhecendo o Glue
  • 11. Conhecendo o Glue Orquestrando o seus jobs com triggers: ● Execução do seu job através de agendamento ou término de um job anterior ● Podemos organizar com Workflow
  • 12. Com triggers conseguimos fazer: Identificando problemas Mas não conseguimos:
  • 13. Ou executar uma função lambda: Identificando problemas Nem mandar um email para a equipe de dados:
  • 14. “AWS Step Functions makes it easy to coordinate the components of distributed applications as a series of steps in a visual workflow.” - AWS Conhecendo o Step-Functions
  • 15. Conhecendo o Step-Functions ● Foco em sistemas distribuídos e microsserviços ● Mas nada nos impede de usar para orquestrar pipelines de dados!
  • 16. Executando o job por chamada direta A definição da sua state-machine é feita em ASL (Amazon States Language). A state-machine aparece de forma visual para facilitar sua vida.
  • 17. Executando o job por chamada direta Os “galhos” dentro do tracejado são rodados em paralelo ‘UpdateDB’ pode retornar um status que leva a ‘last level’ ou ‘simple level’ ‘CWMetric’ roda apenas quando todos os ramos na etapa paralela terminarem
  • 18. Problema Resolvido? Executando o job por chamada direta Poucas ferramentas integradas, não temos todo o leque da AWS Podemos concentrar todas as chamadas na AWS Lambda!
  • 19. Executando um job por Lambda Function amzn.to/2mITqn6
  • 20. Executando um job por Lambda Function Activities. na prática, tornam a step-function em uma API, onde a transição das etapas é feita através de código. Dessa forma podemos usar código em AWS Lambda para orquestrar nosso pipeline!
  • 21. Executando um job por Lambda Function
  • 22. Executando um job por Lambda Function Pipeline roda diariamente através de um evento Step Functions orquestra múltiplos jobs. A Lambda inicia os jobs e trata potenciais erros Lambda inicializa e persiste o status dos jobs do AWS Glue no DynamoDB.
  • 23. Com a lambda podemos chamar qualquer serviço aws como resposta Executando um job por Lambda Function Agora conseguimos rodar paralelo!
  • 29. Estamos contratando! ● Data Engineer ○ Pleno ● Dev Backend ○ Pleno ○ Senior ● Dev Mobile ○ Pleno ○ Senior https://jobs.kenoby.com/stoodi