Background jobs - Com Sidekiq

•Transferir como PPTX, PDF•

0 gostou•530 visualizações

O documento discute background jobs utilizando a ferramenta Sidekiq. Sidekiq é um processador de filas baseado em Redis que pode ser usado para executar tarefas em segundo plano, como envio de e-mails, geração de relatórios e inserção de dados no banco. O documento também fornece exemplos de uso de Sidekiq e boas práticas para trabalhar com jobs assíncronos.

Quem sou eu?
Desenvolvedor, jogador aposentado de basquete,
marido e pai de 1 cachorro e dois gatos.

Utilização
- Tarefas que precisam de muitos processamentos pesados
- Envio de email
- Geração de relatórios
- Inserção de dados

Redis
Redis is an open source (BSD licensed), in-memory data structure store, used as database,
cache and message broker.

Boas práticas
- Parâmetros dos jobs serem sempre pequenos e simples
- Não chamar workers dentro de transactions do banco de dados
- Idempotency
- Concorrência, benchmark e saber os limites

Envio de Email
- Emails devem sempre serem enviados em background
- Servidor de envio de emails ou servidor de email do cliente podem estar offline
- Caixa de entrada do usuário pode estar cheia
- deliver_later
- delay

Geração de Relatórios
- Processamento grande de dados
- Queries grandes no banco
- Salvar arquivos e enviar emails

Links
https://github.com/mperham/sidekiq
http://sidekiq.org/
http://redis.io/
https://github.com/redis/redis-rb

Recomendados

BigQuery Performance Improvements Storage API

Alvaro Viebrantz

Cache com redis novatec

Carlos Rodrigues

Cache com redis novatec

Carlos Rodrigues Junior

Datawarehouse - Obtenha insights consistentes para o seu negócio: conheça o n...

iMasters

Xen e CoreOS: solução para data mining com NodeJS e ElasticSearch

Bernardo Donadio

TDC2016SP - O bê-a-bá da fila de processamento para você deixar o ThreadPool ...

tdc-globalcode

1 Ids On Campus V3a

Alexandre Marini

[DTC21] André Marques - Jornada do Engenheiro de Dados

Deep Tech Brasil

BDI_1_conceitos

Cleiane Oliveira

Monitorando os Recursos e Processos do Servidor, através do Power BI

Sulamita Dantas

Apresentacao infgest 2

jarg1976

O documento apresenta um resumo sobre o curso de Informática de Gestão, destacando que o curso capacita os estudantes a trabalhar com computadores, programação, redes e sistemas de informação para aplicar esses conhecimentos em áreas como informática, contabilidade e administração. O documento também descreve algumas das disciplinas do curso e as saídas profissionais, como técnico de informática.

Economize o Consumo de Link WAN com o BranchCache

Rodrigo Immaginario

Meetup Tivir - Big Data Clusters

Luiz Henrique Garetti Rosário

Replicacao Object Sistemas

taniamaciel

ASP.Net Performance – A pragmatic approach - Luis Paulino

Comunidade NetPonto

Nesta sessão abordamos a performance de Sistemas de Informação desenvolvidos na plataforma ASP.NET com recurso a SQL Server com SGBD. Iremos explicar como surgem os problemas de performance em sistemas com alguns anos de existência e qual a abordagem a tomar, quando temos utilizadores insatisfeitos. Abordaremos também alguns casos de sucesso no mercado a nível de sistemas de alta disponibilidade e como o mercado tem evoluído. De uma forma geral, pretendemos demonstrar técnicas de análise/tuning de performance em ASP.NET e sua evolução ao longo das várias versões, como também algumas técnicas de requisitos para obtenção e estruturação da informação. Finalmente, o objetivo passa por divulgar procedimentos, técnicas e ferramentas que sirvam como uma referência que possam ser úteis caso surjam problemas de performance nos nossos sistemas de futuro, entre os quais : Do’s & Dont’s, Systematic Tuning, ASP.NET Trace, VS Profiling Tools, SQL Profiler entre outros.

Pgbr2013

Pablo Filetti Moreira

Gerenciando dados e criando um plano efetivo de recuperação com Tivoli Storag...

Webcasts developerWorks Brasil

Latinoware 2012 - Desenvolvendo Interfaces com Holy

Dextra

Latinoware2012 - Desenvolvendo interfaces WEB com HOLY de forma prática e efi...

Leandro Guimarães

Scrum e o Ambiente de Desenvolvimento Ágil

abacrazy

Performance Web com ASP.NET MVC

Rodolfo Fadino Junior

Arquitetura Web Desacoplada - FCI/Mackenzie

Vivaldo Jose Breternitz

Bigdata na pratica: Resolvendo problemas de performance com hadoop

tdc-globalcode

O Apache Hadoop tem se tornado o framework padrão para processamento de Big Data. Com ele, podemos processar grandes volumes de dados utilizando hardware de baixo custo de forma paralela e distribuída. Essas características podem ser úteis no cotidiano do desenvolvedor, otimizando a execução de rotinas batch e geração de relatórios, por exemplo. Nesta palestra serão mostrados os passos para desenvolver uma solução utilizando algumas ferramentas que fazem parte do ecossistema do Hadoop: MapReduce, HDFS e HBase.

MongoDB + PHP

Ari Stopassola Junior

Petic Emgetis Final

netimba

L'esprit de l'escalier

Gleicon Moraes

Apresentacao infgest 2

jarg1976

Utilizando a nuvem para proteger o mercado financeiro com segurança, agilidad...

Amazon Web Services LATAM

Mais conteúdo relacionado

Semelhante a Background jobs - Com Sidekiq

BDI_1_conceitos

Cleiane Oliveira

Monitorando os Recursos e Processos do Servidor, através do Power BI

Sulamita Dantas

Apresentacao infgest 2

jarg1976

Economize o Consumo de Link WAN com o BranchCache

Rodrigo Immaginario

Meetup Tivir - Big Data Clusters

Luiz Henrique Garetti Rosário

Replicacao Object Sistemas

taniamaciel

ASP.Net Performance – A pragmatic approach - Luis Paulino

Comunidade NetPonto

Pgbr2013

Pablo Filetti Moreira

Gerenciando dados e criando um plano efetivo de recuperação com Tivoli Storag...

Webcasts developerWorks Brasil

Latinoware 2012 - Desenvolvendo Interfaces com Holy

Dextra

Latinoware2012 - Desenvolvendo interfaces WEB com HOLY de forma prática e efi...

Leandro Guimarães

Scrum e o Ambiente de Desenvolvimento Ágil

abacrazy

Performance Web com ASP.NET MVC

Rodolfo Fadino Junior

Arquitetura Web Desacoplada - FCI/Mackenzie

Vivaldo Jose Breternitz

Bigdata na pratica: Resolvendo problemas de performance com hadoop

tdc-globalcode

MongoDB + PHP

Ari Stopassola Junior

Petic Emgetis Final

netimba

L'esprit de l'escalier

Gleicon Moraes

Apresentacao infgest 2

jarg1976

Utilizando a nuvem para proteger o mercado financeiro com segurança, agilidad...

Amazon Web Services LATAM

Semelhante a Background jobs - Com Sidekiq (20)

BDI_1_conceitos

Monitorando os Recursos e Processos do Servidor, através do Power BI

Apresentacao infgest 2

Economize o Consumo de Link WAN com o BranchCache

Meetup Tivir - Big Data Clusters

Replicacao Object Sistemas

ASP.Net Performance – A pragmatic approach - Luis Paulino

Pgbr2013

Gerenciando dados e criando um plano efetivo de recuperação com Tivoli Storag...

Latinoware 2012 - Desenvolvendo Interfaces com Holy

Latinoware2012 - Desenvolvendo interfaces WEB com HOLY de forma prática e efi...

Scrum e o Ambiente de Desenvolvimento Ágil

Performance Web com ASP.NET MVC

Arquitetura Web Desacoplada - FCI/Mackenzie

Bigdata na pratica: Resolvendo problemas de performance com hadoop

MongoDB + PHP

Petic Emgetis Final

L'esprit de l'escalier

Apresentacao infgest 2

Utilizando a nuvem para proteger o mercado financeiro com segurança, agilidad...

Background jobs - Com Sidekiq

1. Background Jobs Com Sidekiq

2. Quem sou eu? Desenvolvedor, jogador aposentado de basquete, marido e pai de 1 cachorro e dois gatos.

3. O que é background job?

4. Utilização - Tarefas que precisam de muitos processamentos pesados - Envio de email - Geração de relatórios - Inserção de dados

5. Ferramentas

6. Redis Redis is an open source (BSD licensed), in-memory data structure store, used as database, cache and message broker.

7. RubyGems

8. Delayed::Job vs Sidekiq vs SuckerPunch

9. Sidekiq

10. Sidekiq

11. Boas práticas - Parâmetros dos jobs serem sempre pequenos e simples - Não chamar workers dentro de transactions do banco de dados - Idempotency - Concorrência, benchmark e saber os limites

12. Exemplos de Utilização

13. Envio de Email - Emails devem sempre serem enviados em background - Servidor de envio de emails ou servidor de email do cliente podem estar offline - Caixa de entrada do usuário pode estar cheia - deliver_later - delay

14. Geração de Relatórios - Processamento grande de dados - Queries grandes no banco - Salvar arquivos e enviar emails

15. Inserção de muitos registros no banco

16. Cálculo de saldo do usuário

17. Links https://github.com/mperham/sidekiq http://sidekiq.org/ http://redis.io/ https://github.com/redis/redis-rb

Notas do Editor

Background job é, como o próprio nome já diz, o processamento de alguma tarefa, algum job, em background, sem precisar que a aplicação utilizada pelo usuário fique parada esperando essa tarefa ser realizada. Pegando de forma mais macro, pensando em tarefas macros, para o usuário final, o processamento da foto é algo feito em background, pois enquanto isso é realizado, o usuário pode continuar usando o app, inclusive mandar mais fotos. Pensando mais especificamente de sistemas, é por exemplo, o envio de email de confirmação para o usuário após um cadastro, ser executado de forma que não interfira no cadastro do usuário, o cadastro ter sido finalizado, e em paralelo, sem que o usuário mesmo saiba, o email está sendo processado para ser enviado
O rails é singlethreaded e por isso se torna mais necessário ainda a utilização de background jobs para permitir que mais processos possam ser executados em paralelo
Redis é um banco de dados em memória, que é muito utilizado para cache, pois é fácil de utilizar. Pode ser utilizado como banco de dados realmente, ou até message broker. No nosso caso, ele é o banco de dados que usaremos para guardar os nossos jobs e as filas de execução. O sidekiq tem o redis como dependência, já vindo integrado com o mesmo para utilização.
Existem algumas alternativas de gems para serem utilizadas com o ruby para processamento de background jobs. O resque ainda é o mais utilizado, mas aqui eu vou focar no sidekiq e vou mostrar exemplos de como utilizar ele. https://github.com/mperham/sidekiq#performance Uma coisa curiosa que acho que vale a pena citar aqui, há alguns anos eu trabalhei em um projeto que usava o suckerpunch para background jobs. O curioso é que na verdade ele é um processador asíncrono, ele tem uma estrutura de worker, filas, etc, mas ele não usa processos em background, mas executa os processos só de forma asíncrona. Por exemplo, no heroku, se utilizarmos o sucker_punch em algum projeto, não seria preciso ter worker, bastaria ter os web dynos da aplicação rodando que o sucker_punch funcionaria. Por isso não vejo tanta vantagem nele, pois apesar dele permitir que o usuário receba o feedback da ação enquanto algum job que essa ação disparou é executado de forma asíncrona, ele continua ocupando bando do servidor da aplicação.
o delayed job persiste e utiliza o banco e dados para gerenciar os jobs. boa parte do motivo do sidekiq ser ráido, é por ele utilizar o redis para essa função
Mostrar exemplo do código que fiz de sample, mostrando como o worker é definido e executado, mostrando exemplos do perform_in, do perform_async, do perform_at, mostrando como e a instalação, como adicionar segurança para o acesso ao painel web do sidekiq, que necessita do sinatra instalado também, etc, falar que o delay pode ser chamado de qualquer classe na verdade. Falar da API do sidekiq, mostrar exemplo de como pegar a fila, ver o job, etc.
Evitar sempre serializar objetos grandes, primeiro que eles podem acabar ocupando muita memória no redis, e segundo que o ideal é passar uma referência para o objeto, para que o job busque o objeto e use os dados mais atuais do objeto. Essa foi uma adição pessoal minha, mas já tive alguns problemas de workers serem executados e darem erro de record not found. Como o worker roda em background, se você chamar ele a partir de uma transaction e ele for acessar algum objeto que vai ser criado ou modificado naquela transaction, existe o risco do worker executar antes da transaction acabar e com isso aquele objeto ainda não existir, ou os dados dele ainda não terem sido atualizados Idempotency significa não ter problema se o seu job for executado mais de uma vez com os mesmos parâmetros. Por exemplo, se você tem um worker que ao final de um processamento precisa mandar um email, se o envio do email falhar, o work vai para o retry e vai ser executado novamente pelo sidekiq. Executar uma segunda vez o processamento feito pelo worker vai gerar algum problema? Se sim, o worker não foi implementado da forma correta. Algumas alternativas são usar transaction para workers que fazem inserção no banco de dados, pois assim qualquer exceção desfaz tudo que o worker tiver feito antes da exceção, ou colocar condicionais para as ações do worker, ou até ignorar certos erros que podem não ser tão importantes. E a concorrência é realmente utilizar o background jobs ao máximo, colocando para vários jobs serem executados em paralelo, fazendo benchmark, metrificando os workers, para saber quanto de memória, cpu, etc, seu servidor onde os workers estarão rodando precisa. Não adianta jogar tudo para background e sobrecarregar a cpu ou a memória e o servidor não aguentar.
O envio de email, além da possibilidade de demora, pode ocasionar erros que não devem atrapalhar a conclusão da ação do usuário.
Painel da marca, que processa em background, gera xls, e manda por email, mas também retorna para download do usuário caso ele queira esperar.
Criação de grupos, podendo utilizar aluno e disciplina/aula como exemplo de inserção de dados dessa forma.