SlideShare uma empresa Scribd logo
1 de 48
CLOUDMODELTEST
Um modelo de elasticidade de recursos em duas camadas
aplicado ao problema de adequação de sistemas de
substituição filogenética
OR IE N T A D O R :
Rodrigo da Rosa Righi
Coordenador do Programa de Pós-Graduação
em Computação Aplicada
Mestrado em Computação Aplicada
Seminário de Andamento da Proposta de Dissertação
MESTRANDO:
Mateus Rauback Aubin
Bolsista CAPES na modalidade Taxas
Desenvolvedor na SAP Labs
09/20182
AGENDA
INTRO
DUÇÃO
09/20184
MOTIVAÇÃO
Baixa penetração de
paradigmas como Computação
em Nuvem e Elasticidade nos
softwares usados para Inferência
Filogenética
MODERNIZAÇÃO
Incremento na produtividade
dos pesquisadores da Biologia
possibilita melhor
aproveitamento de recursos
humanos favorecendo a
qualidade da produção através
de, por exemplo, análises mais
amplas e/ou profundas
PRODUTIVIDADE
Colaboração com o laboratório de
Biologia da Universidade no
contexto do projeto contemplado
pela FAPERGS: Combinando
Elasticidade Multi-Métrica em
Nuvem nas Modalidades Vertical
Horizontal para Análise de Genes
e Redução de Pragas Agrícolas
FAPERGS
09/20185
QUESTÃO DE
PESQUISA
Como seria projetado um modelo de
elasticidade de recursos em um
ambiente de computação em nuvem
capaz de aperfeiçoar o processo de
adequação de sistemas/modelos de
substituição de sequências moleculares
da filogenética de maneira eficiente do
ponto de vista computacional e
econômico?
09/20186
OBJETIVO DE
PESQUISA
Propor um modelo computacional
que empregue a elasticidade de
recursos oriunda da computação em
nuvem para aumentar a eficiência
computacional e econômica no
problema do teste de adequação de
sistemas/modelos de substituição
de sequências moleculares no contexto
da filogenética.
09/20187
EFICIÊNCIA
COMPUTACIONAL
& ECONÔMICA
MANUTENÇÃO
HARDWARE
GE S T Ã O &
CO N F IG U R A Ç Ã O
TE M P O DE
EX E C U Ç Ã O
FUNDAMEN
TAÇÃO
TEÓRICA
09/20189
INFERÊNCIA
FILOGENÉTICA
OBTENÇÃO DE
SEQUÊNCIAS
MOLECULARES
Clustalo
MUSCLEo
o T-Coffee
ALINHAMENTO
DE SEQUÊNCIAS
MOLECULARES
SELEÇÃO DE
SISTEMAS DE
SUBSTITUIÇÃO
o Matrizes de Distâncias
o Máxima Parcimônia
o Máxima Verossimilhança
o Inferência Bayesiana
ANÁLISE
09/201810
INFERÊNCIA
FILOGENÉTICA
A
B
C
D
E
09/201811
COMPUTAÇÃO PARALELA
& DISTRIBUÍDA
ORQUESTRAÇÃO DE
CONTÊINERES
FUNCTION AS A SERVICE
(FAAS) / SERVERLESS
Através de mecanismos
Regra — Condição — Ação
(automática reativa)
ELASTICIDADE
Virtualmente infinita, uma nova
instância para cada execução
(orientada a eventos)
Imagem do Ambiente de Execução REQUISITOS Pacote com Código Fonte
Maior CARGA OPERACIONAL Menor
Minutos PROVISIONAMENTO Segundos
Ilimitado TEMPO DE EXECUÇÃO Poucos Minutos
Por Hora PRECIFICAÇÃO Por Segundo
Incorre Custos OCIOSIDADE Não Incorre Custos
Processos Longos ADEQUAÇÃO Processos Curtos
09/201812
CONTÊINERES & FaaS
LEVANTA
MENTO
BIBLIO
GRÁFICO
SOFTWARE
Quais são os softwares mais
avançados para inferência
filogenética disponíveis hoje?
TÉCNICAS
Quais técnicas de otimização são
usadas atualmente para possibilitar a
inferência de grandes filogenias?
CENÁRIO
Qual é o cenário no que diz respeito a
adoção de técnicas de computação paralela
e distribuída para inferência filogenética?
DESAFIOS E OPORTUNIDADES
Quais são os desafios encontrados pelos autores e
as oportunidades disponíveis para avançar o estado
da arte no que diz respeito a computação paralela
e distribuída aplicada a algoritmos filogenéticos?
QUESTÕES
14 09/2018
09/201815
FONTES DE BUSCA
ACM: Association for Computing Machinery
BMC: BioMed Central
CiteSeerX †
Elsevier
Google Scholar †
IEEE: Institute of Electrical and Electronics Engineers
Nature
Oxford Academic
PLOS: Public Library of Science
Semantic Scholar †
Springer
09/201816
DIFICULDADES
Trabalhos fundamentais noso
anos 80
Bases teóricas definidas tãoo
cedo quanto 1960
PUBLICAÇÕES SE
ESTENDEM EM UM LONGO
PERÍODO DETEMPO
Poucas publicações emo
revistas da Computação
Nas revistas da Biologia oo
ferramental é secundário
Softwares são publicadoso
como "notes“
FERRAMENTAL É
TRATADO COMO
SECUNDÁRIO
DISTRIBUIÇÃO
TEMPORAL DAS
PUBLICAÇÕES
AVALIADAS
09/201817
Quantidade de trabalhos
agrupados por ano de
publicação
09/201818
TAXONOMIA
09/201819
TAXONOMIACATEGORIA MÉTODO FINALIDADE QUANT
Inferência
Filogenética
Máxima
Verossimilhança
Outras Finalidades 22
Elaboração
de Árvores
Filogenéticas
17
com
Heurísticas
5
Inferência Bayesiana 3
Matrizes de Distâncias 3
Máxima Parcimônia 2
Pacotes e Portais 17
Seleção de Modelos/Sistemas 10
Alinhamento de Sequências 4
TOTAL 83
Quantidade de trabalhos
agrupados por categoria da
Taxonomia
CARACTERÍSTICAS
COMPUTACIONAIS
09/201820
Console Interativo1.
Interface Gráfica2.
Suporte à diretivas de computação distribuída3.
Suporte à computação baseada em4. GPUs
Suporte à elasticidade no consumo de recursos5.
Implementação de diretivas para6.
balanceamento de carga
CARACTERÍSTICAS
COMPUTACIONAIS
Apesar do suporte à Computação
Distribuída, existe pouca adoção
de Elasticidade e até mesmo
Balanceamento de Carga
09/201821
54%
41%
23%
5% 4% 2%
0
10
20
30
40
50
Quantidade Percentual
LACUNAS DE
PESQUISA
A contribuição deste trabalho está situada na intersecção
entre os tópicos de Balanceamento de Carga e Elasticidade
09/201822
MODELO
CLOUD
MODEL
TEST
09/201824
CRITÉRIO DE SELEÇÃO
DA APLICAÇÃO
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
0 k
5 k
10 k
15 k
20 k
25 k
Número de
Citações
Percentual
Acumulado
09/201825
CRITÉRIO DE SELEÇÃO
DA APLICAÇÃO
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
0 k
5 k
10 k
15 k
20 k
25 k
Número de
Citações
Percentual
Acumulado
jModelTest
Porque ele?
09/201826
ENTRE OS SOFTWARES
MAIS CITADOS NO
CONTEXTO DE
IN FER ÊN C IA
FILO G EN ÉTIC A
RESPONSÁVEL POR UMA
DAS ETAPAS MAIS
DEMORADAS NO
PROCESSO DE
INFERÊNCIA
FILOGENÉTICA
PROCESSAMENTO
COMPOSTO POR
TAREFAS DE
COMPLEXIDADE
HETEROGÊNEA
jModelTest
09/201827
ENTRE OS SOFTWARES
MAIS CITADOS NO
CONTEXTO DE
INFERÊNCIA
FILOGENÉTICA
Aproximadamenteo 34 k
citações
Representandoo 14% do
total encontrado
jModelTest
09/201828
RESPONSÁVEL POR UMA
DAS ETAPAS MAIS
DEMORADAS NO
PROCESSO DE
IN FER ÊN C IA
FILO G EN ÉTIC A
Produtividade doso
Pesquisadores
Qualidade daso
Publicações
jModelTest
Quantidade de sequênciaso
Quantidade de modeloso
Comprimento daso
sequências
Complexidade de cadao
modelo
09/201829
PROCESSAMENTO
COMPOSTO POR
TAREFAS DE
COMPLEXIDADE
HETEROGÊNEA
09/201830
jModelTest
Evolução da
ferramenta
Posada, D., & Crandall, K. A. (1998).
MODELTEST: testing the model of DNA
substitution. Bioinformatics, 14(9), 817–
818.
MODELTEST
Posada, D. (2008).
jModelTest: Phylogenetic Model
Averaging. Molecular Biology and
Evolution, 25(7), 1253–1256.
jModelTest
Darriba, D., Taboada, G. L., Doallo, R., &
Posada, D. (2012).
jModelTest2: more models, new
heuristics and parallel computing.
Nature Methods, 9(8), 772.
jModelTest2
CLO U D MO D E L TE ST
09/201831
DECISÕES
DE PROJETOCLOUD NATIVE
ELASTICIDADE
BALANCEAMENTO
DE CARGA
AGNÓSTICO A
PROVEDOR
CONFIGURAÇÃO
SIMPLIFICADA
GESTÃO
SIMPLIFICADA
OTIMIZAÇÃO
DE CUSTOS
09/201832
ARQUITETURA
DO MODELO
COMPUTAÇÃO
DISTRIBUÍDA
FILAS DE MENSAGENS
PARA COMUNICAÇÃO
ASSÍNCRONA
ELASTICIDADE EM
DUAS CAMADAS
FAAS PARA TAREFAS
DE CURTA DURAÇÃO
ORQUESTRAÇÃO DE
CONTÊINERES PARA
TAREFAS DE LONGA
DURAÇÃO
DIAGRAMA UML
DE ATIVIDADES
Uma visão geral sobre o fluxo de
controle conforme as etapas do
processo entre os elementos que
compõem o modelo expondo as
Interações entre eles
36
DIAGRAMA UML
DE ATIVIDADES
09/201837
DIAGRAMA UML
DE ATIVIDADES
09/201838
DIAGRAMA UML
DE ATIVIDADES
09/201839
09/201840
METODOLOGIA DE
AVALIAÇÃO
o Escolher Datasets
o Definir Parâmetros
SETUP
Estabelecer uma baseline de
performance pela execução
do jModelTest em modos:
Sharedo Memory
MPIo
MEDIÇÕES
o Sem Elasticidade
o Apenas FaaS
o Apenas Contêineres
o Modelo Completo
TESTES
COMPARATIVOS
CON
CLU
SÃO
09/201842
CONTRIBUIÇÕES
ESPERADAS
Um entendimento compartilhado
no âmbito da Filogenética e de
suas ferramentas Computacionais
TAXONOMIA
Ampliar as capacidades do
projeto jModelTest para
maximizar o aproveitamento de
ambientes de computação em
nuvem, possibilitando
elasticidade no uso de recursos
MODELO
CL O U D MO D E LTE S T
Generalização do modelo com
foco na elasticidade, dividindo, em
uma camada tarefas curtas com
parametrização agressiva, e
outra camada composta por
tarefas longas priorizando a
flexibilidade de configuração
ELASTICIDADE EM
DUAS CAMADAS
TAREFAS EM
ANDAMENTO
09/201843
09/201844
CRONOGRAMA
ATIVIDADES
2018 2019
SET OUT NOV DEZ JAN FEV
Desenvolvimento do Protótipo
Execução dos Cenários de Avaliação
Análise dos Resultados
Publicações Relacionadas
Escrita da Dissertação
Entrega X
Defesa X
PARECER
DOS
AVALIA
DORES
09/201846
PARECER DOS AVALIADORES
DIS C U S S Ã O
SUPERFICIAL
SOBRE OS
TRABALHOS
RELACIONADOS
AUSÊNCIA DE
REFERÊNCIAS
ATUAIS
CRITÉRIO DE
ESCOLHA DA
APLICAÇÃO
JMODELTEST
TE X T O
INFORMAL OU
COLOQUIAL
OBRIGADO!
Mateus Rauback Aubin
Prof. Dr. Rodrigo da Rosa Righi
CLOUDMODELTEST
Um modelo de elasticidade de recursos em duas camadas
aplicado ao problema de adequação de sistemas de
substituição filogenética
ORIENTADOR:
Rodrigo da Rosa Righi
Coordenador do Programa de Pós-Graduação
em Computação Aplicada
Mestrado em Computação Aplicada
Seminário de Andamento da Proposta de Dissertação
ME S T R A N D O :
Mateus Rauback Aubin
Bolsista CAPES na modalidade Taxas
Desenvolvedor na SAP Labs

Mais conteúdo relacionado

Semelhante a CloudModelTest — Seminário de Andamento da Proposta de Dissertação

Modelagem - Aula 1
Modelagem - Aula 1Modelagem - Aula 1
Modelagem - Aula 1Joabe Amaral
 
Tdc Future 2021 - simples soluções grandes resultados - Márcio Rogério Nizzola
Tdc Future 2021 - simples soluções grandes resultados - Márcio Rogério NizzolaTdc Future 2021 - simples soluções grandes resultados - Márcio Rogério Nizzola
Tdc Future 2021 - simples soluções grandes resultados - Márcio Rogério NizzolaDextra Sistemas / Etec Itu
 
Cloud Computing - Pratices & Patterns
Cloud Computing - Pratices & PatternsCloud Computing - Pratices & Patterns
Cloud Computing - Pratices & PatternsAlan Carlos
 
A eficiência de mainframes medida através de conceitos de linha de produção e...
A eficiência de mainframes medida através de conceitos de linha de produção e...A eficiência de mainframes medida através de conceitos de linha de produção e...
A eficiência de mainframes medida através de conceitos de linha de produção e...Joao Galdino Mello de Souza
 
Análise dos recursos de tecnologia da informação
Análise dos recursos de tecnologia da informaçãoAnálise dos recursos de tecnologia da informação
Análise dos recursos de tecnologia da informaçãoEliseu L. Verissimo
 
COMPUTAÇÃO EM NUVEM: ESTUDO DE CASO EM UMA EMPRESA DE TECNOLOGIA DA INFORMAÇÃO
COMPUTAÇÃO EM NUVEM: ESTUDO DE CASO EM UMA EMPRESA DE TECNOLOGIA DA INFORMAÇÃOCOMPUTAÇÃO EM NUVEM: ESTUDO DE CASO EM UMA EMPRESA DE TECNOLOGIA DA INFORMAÇÃO
COMPUTAÇÃO EM NUVEM: ESTUDO DE CASO EM UMA EMPRESA DE TECNOLOGIA DA INFORMAÇÃOAllan Reis
 
Gerência de Configuração de Software: Benefícios Do Controle de Versões Distr...
Gerência de Configuração de Software: Benefícios Do Controle de Versões Distr...Gerência de Configuração de Software: Benefícios Do Controle de Versões Distr...
Gerência de Configuração de Software: Benefícios Do Controle de Versões Distr...Gilmar Pupo
 
Alta Disponibilidade e Tolerância a Falhas: uma abordagem em Banco de Dados
Alta Disponibilidade e Tolerância a Falhas: uma abordagem em Banco de DadosAlta Disponibilidade e Tolerância a Falhas: uma abordagem em Banco de Dados
Alta Disponibilidade e Tolerância a Falhas: uma abordagem em Banco de DadosAlex Camargo
 
Business Continuity e Disaster Recovery na Cloud
Business Continuity e Disaster Recovery na CloudBusiness Continuity e Disaster Recovery na Cloud
Business Continuity e Disaster Recovery na CloudClaranet Portugal
 
Map reduce novas abordagens para o processo de datamining em grandes volumn...
Map reduce   novas abordagens para o processo de datamining em grandes volumn...Map reduce   novas abordagens para o processo de datamining em grandes volumn...
Map reduce novas abordagens para o processo de datamining em grandes volumn...João Gabriel Lima
 
Portfolio Grupo 4 ADS Unopar Desafios1-2-3-4
Portfolio Grupo 4 ADS Unopar Desafios1-2-3-4Portfolio Grupo 4 ADS Unopar Desafios1-2-3-4
Portfolio Grupo 4 ADS Unopar Desafios1-2-3-4Adilson Nascimento
 
Artigo_Thiago_Lenz_versao2.3-Final
Artigo_Thiago_Lenz_versao2.3-FinalArtigo_Thiago_Lenz_versao2.3-Final
Artigo_Thiago_Lenz_versao2.3-Finalthiago.lenz
 
BDD (Behavior-Driven Development) - Setembro/2015
BDD (Behavior-Driven Development) - Setembro/2015BDD (Behavior-Driven Development) - Setembro/2015
BDD (Behavior-Driven Development) - Setembro/2015Renato Groff
 
Como DDD e Strategic Design estão nos ajudando a modernizar um Legado
Como DDD e Strategic Design estão nos ajudando a modernizar um LegadoComo DDD e Strategic Design estão nos ajudando a modernizar um Legado
Como DDD e Strategic Design estão nos ajudando a modernizar um LegadoLuiz Costa
 
ThingProvider-Proposal
ThingProvider-ProposalThingProvider-Proposal
ThingProvider-ProposalKevin Martins
 

Semelhante a CloudModelTest — Seminário de Andamento da Proposta de Dissertação (20)

RAD
RADRAD
RAD
 
presentation
presentationpresentation
presentation
 
Modelagem - Aula 1
Modelagem - Aula 1Modelagem - Aula 1
Modelagem - Aula 1
 
Oficina cake php
Oficina cake phpOficina cake php
Oficina cake php
 
Tdc Future 2021 - simples soluções grandes resultados - Márcio Rogério Nizzola
Tdc Future 2021 - simples soluções grandes resultados - Márcio Rogério NizzolaTdc Future 2021 - simples soluções grandes resultados - Márcio Rogério Nizzola
Tdc Future 2021 - simples soluções grandes resultados - Márcio Rogério Nizzola
 
Cloud Computing - Pratices & Patterns
Cloud Computing - Pratices & PatternsCloud Computing - Pratices & Patterns
Cloud Computing - Pratices & Patterns
 
A eficiência de mainframes medida através de conceitos de linha de produção e...
A eficiência de mainframes medida através de conceitos de linha de produção e...A eficiência de mainframes medida através de conceitos de linha de produção e...
A eficiência de mainframes medida através de conceitos de linha de produção e...
 
Análise dos recursos de tecnologia da informação
Análise dos recursos de tecnologia da informaçãoAnálise dos recursos de tecnologia da informação
Análise dos recursos de tecnologia da informação
 
COMPUTAÇÃO EM NUVEM: ESTUDO DE CASO EM UMA EMPRESA DE TECNOLOGIA DA INFORMAÇÃO
COMPUTAÇÃO EM NUVEM: ESTUDO DE CASO EM UMA EMPRESA DE TECNOLOGIA DA INFORMAÇÃOCOMPUTAÇÃO EM NUVEM: ESTUDO DE CASO EM UMA EMPRESA DE TECNOLOGIA DA INFORMAÇÃO
COMPUTAÇÃO EM NUVEM: ESTUDO DE CASO EM UMA EMPRESA DE TECNOLOGIA DA INFORMAÇÃO
 
Gerência de Configuração de Software: Benefícios Do Controle de Versões Distr...
Gerência de Configuração de Software: Benefícios Do Controle de Versões Distr...Gerência de Configuração de Software: Benefícios Do Controle de Versões Distr...
Gerência de Configuração de Software: Benefícios Do Controle de Versões Distr...
 
Cluster individual
Cluster   individualCluster   individual
Cluster individual
 
Alta Disponibilidade e Tolerância a Falhas: uma abordagem em Banco de Dados
Alta Disponibilidade e Tolerância a Falhas: uma abordagem em Banco de DadosAlta Disponibilidade e Tolerância a Falhas: uma abordagem em Banco de Dados
Alta Disponibilidade e Tolerância a Falhas: uma abordagem em Banco de Dados
 
Business Continuity e Disaster Recovery na Cloud
Business Continuity e Disaster Recovery na CloudBusiness Continuity e Disaster Recovery na Cloud
Business Continuity e Disaster Recovery na Cloud
 
Map reduce novas abordagens para o processo de datamining em grandes volumn...
Map reduce   novas abordagens para o processo de datamining em grandes volumn...Map reduce   novas abordagens para o processo de datamining em grandes volumn...
Map reduce novas abordagens para o processo de datamining em grandes volumn...
 
Portfolio Grupo 4 ADS Unopar Desafios1-2-3-4
Portfolio Grupo 4 ADS Unopar Desafios1-2-3-4Portfolio Grupo 4 ADS Unopar Desafios1-2-3-4
Portfolio Grupo 4 ADS Unopar Desafios1-2-3-4
 
Arquitetura de sistemas web
Arquitetura de sistemas webArquitetura de sistemas web
Arquitetura de sistemas web
 
Artigo_Thiago_Lenz_versao2.3-Final
Artigo_Thiago_Lenz_versao2.3-FinalArtigo_Thiago_Lenz_versao2.3-Final
Artigo_Thiago_Lenz_versao2.3-Final
 
BDD (Behavior-Driven Development) - Setembro/2015
BDD (Behavior-Driven Development) - Setembro/2015BDD (Behavior-Driven Development) - Setembro/2015
BDD (Behavior-Driven Development) - Setembro/2015
 
Como DDD e Strategic Design estão nos ajudando a modernizar um Legado
Como DDD e Strategic Design estão nos ajudando a modernizar um LegadoComo DDD e Strategic Design estão nos ajudando a modernizar um Legado
Como DDD e Strategic Design estão nos ajudando a modernizar um Legado
 
ThingProvider-Proposal
ThingProvider-ProposalThingProvider-Proposal
ThingProvider-Proposal
 

CloudModelTest — Seminário de Andamento da Proposta de Dissertação