SlideShare uma empresa Scribd logo
1 de 47
Métodos Quantitativos em
Ciência da Computação
Unidade 5: Projeto de Experimentos
Parte 1
Alexandre Duarte
PPGI/UFPB
Apresentação derivada dos slides originais de
Jussara Almeida.
Terminologia do Projeto de
Experimentos
• Variável resposta: representa o valor obtido, que é medido
de acordo com as variações dos dados de entrada.
– Exemplo: tempo de resposta, índice de precisão, utilização,
• Fatores: as variáveis de entrada de um experimento que
podem ser controladas pelo “experimentador”.
– Exemplo: tamanho do cache, tamanho dos arquivos, tempo de
seek, latência da rede, etc
• Níveis: os níveis de um fator são os valores específicos que
podem ser atribuídos ao fator. Podem ser contínuos (ex.:
tempo de seek), discretos (# de servidores) ou podem ser
categóricos, como o tipo de um processador ou a classe de
um certo algoritmo. Também chamados de treatments
Terminologia do Projeto de
Experimentos
• Replicação: replicar um experimento significa re-
executá-lo completamente com todos os
mesmos níveis de entrada. Desde que as medidas
da variável resposta são sujeitas a variações
aleatórias, as replicações de um experimento são
usadas para determinar o impacto do erro
experimental na variável resposta.
• Interação: uma interação entre fatores ocorre
quando o efeito de um fator depende do nível de
outro fator.
– Efeito da memória na atividade de paginação.
Introdução ao Projeto de
Experimentos: perguntas básicas
• Você conhece as métricas?
• Você conhece os fatores?
• Você conhece os níveis?
• Você tem conhecimento de como
instrumentar o sistema e elaborar as cargas
de teste?
• Você sabe descrever o que fazer para realizar
experimentos que comprovem ou refutem as
hipóteses de sua pesquisa?
Objetivos no Projeto de
Experimentos
• Obter a maior quantidade de informação
• Reduzir o trabalho/esforço de experimentação
– Tipicamente significa o menor número de
experimentos
• Realizar mais experimentos não é bom (gasta-se
tempo e recursos), principalmente se você for
aquele responsável pela execução dos mesmos.
– Experimentos bem projetados são mais fáceis de
serem analisados.
Replicações Experimentais
• O sistema em estudo executará com vários
níveis de diferentes fatores, potencialmente
com diferentes cargas.
• Uma execução com um conjunto particular de
níveis e dados de entrada é uma replicação.
• Em geral, é necessário realizar múltiplas
replicações com um único conjunto de níveis e
dados de entrada, por razões de verificação e
validação estatística.
A Interação dos Fatores
• Alguns fatores tem efeitos completamente
independentes um do outro.
– Exemplo: Duplique o nível de um fator e obterá́
metade da resposta, independente dos outros
fatores.
• Mas os efeitos de alguns fatores dependem dos
valores de outros fatores
– Fatores inter-atuantes
• A presença de fatores inter-atuantes complica o
projeto experimental.
Problema Básico ao Projeto
Experimentos
• Um determinado numero de fatores foi
escolhido
• Os fatores podem ou não interagir
• Como se pode projetar um experimento que
captura os intervalos completos de variação
dos níveis?
– Com a menor quantidade de trabalho possível
• Qual a combinação ou combinações de níveis
de fatores deseja-se medir?
Erros Comuns na Experimentação
• Ignorar o erro experimental
– A variação devido a um fator deve ser comparada com a variação
devido aos erros experimentais antes de se tomar uma decisão sobre
o fator (ele tem impacto significativo?)
• Existência de parâmetros não controlados (não são fatores)
– Somente o impacto de fatores é avaliado
• Não isolamento dos efeitos de diferentes fatores
– Variação de vários fatores simultaneamente
• Projetos de experimentos com um fator-de-cada-vez
– Muito caro: não necessariamente mais informativo
• Ignorar as interações entre os fatores
• Projetos que requerem um número excessivo de experimentos
– Melhor considerar um subconjunto dos fatores/níveis primeiro e
depois ir acrescentando fatores/níveis aos poucos.
Tipos de Projetos de Exprimentos
• Projetos simples
• Projetos com fatorial completo
• Projetos com fatorial fracionado
Projetos Simples
• Varie um fator de cada vez
• Para k fatores com o i-ésimo fator tendo ni
níveis
• Assume que os fatores não interagem
• Usualmente requer mais esforço que se pensa
• Tente evitar esse enfoque de experimentação
Projeto com Fatorial Completo
• Para k fatores com o i-ésimo fator tendo ni níveis
• Teste cada combinação possível dos níveis dos
fatores.
• Capture a informação completa sobre a interação
• É no entanto, um trabalho ENORME!!!
– Principalmente se valores de ni forem grandes
Reduzindo o trabalho em Projetos
com Fatorial Completo
• Reduza o número de níveis por fator
– Geralmente uma boa opção
– Especialmente quando se sabe quais fatores são
mais importantes
– Para os fatores mais relevantes, use mais níveis
• Reduza o número de fatores
– Simplifique o modelo experimental
– Mas não retire fatores “relevantes”
• Use projetos de fatorial fracionado
Projetos com Fatorial Fracionado
• Faça a medição somente de uma combinação de
níveis de fatores.
• O projeto deve ser cuidadosamente projetado
para capturar melhor qualquer interação que
possivelmente exista.
• Menos trabalho, porém com mais chance de
imprecisões nos resultados.
– Trade-off
• Pode ser útil quando se sabe a priori que alguns
fatores não interagem.
Projetos Fatoriais 2k
• Usados para determinar os efeitos de k
fatores
– Cada um com duas alternativas ou níveis
• Em geral, são usados de maneira preliminar,
antes de estudos mais detalhados
– Cada fator medido é representado por seu nível
máximo e mínimo.
– Pode oferecer algum “insight” sobre as interações
entre os vários fatores.
Efeitos Unidirecionais
• Efeitos que somente aumentam à medida que
o nível de um fator também aumenta
– Ou vice-versa
• Se essa característica é conhecida a priori, um
projeto fatorial 2k
nos níveis máximo e mínimo
pode ser útil.
• Demonstra-se quando um fator tem efeito
significativo no experimento.
Projetos Fatoriais 22
• Dois fatores, com dois níveis cada
• Tipo mais simples de um projeto fatorial de
experimentos
• Os conceitos desenvolvidos podem ajudar o
entendimento dos problemas de 2k
• Exemplo simples, com finalidade pedagógica
Exemplo de um Projeto Fatorial 22
• Uma arquitetura de máquina de busca, composta
por N servidores;
• Pode-se usar vários esquemas de distribuição ou
escalonamento de queries para os servidores,
por exemplo, round-robin, gang, random,
priority, etc
• O objetivo é completar os queries no menor
tempo possível.
• No exemplo, a métrica usada é o tempo de
execução da query em microssegundos.
Fatores e Níveis do Exemplo
• Primeiro fator – número de servidores usados na
máquina de busca experimental:
– Varia entre 8 e 64
• Segundo fator – baseado em outros estudos, usa-
se dois extremos de políticas de escalonamento:
aleatório e “round-robin”.
– Sistema de arquivos local e global na arquitetura, que
permite a distribuição de query para qualquer
servidor.
• Outros fatores existem, mas neste exemplo,
vamos ignorá-los.
Definindo as Variáveis para um
Exemplo de Projeto 22
Fatorial
Dados Amostrais para o Exemplo
• Execução única de uma carga benchmark de
queries nas duas configurações resultou nos
seguintes tempos de execução:
Modelo de Regressão Não Linear
para o Exemplo
• y = q0 + qAxA + qBxB + qABxAxB
• 820 = q0 - qA - qB + qAB
• 217 = q0 + qA - qB - qAB
• 776 = q0 - qA + qB - qAB
• 197 = q0 + qA + qB + qAB
• A = número de servidores
• B = escalonamento
Modelo de Regressão
• 4 equações e 4 variáveis
• Outra representação – tabela
Solucionando para os qi’s
Solução das Equações
• q0 = 1/4(820 + 217 + 776 + 197) = 502.5
• qA = 1/4(-820 + 217 - 776 + 197) = -295.5
• qB =1/4(-820 -217 + 776 + 197) = -16
• qAB = 1/4(820 - 217 - 776 + 197) = 6
• Assim: y = 502.5 - 295.5xA - 16xB + 6xAxB
• q0 = 502.5 = tempo de execução médio
• A = número de servidores tem maior impacto no
tempo de resposta, e faz uma diferença de +-
295,5
Alocação de Variação para o
Modelo 22
• Calcule a variância amostral de y
• Numerador é o SST (variação total)
– (não confundir variação com variância)
• Outra formula para SST é: SST = 22
qA
2
+ 22
qB
2
+ 22
qAB
2
• Podemos usar isso para entender as causas da variação
de y
Termos no SST
• 22
qA
2
é parte da variação explicada pelo efeito
de A (SSA)
• 22
qB
2
é parte da variação explicada pelo efeito
de B (SSB)
• 22
qAB
2
é parte da variação explicada pelo efeito
da interação de A e B (SSAB)
Variações no Exemplo
• SST = 350449
• SSA = 349281
• SSB = 1024
• SSAB = 144
• Pode-se agora calcular e entender a fração da
variação total causada por cada efeito.
Frações da Variação no Exemplo
• Fração explicada por A: 99.67%
• Fração explicada por B: 0.29%
• Fração explicada pela interação de A e B: 0.04%
• Assim, quase toda variação vem do número de servidores
da arquitetura e o esquema de escalonamento tem um
efeito desprezível na performance da máquina de busca
em estudo.
• Se o objetivo é diminuir o tempo de resposta de queries,
deve-se então concentrar no número de servidores e não
no esquema de distribuição-escalonamento (exemplo
hipotético!)
Projetos com Fatorial 2k
• Usado para analisar os efeitos de k fatores,
cada um com níveis de duas alternativas
• Projetos 22
fatorial são um caso especial
Exemplo
• No projeto de um sistema, os três fatores de
maior impacto e que precisam ser estudados
são : tamanho do cache, tamanho da
memória, e se 1 ou 2 processadores serão
usados.
Exemplo
• O projeto 23
e o desempenho medido em
MIPS, é mostrado na tabela abaixo:
Solução
Solução
Solução
Solução
Solução
Solução
• A porção da variação explicada por cada fator
e suas interações são:
– A : 800/4512 = 18%
– B: 200/4512 = 4%
– C: 3200/4512 = 71%
– AB: 200/4512 = 4%
– AC: 32/4512 = 1%
– BC: 72/4512 = 2%
– ABC: 8/4512 = 0% -> pode ignorar
Projetos Fatoriais 2k
r
• Projetos fatoriais 2k
não permitem estimar os
erros experimentais já́ que nenhum experimento
e repetido
• Se cada um dos 2k
forem replicados r vezes,
teremos 2k
r observações
– Projetos fatoriais 2k
r
– Poderemos estimar os erros experimentais
– Poderemos comparar a % da variação devido a cada
fator ou interação com a % da variação devido aos
erros experimentais
• Fator/interação tem impacto significativo?
Projetos Fatorias 22
r
• Assume o modelo genérico:
– y = q0 +qAxA +qBxB +qABxAxB+ e
• Computar os efeitos (coeficientes) de forma
similar aos projetos 2k
Exemplo
• Um sistema foi avaliado considerando 2 fatores (A e B) e
variando cada fator em dois níveis. Cada experimento foi
repetido 3 vezes e os resultados são mostrados na tabela
abaixo:
Estimando erros experimentais
Exemplo
Alocação de Variação
Alocação de Variação
Exemplo
Exemplo
• Fator A explica 5547/7032 = 78.88% da
variação.
• Fator B explica 1083/7032 = 15.4%
• A interação AB explica 4.27% da variação.
• Os restantes 1.45% são inexplicados e são
atribuidos aos erros experimentais

Mais conteúdo relacionado

Destaque

[Jc online] Edital concurso sej-pe
[Jc online] Edital concurso sej-pe[Jc online] Edital concurso sej-pe
[Jc online] Edital concurso sej-pePortal NE10
 
7 redesdeprotecao18-10-2010-120312085504-phpapp01
7 redesdeprotecao18-10-2010-120312085504-phpapp017 redesdeprotecao18-10-2010-120312085504-phpapp01
7 redesdeprotecao18-10-2010-120312085504-phpapp01Adriana Alves
 
Qué es la selección natural y cómo es ella central a la teoría de la evolución
Qué es la selección natural y cómo es ella central a la teoría de la evoluciónQué es la selección natural y cómo es ella central a la teoría de la evolución
Qué es la selección natural y cómo es ella central a la teoría de la evolucióngggutierrez
 
Ensamblaje y matenimiento
Ensamblaje y matenimientoEnsamblaje y matenimiento
Ensamblaje y matenimientoEduardo Evas
 
A Knowledge Exchange Strategy for Enterprise
A Knowledge Exchange Strategy for EnterpriseA Knowledge Exchange Strategy for Enterprise
A Knowledge Exchange Strategy for EnterpriseAaron Silvers
 
Analysez le comportement de vos visiteurs
Analysez le comportement de vos visiteurs Analysez le comportement de vos visiteurs
Analysez le comportement de vos visiteurs AT Internet
 
Un dia de flogera en la clase de medios de comunicacion
Un dia de flogera en la clase de medios de comunicacionUn dia de flogera en la clase de medios de comunicacion
Un dia de flogera en la clase de medios de comunicaciongay67
 
Evaluación de proyectos
Evaluación de proyectosEvaluación de proyectos
Evaluación de proyectosmono211
 
Las tecnicas de informacion y comunicacion
Las tecnicas de informacion y comunicacionLas tecnicas de informacion y comunicacion
Las tecnicas de informacion y comunicacionWR Esta Aqui
 
Ordinateur Mediateur _ Roumics Novembre09
Ordinateur Mediateur _ Roumics Novembre09Ordinateur Mediateur _ Roumics Novembre09
Ordinateur Mediateur _ Roumics Novembre09Stéphanie LUCIEN-BRUN
 
La "boîte à outils" de François Hollande détruit l'emploi
La "boîte à outils" de François Hollande détruit l'emploiLa "boîte à outils" de François Hollande détruit l'emploi
La "boîte à outils" de François Hollande détruit l'emploiContribuables associés
 
Presentación1
Presentación1Presentación1
Presentación1ale9723
 
Previsão de comportamento dos preços de ações através do volume do saldo de c...
Previsão de comportamento dos preços de ações através do volume do saldo de c...Previsão de comportamento dos preços de ações através do volume do saldo de c...
Previsão de comportamento dos preços de ações através do volume do saldo de c...antenudoriopreto
 

Destaque (20)

[Jc online] Edital concurso sej-pe
[Jc online] Edital concurso sej-pe[Jc online] Edital concurso sej-pe
[Jc online] Edital concurso sej-pe
 
7 redesdeprotecao18-10-2010-120312085504-phpapp01
7 redesdeprotecao18-10-2010-120312085504-phpapp017 redesdeprotecao18-10-2010-120312085504-phpapp01
7 redesdeprotecao18-10-2010-120312085504-phpapp01
 
Qué es la selección natural y cómo es ella central a la teoría de la evolución
Qué es la selección natural y cómo es ella central a la teoría de la evoluciónQué es la selección natural y cómo es ella central a la teoría de la evolución
Qué es la selección natural y cómo es ella central a la teoría de la evolución
 
Metasip
MetasipMetasip
Metasip
 
Ensamblaje y matenimiento
Ensamblaje y matenimientoEnsamblaje y matenimiento
Ensamblaje y matenimiento
 
Manual del-profesor
Manual del-profesorManual del-profesor
Manual del-profesor
 
A Knowledge Exchange Strategy for Enterprise
A Knowledge Exchange Strategy for EnterpriseA Knowledge Exchange Strategy for Enterprise
A Knowledge Exchange Strategy for Enterprise
 
Powerpoint
PowerpointPowerpoint
Powerpoint
 
Analysez le comportement de vos visiteurs
Analysez le comportement de vos visiteurs Analysez le comportement de vos visiteurs
Analysez le comportement de vos visiteurs
 
Lectura sales
Lectura salesLectura sales
Lectura sales
 
Pepsi
PepsiPepsi
Pepsi
 
Un dia de flogera en la clase de medios de comunicacion
Un dia de flogera en la clase de medios de comunicacionUn dia de flogera en la clase de medios de comunicacion
Un dia de flogera en la clase de medios de comunicacion
 
Evaluación de proyectos
Evaluación de proyectosEvaluación de proyectos
Evaluación de proyectos
 
Las tecnicas de informacion y comunicacion
Las tecnicas de informacion y comunicacionLas tecnicas de informacion y comunicacion
Las tecnicas de informacion y comunicacion
 
Ordinateur Mediateur _ Roumics Novembre09
Ordinateur Mediateur _ Roumics Novembre09Ordinateur Mediateur _ Roumics Novembre09
Ordinateur Mediateur _ Roumics Novembre09
 
Webquest
WebquestWebquest
Webquest
 
La "boîte à outils" de François Hollande détruit l'emploi
La "boîte à outils" de François Hollande détruit l'emploiLa "boîte à outils" de François Hollande détruit l'emploi
La "boîte à outils" de François Hollande détruit l'emploi
 
Presentación1
Presentación1Presentación1
Presentación1
 
Resumosapresentacaoposter
ResumosapresentacaoposterResumosapresentacaoposter
Resumosapresentacaoposter
 
Previsão de comportamento dos preços de ações através do volume do saldo de c...
Previsão de comportamento dos preços de ações através do volume do saldo de c...Previsão de comportamento dos preços de ações através do volume do saldo de c...
Previsão de comportamento dos preços de ações através do volume do saldo de c...
 

Semelhante a Métodos Quantitativos em Ciência da Computação: Projeto de Experimentos

Método para análise e melhoria de processos
Método para análise e melhoria de processosMétodo para análise e melhoria de processos
Método para análise e melhoria de processosJorge Covacs
 
dBest - Um Framework para Avaliação de Desempenho de Banco de Dados - SBBD 2011
dBest - Um Framework para Avaliação de Desempenho de Banco de Dados - SBBD 2011dBest - Um Framework para Avaliação de Desempenho de Banco de Dados - SBBD 2011
dBest - Um Framework para Avaliação de Desempenho de Banco de Dados - SBBD 2011Lucas Lemos
 
Método AHP em Processo Decisório
Método AHP em Processo DecisórioMétodo AHP em Processo Decisório
Método AHP em Processo DecisórioWellington Oliveira
 
Algoritmo de escalonamento Fuzzy Round Robin
Algoritmo de escalonamento Fuzzy Round RobinAlgoritmo de escalonamento Fuzzy Round Robin
Algoritmo de escalonamento Fuzzy Round RobinMarcos Castro
 
Introdução ao Teste de Software - Uma abordagem prática
Introdução ao Teste de Software - Uma abordagem práticaIntrodução ao Teste de Software - Uma abordagem prática
Introdução ao Teste de Software - Uma abordagem práticaFabrício Campos
 
Unidade 0: Visão geral sobre o método científico
Unidade 0: Visão geral sobre o método científicoUnidade 0: Visão geral sobre o método científico
Unidade 0: Visão geral sobre o método científicoAlexandre Duarte
 
TDC 2016 - Workshop sobre Planejamento Ágil de Releases
TDC 2016 - Workshop sobre Planejamento Ágil de ReleasesTDC 2016 - Workshop sobre Planejamento Ágil de Releases
TDC 2016 - Workshop sobre Planejamento Ágil de ReleasesAdriano Campestrini
 
A Measurement-Based Model for Estimation of Resource Exhaustion in Operationa...
A Measurement-Based Model for Estimation of Resource Exhaustion in Operationa...A Measurement-Based Model for Estimation of Resource Exhaustion in Operationa...
A Measurement-Based Model for Estimation of Resource Exhaustion in Operationa...Carlos Eduardo
 
Aguiar utilizando monte carlo e reamostragem em estimativas 2008-11-04
Aguiar utilizando monte carlo e reamostragem em estimativas 2008-11-04Aguiar utilizando monte carlo e reamostragem em estimativas 2008-11-04
Aguiar utilizando monte carlo e reamostragem em estimativas 2008-11-04Agenor Barbosa
 
Testes de unidade - RP Tec Com
Testes de unidade - RP Tec ComTestes de unidade - RP Tec Com
Testes de unidade - RP Tec ComIgor Rozani
 
6. apresentacao rp tec com 2018 igor rozani e felipe muniz
6. apresentacao rp tec com 2018 igor rozani e felipe muniz6. apresentacao rp tec com 2018 igor rozani e felipe muniz
6. apresentacao rp tec com 2018 igor rozani e felipe munizMatheus de Lara Calache
 
Workshop - Plano de Testes End to End com o Microsoft Test Manager
Workshop   - Plano de Testes End to End com o Microsoft Test ManagerWorkshop   - Plano de Testes End to End com o Microsoft Test Manager
Workshop - Plano de Testes End to End com o Microsoft Test ManagerAlan Carlos
 

Semelhante a Métodos Quantitativos em Ciência da Computação: Projeto de Experimentos (20)

Método para análise e melhoria de processos
Método para análise e melhoria de processosMétodo para análise e melhoria de processos
Método para análise e melhoria de processos
 
dBest - Um Framework para Avaliação de Desempenho de Banco de Dados - SBBD 2011
dBest - Um Framework para Avaliação de Desempenho de Banco de Dados - SBBD 2011dBest - Um Framework para Avaliação de Desempenho de Banco de Dados - SBBD 2011
dBest - Um Framework para Avaliação de Desempenho de Banco de Dados - SBBD 2011
 
Método AHP em Processo Decisório
Método AHP em Processo DecisórioMétodo AHP em Processo Decisório
Método AHP em Processo Decisório
 
Overview de QA
Overview de QA Overview de QA
Overview de QA
 
Algoritmo de escalonamento Fuzzy Round Robin
Algoritmo de escalonamento Fuzzy Round RobinAlgoritmo de escalonamento Fuzzy Round Robin
Algoritmo de escalonamento Fuzzy Round Robin
 
Introdução ao Teste de Software - Uma abordagem prática
Introdução ao Teste de Software - Uma abordagem práticaIntrodução ao Teste de Software - Uma abordagem prática
Introdução ao Teste de Software - Uma abordagem prática
 
Unidade 0: Visão geral sobre o método científico
Unidade 0: Visão geral sobre o método científicoUnidade 0: Visão geral sobre o método científico
Unidade 0: Visão geral sobre o método científico
 
TDD na Prática
TDD na PráticaTDD na Prática
TDD na Prática
 
TDC 2016 - Workshop sobre Planejamento Ágil de Releases
TDC 2016 - Workshop sobre Planejamento Ágil de ReleasesTDC 2016 - Workshop sobre Planejamento Ágil de Releases
TDC 2016 - Workshop sobre Planejamento Ágil de Releases
 
A Measurement-Based Model for Estimation of Resource Exhaustion in Operationa...
A Measurement-Based Model for Estimation of Resource Exhaustion in Operationa...A Measurement-Based Model for Estimation of Resource Exhaustion in Operationa...
A Measurement-Based Model for Estimation of Resource Exhaustion in Operationa...
 
Metricas forecasting
Metricas forecastingMetricas forecasting
Metricas forecasting
 
Aguiar utilizando monte carlo e reamostragem em estimativas 2008-11-04
Aguiar utilizando monte carlo e reamostragem em estimativas 2008-11-04Aguiar utilizando monte carlo e reamostragem em estimativas 2008-11-04
Aguiar utilizando monte carlo e reamostragem em estimativas 2008-11-04
 
Testes de unidade - RP Tec Com
Testes de unidade - RP Tec ComTestes de unidade - RP Tec Com
Testes de unidade - RP Tec Com
 
6. apresentacao rp tec com 2018 igor rozani e felipe muniz
6. apresentacao rp tec com 2018 igor rozani e felipe muniz6. apresentacao rp tec com 2018 igor rozani e felipe muniz
6. apresentacao rp tec com 2018 igor rozani e felipe muniz
 
Robust design
Robust designRobust design
Robust design
 
Workshop - Plano de Testes End to End com o Microsoft Test Manager
Workshop   - Plano de Testes End to End com o Microsoft Test ManagerWorkshop   - Plano de Testes End to End com o Microsoft Test Manager
Workshop - Plano de Testes End to End com o Microsoft Test Manager
 
Teste de software
Teste de softwareTeste de software
Teste de software
 
Refatoração
RefatoraçãoRefatoração
Refatoração
 
Introdução a tdd
Introdução a tddIntrodução a tdd
Introdução a tdd
 
Apresentação testes white box
Apresentação testes white boxApresentação testes white box
Apresentação testes white box
 

Mais de Alexandre Duarte

Fazer Ciência é Difícil!
Fazer Ciência é Difícil!Fazer Ciência é Difícil!
Fazer Ciência é Difícil!Alexandre Duarte
 
Escolhendo um Projeto de Pesquisa
Escolhendo um Projeto de PesquisaEscolhendo um Projeto de Pesquisa
Escolhendo um Projeto de PesquisaAlexandre Duarte
 
Ciência da Computação como Ciência
Ciência da Computação como CiênciaCiência da Computação como Ciência
Ciência da Computação como CiênciaAlexandre Duarte
 
Metodologia da Pesquisa Científica: Introdução
Metodologia da Pesquisa Científica:  IntroduçãoMetodologia da Pesquisa Científica:  Introdução
Metodologia da Pesquisa Científica: IntroduçãoAlexandre Duarte
 
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazerGráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazerAlexandre Duarte
 
Panorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPBPanorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPBAlexandre Duarte
 
Sumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis NominaisSumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis NominaisAlexandre Duarte
 
Correlação e Classificação
Correlação e ClassificaçãoCorrelação e Classificação
Correlação e ClassificaçãoAlexandre Duarte
 
Sumarização Estatística 2D
Sumarização Estatística 2DSumarização Estatística 2D
Sumarização Estatística 2DAlexandre Duarte
 
Sumarização Estatística 1D
Sumarização Estatística 1DSumarização Estatística 1D
Sumarização Estatística 1DAlexandre Duarte
 
Preparação e Limpeza de Dados
Preparação e Limpeza de DadosPreparação e Limpeza de Dados
Preparação e Limpeza de DadosAlexandre Duarte
 
Introdução ao Projeto de Surveys
Introdução ao Projeto de SurveysIntrodução ao Projeto de Surveys
Introdução ao Projeto de SurveysAlexandre Duarte
 
Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Alexandre Duarte
 
Introdução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de DadosIntrodução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de DadosAlexandre Duarte
 
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados Alexandre Duarte
 
Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios Alexandre Duarte
 

Mais de Alexandre Duarte (20)

Causalidade e Abdução
Causalidade e AbduçãoCausalidade e Abdução
Causalidade e Abdução
 
Fazer Ciência é Difícil!
Fazer Ciência é Difícil!Fazer Ciência é Difícil!
Fazer Ciência é Difícil!
 
Atividades Científica
Atividades CientíficaAtividades Científica
Atividades Científica
 
Escolhendo um Projeto de Pesquisa
Escolhendo um Projeto de PesquisaEscolhendo um Projeto de Pesquisa
Escolhendo um Projeto de Pesquisa
 
Ciência da Computação como Ciência
Ciência da Computação como CiênciaCiência da Computação como Ciência
Ciência da Computação como Ciência
 
Metodologia da Pesquisa Científica: Introdução
Metodologia da Pesquisa Científica:  IntroduçãoMetodologia da Pesquisa Científica:  Introdução
Metodologia da Pesquisa Científica: Introdução
 
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazerGráficos: 10 dicas sobre o que fazer e sobre o que não fazer
Gráficos: 10 dicas sobre o que fazer e sobre o que não fazer
 
Panorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPBPanorama de Pesquisas em Análise de Dados na UFPB
Panorama de Pesquisas em Análise de Dados na UFPB
 
Agrupamento com K-Means
Agrupamento com K-MeansAgrupamento com K-Means
Agrupamento com K-Means
 
Sumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis NominaisSumarização Estatística 2D: Variáveis Nominais
Sumarização Estatística 2D: Variáveis Nominais
 
Correlação e Classificação
Correlação e ClassificaçãoCorrelação e Classificação
Correlação e Classificação
 
Sumarização Estatística 2D
Sumarização Estatística 2DSumarização Estatística 2D
Sumarização Estatística 2D
 
Sumarização Estatística 1D
Sumarização Estatística 1DSumarização Estatística 1D
Sumarização Estatística 1D
 
Transformação de Dados
Transformação de DadosTransformação de Dados
Transformação de Dados
 
Preparação e Limpeza de Dados
Preparação e Limpeza de DadosPreparação e Limpeza de Dados
Preparação e Limpeza de Dados
 
Introdução ao Projeto de Surveys
Introdução ao Projeto de SurveysIntrodução ao Projeto de Surveys
Introdução ao Projeto de Surveys
 
Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01Introdução à Análise de Dados - Aula 01
Introdução à Análise de Dados - Aula 01
 
Introdução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de DadosIntrodução à Analise de Dados - aula 3 - Agregação de Dados
Introdução à Analise de Dados - aula 3 - Agregação de Dados
 
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
Introdução à Análise de Dados - Aula 02 - Tipos Básicos de Dados
 
Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios Análise de Redes Sociais: Introdução aos Grafos Aleatórios
Análise de Redes Sociais: Introdução aos Grafos Aleatórios
 

Último

Prática de interpretação de imagens de satélite no QGIS
Prática de interpretação de imagens de satélite no QGISPrática de interpretação de imagens de satélite no QGIS
Prática de interpretação de imagens de satélite no QGISVitor Vieira Vasconcelos
 
Intolerância religiosa. Trata-se de uma apresentação sobre o respeito a diver...
Intolerância religiosa. Trata-se de uma apresentação sobre o respeito a diver...Intolerância religiosa. Trata-se de uma apresentação sobre o respeito a diver...
Intolerância religiosa. Trata-se de uma apresentação sobre o respeito a diver...LizanSantos1
 
A galinha ruiva sequencia didatica 3 ano
A  galinha ruiva sequencia didatica 3 anoA  galinha ruiva sequencia didatica 3 ano
A galinha ruiva sequencia didatica 3 anoandrealeitetorres
 
QUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptx
QUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptxQUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptx
QUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptxIsabellaGomes58
 
Investimentos. EDUCAÇÃO FINANCEIRA 8º ANO
Investimentos. EDUCAÇÃO FINANCEIRA 8º ANOInvestimentos. EDUCAÇÃO FINANCEIRA 8º ANO
Investimentos. EDUCAÇÃO FINANCEIRA 8º ANOMarcosViniciusLemesL
 
DIA DO INDIO - FLIPBOOK PARA IMPRIMIR.pdf
DIA DO INDIO - FLIPBOOK PARA IMPRIMIR.pdfDIA DO INDIO - FLIPBOOK PARA IMPRIMIR.pdf
DIA DO INDIO - FLIPBOOK PARA IMPRIMIR.pdfIedaGoethe
 
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasCenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasRosalina Simão Nunes
 
William J. Bennett - O livro das virtudes para Crianças.pdf
William J. Bennett - O livro das virtudes para Crianças.pdfWilliam J. Bennett - O livro das virtudes para Crianças.pdf
William J. Bennett - O livro das virtudes para Crianças.pdfAdrianaCunha84
 
Slides Lição 4, CPAD, Como se Conduzir na Caminhada, 2Tr24.pptx
Slides Lição 4, CPAD, Como se Conduzir na Caminhada, 2Tr24.pptxSlides Lição 4, CPAD, Como se Conduzir na Caminhada, 2Tr24.pptx
Slides Lição 4, CPAD, Como se Conduzir na Caminhada, 2Tr24.pptxLuizHenriquedeAlmeid6
 
Currículo escolar na perspectiva da educação inclusiva.pdf
Currículo escolar na perspectiva da educação inclusiva.pdfCurrículo escolar na perspectiva da educação inclusiva.pdf
Currículo escolar na perspectiva da educação inclusiva.pdfIedaGoethe
 
PPT _ Módulo 3_Direito Comercial_2023_2024.pdf
PPT _ Módulo 3_Direito Comercial_2023_2024.pdfPPT _ Módulo 3_Direito Comercial_2023_2024.pdf
PPT _ Módulo 3_Direito Comercial_2023_2024.pdfAnaGonalves804156
 
Bingo da potenciação e radiciação de números inteiros
Bingo da potenciação e radiciação de números inteirosBingo da potenciação e radiciação de números inteiros
Bingo da potenciação e radiciação de números inteirosAntnyoAllysson
 
FCEE - Diretrizes - Autismo.pdf para imprimir
FCEE - Diretrizes - Autismo.pdf para imprimirFCEE - Diretrizes - Autismo.pdf para imprimir
FCEE - Diretrizes - Autismo.pdf para imprimirIedaGoethe
 
geografia 7 ano - relevo, altitude, topos do mundo
geografia 7 ano - relevo, altitude, topos do mundogeografia 7 ano - relevo, altitude, topos do mundo
geografia 7 ano - relevo, altitude, topos do mundonialb
 
Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Centro Jacques Delors
 
Atividade com a letra da música Meu Abrigo
Atividade com a letra da música Meu AbrigoAtividade com a letra da música Meu Abrigo
Atividade com a letra da música Meu AbrigoMary Alvarenga
 
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOLEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOColégio Santa Teresinha
 
Aula - 2º Ano - Cultura e Sociedade - Conceitos-chave
Aula - 2º Ano - Cultura e Sociedade - Conceitos-chaveAula - 2º Ano - Cultura e Sociedade - Conceitos-chave
Aula - 2º Ano - Cultura e Sociedade - Conceitos-chaveaulasgege
 

Último (20)

Em tempo de Quaresma .
Em tempo de Quaresma                            .Em tempo de Quaresma                            .
Em tempo de Quaresma .
 
Prática de interpretação de imagens de satélite no QGIS
Prática de interpretação de imagens de satélite no QGISPrática de interpretação de imagens de satélite no QGIS
Prática de interpretação de imagens de satélite no QGIS
 
XI OLIMPÍADAS DA LÍNGUA PORTUGUESA -
XI OLIMPÍADAS DA LÍNGUA PORTUGUESA      -XI OLIMPÍADAS DA LÍNGUA PORTUGUESA      -
XI OLIMPÍADAS DA LÍNGUA PORTUGUESA -
 
Intolerância religiosa. Trata-se de uma apresentação sobre o respeito a diver...
Intolerância religiosa. Trata-se de uma apresentação sobre o respeito a diver...Intolerância religiosa. Trata-se de uma apresentação sobre o respeito a diver...
Intolerância religiosa. Trata-se de uma apresentação sobre o respeito a diver...
 
A galinha ruiva sequencia didatica 3 ano
A  galinha ruiva sequencia didatica 3 anoA  galinha ruiva sequencia didatica 3 ano
A galinha ruiva sequencia didatica 3 ano
 
QUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptx
QUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptxQUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptx
QUARTA - 1EM SOCIOLOGIA - Aprender a pesquisar.pptx
 
Investimentos. EDUCAÇÃO FINANCEIRA 8º ANO
Investimentos. EDUCAÇÃO FINANCEIRA 8º ANOInvestimentos. EDUCAÇÃO FINANCEIRA 8º ANO
Investimentos. EDUCAÇÃO FINANCEIRA 8º ANO
 
DIA DO INDIO - FLIPBOOK PARA IMPRIMIR.pdf
DIA DO INDIO - FLIPBOOK PARA IMPRIMIR.pdfDIA DO INDIO - FLIPBOOK PARA IMPRIMIR.pdf
DIA DO INDIO - FLIPBOOK PARA IMPRIMIR.pdf
 
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicasCenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
Cenários de Aprendizagem - Estratégia para implementação de práticas pedagógicas
 
William J. Bennett - O livro das virtudes para Crianças.pdf
William J. Bennett - O livro das virtudes para Crianças.pdfWilliam J. Bennett - O livro das virtudes para Crianças.pdf
William J. Bennett - O livro das virtudes para Crianças.pdf
 
Slides Lição 4, CPAD, Como se Conduzir na Caminhada, 2Tr24.pptx
Slides Lição 4, CPAD, Como se Conduzir na Caminhada, 2Tr24.pptxSlides Lição 4, CPAD, Como se Conduzir na Caminhada, 2Tr24.pptx
Slides Lição 4, CPAD, Como se Conduzir na Caminhada, 2Tr24.pptx
 
Currículo escolar na perspectiva da educação inclusiva.pdf
Currículo escolar na perspectiva da educação inclusiva.pdfCurrículo escolar na perspectiva da educação inclusiva.pdf
Currículo escolar na perspectiva da educação inclusiva.pdf
 
PPT _ Módulo 3_Direito Comercial_2023_2024.pdf
PPT _ Módulo 3_Direito Comercial_2023_2024.pdfPPT _ Módulo 3_Direito Comercial_2023_2024.pdf
PPT _ Módulo 3_Direito Comercial_2023_2024.pdf
 
Bingo da potenciação e radiciação de números inteiros
Bingo da potenciação e radiciação de números inteirosBingo da potenciação e radiciação de números inteiros
Bingo da potenciação e radiciação de números inteiros
 
FCEE - Diretrizes - Autismo.pdf para imprimir
FCEE - Diretrizes - Autismo.pdf para imprimirFCEE - Diretrizes - Autismo.pdf para imprimir
FCEE - Diretrizes - Autismo.pdf para imprimir
 
geografia 7 ano - relevo, altitude, topos do mundo
geografia 7 ano - relevo, altitude, topos do mundogeografia 7 ano - relevo, altitude, topos do mundo
geografia 7 ano - relevo, altitude, topos do mundo
 
Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029Apresentação | Eleições Europeias 2024-2029
Apresentação | Eleições Europeias 2024-2029
 
Atividade com a letra da música Meu Abrigo
Atividade com a letra da música Meu AbrigoAtividade com a letra da música Meu Abrigo
Atividade com a letra da música Meu Abrigo
 
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃOLEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
LEMBRANDO A MORTE E CELEBRANDO A RESSUREIÇÃO
 
Aula - 2º Ano - Cultura e Sociedade - Conceitos-chave
Aula - 2º Ano - Cultura e Sociedade - Conceitos-chaveAula - 2º Ano - Cultura e Sociedade - Conceitos-chave
Aula - 2º Ano - Cultura e Sociedade - Conceitos-chave
 

Métodos Quantitativos em Ciência da Computação: Projeto de Experimentos

  • 1. Métodos Quantitativos em Ciência da Computação Unidade 5: Projeto de Experimentos Parte 1 Alexandre Duarte PPGI/UFPB Apresentação derivada dos slides originais de Jussara Almeida.
  • 2. Terminologia do Projeto de Experimentos • Variável resposta: representa o valor obtido, que é medido de acordo com as variações dos dados de entrada. – Exemplo: tempo de resposta, índice de precisão, utilização, • Fatores: as variáveis de entrada de um experimento que podem ser controladas pelo “experimentador”. – Exemplo: tamanho do cache, tamanho dos arquivos, tempo de seek, latência da rede, etc • Níveis: os níveis de um fator são os valores específicos que podem ser atribuídos ao fator. Podem ser contínuos (ex.: tempo de seek), discretos (# de servidores) ou podem ser categóricos, como o tipo de um processador ou a classe de um certo algoritmo. Também chamados de treatments
  • 3. Terminologia do Projeto de Experimentos • Replicação: replicar um experimento significa re- executá-lo completamente com todos os mesmos níveis de entrada. Desde que as medidas da variável resposta são sujeitas a variações aleatórias, as replicações de um experimento são usadas para determinar o impacto do erro experimental na variável resposta. • Interação: uma interação entre fatores ocorre quando o efeito de um fator depende do nível de outro fator. – Efeito da memória na atividade de paginação.
  • 4. Introdução ao Projeto de Experimentos: perguntas básicas • Você conhece as métricas? • Você conhece os fatores? • Você conhece os níveis? • Você tem conhecimento de como instrumentar o sistema e elaborar as cargas de teste? • Você sabe descrever o que fazer para realizar experimentos que comprovem ou refutem as hipóteses de sua pesquisa?
  • 5. Objetivos no Projeto de Experimentos • Obter a maior quantidade de informação • Reduzir o trabalho/esforço de experimentação – Tipicamente significa o menor número de experimentos • Realizar mais experimentos não é bom (gasta-se tempo e recursos), principalmente se você for aquele responsável pela execução dos mesmos. – Experimentos bem projetados são mais fáceis de serem analisados.
  • 6. Replicações Experimentais • O sistema em estudo executará com vários níveis de diferentes fatores, potencialmente com diferentes cargas. • Uma execução com um conjunto particular de níveis e dados de entrada é uma replicação. • Em geral, é necessário realizar múltiplas replicações com um único conjunto de níveis e dados de entrada, por razões de verificação e validação estatística.
  • 7. A Interação dos Fatores • Alguns fatores tem efeitos completamente independentes um do outro. – Exemplo: Duplique o nível de um fator e obterá́ metade da resposta, independente dos outros fatores. • Mas os efeitos de alguns fatores dependem dos valores de outros fatores – Fatores inter-atuantes • A presença de fatores inter-atuantes complica o projeto experimental.
  • 8. Problema Básico ao Projeto Experimentos • Um determinado numero de fatores foi escolhido • Os fatores podem ou não interagir • Como se pode projetar um experimento que captura os intervalos completos de variação dos níveis? – Com a menor quantidade de trabalho possível • Qual a combinação ou combinações de níveis de fatores deseja-se medir?
  • 9. Erros Comuns na Experimentação • Ignorar o erro experimental – A variação devido a um fator deve ser comparada com a variação devido aos erros experimentais antes de se tomar uma decisão sobre o fator (ele tem impacto significativo?) • Existência de parâmetros não controlados (não são fatores) – Somente o impacto de fatores é avaliado • Não isolamento dos efeitos de diferentes fatores – Variação de vários fatores simultaneamente • Projetos de experimentos com um fator-de-cada-vez – Muito caro: não necessariamente mais informativo • Ignorar as interações entre os fatores • Projetos que requerem um número excessivo de experimentos – Melhor considerar um subconjunto dos fatores/níveis primeiro e depois ir acrescentando fatores/níveis aos poucos.
  • 10. Tipos de Projetos de Exprimentos • Projetos simples • Projetos com fatorial completo • Projetos com fatorial fracionado
  • 11. Projetos Simples • Varie um fator de cada vez • Para k fatores com o i-ésimo fator tendo ni níveis • Assume que os fatores não interagem • Usualmente requer mais esforço que se pensa • Tente evitar esse enfoque de experimentação
  • 12. Projeto com Fatorial Completo • Para k fatores com o i-ésimo fator tendo ni níveis • Teste cada combinação possível dos níveis dos fatores. • Capture a informação completa sobre a interação • É no entanto, um trabalho ENORME!!! – Principalmente se valores de ni forem grandes
  • 13. Reduzindo o trabalho em Projetos com Fatorial Completo • Reduza o número de níveis por fator – Geralmente uma boa opção – Especialmente quando se sabe quais fatores são mais importantes – Para os fatores mais relevantes, use mais níveis • Reduza o número de fatores – Simplifique o modelo experimental – Mas não retire fatores “relevantes” • Use projetos de fatorial fracionado
  • 14. Projetos com Fatorial Fracionado • Faça a medição somente de uma combinação de níveis de fatores. • O projeto deve ser cuidadosamente projetado para capturar melhor qualquer interação que possivelmente exista. • Menos trabalho, porém com mais chance de imprecisões nos resultados. – Trade-off • Pode ser útil quando se sabe a priori que alguns fatores não interagem.
  • 15. Projetos Fatoriais 2k • Usados para determinar os efeitos de k fatores – Cada um com duas alternativas ou níveis • Em geral, são usados de maneira preliminar, antes de estudos mais detalhados – Cada fator medido é representado por seu nível máximo e mínimo. – Pode oferecer algum “insight” sobre as interações entre os vários fatores.
  • 16. Efeitos Unidirecionais • Efeitos que somente aumentam à medida que o nível de um fator também aumenta – Ou vice-versa • Se essa característica é conhecida a priori, um projeto fatorial 2k nos níveis máximo e mínimo pode ser útil. • Demonstra-se quando um fator tem efeito significativo no experimento.
  • 17. Projetos Fatoriais 22 • Dois fatores, com dois níveis cada • Tipo mais simples de um projeto fatorial de experimentos • Os conceitos desenvolvidos podem ajudar o entendimento dos problemas de 2k • Exemplo simples, com finalidade pedagógica
  • 18. Exemplo de um Projeto Fatorial 22 • Uma arquitetura de máquina de busca, composta por N servidores; • Pode-se usar vários esquemas de distribuição ou escalonamento de queries para os servidores, por exemplo, round-robin, gang, random, priority, etc • O objetivo é completar os queries no menor tempo possível. • No exemplo, a métrica usada é o tempo de execução da query em microssegundos.
  • 19. Fatores e Níveis do Exemplo • Primeiro fator – número de servidores usados na máquina de busca experimental: – Varia entre 8 e 64 • Segundo fator – baseado em outros estudos, usa- se dois extremos de políticas de escalonamento: aleatório e “round-robin”. – Sistema de arquivos local e global na arquitetura, que permite a distribuição de query para qualquer servidor. • Outros fatores existem, mas neste exemplo, vamos ignorá-los.
  • 20. Definindo as Variáveis para um Exemplo de Projeto 22 Fatorial
  • 21. Dados Amostrais para o Exemplo • Execução única de uma carga benchmark de queries nas duas configurações resultou nos seguintes tempos de execução:
  • 22. Modelo de Regressão Não Linear para o Exemplo • y = q0 + qAxA + qBxB + qABxAxB • 820 = q0 - qA - qB + qAB • 217 = q0 + qA - qB - qAB • 776 = q0 - qA + qB - qAB • 197 = q0 + qA + qB + qAB • A = número de servidores • B = escalonamento
  • 23. Modelo de Regressão • 4 equações e 4 variáveis • Outra representação – tabela
  • 25. Solução das Equações • q0 = 1/4(820 + 217 + 776 + 197) = 502.5 • qA = 1/4(-820 + 217 - 776 + 197) = -295.5 • qB =1/4(-820 -217 + 776 + 197) = -16 • qAB = 1/4(820 - 217 - 776 + 197) = 6 • Assim: y = 502.5 - 295.5xA - 16xB + 6xAxB • q0 = 502.5 = tempo de execução médio • A = número de servidores tem maior impacto no tempo de resposta, e faz uma diferença de +- 295,5
  • 26. Alocação de Variação para o Modelo 22 • Calcule a variância amostral de y • Numerador é o SST (variação total) – (não confundir variação com variância) • Outra formula para SST é: SST = 22 qA 2 + 22 qB 2 + 22 qAB 2 • Podemos usar isso para entender as causas da variação de y
  • 27. Termos no SST • 22 qA 2 é parte da variação explicada pelo efeito de A (SSA) • 22 qB 2 é parte da variação explicada pelo efeito de B (SSB) • 22 qAB 2 é parte da variação explicada pelo efeito da interação de A e B (SSAB)
  • 28. Variações no Exemplo • SST = 350449 • SSA = 349281 • SSB = 1024 • SSAB = 144 • Pode-se agora calcular e entender a fração da variação total causada por cada efeito.
  • 29. Frações da Variação no Exemplo • Fração explicada por A: 99.67% • Fração explicada por B: 0.29% • Fração explicada pela interação de A e B: 0.04% • Assim, quase toda variação vem do número de servidores da arquitetura e o esquema de escalonamento tem um efeito desprezível na performance da máquina de busca em estudo. • Se o objetivo é diminuir o tempo de resposta de queries, deve-se então concentrar no número de servidores e não no esquema de distribuição-escalonamento (exemplo hipotético!)
  • 30. Projetos com Fatorial 2k • Usado para analisar os efeitos de k fatores, cada um com níveis de duas alternativas • Projetos 22 fatorial são um caso especial
  • 31. Exemplo • No projeto de um sistema, os três fatores de maior impacto e que precisam ser estudados são : tamanho do cache, tamanho da memória, e se 1 ou 2 processadores serão usados.
  • 32. Exemplo • O projeto 23 e o desempenho medido em MIPS, é mostrado na tabela abaixo:
  • 38. Solução • A porção da variação explicada por cada fator e suas interações são: – A : 800/4512 = 18% – B: 200/4512 = 4% – C: 3200/4512 = 71% – AB: 200/4512 = 4% – AC: 32/4512 = 1% – BC: 72/4512 = 2% – ABC: 8/4512 = 0% -> pode ignorar
  • 39. Projetos Fatoriais 2k r • Projetos fatoriais 2k não permitem estimar os erros experimentais já́ que nenhum experimento e repetido • Se cada um dos 2k forem replicados r vezes, teremos 2k r observações – Projetos fatoriais 2k r – Poderemos estimar os erros experimentais – Poderemos comparar a % da variação devido a cada fator ou interação com a % da variação devido aos erros experimentais • Fator/interação tem impacto significativo?
  • 40. Projetos Fatorias 22 r • Assume o modelo genérico: – y = q0 +qAxA +qBxB +qABxAxB+ e • Computar os efeitos (coeficientes) de forma similar aos projetos 2k
  • 41. Exemplo • Um sistema foi avaliado considerando 2 fatores (A e B) e variando cada fator em dois níveis. Cada experimento foi repetido 3 vezes e os resultados são mostrados na tabela abaixo:
  • 47. Exemplo • Fator A explica 5547/7032 = 78.88% da variação. • Fator B explica 1083/7032 = 15.4% • A interação AB explica 4.27% da variação. • Os restantes 1.45% são inexplicados e são atribuidos aos erros experimentais