SlideShare uma empresa Scribd logo
Estatística
PROFESSORA MSC. RAFAELA CAVALCANTI
Estatística: o que é ?
Estatística pode ser pensada como a ciência de aprendizagem a
partir de dados. No nosso cotidiano, precisamos tomar decisões,
muitas vezes decisões rápidas.
 Em linhas gerais, a Estatística fornece métodos que
auxiliam o processo de tomada de decisão na presença de
incerteza.
Aplicações da Estatística
Área social
pesquisa de opinião
Área de saúde
medicamentos genéricos
epidemia de meningite
Área industrial
controle de qualidade
Área financeira
investimentos no
mercado financeiro
DADOS E ESTATÍSTICA
• O propósito da maioria dos estudos é coletar dados
para obter informações sobre uma área específica de
pesquisa.
• Dados compreendem observações sobre uma ou
mais variáveis.
• Variável/ dados
• A estatística engloba os métodos de coleta, resumo,
análise e tirada de conclusões a partir dos dados.
• Variável/dados pertencerão a um de dois tipos:
categóricos ou numéricos.
DADOS E ESTATÍSTICA
• DADOS CATEGÓRICOS (QUALITATIVOS)
Dados nominais- são dados que se definem exclusivamente
por nomes (não são mensurados), ex: grupo sanguineo (A,
AB, B e O), estado civil (casado/viúvo/solteiro,etc), raça,
sexo.
Dados Ordinais – os dados são ordenados de alguma maneira
(incluem escalas). Ex: estadiamento de doença (avançada,
moderada, branda, nenhuma), grau da dor (forte,
moderada, branda, nenhuma), apgar, glasgow.
Obs: existem as variáveis binárias cuja resposta é sim/não ou
vivo/morto.
DADOS E ESTATÍSTICA
• Nome- Fulano de Tal
• Sexo- Masculino
• Idade – 50 anos
• Etnia – caucasiano
• Tipo sanguineo – A
• Peso – 60 kg
• Creatinina 0.8mg/Dl
QUAIS SÃO DADOS CATEGÓRICOS?
DADOS CATEGÓRICOS
Nome- Fulano de Tal
• Sexo- Masculino
• Idade – 50 anos
• Etnia – caucasiano
• Tipo sanguineo – A
• Peso – 60 kg
• Creatinina -0.8mg/Dl
DADOS CATEGÓRICOS
• DADOS NUMÉRICOS
Dados discretos - só podem assumir valores numéricos
inteiros, ex: número de consultas médicas, número
de episódios de uma enfermidade.
Dados contínuos - podem existir valores intermediários,
ex: peso, altura, uréia, creatinina, hemoglobina.
DADOS E ESTATÍSTICA
• Nome- Fulano de Tal
• Sexo- Masculino
• Idade – 50 anos
• Etnia – caucasiano
• Tipo sanguineo – A
• Peso – 60 kg
• Creatinina 0.8mg/Dl
QUAIS SÃO DADOS NUMÉRICOS?
DADOS NUMÉRICOS
• Nome- Fulano de Tal
• Sexo- Masculino
• Idade – 50 anos
• Etnia – caucasiano
• Tipo sanguineo – A
• Peso – 60 kg
• Creatinina 0.8mg/Dl
DADOS NUMÉRICOS
DADOS E ESTATÍSTICA
VARIÁVEL
CATEGÓRICA
(qualitativa)
NUMÉRICA
(quantitativa)
Nominal Ordinal Discreta Continua
-----------------------------------------------
São representados por porcentagem
--------------------------------------------------
São representados por média ± desvio
Padrão ou mediana (intervalo entre
Quartis), etc
O que é Bioestatística ?
• Bioestatística é um conjunto de métodos estatísticos usados para
planejamento e análise de dados de estudos de ciências médicas,
biológicas ou, de forma geral da área da saúde.
• A Bioestatística tem o objetivo de determinar se um fato na
natureza ocorre , por um fator determinado ou pelo mero acaso.
• Aplicações incluem a avaliação de acurácia de testes laboratoriais,
construção de faixas de referência para medidas clínicas e
investigação da eficácia de tratamentos e da influência de fatores
de risco no aparecimento de doenças ou na ocorrência de
determinado desfecho.
Planejamento Pesquisa
Para realizar uma pesquisa que leve a fazer afirmações
sobre a população de interesse é necessário seguir os
seguintes passos:
1. Planejamento e desenho
2. Execução (coleta de dados)
3. Processamento de dados
4. Análise de dados
5. Interpretação, apresentação e publicação de
resultados
DADOS E ESTATÍSTICA
VARIÁVEL
CATEGÓRICA
(qualitativa)
NUMÉRICA
(quantitativa)
Nominal Ordinal Discreta Continua
 Cor de cabelos
 Tipo de Sangue
 Gênero
 Sexo
 Religião
 Estado Civil
 Raça
 Escolaridade
 Classe Social
 Gravidade de
uma doença
 Escala de
intensidade de
dor
 Número de filhos
 Número de
batimentos
cardíacos
 Números de
eventos de uma
doença
 Altura
 Peso
 Pressão
Arterial
 Temperatura
Corporal
Organização dos Dados
 A organização dos dados evidencia diversos aspectos do assunto
ou fenômeno que está sendo estudado, permitindo tirar
importantes conclusões sobre o assunto pesquisado.
 Na etapa de organização dos dados, alguns conceitos são
importantes, como:
 dados brutos;
 rol;
 frequência;
 frequência relativa
Organização dos Dados
 Dados brutos: são dados que não tiveram qualquer
tratamento, ou seja, não foram organizados após a coleta.
Esses dados praticamente não trazem informações sobre a
variável que está sendo analisada.
 Rol: é a ordenação dos dados coletados na amostra, em
ordem crescente ou decrescente
Organização dos Dados
 Frequência: A frequência é o total de vezes que um
acontecimento se repete. Ela pode ser chamada de simples
ou absoluta. Em matemática, esse tipo de frequência é
representado pela sigla f
 Frequência relativa: a frequência relativa é obtida dividindo-
se a frequência simples ou absoluta de cada acontecimento
pelo número total dos acontecimentos. Em matemática, sua
sigla é fr
Organização dos Dados
Tabelas
Elementos essenciais
 Título: o título é colocado na parte superior da tabela. Ele deve ser
preciso, indicando a natureza do fato sob estudo, as variáveis
analisadas, o local e o período relacionado ao fato
 Cabeçalho: no cabeçalho é especificada a natureza do conteúdo
de cada coluna. Ele fica logo abaixo do título, centralizado na
coluna
 Coluna indicadora: divisão da tabela em sentido vertical.
Especifica a natureza do conteúdo de cada linha.
 Corpo: conjunto de linhas e colunas com os dados.
Tabelas
Tabelas
Apresentação de dados qualitativos
Apresentação de dados qualitativos
Apresentação de dados qualitativos
Apresentação de dados qualitativos
Tabelas de Contingência
 Duas variáveis qualitativas
Apresentação de dados numéricos
 Normalmente são apresentados na ordem em que são coletados.
 Geralmente são obtidos dados relativos a diversas variáveis em cada paciente.
 Os pacientes são identificados na pesquisa por números
Apresentação de dados numéricos
Dados Discretos
Apresentação de dados numéricos
Dados Contínuos
Etapas para construção da tabela
1. Achar o valor máximo e o valor mínimo do conjunto de dados
2. Calcular a amplitude que é a diferença entre o valor máximo e valor mínimo
3. Determine o número de classes
4. Dividir a amplitude pelo número de classes
5. O resultado da divisão é o intervalo das classes
6. Organização das classes sendo a primeira contendo o valor menor
Apresentação de dados numéricos
Apresentação de dados numéricos
Gráficos
Elementos essenciais
 Título: O título pode estar acima ou abaixo do gráfico e
também deve responder às questões: O quê? Onde?
Quando?
 Escala: A escala é um método de ordenar grandezas
permitindo comparar seus valores. Grandeza é tudo aquilo
que pode ser contado, medido ou relacionado (ex.: altura,
peso, tempo etc.). Ela deve ser crescente, da esquerda para a
direita.
 Fonte: deve estar logo abaixo do gráfico..
Gráficos
Os principais tipos de gráficos são:
1. Em barras ou em colunas
2. Em setores
3. Em linhas
4. Histograma
Gráficos
Apresentaçãodedadosqualitativos
1–GráficosdeBarras
O gráfico de barras é usado para apresentar variáveis qualitativas, sejam elas
nominais ou ordinais
Gráficos
Apresentaçãodedadosqualitativos
1–GráficosdeBarras
Gráficos
Apresentaçãodedadosqualitativos
1–GráficosdeBarras
Gráficos
Apresentaçãodedadosqualitativos
1–GráficosdeBarras
Gráficos
Apresentaçãodedadosqualitativos
2–GráficosdeSetores
É especialmente indicado para apresentar variáveis nominais, desde que o número
de categorias seja pequeno.
Gráficos
Apresentaçãodedadosqualitativos
2–Gráficosdesetores
Gráficos
Apresentaçãodedadosnuméricos
3–DiagramadeLinhas
Este tipo de gráfico é indicado para dados de séries temporais, ou seja, um conjunto
de dados para uma determinada variável, ao longo do tempo.
Gráficos
Apresentaçãodedadosnuméricos
4– Histograma
É mais utilizado para a representação dos dados que são apresentados em tabelas
de distribuição de frequências.
DADOS E ESTATÍSTICA
VARIÁVEL
CATEGÓRICA
(qualitativa)
NUMÉRICA
(quantitativa)
Nominal Ordinal Discreta Continua
 Cor de cabelos
 Tipo de Sangue
 Gênero
 Sexo
 Religião
 Estado Civil
 Raça
 Escolaridade
 Classe Social
 Gravidade de
uma doença
 Escala de
intensidade de
dor
 Número de filhos
 Número de
batimentos
cardíacos
 Números de
eventos de uma
doença
 Altura
 Peso
 Pressão
Arterial
 Temperatura
Corporal
MEDIDAS RESUMO NUMÉRICAS
Permitem fazer afirmações concisas e quantitativas que
caracterizem a distribuição dos valores como um todo.
Medidas de tendência central:
1. Média
2. Mediana
3. Moda
Medidas de Dispersão
1. Amplitude
2. Intervalo Interquartil
3. Variância e Desvio Padrão
4. Coeficiente de Variação
Medidas de Tendência Central
 Média
 Mais conhecida e mais utilizada
 Usado para dados discretos ou contínuos
 Não é apropriada para dados nominais ou ordinais
Medidas de Tendência Central
Medidas de Tendência Central
 Média dados discretos
 Dados repetidos, necessário uma tabela de frequência
Medidas de Tendência Central
 Média dados discretos
É preciso multiplicar cada valor possível (x) pela respectiva freqüência (f) somar e
dividir a soma pelo tamanho da amostra n
Medidas de Tendência Central
 Média dados contínuos
 Para calcular a média de dados agrupados em classes, é preciso
calcular o valor central de cada classe.
1. O valor central é a média dos dois extremos de classe.
2. Cálculo auxiliar = produto valor central X frequência
3. Média é obtida dividindo o somatório do produto por 100
Medidas de Tendência Central
Medidas de Tendência Central
 Mediana
 Usada tanto para dados ordinais, discretos e contínuos
 É o valor que ocupa a posição central do conjunto dos dados
ordenados.
 Divide a amostra em duas partes: uma com números menores ou
iguais à mediana, outra com números maiores ou iguais à
mediana.
 Quando o número de dados é impar, existe um único valor na
posição central.
 Quando o número de dados é par, existem dois valores na posição
central. A mediana é a média desses dois valores.
Medidas de Tendência Central
Medidas de Tendência Central
Medidas de Tendência Central
Medidas de Tendência Central
 Moda
 É o valor que ocorre com maior frequuência.
Medidas de Tendência Central
 Moda
 Classe modal
Medidas de dispersão
 Por causa da variabilidade, a média, a mediana e a moda não
bastam para descrever um conjunto de dados: elas informam a
tendência central, mas nada dizem sobre a variabilidade.
 Quando você apresenta medidas de tendência central para
descrever um conjunto de dados, deve fornecer também uma
medida de variabilidade ou dispersão.
Medidas de dispersão
 Mínimo, Máximo e Amplitude
Medidas de dispersão
Medidas de dispersão
Medidas de dispersão
 Intervalo Interquartil
Medidas de dispersão
Para obter os quartis1:
Organize os dados em ordem crescente. Ache a mediana (que é,
também, o segundo quartil); marque esse valor.
Ache o primeiro quartil, da seguinte forma: tome o conjunto de
dados à esquerda da mediana; o primeiro quartil é a mediana do
novo conjunto de dados.
Ache o terceiro quartil, da seguinte forma: tome o conjunto de da-
dos à direita dessa mediana; o terceiro quartil é a mediana do novo
conjunto de dados.
Medidas de dispersão
Medidas de dispersão
 Diagrama de caixa (Box Plot)
 Representa as medidas dispersão
 São necessárias cinco medidas: mínimo, primeiro quartil, mediana,
terceiro quartil, máximo.
Medidas de dispersão
Medidas de dispersão
Medidas de dispersão
 Variância e desvio padrão
Para calcular a variância:
• calcule os desvios, de cada observação em relação à média;
• eleve cada desvio ao quadrado;
• some os quadrados;
• divida o resultado por n-1 (n é o número de observações).
Medidas de dispersão
Dadas as idades de cinco crianças 3, 6, 5. 7 e 9 anos. Calcule os desvios em
relação à média e a variância.
Medidas de dispersão
Medidas de dispersão
 Coeficiente de variação
 É a razão entre o desvio padrão e a média. O resultado é
multiplicado por 100, para que o coeficiente de variação seja dado
em porcentagem.
 Por ser adimensional, o coeficiente de variação é útil para
comparar a dispersão relativa de variáveis medidas em diferentes
unidades.
Análise Bidimensional
Muitas vezes queremos verificar se há uma relação de causa
e efeito entre as duas variáveis (se as variáveis são
dependentes ou não), se é possível estudar uma das
variáveis através da outra (que é mais fácil de medir) - prever
os valores de uma através dos valores da outra, ou calcular
uma medida de correlação ou de dependência entre as
variáveis.
Através da Análise Bidimensional, podemos tentar responder
a essas perguntas. As duas variáveis abordadas podem ser
qualitativas ou quantitativas, e para cada tipo haverá técnicas
apropriadas.
Variáveis quantitativas: Diagramas de dispersão,
Correlação, Regressão linear simples
Variáveis qualitativas: Tabelas de contingência, Estatística
Qui-Quadrado
Análise Bidimensional
• Muitas vezes também estamos interessados em avaliar o relacionamento
entre variáveis QUANTITATIVAS, sejam elas discretas ou contínuas.
Basicamente dois tipos de análise podem ser realizados: Análise de Correlação
e Análise de Regressão.
• Na análise de correlação e regressão há interesse em, a partir de dados de
uma amostra aleatória, verificar SE e COMO duas ou mais variáveis
quantitativas relacionam-se entre si em uma população
Correlação
• A Análise de Correlação fornece um número que resume o relacionamento
entre as variáveis, indicando a força e a direção do relacionamento.
• A Análise de Regressão fornece uma equação matemática que descreve a
natureza do relacionamento entre as duas variáveis, permitindo inclusive que
sejam feitas previsões dos valores de uma delas em função dos valores das
outras.
Correlação
Estamos estudando um problema em que queremos:
• Avaliar o efeito que uma ou mais variáveis independentes (explicativas) causam em
uma ÚNICA variável dependente (resposta).
Exemplo:
• Peso e alturas das crianças
• Tempo de prática de esporte e ritmo cardíaco
• Tempo de estudo e nota na prova
• Taxa de desemprego e taxa de criminalidade
• Expectativa de vida e taxa de analfabetismo
• Vendas e Gasto com publicidade
• Número de clientes nas vendas de uma empresa.
Correlação
Correlação
Correlação Linear
Positiva
Correlação Linear
Negativa
SEM correlação
Correlação
A correlação será positiva
- se os valores crescentes de X estiverem associados a valores crescentes de
Y, ou valores decrescente de X estiverem associados a valores decrescentes
da variável Y.
A correlação será negativa
- quando valores crescentes da variável X estiverem associados a valores
decrescentes da variável Y, ou valores decrescentes de X associados a
valores crescentes da variável Y.
Correlação nula
-quando não houver relação entre as variáveis X e Y, ou seja, quando as
variações de X e Y ocorrerem independentemente não existe correlação entre
elas.
Correlação
Variável independente é o número de
horas estudadas.
A nota do aluno é a var. dependente.
A nota do aluno depende do nº de
horas que ele estuda?
Essas variáveis se relacionam?
Por convenção, a variável
independente é considerada no eixo
horizontal x.
A dependente é considerada no eixo
vertical y.
Pares de observação (Xi;Yi)
Tempo Nota
3,0 4,5
7,0 6,5
2,0 3,7
1,5 4,0
12,0 9,3
Diagrama de dispersão
0
2
4
6
8
10
0 5 10 15
Tempo
Nota
Correlação
Diagrama de dispersão indica a possibilidade de correlação linear.
Coeficiente de correlação linear de Pearson: medir a força e a direção
do relacionamento LINEAR entre as duas variáveis:
 para dados populacionais;
r para dados amostrais.
Equação:
r – coeficiente de correlação linear de Pearson;
n – número de pares de observações;
x – variável independente;
y – variável dependente.
 
   




















































2
n
1
i
i
n
1
i
2
i
2
n
1
i
i
n
1
i
2
i
n
1
i
i
n
1
i
i
n
1
i
i
i
y
y
n
x
x
n
y
x
y
x
n
r
Correlação
- 1  r  +1
r = - 1: correlação linear negativa perfeita (reta decrescente).
r = +1: correlação linear positiva perfeita (reta crescente).
r = 0: não há correlação LINEAR.
• 0,00 < | r | ≤ 0,25 - correlação muito fraca;
• 0,25 < | r | ≤ 0,50 – correlação fraca;
• 0,50 < | r | ≤ 0,75 – correlação forte;
• 0,75 < | r | ≤ 1,00 – correlação muito forte.
Correlação
Estamos avaliando as médias de 15
estudantes no ensino médio,
relacionando-as com os índices dos
mesmos estudantes no seus cursos
universitários.
As médias no ensino médio podem
variar de 0 a 100, e os índices na
universidade de 0 a 4.
Construa um diagrama de dispersão e
calcule o coeficiente de correlação
linear de Pearson para os dados a
seguir. Interprete os resultados
encontrados.
Correlação
Nosso primeiro passo é definir qual variável é independente (X) e qual é a
dependente (Y).
Quem pode ter influenciado quem?
É razoável imaginar que a média no ensino médio dos estudantes tenha
influenciado de algum modo o índice por eles obtidos na universidade,
simplesmente pelo fato de que é preciso cursar o ensino médio antes da
universidade.
Correlação
Assim sendo, X será a média no ensino médio (variável independente) e Y será o
índice na universidade (variável dependente).
Como será o relacionamento entre estas variáveis?
Novamente, o bom senso nos indica que a valores altos de médias no ensino
médio devem corresponder índices altos na universidade: esperamos uma
correlação positiva.
Correlação
Correlação
A correlação linear é forte? Quanto mais os pontos estiverem próximos da
reta hipotética ajustada aos dados mais forte será a correlação.
No diagrama da figura anterior os pontos estão próximos uns dos outros,
estariam a pouca distância de uma reta que passasse entre eles. Concluímos
então que a correlação linear deve ser forte, o que resultará em um
coeficiente de correlação linear de Pearson próximo de 1.
Correlação
Confirmando nossas conclusões anteriores, o coeficiente de correlação
linear de Pearson teve resultado positivo, e próximo de 1, indicando forte
correlação linear positiva entre a média no ensino médio e o índice na
universidade ao menos para estes estudantes.
Regressão
Permite estimar o comportamento de uma variável (var. dependente - y) em
relação à uma outra variável (var. independente - x) através de uma função
linear, logarítmica, exponencial ou polinomial.
1. Modelo de Regressão Linear Simples
2. Modelo de Regressão Multivariada
Regressão Linear
Este é o modelo mais comum para descrever a relação entre uma variável
explanatória (x) e uma variável dependente (y).
O modelo faz as seguintes suposições, em ordem decrescente de importância:
1. o valor médio da variável resposta é uma função linear de x
2. a variância da variável dependente é constante (ou seja, é a mesma para
todos os valores de x)
3. a variação aleatória da variável dependente para qualquer valor fixo de x
segue uma Distribuição Normal, e estes termos de erro são independentes
Regressão Linear
Regressão Linear
Regressão Linear
Regressão Linear
Regressão Linear
Regressão Linear
Regressão Linear
Coeficiente de determinação R²
Regressão Linear
Coeficiente de determinação R²
Regressão Linear
Coeficiente de determinação R²
Regressão Múltipla

Mais conteúdo relacionado

Semelhante a Aula 1 - Introdução estatística 2.pptx

Estatãstica descritiva
Estatãstica descritivaEstatãstica descritiva
Estatãstica descritiva
Nilo Sampaio
 
Aula 01
Aula 01Aula 01
ESTATISTICA.pptx
ESTATISTICA.pptxESTATISTICA.pptx
ESTATISTICA.pptx
GuilhermeBarreto53
 
Probabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidadeProbabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidade
Leonel Boano
 
Apostila bioestatistica 2018
Apostila bioestatistica 2018Apostila bioestatistica 2018
Apostila bioestatistica 2018
Aroldo Lenza Junior
 
Estatística 8.º ano
Estatística 8.º anoEstatística 8.º ano
Estatística 8.º ano
aldaalves
 
Estatística 8.º ano
Estatística 8.º anoEstatística 8.º ano
Estatística 8.º ano
aldaalves
 
Bioestatistica basica completa-apresentacao
Bioestatistica basica completa-apresentacaoBioestatistica basica completa-apresentacao
Bioestatistica basica completa-apresentacao
Fabiano Reis
 
Uma Breve Revisão sobre Bioestatística no GESME
Uma Breve Revisão sobre Bioestatística no GESMEUma Breve Revisão sobre Bioestatística no GESME
Uma Breve Revisão sobre Bioestatística no GESME
Rilva Lopes de Sousa Muñoz
 
Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
Federal University of Bahia
 
Coleta de dados e crítica de variáveis
Coleta de dados e crítica de variáveisColeta de dados e crítica de variáveis
Coleta de dados e crítica de variáveis
Grupo de Estudos em Aprendizagem e Cognição
 
Calculo da Media aritmética, moda e mediana em situações do cotidiano.ppt
Calculo da Media aritmética, moda e mediana em situações do cotidiano.pptCalculo da Media aritmética, moda e mediana em situações do cotidiano.ppt
Calculo da Media aritmética, moda e mediana em situações do cotidiano.ppt
ElisangelaJesus17
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
ssuser2b53fe
 
aula_analiseDeDados.pptx
aula_analiseDeDados.pptxaula_analiseDeDados.pptx
aula_analiseDeDados.pptx
RafaelEscalfoni1
 
Introdução a Estatistica 2.pdf
Introdução a Estatistica 2.pdfIntrodução a Estatistica 2.pdf
Introdução a Estatistica 2.pdf
Celso Paquete Cellso
 
Fundamentos da estatística
Fundamentos da estatísticaFundamentos da estatística
Fundamentos da estatística
Naiade Costa Inácio
 
Medidas de Posição e Dispersão
Medidas de Posição e DispersãoMedidas de Posição e Dispersão
Medidas de Posição e Dispersão
LucasCoimbra24
 
Ficha de-trabalho-sobre-estatistica
Ficha de-trabalho-sobre-estatisticaFicha de-trabalho-sobre-estatistica
Ficha de-trabalho-sobre-estatistica
Ana Colaco
 
Estatistica
EstatisticaEstatistica
Estatistica
Paulo Rafael Vaz
 
Introdução a Estatistica 1.pdf
Introdução a Estatistica 1.pdfIntrodução a Estatistica 1.pdf
Introdução a Estatistica 1.pdf
Celso Paquete Cellso
 

Semelhante a Aula 1 - Introdução estatística 2.pptx (20)

Estatãstica descritiva
Estatãstica descritivaEstatãstica descritiva
Estatãstica descritiva
 
Aula 01
Aula 01Aula 01
Aula 01
 
ESTATISTICA.pptx
ESTATISTICA.pptxESTATISTICA.pptx
ESTATISTICA.pptx
 
Probabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidadeProbabilidade estatatìstica e contabilidade
Probabilidade estatatìstica e contabilidade
 
Apostila bioestatistica 2018
Apostila bioestatistica 2018Apostila bioestatistica 2018
Apostila bioestatistica 2018
 
Estatística 8.º ano
Estatística 8.º anoEstatística 8.º ano
Estatística 8.º ano
 
Estatística 8.º ano
Estatística 8.º anoEstatística 8.º ano
Estatística 8.º ano
 
Bioestatistica basica completa-apresentacao
Bioestatistica basica completa-apresentacaoBioestatistica basica completa-apresentacao
Bioestatistica basica completa-apresentacao
 
Uma Breve Revisão sobre Bioestatística no GESME
Uma Breve Revisão sobre Bioestatística no GESMEUma Breve Revisão sobre Bioestatística no GESME
Uma Breve Revisão sobre Bioestatística no GESME
 
Estatística Descritiva
Estatística DescritivaEstatística Descritiva
Estatística Descritiva
 
Coleta de dados e crítica de variáveis
Coleta de dados e crítica de variáveisColeta de dados e crítica de variáveis
Coleta de dados e crítica de variáveis
 
Calculo da Media aritmética, moda e mediana em situações do cotidiano.ppt
Calculo da Media aritmética, moda e mediana em situações do cotidiano.pptCalculo da Media aritmética, moda e mediana em situações do cotidiano.ppt
Calculo da Media aritmética, moda e mediana em situações do cotidiano.ppt
 
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.pptCurso_de_Estatística_Aplicada_Usando_o_R.ppt
Curso_de_Estatística_Aplicada_Usando_o_R.ppt
 
aula_analiseDeDados.pptx
aula_analiseDeDados.pptxaula_analiseDeDados.pptx
aula_analiseDeDados.pptx
 
Introdução a Estatistica 2.pdf
Introdução a Estatistica 2.pdfIntrodução a Estatistica 2.pdf
Introdução a Estatistica 2.pdf
 
Fundamentos da estatística
Fundamentos da estatísticaFundamentos da estatística
Fundamentos da estatística
 
Medidas de Posição e Dispersão
Medidas de Posição e DispersãoMedidas de Posição e Dispersão
Medidas de Posição e Dispersão
 
Ficha de-trabalho-sobre-estatistica
Ficha de-trabalho-sobre-estatisticaFicha de-trabalho-sobre-estatistica
Ficha de-trabalho-sobre-estatistica
 
Estatistica
EstatisticaEstatistica
Estatistica
 
Introdução a Estatistica 1.pdf
Introdução a Estatistica 1.pdfIntrodução a Estatistica 1.pdf
Introdução a Estatistica 1.pdf
 

Mais de RAFAELACAVALCANTILIR

2-SIFILIS_ADQUIRIDA_QUALISUS_final.ppt
2-SIFILIS_ADQUIRIDA_QUALISUS_final.ppt2-SIFILIS_ADQUIRIDA_QUALISUS_final.ppt
2-SIFILIS_ADQUIRIDA_QUALISUS_final.ppt
RAFAELACAVALCANTILIR
 
Aula 6 - Resolução 453_2012.pptx
Aula 6 - Resolução 453_2012.pptxAula 6 - Resolução 453_2012.pptx
Aula 6 - Resolução 453_2012.pptx
RAFAELACAVALCANTILIR
 
Aula 1 - Introdução.pptx
Aula 1 - Introdução.pptxAula 1 - Introdução.pptx
Aula 1 - Introdução.pptx
RAFAELACAVALCANTILIR
 
Apresentação Qualidade de Vida no Trabalho.pptx
Apresentação Qualidade de Vida no Trabalho.pptxApresentação Qualidade de Vida no Trabalho.pptx
Apresentação Qualidade de Vida no Trabalho.pptx
RAFAELACAVALCANTILIR
 
INTRODUÇÃO À ANATOMIA 2017.ppt
INTRODUÇÃO À ANATOMIA 2017.pptINTRODUÇÃO À ANATOMIA 2017.ppt
INTRODUÇÃO À ANATOMIA 2017.ppt
RAFAELACAVALCANTILIR
 
Avaliação 1 - Funções Oxigenadas.pptx
Avaliação 1 - Funções Oxigenadas.pptxAvaliação 1 - Funções Oxigenadas.pptx
Avaliação 1 - Funções Oxigenadas.pptx
RAFAELACAVALCANTILIR
 
Apresentação Qualidade de Vida.pptx
Apresentação Qualidade de Vida.pptxApresentação Qualidade de Vida.pptx
Apresentação Qualidade de Vida.pptx
RAFAELACAVALCANTILIR
 
Apresentação Promoção da Saúde.pptx
Apresentação Promoção da Saúde.pptxApresentação Promoção da Saúde.pptx
Apresentação Promoção da Saúde.pptx
RAFAELACAVALCANTILIR
 
aula_ governança_SUS_2022 (1).pptx
aula_ governança_SUS_2022 (1).pptxaula_ governança_SUS_2022 (1).pptx
aula_ governança_SUS_2022 (1).pptx
RAFAELACAVALCANTILIR
 
Aula Sistemas de informação Atualizada.pptx
Aula Sistemas de informação Atualizada.pptxAula Sistemas de informação Atualizada.pptx
Aula Sistemas de informação Atualizada.pptx
RAFAELACAVALCANTILIR
 

Mais de RAFAELACAVALCANTILIR (10)

2-SIFILIS_ADQUIRIDA_QUALISUS_final.ppt
2-SIFILIS_ADQUIRIDA_QUALISUS_final.ppt2-SIFILIS_ADQUIRIDA_QUALISUS_final.ppt
2-SIFILIS_ADQUIRIDA_QUALISUS_final.ppt
 
Aula 6 - Resolução 453_2012.pptx
Aula 6 - Resolução 453_2012.pptxAula 6 - Resolução 453_2012.pptx
Aula 6 - Resolução 453_2012.pptx
 
Aula 1 - Introdução.pptx
Aula 1 - Introdução.pptxAula 1 - Introdução.pptx
Aula 1 - Introdução.pptx
 
Apresentação Qualidade de Vida no Trabalho.pptx
Apresentação Qualidade de Vida no Trabalho.pptxApresentação Qualidade de Vida no Trabalho.pptx
Apresentação Qualidade de Vida no Trabalho.pptx
 
INTRODUÇÃO À ANATOMIA 2017.ppt
INTRODUÇÃO À ANATOMIA 2017.pptINTRODUÇÃO À ANATOMIA 2017.ppt
INTRODUÇÃO À ANATOMIA 2017.ppt
 
Avaliação 1 - Funções Oxigenadas.pptx
Avaliação 1 - Funções Oxigenadas.pptxAvaliação 1 - Funções Oxigenadas.pptx
Avaliação 1 - Funções Oxigenadas.pptx
 
Apresentação Qualidade de Vida.pptx
Apresentação Qualidade de Vida.pptxApresentação Qualidade de Vida.pptx
Apresentação Qualidade de Vida.pptx
 
Apresentação Promoção da Saúde.pptx
Apresentação Promoção da Saúde.pptxApresentação Promoção da Saúde.pptx
Apresentação Promoção da Saúde.pptx
 
aula_ governança_SUS_2022 (1).pptx
aula_ governança_SUS_2022 (1).pptxaula_ governança_SUS_2022 (1).pptx
aula_ governança_SUS_2022 (1).pptx
 
Aula Sistemas de informação Atualizada.pptx
Aula Sistemas de informação Atualizada.pptxAula Sistemas de informação Atualizada.pptx
Aula Sistemas de informação Atualizada.pptx
 

Aula 1 - Introdução estatística 2.pptx

  • 2. Estatística: o que é ? Estatística pode ser pensada como a ciência de aprendizagem a partir de dados. No nosso cotidiano, precisamos tomar decisões, muitas vezes decisões rápidas.  Em linhas gerais, a Estatística fornece métodos que auxiliam o processo de tomada de decisão na presença de incerteza.
  • 3. Aplicações da Estatística Área social pesquisa de opinião Área de saúde medicamentos genéricos epidemia de meningite Área industrial controle de qualidade Área financeira investimentos no mercado financeiro
  • 4. DADOS E ESTATÍSTICA • O propósito da maioria dos estudos é coletar dados para obter informações sobre uma área específica de pesquisa. • Dados compreendem observações sobre uma ou mais variáveis. • Variável/ dados
  • 5. • A estatística engloba os métodos de coleta, resumo, análise e tirada de conclusões a partir dos dados. • Variável/dados pertencerão a um de dois tipos: categóricos ou numéricos. DADOS E ESTATÍSTICA
  • 6. • DADOS CATEGÓRICOS (QUALITATIVOS) Dados nominais- são dados que se definem exclusivamente por nomes (não são mensurados), ex: grupo sanguineo (A, AB, B e O), estado civil (casado/viúvo/solteiro,etc), raça, sexo. Dados Ordinais – os dados são ordenados de alguma maneira (incluem escalas). Ex: estadiamento de doença (avançada, moderada, branda, nenhuma), grau da dor (forte, moderada, branda, nenhuma), apgar, glasgow. Obs: existem as variáveis binárias cuja resposta é sim/não ou vivo/morto. DADOS E ESTATÍSTICA
  • 7. • Nome- Fulano de Tal • Sexo- Masculino • Idade – 50 anos • Etnia – caucasiano • Tipo sanguineo – A • Peso – 60 kg • Creatinina 0.8mg/Dl QUAIS SÃO DADOS CATEGÓRICOS? DADOS CATEGÓRICOS
  • 8. Nome- Fulano de Tal • Sexo- Masculino • Idade – 50 anos • Etnia – caucasiano • Tipo sanguineo – A • Peso – 60 kg • Creatinina -0.8mg/Dl DADOS CATEGÓRICOS
  • 9. • DADOS NUMÉRICOS Dados discretos - só podem assumir valores numéricos inteiros, ex: número de consultas médicas, número de episódios de uma enfermidade. Dados contínuos - podem existir valores intermediários, ex: peso, altura, uréia, creatinina, hemoglobina. DADOS E ESTATÍSTICA
  • 10. • Nome- Fulano de Tal • Sexo- Masculino • Idade – 50 anos • Etnia – caucasiano • Tipo sanguineo – A • Peso – 60 kg • Creatinina 0.8mg/Dl QUAIS SÃO DADOS NUMÉRICOS? DADOS NUMÉRICOS
  • 11. • Nome- Fulano de Tal • Sexo- Masculino • Idade – 50 anos • Etnia – caucasiano • Tipo sanguineo – A • Peso – 60 kg • Creatinina 0.8mg/Dl DADOS NUMÉRICOS
  • 12. DADOS E ESTATÍSTICA VARIÁVEL CATEGÓRICA (qualitativa) NUMÉRICA (quantitativa) Nominal Ordinal Discreta Continua ----------------------------------------------- São representados por porcentagem -------------------------------------------------- São representados por média ± desvio Padrão ou mediana (intervalo entre Quartis), etc
  • 13. O que é Bioestatística ? • Bioestatística é um conjunto de métodos estatísticos usados para planejamento e análise de dados de estudos de ciências médicas, biológicas ou, de forma geral da área da saúde. • A Bioestatística tem o objetivo de determinar se um fato na natureza ocorre , por um fator determinado ou pelo mero acaso. • Aplicações incluem a avaliação de acurácia de testes laboratoriais, construção de faixas de referência para medidas clínicas e investigação da eficácia de tratamentos e da influência de fatores de risco no aparecimento de doenças ou na ocorrência de determinado desfecho.
  • 14. Planejamento Pesquisa Para realizar uma pesquisa que leve a fazer afirmações sobre a população de interesse é necessário seguir os seguintes passos: 1. Planejamento e desenho 2. Execução (coleta de dados) 3. Processamento de dados 4. Análise de dados 5. Interpretação, apresentação e publicação de resultados
  • 15. DADOS E ESTATÍSTICA VARIÁVEL CATEGÓRICA (qualitativa) NUMÉRICA (quantitativa) Nominal Ordinal Discreta Continua  Cor de cabelos  Tipo de Sangue  Gênero  Sexo  Religião  Estado Civil  Raça  Escolaridade  Classe Social  Gravidade de uma doença  Escala de intensidade de dor  Número de filhos  Número de batimentos cardíacos  Números de eventos de uma doença  Altura  Peso  Pressão Arterial  Temperatura Corporal
  • 16. Organização dos Dados  A organização dos dados evidencia diversos aspectos do assunto ou fenômeno que está sendo estudado, permitindo tirar importantes conclusões sobre o assunto pesquisado.  Na etapa de organização dos dados, alguns conceitos são importantes, como:  dados brutos;  rol;  frequência;  frequência relativa
  • 17. Organização dos Dados  Dados brutos: são dados que não tiveram qualquer tratamento, ou seja, não foram organizados após a coleta. Esses dados praticamente não trazem informações sobre a variável que está sendo analisada.  Rol: é a ordenação dos dados coletados na amostra, em ordem crescente ou decrescente
  • 18. Organização dos Dados  Frequência: A frequência é o total de vezes que um acontecimento se repete. Ela pode ser chamada de simples ou absoluta. Em matemática, esse tipo de frequência é representado pela sigla f  Frequência relativa: a frequência relativa é obtida dividindo- se a frequência simples ou absoluta de cada acontecimento pelo número total dos acontecimentos. Em matemática, sua sigla é fr
  • 20. Tabelas Elementos essenciais  Título: o título é colocado na parte superior da tabela. Ele deve ser preciso, indicando a natureza do fato sob estudo, as variáveis analisadas, o local e o período relacionado ao fato  Cabeçalho: no cabeçalho é especificada a natureza do conteúdo de cada coluna. Ele fica logo abaixo do título, centralizado na coluna  Coluna indicadora: divisão da tabela em sentido vertical. Especifica a natureza do conteúdo de cada linha.  Corpo: conjunto de linhas e colunas com os dados.
  • 23. Apresentação de dados qualitativos
  • 24. Apresentação de dados qualitativos
  • 25. Apresentação de dados qualitativos
  • 26. Apresentação de dados qualitativos Tabelas de Contingência  Duas variáveis qualitativas
  • 27. Apresentação de dados numéricos  Normalmente são apresentados na ordem em que são coletados.  Geralmente são obtidos dados relativos a diversas variáveis em cada paciente.  Os pacientes são identificados na pesquisa por números
  • 28. Apresentação de dados numéricos Dados Discretos
  • 29. Apresentação de dados numéricos Dados Contínuos Etapas para construção da tabela 1. Achar o valor máximo e o valor mínimo do conjunto de dados 2. Calcular a amplitude que é a diferença entre o valor máximo e valor mínimo 3. Determine o número de classes 4. Dividir a amplitude pelo número de classes 5. O resultado da divisão é o intervalo das classes 6. Organização das classes sendo a primeira contendo o valor menor
  • 32. Gráficos Elementos essenciais  Título: O título pode estar acima ou abaixo do gráfico e também deve responder às questões: O quê? Onde? Quando?  Escala: A escala é um método de ordenar grandezas permitindo comparar seus valores. Grandeza é tudo aquilo que pode ser contado, medido ou relacionado (ex.: altura, peso, tempo etc.). Ela deve ser crescente, da esquerda para a direita.  Fonte: deve estar logo abaixo do gráfico..
  • 33. Gráficos Os principais tipos de gráficos são: 1. Em barras ou em colunas 2. Em setores 3. Em linhas 4. Histograma
  • 34. Gráficos Apresentaçãodedadosqualitativos 1–GráficosdeBarras O gráfico de barras é usado para apresentar variáveis qualitativas, sejam elas nominais ou ordinais
  • 38. Gráficos Apresentaçãodedadosqualitativos 2–GráficosdeSetores É especialmente indicado para apresentar variáveis nominais, desde que o número de categorias seja pequeno.
  • 40. Gráficos Apresentaçãodedadosnuméricos 3–DiagramadeLinhas Este tipo de gráfico é indicado para dados de séries temporais, ou seja, um conjunto de dados para uma determinada variável, ao longo do tempo.
  • 41. Gráficos Apresentaçãodedadosnuméricos 4– Histograma É mais utilizado para a representação dos dados que são apresentados em tabelas de distribuição de frequências.
  • 42. DADOS E ESTATÍSTICA VARIÁVEL CATEGÓRICA (qualitativa) NUMÉRICA (quantitativa) Nominal Ordinal Discreta Continua  Cor de cabelos  Tipo de Sangue  Gênero  Sexo  Religião  Estado Civil  Raça  Escolaridade  Classe Social  Gravidade de uma doença  Escala de intensidade de dor  Número de filhos  Número de batimentos cardíacos  Números de eventos de uma doença  Altura  Peso  Pressão Arterial  Temperatura Corporal
  • 43. MEDIDAS RESUMO NUMÉRICAS Permitem fazer afirmações concisas e quantitativas que caracterizem a distribuição dos valores como um todo. Medidas de tendência central: 1. Média 2. Mediana 3. Moda Medidas de Dispersão 1. Amplitude 2. Intervalo Interquartil 3. Variância e Desvio Padrão 4. Coeficiente de Variação
  • 44. Medidas de Tendência Central  Média  Mais conhecida e mais utilizada  Usado para dados discretos ou contínuos  Não é apropriada para dados nominais ou ordinais
  • 46. Medidas de Tendência Central  Média dados discretos  Dados repetidos, necessário uma tabela de frequência
  • 47. Medidas de Tendência Central  Média dados discretos É preciso multiplicar cada valor possível (x) pela respectiva freqüência (f) somar e dividir a soma pelo tamanho da amostra n
  • 48. Medidas de Tendência Central  Média dados contínuos  Para calcular a média de dados agrupados em classes, é preciso calcular o valor central de cada classe. 1. O valor central é a média dos dois extremos de classe. 2. Cálculo auxiliar = produto valor central X frequência 3. Média é obtida dividindo o somatório do produto por 100
  • 50. Medidas de Tendência Central  Mediana  Usada tanto para dados ordinais, discretos e contínuos  É o valor que ocupa a posição central do conjunto dos dados ordenados.  Divide a amostra em duas partes: uma com números menores ou iguais à mediana, outra com números maiores ou iguais à mediana.  Quando o número de dados é impar, existe um único valor na posição central.  Quando o número de dados é par, existem dois valores na posição central. A mediana é a média desses dois valores.
  • 54. Medidas de Tendência Central  Moda  É o valor que ocorre com maior frequuência.
  • 55. Medidas de Tendência Central  Moda  Classe modal
  • 56. Medidas de dispersão  Por causa da variabilidade, a média, a mediana e a moda não bastam para descrever um conjunto de dados: elas informam a tendência central, mas nada dizem sobre a variabilidade.  Quando você apresenta medidas de tendência central para descrever um conjunto de dados, deve fornecer também uma medida de variabilidade ou dispersão.
  • 57. Medidas de dispersão  Mínimo, Máximo e Amplitude
  • 60. Medidas de dispersão  Intervalo Interquartil
  • 61. Medidas de dispersão Para obter os quartis1: Organize os dados em ordem crescente. Ache a mediana (que é, também, o segundo quartil); marque esse valor. Ache o primeiro quartil, da seguinte forma: tome o conjunto de dados à esquerda da mediana; o primeiro quartil é a mediana do novo conjunto de dados. Ache o terceiro quartil, da seguinte forma: tome o conjunto de da- dos à direita dessa mediana; o terceiro quartil é a mediana do novo conjunto de dados.
  • 63. Medidas de dispersão  Diagrama de caixa (Box Plot)  Representa as medidas dispersão  São necessárias cinco medidas: mínimo, primeiro quartil, mediana, terceiro quartil, máximo.
  • 66. Medidas de dispersão  Variância e desvio padrão Para calcular a variância: • calcule os desvios, de cada observação em relação à média; • eleve cada desvio ao quadrado; • some os quadrados; • divida o resultado por n-1 (n é o número de observações).
  • 67. Medidas de dispersão Dadas as idades de cinco crianças 3, 6, 5. 7 e 9 anos. Calcule os desvios em relação à média e a variância.
  • 69. Medidas de dispersão  Coeficiente de variação  É a razão entre o desvio padrão e a média. O resultado é multiplicado por 100, para que o coeficiente de variação seja dado em porcentagem.  Por ser adimensional, o coeficiente de variação é útil para comparar a dispersão relativa de variáveis medidas em diferentes unidades.
  • 70. Análise Bidimensional Muitas vezes queremos verificar se há uma relação de causa e efeito entre as duas variáveis (se as variáveis são dependentes ou não), se é possível estudar uma das variáveis através da outra (que é mais fácil de medir) - prever os valores de uma através dos valores da outra, ou calcular uma medida de correlação ou de dependência entre as variáveis. Através da Análise Bidimensional, podemos tentar responder a essas perguntas. As duas variáveis abordadas podem ser qualitativas ou quantitativas, e para cada tipo haverá técnicas apropriadas.
  • 71. Variáveis quantitativas: Diagramas de dispersão, Correlação, Regressão linear simples Variáveis qualitativas: Tabelas de contingência, Estatística Qui-Quadrado Análise Bidimensional
  • 72. • Muitas vezes também estamos interessados em avaliar o relacionamento entre variáveis QUANTITATIVAS, sejam elas discretas ou contínuas. Basicamente dois tipos de análise podem ser realizados: Análise de Correlação e Análise de Regressão. • Na análise de correlação e regressão há interesse em, a partir de dados de uma amostra aleatória, verificar SE e COMO duas ou mais variáveis quantitativas relacionam-se entre si em uma população Correlação
  • 73. • A Análise de Correlação fornece um número que resume o relacionamento entre as variáveis, indicando a força e a direção do relacionamento. • A Análise de Regressão fornece uma equação matemática que descreve a natureza do relacionamento entre as duas variáveis, permitindo inclusive que sejam feitas previsões dos valores de uma delas em função dos valores das outras. Correlação
  • 74. Estamos estudando um problema em que queremos: • Avaliar o efeito que uma ou mais variáveis independentes (explicativas) causam em uma ÚNICA variável dependente (resposta). Exemplo: • Peso e alturas das crianças • Tempo de prática de esporte e ritmo cardíaco • Tempo de estudo e nota na prova • Taxa de desemprego e taxa de criminalidade • Expectativa de vida e taxa de analfabetismo • Vendas e Gasto com publicidade • Número de clientes nas vendas de uma empresa. Correlação
  • 76. Correlação A correlação será positiva - se os valores crescentes de X estiverem associados a valores crescentes de Y, ou valores decrescente de X estiverem associados a valores decrescentes da variável Y. A correlação será negativa - quando valores crescentes da variável X estiverem associados a valores decrescentes da variável Y, ou valores decrescentes de X associados a valores crescentes da variável Y. Correlação nula -quando não houver relação entre as variáveis X e Y, ou seja, quando as variações de X e Y ocorrerem independentemente não existe correlação entre elas.
  • 77. Correlação Variável independente é o número de horas estudadas. A nota do aluno é a var. dependente. A nota do aluno depende do nº de horas que ele estuda? Essas variáveis se relacionam? Por convenção, a variável independente é considerada no eixo horizontal x. A dependente é considerada no eixo vertical y. Pares de observação (Xi;Yi) Tempo Nota 3,0 4,5 7,0 6,5 2,0 3,7 1,5 4,0 12,0 9,3 Diagrama de dispersão 0 2 4 6 8 10 0 5 10 15 Tempo Nota
  • 78. Correlação Diagrama de dispersão indica a possibilidade de correlação linear. Coeficiente de correlação linear de Pearson: medir a força e a direção do relacionamento LINEAR entre as duas variáveis:  para dados populacionais; r para dados amostrais. Equação: r – coeficiente de correlação linear de Pearson; n – número de pares de observações; x – variável independente; y – variável dependente.                                                           2 n 1 i i n 1 i 2 i 2 n 1 i i n 1 i 2 i n 1 i i n 1 i i n 1 i i i y y n x x n y x y x n r
  • 79. Correlação - 1  r  +1 r = - 1: correlação linear negativa perfeita (reta decrescente). r = +1: correlação linear positiva perfeita (reta crescente). r = 0: não há correlação LINEAR. • 0,00 < | r | ≤ 0,25 - correlação muito fraca; • 0,25 < | r | ≤ 0,50 – correlação fraca; • 0,50 < | r | ≤ 0,75 – correlação forte; • 0,75 < | r | ≤ 1,00 – correlação muito forte.
  • 80. Correlação Estamos avaliando as médias de 15 estudantes no ensino médio, relacionando-as com os índices dos mesmos estudantes no seus cursos universitários. As médias no ensino médio podem variar de 0 a 100, e os índices na universidade de 0 a 4. Construa um diagrama de dispersão e calcule o coeficiente de correlação linear de Pearson para os dados a seguir. Interprete os resultados encontrados.
  • 81. Correlação Nosso primeiro passo é definir qual variável é independente (X) e qual é a dependente (Y). Quem pode ter influenciado quem? É razoável imaginar que a média no ensino médio dos estudantes tenha influenciado de algum modo o índice por eles obtidos na universidade, simplesmente pelo fato de que é preciso cursar o ensino médio antes da universidade.
  • 82. Correlação Assim sendo, X será a média no ensino médio (variável independente) e Y será o índice na universidade (variável dependente). Como será o relacionamento entre estas variáveis? Novamente, o bom senso nos indica que a valores altos de médias no ensino médio devem corresponder índices altos na universidade: esperamos uma correlação positiva.
  • 84. Correlação A correlação linear é forte? Quanto mais os pontos estiverem próximos da reta hipotética ajustada aos dados mais forte será a correlação. No diagrama da figura anterior os pontos estão próximos uns dos outros, estariam a pouca distância de uma reta que passasse entre eles. Concluímos então que a correlação linear deve ser forte, o que resultará em um coeficiente de correlação linear de Pearson próximo de 1.
  • 85. Correlação Confirmando nossas conclusões anteriores, o coeficiente de correlação linear de Pearson teve resultado positivo, e próximo de 1, indicando forte correlação linear positiva entre a média no ensino médio e o índice na universidade ao menos para estes estudantes.
  • 86. Regressão Permite estimar o comportamento de uma variável (var. dependente - y) em relação à uma outra variável (var. independente - x) através de uma função linear, logarítmica, exponencial ou polinomial. 1. Modelo de Regressão Linear Simples 2. Modelo de Regressão Multivariada
  • 87. Regressão Linear Este é o modelo mais comum para descrever a relação entre uma variável explanatória (x) e uma variável dependente (y). O modelo faz as seguintes suposições, em ordem decrescente de importância: 1. o valor médio da variável resposta é uma função linear de x 2. a variância da variável dependente é constante (ou seja, é a mesma para todos os valores de x) 3. a variação aleatória da variável dependente para qualquer valor fixo de x segue uma Distribuição Normal, e estes termos de erro são independentes
  • 94. Regressão Linear Coeficiente de determinação R²
  • 95. Regressão Linear Coeficiente de determinação R²
  • 96. Regressão Linear Coeficiente de determinação R²