Este documento apresenta conceitos básicos sobre estatística descritiva e inferencial, incluindo: (1) variáveis quantitativas e qualitativas, (2) medidas de tendência central e dispersão, (3) distribuições de frequências. Também mostra como organizar e resumir dados no software R, como criar tabelas, histograma e calcular frequências.
Análise exploratória e modelação com r parte 3Lucas Castro
O documento discute tópicos de inferência estatística como distribuições de probabilidade, intervalos de confiança e testes de hipóteses utilizando o software R. É apresentado como gerar amostras aleatórias de distribuições normais, binomiais, plotar e resumir dados. Além disso, exemplos demonstram como realizar testes t para uma média e para duas amostras independentes no R.
Análise exploratória e modelação com r parte 2Lucas Castro
O documento apresenta uma introdução à análise exploratória de dados com R. Discute tipos de dados, medidas de tendência central e dispersão e exemplos de resumo estatístico de variáveis usando a base de dados iris.
O documento apresenta os conceitos básicos de estatística descritiva, como apresentação de dados brutos, rol e distribuição de frequência. Discute métodos para organizar e sintetizar dados numéricos de forma a facilitar a análise, incluindo agrupamento em classes e cálculo de frequências. Fornece exemplos práticos e exercícios para que os alunos possam aplicar os conceitos aprendidos.
O documento apresenta os principais tipos de gráficos para apresentação de dados, incluindo diagramas de barras, histogramas, polígonos de frequência, ogivas, diagramas de ramo e folha, diagramas de pontos, gráficos de setores, gráficos de Pareto e gráficos de dispersão. Exemplos ilustram como cada tipo de gráfico pode ser construído e interpretado.
1) O documento apresenta as principais formas de apresentação de conjuntos de dados em provas de estatística: rol, dados tabulados, distribuição de frequências e histogramas.
2) É introduzido o conceito de medidas de tendência central como média aritmética, moda e mediana.
3) É explicado como calcular a média aritmética para diferentes formas de apresentação de dados.
O documento apresenta a resolução de três questões de estatística. Na primeira questão, o professor calcula a frequência populacional de salários inferiores a R$7.000 na população da empresa, encontrando o valor de 180. Na segunda questão, ele estima a frequência relativa de observações menores que 145, encontrando o valor de 62,5%. Na terceira questão, ele calcula o número de indivíduos na população com valores entre 50,5 e 95,5, encontrando o valor de 7.
1) Uma empresa planeja instalar uma fábrica em Portugal e precisa analisar dados sobre a mão de obra local, renda média e capacidade de consumo para tomar sua decisão.
2) A estatística é o método usado para analisar e organizar grandes quantidades de dados, agrupando-os, classificando-os e extraindo conclusões. Ela é usada em diversas áreas como economia, psicologia e medicina.
3) O documento explica os conceitos básicos de estatística descritiva como frequência absoluta,
Este documento fornece informações sobre estatística descritiva e técnicas de descrição gráfica. Ele discute conceitos como população, amostra, variáveis, frequências, medidas de tendência central e dispersão. O documento também apresenta exemplos de tabelas, gráficos e cálculos estatísticos como média, mediana e quantis.
Análise exploratória e modelação com r parte 3Lucas Castro
O documento discute tópicos de inferência estatística como distribuições de probabilidade, intervalos de confiança e testes de hipóteses utilizando o software R. É apresentado como gerar amostras aleatórias de distribuições normais, binomiais, plotar e resumir dados. Além disso, exemplos demonstram como realizar testes t para uma média e para duas amostras independentes no R.
Análise exploratória e modelação com r parte 2Lucas Castro
O documento apresenta uma introdução à análise exploratória de dados com R. Discute tipos de dados, medidas de tendência central e dispersão e exemplos de resumo estatístico de variáveis usando a base de dados iris.
O documento apresenta os conceitos básicos de estatística descritiva, como apresentação de dados brutos, rol e distribuição de frequência. Discute métodos para organizar e sintetizar dados numéricos de forma a facilitar a análise, incluindo agrupamento em classes e cálculo de frequências. Fornece exemplos práticos e exercícios para que os alunos possam aplicar os conceitos aprendidos.
O documento apresenta os principais tipos de gráficos para apresentação de dados, incluindo diagramas de barras, histogramas, polígonos de frequência, ogivas, diagramas de ramo e folha, diagramas de pontos, gráficos de setores, gráficos de Pareto e gráficos de dispersão. Exemplos ilustram como cada tipo de gráfico pode ser construído e interpretado.
1) O documento apresenta as principais formas de apresentação de conjuntos de dados em provas de estatística: rol, dados tabulados, distribuição de frequências e histogramas.
2) É introduzido o conceito de medidas de tendência central como média aritmética, moda e mediana.
3) É explicado como calcular a média aritmética para diferentes formas de apresentação de dados.
O documento apresenta a resolução de três questões de estatística. Na primeira questão, o professor calcula a frequência populacional de salários inferiores a R$7.000 na população da empresa, encontrando o valor de 180. Na segunda questão, ele estima a frequência relativa de observações menores que 145, encontrando o valor de 62,5%. Na terceira questão, ele calcula o número de indivíduos na população com valores entre 50,5 e 95,5, encontrando o valor de 7.
1) Uma empresa planeja instalar uma fábrica em Portugal e precisa analisar dados sobre a mão de obra local, renda média e capacidade de consumo para tomar sua decisão.
2) A estatística é o método usado para analisar e organizar grandes quantidades de dados, agrupando-os, classificando-os e extraindo conclusões. Ela é usada em diversas áreas como economia, psicologia e medicina.
3) O documento explica os conceitos básicos de estatística descritiva como frequência absoluta,
Este documento fornece informações sobre estatística descritiva e técnicas de descrição gráfica. Ele discute conceitos como população, amostra, variáveis, frequências, medidas de tendência central e dispersão. O documento também apresenta exemplos de tabelas, gráficos e cálculos estatísticos como média, mediana e quantis.
O documento apresenta as respostas de um professor para três questões sobre distribuições de frequência. Na primeira questão, o professor identifica a coluna de frequência acumulada fornecida e transforma em frequência absoluta simples. Na segunda questão, ele identifica a coluna de frequência absoluta acumulada e também a transforma em frequência absoluta simples. Na terceira questão, o enunciado fornece uma tabela de frequência absoluta para as próximas questões.
O documento discute medidas estatísticas de posição central, dispersão e variabilidade de dados. Ele explica medidas como moda, mediana, média, variância, desvio padrão e coeficiente de variação, fornecendo suas definições, fórmulas e propriedades para analisar o comportamento central e variabilidade de variáveis.
O documento apresenta resoluções de exercícios que envolvem o cálculo de intervalos de confiança para médias e proporções populacionais com base em amostras. O primeiro exercício trata da obtenção de um intervalo de confiança para a média do diâmetro de esferas de rolamento produzidas por uma máquina. O segundo exercício estima um intervalo de confiança para a proporção de implantes mamários fabricados dentro de especificações de tensão.
O documento apresenta cálculos estatísticos utilizados por uma equipe de qualidade, incluindo média, desvio padrão, variância e coeficiente de variação. Os dados de 2010 são analisados usando esses métodos para definir metas de desempenho.
O documento explica o conceito e cálculo de medidas separatrizes como quartis, quintis, decis e percentis. Descreve três casos para o cálculo: 1) dados brutos ou rol, 2) variável discreta, 3) variável contínua. Fornece fórmulas e exemplos para ilustrar o cálculo destas medidas a partir de diferentes tipos de dados.
O documento introduz conceitos sobre medidas de dispersão e descreve o cálculo da amplitude total e do desvio médio simples. Apresenta três casos para o cálculo destas medidas: 1) variável discreta com dados brutos, 2) variável discreta, e 3) variável contínua. Fornece exemplos detalhados para cada caso.
Este documento apresenta uma apostila sobre estatística aplicada a administração, economia, matemática industrial e engenharia. A apostila introduz conceitos básicos de estatística descritiva e inferencial, incluindo probabilidade, amostragem, estimação de parâmetros, testes de hipóteses, análise de variância e regressão linear. O documento é organizado em seções com exemplos para facilitar o aprendizado dos alunos dessas áreas.
1) A mediana e o desvio padrão não são afetados, mas a média é multiplicada por 2.
2) A mediana, média e desvio padrão aumentam em 10 unidades.
3) A mediana e o desvio padrão não são afetados, mas a média passa a ser 0.
O documento discute o cálculo e interpretação da variância e desvio padrão. Apresenta três casos: 1) dados brutos ou rol, 2) variável discreta, 3) variável contínua. Fornece fórmulas para calcular a variância e desvio padrão para populações e amostras, e exemplos ilustrativos para cada caso.
1) O documento apresenta os conceitos básicos de estatística descritiva, incluindo medidas de posição, organização de dados e distribuição de frequências.
2) Inclui definições de população, amostra, variáveis, tabelas, séries estatísticas e métodos de agrupamento de dados em intervalos de classe.
3) Fornece exemplos detalhados para ilustrar cada conceito apresentado.
O documento introduz os principais conceitos e métodos de organização de dados estatísticos. Ele discute o que é estatística, seus ramos, conceitos como população, amostra e variáveis, o método estatístico que inclui planejamento, coleta e organização de dados, e formas de representar dados como tabelas e gráficos.
Este documento discute a organização e interpretação de dados estatísticos. Ele explica como classificar e organizar dados qualitativos e quantitativos em tabelas de frequência e como representar dados em gráficos de barras, histogramas e gráficos circulares. O documento também descreve medidas de localização como média, moda e mediana, e medidas de dispersão como amplitude e amplitude interquartis para interpretar conjuntos de dados.
1. O documento descreve sete ferramentas da qualidade utilizadas para coleta e análise de dados sobre processos e produtos, incluindo folha de verificação, diagrama de Pareto, estratificação, diagrama de causa e efeito, histograma, diagrama de dispersão e gráficos de controle.
2. A folha de verificação é usada para registrar defeitos observados em um produto de forma sistemática.
3. O diagrama de Pareto organiza problemas ou reclamações por frequência para ident
[1] O documento apresenta os conceitos básicos para construção de tabelas e gráficos estatísticos para organizar e tabular dados coletados. [2] Inclui informações sobre construção de tabelas de frequência e gráficos de barras, setores e histograma. [3] Tem como objetivo ensinar a resumir dados em tabelas de frequência e apresentá-los em forma de gráficos para análise e tomada de decisão.
1. O documento apresenta notas de aula sobre estatística ministradas por um professor.
2. As notas de aula abordam diversos tópicos estatísticos como estatística descritiva, inferencial, probabilidade, variáveis aleatórias, distribuições de probabilidade e inferência estatística.
3. O documento apresenta os conceitos de forma organizada em 18 seções numeradas e fornece exemplos ilustrativos para cada tópico.
1. O documento apresenta notas de aula sobre estatística ministradas por um professor.
2. As notas de aula abordam diversos tópicos estatísticos como estatística descritiva, inferencial, probabilidade, variáveis aleatórias, distribuições de probabilidade e inferência estatística.
3. O documento apresenta os conceitos de forma organizada em 18 seções numeradas e fornece exemplos ilustrativos dos principais tópicos estatísticos.
Este documento descreve diferentes técnicas de amostragem utilizadas para coletar dados de uma população. A amostragem é preferível ao censo completo devido aos seus menores custos e maior rapidez. As principais técnicas discutidas incluem amostra aleatória simples, amostra estratificada, amostra sistemática e amostra por conglomerado. O documento também aborda medidas estatísticas como média, mediana e percentis que podem ser usadas para resumir dados amostrais.
O documento apresenta um resumo sobre estatística, abordando os seguintes tópicos: conceitos básicos de população, amostra, variáveis, parâmetros e estatísticas; representação tabular e gráfica de dados; medidas descritivas como média, mediana e desvio padrão; probabilidade e variáveis aleatórias; distribuições de probabilidade; amostragem; estimação de parâmetros; testes de hipóteses; regressão e correlação. O documento fornece definições e exemplos para cada um des
Este documento fornece uma introdução às noções básicas de bioestatística. Define estatística e bioestatística, e discute brevemente o histórico da estatística. Também aborda conceitos como população e amostra, variáveis, apresentação de dados em tabelas e gráficos, medidas de posição central como média, mediana e moda, e medidas de dispersão.
Este documento discute técnicas de amostragem e estatística descritiva. Apresenta definições de população e amostra, tipos de variáveis, e métodos para organizar e resumir dados como tabelas de frequência, histogramas e medidas de tendência central.
O documento apresenta os principais conceitos e técnicas da estatística descritiva, incluindo medidas de posição central e dispersão para resumir conjuntos de dados, além de métodos de amostragem e organização de dados em tabelas de frequência e gráficos.
O documento apresenta os conceitos e objetivos da análise exploratória de dados, incluindo representações tabulares e gráficas. Discute tabelas, medidas de tendência central, medidas de dispersão e os principais tipos de gráficos como histograma, diagrama de dispersão e gráfico de barras.
O documento apresenta as respostas de um professor para três questões sobre distribuições de frequência. Na primeira questão, o professor identifica a coluna de frequência acumulada fornecida e transforma em frequência absoluta simples. Na segunda questão, ele identifica a coluna de frequência absoluta acumulada e também a transforma em frequência absoluta simples. Na terceira questão, o enunciado fornece uma tabela de frequência absoluta para as próximas questões.
O documento discute medidas estatísticas de posição central, dispersão e variabilidade de dados. Ele explica medidas como moda, mediana, média, variância, desvio padrão e coeficiente de variação, fornecendo suas definições, fórmulas e propriedades para analisar o comportamento central e variabilidade de variáveis.
O documento apresenta resoluções de exercícios que envolvem o cálculo de intervalos de confiança para médias e proporções populacionais com base em amostras. O primeiro exercício trata da obtenção de um intervalo de confiança para a média do diâmetro de esferas de rolamento produzidas por uma máquina. O segundo exercício estima um intervalo de confiança para a proporção de implantes mamários fabricados dentro de especificações de tensão.
O documento apresenta cálculos estatísticos utilizados por uma equipe de qualidade, incluindo média, desvio padrão, variância e coeficiente de variação. Os dados de 2010 são analisados usando esses métodos para definir metas de desempenho.
O documento explica o conceito e cálculo de medidas separatrizes como quartis, quintis, decis e percentis. Descreve três casos para o cálculo: 1) dados brutos ou rol, 2) variável discreta, 3) variável contínua. Fornece fórmulas e exemplos para ilustrar o cálculo destas medidas a partir de diferentes tipos de dados.
O documento introduz conceitos sobre medidas de dispersão e descreve o cálculo da amplitude total e do desvio médio simples. Apresenta três casos para o cálculo destas medidas: 1) variável discreta com dados brutos, 2) variável discreta, e 3) variável contínua. Fornece exemplos detalhados para cada caso.
Este documento apresenta uma apostila sobre estatística aplicada a administração, economia, matemática industrial e engenharia. A apostila introduz conceitos básicos de estatística descritiva e inferencial, incluindo probabilidade, amostragem, estimação de parâmetros, testes de hipóteses, análise de variância e regressão linear. O documento é organizado em seções com exemplos para facilitar o aprendizado dos alunos dessas áreas.
1) A mediana e o desvio padrão não são afetados, mas a média é multiplicada por 2.
2) A mediana, média e desvio padrão aumentam em 10 unidades.
3) A mediana e o desvio padrão não são afetados, mas a média passa a ser 0.
O documento discute o cálculo e interpretação da variância e desvio padrão. Apresenta três casos: 1) dados brutos ou rol, 2) variável discreta, 3) variável contínua. Fornece fórmulas para calcular a variância e desvio padrão para populações e amostras, e exemplos ilustrativos para cada caso.
1) O documento apresenta os conceitos básicos de estatística descritiva, incluindo medidas de posição, organização de dados e distribuição de frequências.
2) Inclui definições de população, amostra, variáveis, tabelas, séries estatísticas e métodos de agrupamento de dados em intervalos de classe.
3) Fornece exemplos detalhados para ilustrar cada conceito apresentado.
O documento introduz os principais conceitos e métodos de organização de dados estatísticos. Ele discute o que é estatística, seus ramos, conceitos como população, amostra e variáveis, o método estatístico que inclui planejamento, coleta e organização de dados, e formas de representar dados como tabelas e gráficos.
Este documento discute a organização e interpretação de dados estatísticos. Ele explica como classificar e organizar dados qualitativos e quantitativos em tabelas de frequência e como representar dados em gráficos de barras, histogramas e gráficos circulares. O documento também descreve medidas de localização como média, moda e mediana, e medidas de dispersão como amplitude e amplitude interquartis para interpretar conjuntos de dados.
1. O documento descreve sete ferramentas da qualidade utilizadas para coleta e análise de dados sobre processos e produtos, incluindo folha de verificação, diagrama de Pareto, estratificação, diagrama de causa e efeito, histograma, diagrama de dispersão e gráficos de controle.
2. A folha de verificação é usada para registrar defeitos observados em um produto de forma sistemática.
3. O diagrama de Pareto organiza problemas ou reclamações por frequência para ident
[1] O documento apresenta os conceitos básicos para construção de tabelas e gráficos estatísticos para organizar e tabular dados coletados. [2] Inclui informações sobre construção de tabelas de frequência e gráficos de barras, setores e histograma. [3] Tem como objetivo ensinar a resumir dados em tabelas de frequência e apresentá-los em forma de gráficos para análise e tomada de decisão.
1. O documento apresenta notas de aula sobre estatística ministradas por um professor.
2. As notas de aula abordam diversos tópicos estatísticos como estatística descritiva, inferencial, probabilidade, variáveis aleatórias, distribuições de probabilidade e inferência estatística.
3. O documento apresenta os conceitos de forma organizada em 18 seções numeradas e fornece exemplos ilustrativos para cada tópico.
1. O documento apresenta notas de aula sobre estatística ministradas por um professor.
2. As notas de aula abordam diversos tópicos estatísticos como estatística descritiva, inferencial, probabilidade, variáveis aleatórias, distribuições de probabilidade e inferência estatística.
3. O documento apresenta os conceitos de forma organizada em 18 seções numeradas e fornece exemplos ilustrativos dos principais tópicos estatísticos.
Este documento descreve diferentes técnicas de amostragem utilizadas para coletar dados de uma população. A amostragem é preferível ao censo completo devido aos seus menores custos e maior rapidez. As principais técnicas discutidas incluem amostra aleatória simples, amostra estratificada, amostra sistemática e amostra por conglomerado. O documento também aborda medidas estatísticas como média, mediana e percentis que podem ser usadas para resumir dados amostrais.
O documento apresenta um resumo sobre estatística, abordando os seguintes tópicos: conceitos básicos de população, amostra, variáveis, parâmetros e estatísticas; representação tabular e gráfica de dados; medidas descritivas como média, mediana e desvio padrão; probabilidade e variáveis aleatórias; distribuições de probabilidade; amostragem; estimação de parâmetros; testes de hipóteses; regressão e correlação. O documento fornece definições e exemplos para cada um des
Este documento fornece uma introdução às noções básicas de bioestatística. Define estatística e bioestatística, e discute brevemente o histórico da estatística. Também aborda conceitos como população e amostra, variáveis, apresentação de dados em tabelas e gráficos, medidas de posição central como média, mediana e moda, e medidas de dispersão.
Este documento discute técnicas de amostragem e estatística descritiva. Apresenta definições de população e amostra, tipos de variáveis, e métodos para organizar e resumir dados como tabelas de frequência, histogramas e medidas de tendência central.
O documento apresenta os principais conceitos e técnicas da estatística descritiva, incluindo medidas de posição central e dispersão para resumir conjuntos de dados, além de métodos de amostragem e organização de dados em tabelas de frequência e gráficos.
O documento apresenta os conceitos e objetivos da análise exploratória de dados, incluindo representações tabulares e gráficas. Discute tabelas, medidas de tendência central, medidas de dispersão e os principais tipos de gráficos como histograma, diagrama de dispersão e gráfico de barras.
1) O documento discute conceitos estatísticos básicos como população, amostra, distribuição de frequência, medidas de tendência central e histograma.
2) Apresenta definições de população, amostra, variáveis, distribuição de frequência e como construir um histograma.
3) Explica como calcular a média, mediana e moda e como elas fornecem medidas sobre a posição central de uma distribuição de dados.
1. O documento apresenta notas de aula sobre estatística. 2. As notas de aula abordam tópicos como conceitos básicos de estatística, apresentação de dados, distribuição de frequências, medidas de tendência central e dispersão, teoria da probabilidade, variáveis aleatórias, modelos de probabilidade, inferência estatística e análise de correlação e regressão. 3. O documento serve como guia para estudantes aprenderem os principais conceitos e técnicas da estatística.
1. O documento discute distribuições de frequências, que condensam grandes conjuntos de dados em tabelas. 2. Existem dois tipos de distribuições: tipo A para variáveis discretas e tipo B para variáveis contínuas. 3. Vários conceitos são explicados, como classes, frequências, amplitude total e pontos médios.
Aula 3 Estatística descritiva (Medidas de Tendencia Central).pdfJeremiasFontinele
1) O documento discute medidas de tendência central como média, mediana e moda.
2) A média é a soma de todos os valores dividida pelo número total de valores e pode ser influenciada por valores extremos. A mediana é o valor central quando os dados são ordenados e não é influenciada por valores extremos. A moda é o valor que mais se repete.
3) Essas medidas de tendência central resumem dados de forma condensada e indicam o valor central em torno do qual os dados se distribuem.
1) A estatística é a ciência que coleta, organiza e interpreta dados de grupos aleatórios.
2) Ela é dividida em estatística geral e estatística indutiva.
3) A estatística geral inclui estatística descritiva, que descreve dados, e estatística indutiva, que tira conclusões sobre populações a partir de amostras.
O Método Estatístico
• Introdução aos gráficos
• Tabela de distribuição de Frequências
• Elementos de uma distribuição de frequência
• Tabelas comparativas
• Calculo da variação percentual
• Recodificação /Transformação /Manipulação de variáveis
• Agrupar idades em faixa etária com Excel
• Transformando a variável data
• Copiar tabelas do Excel para outros programas
• Gráficos
• Requisitos fundamentais para construir um gráfico
• Principais tipos de gráficos
• Criando Gráfico no Excel
• Gráficos mais usados
• Bibliografia e Links úteis
O documento introduz os principais conceitos estatísticos, como: estatística serve para coletar, organizar e analisar dados para apresentar resultados conclusivos de pesquisas; população e amostra; variáveis qualitativas e quantitativas; frequência absoluta e relativa; medidas de tendência central como média, mediana e moda.
Este documento fornece instruções sobre análise exploratória de dados no SPSS, incluindo estatísticas descritivas, gráficos como caixas e bigodes e Q-Q plots, e transformações de dados para corrigir problemas de normalidade. O objetivo é explorar os dados amostrais para entender a distribuição da população e tirar conclusões estatísticas.
1. O documento apresenta os principais conceitos estatísticos, incluindo representação de dados, medidas descritivas, probabilidade, distribuições de probabilidade e amostragem.
2. Os tópicos são organizados em seções que cobrem conceitos básicos, representação tabular e gráfica de dados, medidas descritivas, probabilidade, distribuições de probabilidade, amostragem e testes de hipóteses.
3. O documento serve como uma apostila introdutória abrangente sobre os principais conceitos estatísticos.
Este documento apresenta um resumo do conteúdo do curso de Estatística I ministrado na Universidade do Vale do Paraíba. O curso aborda tópicos como representação e operações com dados por meio de tabelas de frequência e histogramas, variáveis aleatórias, probabilidades, distribuições de probabilidade para variáveis discretas e contínuas.
1. +
Bioestatística - Universidade Católica de Brasília
O Programa R
Prof. Dr. Gabriel da Rocha Fernandes
Universidade Católica de Brasília
gabrielf@ucb.br - fernandes.gabriel@gmail.com
2. + 2
O Ambiente R
R é uma aplicação de distribuição gratuita (http://
cran.rproject.org/).
Conjuntointegrado de programas para manipulação de
dados, cálculos e gráficos.
manipulação e armazenamento efetivo de dados.
operadores para cálculos sobre variáveis indexadas.
vasta coleção de ferramentas para análises de dados.
capacidade gráfica para análise exploratória.
linguagem de programação simples e eficiente.
3. + 3
Conceitos
Estatística descritiva: apresentação de dados.
Estatística
inferencial: conclusão sobre conjuntos maiores
de dados, quando estudamos apenas partes.
Unidadeexperimental: menor unidade a fornecer
informação.
Dados: informações obtidas de uma unidade experimental.
Variável:
característica observada em uma unidade
experimental que pode variar de um indivíduo para outro.
4. + 4
Conceitos
Variáveis
quantitativas: dados são valores numéricos que
expressam quantidade.
Discretas:
dados somente podem apresentar determinados valores
(números inteiros).
Contínuas: dados podem apresentar qualquer valor dentro de um
intervalo de variação possível.
Variáveis qualitativas: dados de natureza não numérica.
Nível
nominal: diferencia uma categoria da outra pela
denominação.
Nível ordinal: graus de intensidade, permite uma ordenação.
5. + 5
Conceitos
População:todo conjunto de unidades experimentais que
apresenta características em comum.
Amostra: qualquer fração de uma população.
Representar uma população.
Mesmas características.
Representativa e não-tendenciosa.
6. + 6
Organização de dados
quantitativos
Estatística
descritiva é imprescindível como um passo
prévio a interpretação dos resultados de uma investigação.
Tabelas e gráficos.
Medidas de tendência central e de dispersão.
Distribuições de frequências.
Amostra:
5.1 4.9 4.9 5.1 4.7
5.0 5.0 5.0 5.1 5.4
5.2 5.2 4.9 5.3 5.0
4.5 5.4 5.1 4.7 5.5
4.8 5.1 5.3 5.3 5.0
11. + 11
Medidas de tendência central
Média:
Fácil de calcular.
Fácil de interpretar.
Muito útil para inferências.
Valor esperado, ou esperança matemática.
Mediana:
divide uma série ordenada de dados em dois
subgrupos de tamanho igual.
Moda: valor mais frequente de uma série de valores.
12. + 12
No R
Dados pertecem ao pacote MASS, e devem ser pre-
carregados antes de usar.
> library(MASS) # load the MASS package
> painters
Composition Drawing Colour Expression School
Da Udine 10 8 16 3 A
Da Vinci 15 16 4 14 A
Del Piombo 8 13 16 7 A
Del Sarto 12 16 9 8 A
Fr. Penni 0 15 8 0 A
Guilio Romano 15 16 4 14 A
.................
13. + 13
No R
Nacoluna School contém a informação da classificação da
escola de cada um dos pintores. Elas são nomeadas como
A, B, C,... etc. E School é uma variável qualitativa.
> painters$School
[1] A A A A A A A A A A B B B B B B C C C C C C D D D D
[27] D D D D D D E E E E E E E F F F F G G G G G G G H H
[53] H H
Levels: A B C D E F G H
Para
mais informações pode pedir uma ajuda sobre o
pacote.
> help(painters)
14. + 14
Distribuição da frequência de
dados qualitativos
A frequencia da distribuição de uma variável é o resumo da
ocorrência dos dados em um conjunto de categorias.
Nos dados de “painters”, a distribuição da frequência da
variável School é o resumo do número de pintores em cada
escola.
> library(MASS) # carrega o pacote
> school = painters$School # School de painters
> school.freq = table(school) # aplica a função table
> cbind(school.freq) # coloca em tabela vertical
15. + 15
Distribuição da frequencia
relativa de dados qualitativos
> library(MASS) # carrega o pacote
> school = painters$School # School de painters
> school.freq = table(school) # aplica a função table
> school.relfreq = school.freq / nrow(painters)
> cbind(school.relfreq) # coloca em tabela vertical
> options(digits=1) # numeros decimais além de 1
> cbind(school.relfreq)
school.relfreq
A 0.19
B 0.11
C 0.11
D 0.19
E 0.13
F 0.07
17. + 17
Gráfico de pizza
> pie(school.freq) # aplica a função pie
> colors = c("red", "yellow", "green", "violet", "orange", "blue"
, "pink", "cyan")
> pie(school.freq, col=colors) # pie com cores
18. + 18
Estatística em uma categoria
Qual escola tem a maior média de composições?
#Criar um índice lógico para School C
> c_school = school == "C" # the logical index vector
#Encontrar os subdados de pintores onde a School = C
> c_painters = painters[c_school, ] # seleciona subdados
#Encontrar a média da composição para School C
> mean(c_painters$Composition)
[1] 13.167
Aoinvés de calcular a média para cada School, podemos
usar a função tapply
> tapply(painters$Composition, painters$School, mean)
19. + 19
Dados Quantitativos
Dados da variável faithful.
Uma observação, chamada eruptions, é a duração das
erupções de um geiser do Parque Yellowstone.
A outra, chamada waiting, é o tempo esperado até a
próxima erupção.
> head(faithful)
eruptions waiting
1 3.600 79
2 1.800 54
3 3.333 74
4 2.283 62
5 4.533 85
6 2.883 55
20. + 20
Distribuição de frequências de
dados quantitativos
Saber a amplitude da duração das erupções.
> duration = faithful$eruptions
> range(duration)
[1] 1.6 5.1
Dividir essa amplitude em intervalos.
> breaks = seq(1.5, 5.5, by=0.5) # sequência de meio ponto
> breaks
[1] 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5
Classificar as durações das erupções de acordo com os
intervalos.
> duration.cut = cut(duration, breaks, right=FALSE)
Calcular a frequência das erupções dentro dos intervalos.
> duration.freq = table(duration.cut)
21. + 21
Histograma
> duration = faithful$eruptions
> hist(duration, right=FALSE) # função para histogramas
> colors = c("red", "yellow", "green", "violet", "orange",
"blue", "pink", "cyan")
> hist(duration, # Função hist
+ right=FALSE, # intervalos fechados somente a
esquerda
+ col=colors, # definir cores
+ main="Old Faithful Eruptions", # Titulo principal
+ xlab="Duration minutes") # Titulo do eixo X
24. + 24
Gráfico da frequência acumulada
> cumfreq0 = c(0, cumsum(duration.freq))
> plot(breaks, cumfreq0, # Plotar os dados
+ main="Old Faithful Eruptions", # Titulos principal
+ xlab="Duration minutes", # Titulo do eixo x
+ ylab="Cumumlative Eruptions") # Titulo do eixo y
> lines(breaks, cumfreq0) # conecta os pontos