SlideShare uma empresa Scribd logo
1 de 25
UNIVERSIDAD TECNICA DEL NORTE
FACULTAD DE CIENCIAS ADMINISTRATIVAS
Y ECONOMICAS
INGENIERIA EN CONTABILIDAD Y
AUDITORIA
COMPUTACION I
TIPOS DE ESTILOS DE TABLAS, GRAFICOS Y
CONTENIDOS
NOMBRE: DANIEL VILAÑEZ
CURSO: TERCERO C1
FECHA: 25-11-2015
2
INDICE
INDICE......................................................................................................3
INDICE DE GRAFICOS.........................................................................3
INDICE DE TABLAS ............................................................................3
1) La Estadística en la Educación Básica y Media...............................5
A)OBJETIVOS: ........................................................................................5
B)INTRODUCCION..................................................................................5
C)DEFINICIONES BASICAS..................................................................7
D)TIPOS DE DATOS................................................................................7
E)ENCUESTAS POR MUESTREO..........................................................8
F)MUESTREO ALEATORIO SIMPLE....................................................9
G)EVALUACION DE UNA ENCUESTA POR MUESTREO..............10
H)CLASIFICACION ORDENADA DE LOS DATOS...........................11
I)CARACTERÍSTICAS DE LOS DATOS.............................................13
J)DIAGRAMAS Y GRÁFICOS..............................................................13
K)DISTRIBUCIÓN DE FRECUENCIAS E HISTOGRAMAS..............18
L)MEDIDAS DE LOCALIZACIÓN O TENDENCIA CENTRAL.......19
M)MEDIDAS DE DISPERSIÓN............................................................21
N)DIAGRAMA DE CAJA......................................................................21
O)TABLA DE CONTINGENCIA...........................................................22
P)REGRESIÓN LINEAL SIMPLE.........................................................24
2) Bibliografía:..................................................................................24
3) LINCOGRAFIA...............................................................................25
INDICE DE GRAFICOS
INDICE DE TABLAS
Tabla 1.............................................................................................12
Tabla 2.............................................................................................12
Tabla 3.............................................................................................12
Tabla 4.............................................................................................15
Tabla 5.............................................................................................17
3
Tabla 6.............................................................................................17
Tabla 7.............................................................................................18
Tabla 8.............................................................................................20
Tabla 9.............................................................................................22
Tabla 10...........................................................................................23
4
1) La Estadística en la Educación Básica y Media
A) OBJETIVOS:
Presentar una visión general de la Estadística y sus aplicaciones, los
procedimientos para recolección de datos, su clasificación y
organización, los requerimientos de una buena investigación por
muestreo y los errores que se pueden cometer en una encuesta.
Mostrar cómo grandes conjuntos de datos numéricos pueden
organizarse y presentarse de manera eficaz, con el propósito de
favorecer el análisis y la interpretación de los datos, aspectos claves
del proceso de planificación y toma de decisiones.
Describir de manera conveniente las características de los datos
mediante tablas, diagramas y representaciones gráficas; es decir
presentar las técnicas básicas para realizar el análisis de los datos.
Motivar a directivos y profesores de colegios para que la estadística
sea considerada importante en la formación y el curriculum
académico del estudiante, con la finalidad de que forme parte de la
cultura general en nuestro país.
B) INTRODUCCION
La estadística se origina en los propósitos de los gobiernos (naciones
o estados) de tener información sobre su población y recabar datos
sobre sus ciudadanos, su desarrollo se favorece con el florecimiento
en las matemáticas de la teoría de las probabilidades.
Cada día es más importante el contar con información para las
actividades de planificación y toma de decisiones en cualquier ámbito
institucional, por ello las empresas públicas y privadas requieren tener
información relevante y confiable sobre su campo de acción con los
menores costos posibles.
El gobierno es un importante recolector y compilador de datos con
propósitos tanto públicos como privados.
Hay que distinguir entre el recolector original de los datos,
denominado fuente primaria, y el organizador que compila estos
5
datos en tablas y diagramas, llamados fuente secundaria.
En nuestro país, el Banco Central y el Instituto Nacional de
Estadística y Censos, INEC, son entidades responsables de recolectar
datos sobre variables económicas, financieras, sociales y
demográficas.
Sin embargo en muchas ocasiones no existe la información que
requerimos, y para obtenerla debemos diseñar un experimento, o
realizar un estudio basado en la observación del comportamiento de
interés, o hacer una investigación por medio de una encuesta dirigida
a una muestra de la población objeto del estudio.
En la actualidad se recogen datos con la finalidad de utilizarlos en
diversos propósitos relacionados con estudios de investigación
científica, planificación para el desarrollo de un proyecto, para
contribuir en un proceso de toma de decisiones, medir el desempeño
de un proceso de producción o de un servicio, realizar un estudio de
mercado, o simplemente para satisfacer nuestra curiosidad.
La estadística comprende dos partes fundamentales:
a) La estadística descriptiva: que son los métodos que
involucran la recolección, presentación y análisis de un
conjunto de datos con el fin de describir apropiadamente
sus diversas características. Su desarrollo se ha dado por
la necesidad de información relevante de amplias
poblaciones.
b) La estadística inferencial: que puede definirse como
aquellos métodos que hacen posible la estimación de una
característica de una población basándose solamente en
los resultados de una muestra. Su desarrollo se ha dado a
principios del siglo XX y tienen amplia aplicación en
todos los campos de la investigación en la actualidad.
Para aclarar estos términos, en el siguiente tema, se introducen
algunas definiciones fundamentales.
6
C) DEFINICIONES BASICAS
a) Población (o universo): es el conjunto de todos los
elementos considerados como objetivo del estudio y del
cual queremos obtener sus características.
b) Muestra: es la porción de la población que se selecciona
para su análisis, es el objetivo de la encuesta o del
experimento, que será de utilidad para poder obtener las
conclusiones sobre la población.
c) Parámetro: es una medida de resumen para describir
una característica de toda una población.
d) Estadístico(a): es una medida de resumen para describir
una característica de una muestra de la población.
Para que un análisis estadístico sea útil los datos de entrada no deben
contener errores, puesto que si entra basura saldrá basura.
D) TIPOS DE DATOS
Los datos son los resultados observados de diversas características, de
los elementos de una población de estudio, llamadas variables
aleatorias.
Existen básicamente dos tipos de datos o de variables aleatorias:
Datos categóricos (variables cualitativas) y datos numéricos
(variables cuantitativas).
Las variables categóricas se clasifican en dos grupos, pueden ser
7
nominales u ordinales.
Variable Nominal, si los datos observados se clasifican en diversas
categorías que no implican ningún orden, por ejemplo el estado civil,
el sexo, el partido político, o si tiene o no hijos.
Variable Ordinal, si los datos se clasifican en categorías que implican
algún orden, por ejemplo la medida de satisfacción en el trabajo que
desempeña (poco en menos que medianamente y este es menor a
mucho).
La variable es numérica si sus valores observados son números, es
decir representan una cantidad o una medida. Por ejemplo, las
respuestas a las preguntas: ¿Cuántos vehículos posee? ¿A cuántas
revistas está suscrito actualmente?, ¿Cuántos hijos tiene?, ¿Cuál es su
estatura?, ¿Cuánto pesa? son claramente numéricas.
Las variables numéricas se clasifican en dos grupos, pueden ser
discretas o continuas.
Variable discreta si los datos corresponden a respuestas numéricas
que provienen de un proceso de conteo.
Variable continua si los datos corresponden a respuestas numéricas
que surgen de un proceso de medición.
E) ENCUESTAS POR MUESTREO
Para realizar una encuesta por muestreo previamente se debe
determinar con precisión que información se necesita obtener, es decir
establecer claramente los objetivos de la investigación, y
posteriormente se requiere planificar y ejecutar una serie de
actividades para lograr el éxito deseado.
Las principales tareas son: definir cuidadosamente la población,
establecer el o los marcos de muestreo de manera que la lista de
unidades muestrales y la población concuerden lo mejor posible,
8
seleccionar el diseño de muestreo y el método de entrevista, elaborar
el cuestionario, capacitar a los encuestadores y supervisores, realizar
una prueba piloto, organizar el trabajo de campo, sistematizar el
manejo, validación y análisis de los datos y finalmente calcular las
estimaciones para obtener la información requerida.
El cuestionario es un instrumento que contiene varias preguntas que
trata sobre una diversidad de fenómenos o características de una
población, denominadas variables aleatorias.
Una muestra de probabilidad o aleatoria, es aquella en la que los
elementos de la muestra se eligen sobre la base de probabilidades
conocidas.
La única forma de que hagamos inferencias estadísticas correctas de
una muestra a una población, es mediante el uso de una muestra de
probabilidad.
Los cuatro diseños o tipos de muestras probabilísticas de uso común
son: la muestra aleatoria simple, la muestra sistemática, la muestra
estratificada y la muestra de agrupación o conglomerados; un análisis
detallado de estos procedimientos de muestreo pueden encontrarse en
libros sobre investigación por muestreo (en inglés: Sample Survey).
F) MUESTREO ALEATORIO SIMPLE
En una muestra aleatoria simple cada individuo o elemento tiene la
misma oportunidad de selección que cualquier otro, y la selección de
un elemento en particular no afecta la probabilidad de que se elija
cualquier otro.
Una muestra aleatoria simple también puede interpretarse como
aquella en la que cada posible muestra extraída (de determinado
tamaño) tiene la misma probabilidad de selección que cualquier otra
muestra que se pueda extraer (de ese mismo tamaño).
Por tanto el marco de población es sencillamente una lista
9
(numerada) de todas las unidades de muestreo. Se denomina marco
de lista de la población si cada unidad de muestreo contiene un solo
elemento de la población, en este caso la numeración va desde uno (1)
hasta el tamaño de la población (N).
Numerados los elementos del marco de lista de la población, se
obtiene la muestra aleatoria seleccionando aquellos miembros cuyos
códigos concuerden con los dígitos extraídos de la urna.
Por ejemplo, si deseamos una muestra, de n=50 elementos distintos,
seleccionada de una población de N=782 elementos, se formarán por
lo menos cincuenta números de tres dígitos (pues se eliminan los
números repetidos y no se toman en cuenta los mayores a 782 y el
000) hasta completar los cincuenta requeridos.
G) EVALUACION DE UNA ENCUESTA POR
MUESTREO
Una buena investigación por muestreo requiere tener los objetivos
claros, una apropiada planificación y una buena ejecución de todas las
actividades programadas.
Es de fundamental importancia realizar una encuesta piloto, con una
muestra muy reducida, con la finalidad de probar el cuestionario y
todos los instrumentos que se utilizarán en los diversas etapas, de
modo que se corrijan los errores y se puedan evaluar los procesos y
sus costos.
Para una buena recolección de datos se debe adiestrar a los
encuestadores sobre las definiciones operacionales de la encuesta, es
decir sobre el significado de cada variable, de modo que no existan
ambigüedades en las preguntas correspondientes; se requiere además
organizar detalladamente el trabajo de campo, estableciendo
claramente las obligaciones del personal y las líneas de autoridad.
Son extremadamente importantes también las actividades de
codificación, validación y análisis de datos, puesto que se deben
10
examinar las respuestas buscando su integridad y posibles errores
para corregirlos.
Para valorar una investigación por muestreo hay que verificar si se
han considerado estas recomendaciones y realizado eficientemente
todas las actividades antes mencionadas.
Es claro que hay una proliferación de investigaciones de encuestas de
opinión, pero no toda investigación es buena, significativa o
importante.
Es esencial que aprendamos a evaluar críticamente lo que leemos o
escuchamos y que descartemos las encuestas que carezcan de
objetividad y credibilidad.
El primer paso para evaluar una encuesta es determinar si se basó en
una muestra de probabilidad o en una no probabilística; puesto que la
única forma de que hagamos inferencias estadísticas correctas es a
través del uso de una muestra aleatoria.
H) CLASIFICACION ORDENADA DE LOS DATOS.
Cuando se elabora un conjunto de datos, las observaciones numéricas
no tienen ningún orden o secuencia particular ni tampoco se
encuentran agrupados por similares cualidades o características.
Al crecer el número de observaciones, se hace más difícil observar las
principales características del conjunto de datos, se requiere entonces
organizar las observaciones, de tal manera que entendamos mejor la
información que contienen los datos, para lograrlo se han desarrollado
diversos métodos, algunos fundamentados en gráficos y diagramas,
otros en ciertas medidas numéricas, y varias técnicas fundamentadas
en diferentes tipos de análisis matemáticos.
Ejemplo 1: los siguientes datos corresponden al número (aproximado
y en miles) de Unidades de Producción Agropecuarias (UPAs) de
cada provincia del país (resultados del Censo Nacional Agropecuario
11
CNA del año 2000)
Tabla 1
Prov Azua Boli Caña Carc Coto Chim ElOr Esme Gala Guay Imba
UPAs 99 39 32 13 68 82 22 16 1 65 34
Loja LoRi Mana
Mo
Sa Napo Orel Past Pich Sucu Tung ZaCh ZNAs
66 42 75 17 5 6 5 64 8 71 9 4
La clasificación ordenada de estos datos es la siguiente:
Tabla 2
Prov Gala ZNAs Napo Past Orel Sucu ZaCh Carc Esme
Mo
Sa ElOr
UPAs 1 4 5 5 6 8 9 13 16 17 22
Caña Imba Boli LoRi Pich Guay Loja Coto Tung Mana Chim Azua
32 34 39 42 64 65 66 68 71 75 82 99
De esta tabla se puede determinar inmediatamente algunas
características, como por ejemplo: la provincia que menos UPAs tiene
es Galápagos (aproximadamente un mil), la que tiene mayor cantidad
es Azuay (con alrededor de 99 mil); la provincia que corresponde a la
mediana es Cañar con 32 mil UPAs.
Ejercicio 1: Realizar la clasificación ordenada de los datos
correspondientes al número (aproximado y en miles) de habitantes de
cada provincia del país (resultados del Censo Nacional de Población y
Vivienda del año 2001)
Tabla 3
Prov Azua Boli Caña Carc Coto Chim ElOr Esme Gala Guay Imba
UPAs 600 169 207 153 350 404 526 385 19 3309 344
Loja LoRi Mana
Mo
Sa Napo Orel Past Pich Sucu Tung ZaCh ZNAs
12
405 650 1186 115 79 86 62 2389 129 441 77 73
La mejor manera de examinar datos es presentarlos en forma de
resumen construyendo tablas y diagramas apropiados, de manera que
podamos extraer las características más importantes de los datos.
I) CARACTERÍSTICAS DE LOS DATOS
Las tres principales características que dan la posición relativa del
conjunto de datos son: la localización o tendencia central, la
dispersión y la simetría.
Tendencia central o localización: es una cantidad cerca de la cual se
encuentran los valores del conjunto de datos, se la mide mediante un
valor junto al cual se agrupa la mayoría de las observaciones. Una
medida de tendencia central es, por ejemplo, la media o promedio de
los datos.
J) DIAGRAMAS Y GRÁFICOS
Puesto que la tabla o matriz de los datos no muestra las cualidades de
los datos, se usan representaciones gráficas que ayudan a captar
tendencias, apreciar características y establecer modelos
probabilísticos de comportamiento global.
En general un diagrama o un gráfico, en donde están representados los
datos, sirve para resumir el conjunto de las observaciones y advertir
sus carácterísticas de localización, de dispersión , de simetría y la
presencia de valores atípicos.
Los diagramas y gráficos que comúnmente son utilizados, para
organizar las observaciones de modo que entendamos mejor la
información que contienen y apreciemos sus características, se
13
presentan a continuación:
Diagrama de puntos: cada observación se representa mediante un
punto sobre la recta numérica.
GRAFICO 1
Ejercicio 4: hacer el diagrama de puntos de los datos del ejercicio 1.
Diagrama de tallo y hojas: a los datos se los clasifica considerando,
por ejemplo, las unidades, o las decenas, o las centenas, etc., estas
forman el tallo y se las coloca verticalmente, a continuación se coloca
los siguientes dígitos para cada observación a la derecha de la barra
vertical, estos valores vienen a constituir las hojas, y así se van
añadiendo todas las observaciones; pueden realizarse variantes (por
ejemplo distinguiendo las cifras altas y las bajas).
Un diagrama de tallo y hojas con los datos correspondientes al
número de UPAs (ejemplo 1) sería el siguiente:
9 9
8 2
7 1 / 5
6 4 / 5 / 6 / 8
4 2
3 2 / 4 / 9
2 2
1 3 / 6 / 7
0 1 / 4 / 5 / 5 / 6 / 8 / 9
Ejercicio 5: Hacer al menos un diagrama (adicional) de tallo y hojas
con los datos del ejemplo 1, y dos diagramas con los datos del
ejercicio 1.
14
Representación de puntos del ejemplo 1
0 20 40 60 80 100
Gráfico de pastel: es una forma de resumir un conjunto de datos
categóricos. Es un círculo dividido en segmentos, donde el área de
cada uno de los segmentos es proporcional al número de casos en la
categoría correspondiente.
Tabla 4
Población Nacional Categorías
Total Urbana Rural
Número de habitantes 12156 7431 4725
GRAFICO 2
Ejercicio 6: Hacer el gráfico de pastel con los respectivos porcentajes
15
Población Nacional Por Categorías de Area
Urbana
61.1%
Rural
38.9%
Urbana
Rural
de los siguientes datos del Censo de Población (2001):
(a) Población nacional (número de habitantes) por (categorías
correspondientes al) sexo (hombre/mujer).
(b) Población de la provincia de Pichincha por sexo.
(c) Población de la provincia de Guayas por área.
(d) Unidades de Producción Agropecuarias (UPAs) por categorías de
tenencia de la tierra (referirse a los resultados del CNA 2000)
(e) Población (nacional mayor a diez años) de analfabetos por
categorías quinquenales de edad.
(f) Población de analfabetos por categorías provinciales.
(g) Población (nacional masculina mayor a diez años) de analfabetos
por categorías quinquenales de edad (respectivamente femenina)
(h) Población de hombres analfabetos por categorías provinciales
(respectivamente de mujeres).
(i) Población nacional mayor a doce años por categorías de estado
civil.
La representación de pastel se suele usar también con cantidades si se
han agregado las mismas en las correspondientes categorías (ver
ejercicio 9).
Se puede también usar el gráfico de pastel con datos numéricos si
previamente se ha creado una tabla de frecuencias (es decir se han
clasificado las observaciones en grupos o clases dados por una
partición en subintervalos) pero en este caso se usa generalmente el
gráfico de barras denominado histograma.
Gráfico de barras: los datos categóricos se exhiben mediante un
número de rectángulos, del mismo ancho, cada uno de los cuales
representa una categoría particular.
16
La longitud (y por lo tanto el área) de cada rectángulo es proporcional
al número de casos en la categoría que representa.
Ejemplo 3: considerar los datos, de la población nacional por grupos
de edad quinquenales, que se presentan a continuación:
Tabla 5
Grupos
Edad
0 a 4 5 a 9 10 a 14 15 a 19 20 a 24 25 a 29
N°
habitantes
1337 1362 1341 1241 1169 947
30 a 34 35 a 39 40 a 44 45 a 49 50 a 54 55 a 59 60 a 64
863 775 674 539 463 339 294
65 a 69 70 a 74 75 a 79 80 a 84 85 a 89 90 a 94 95 y más
244 195 143 97 63 39 32
GRAFICO 3
Ejercicio 8: realizar el gráfico de barras con los datos del ejemplo 2.
Ejercicio 9: hacer el gráfico de pastel, y el de barras, de los siguientes
datos, que corresponden a la superficie (área) nacional según el uso
del suelo (resultados del CNA 2000)
Tabla 6
17
Número de habitantes por grupos de edad
0 200 400 600 800 1000 1200 1400 1600
0 a 4 años
10 a 14 años
20 a 24 años
30 a 34 años
40 a 44 años
50 a 54 años
60 a 64 años
70 a 74 años
80 a 84 años
90 a 94 años
N° habitantes
Uso del suelo (en miles de hectáreas)
Categ. Cultiv.
Perma.
Cultiv.
Trans.
Descan. Pastos Pasto
s
Páramo Montes Otro
y
Barbe.
Cultiv. Natur
.
y
Bosques
Usos
Super
.
1363 1232 381 3357 1130 600 3881 411
Ejemplo 4: los siguientes datos corresponden al número (aproximado
y en miles) de Unidades de Producción Agropecuarias (UPAs) según
su condición jurídica (de acuerdo al CNA 2000)
Tabla 7
CONDICION JURIDICA
Cate- Persona Soc.Hecho
sin
Soc. Institución Otras
goría Individual Contrato
Legal
Legal Pública Condiciones
UPAs 577 56 10 9 13
K) DISTRIBUCIÓN DE FRECUENCIAS E
HISTOGRAMAS
Para crear la tabla de frecuencias con datos categóricos se cuenta el
número de veces en la que aparece cada dato, es decir se calcula el
número de elementos de cada una de las categorías.
Si los datos son numéricos se tiene que crear una partición del
intervalo que contiene a todos los valores, es decir dividirlo en grupos
de subintervalos, y se cuentan cuantos elementos están en cada clase.
Se determina el número de grupos dependiendo del número de
observaciones, por ejemplo: si tenemos menos de 20 observaciones se
seleccionar 4 clases, de 20 a 50 observaciones se toman 5 clases, de
18
50 a 100 observaciones se escogen 6 clases, de 100 a 200
observaciones se suele elegir 7 clases, de 200 a 500 observaciones
usualmente se seleccionan 8 clases, y más de 500 observaciones se
eligen 9 clases o más (en función del número de datos).
En el caso de datos numéricos, la longitud de cada clase
(subintervalo) es igual a la extensión o rango de los datos dividido
para el número de clases.
Para cada observación se determina a que clase pertenece para
calcular la frecuencia absoluta de cada clase.
GRAFICO 4
L) MEDIDAS DE LOCALIZACIÓN O TENDENCIA
CENTRAL
Una medida de localización es un valor en torno al cual se
agrupan la mayoría de datos, es una característica de tendencia
central de las observaciones, las más empleadas son: el promedio o
media muestral, la mediana, la moda y la media simétricamente
segada.
Promedio o media muestral (m): es igual a la suma de los valores de
las observaciones dividida para el número total de datos (n). Se le
denomina m o también x−
(x techo).
19
Histograma del ejemplo 1: Provincias por cantidad de UPAs
11
4 5
3
0
5
10
15
De 1 a < 25.5 De 25.5 a <50 De 50 a <74.5 De 74.5 a 99
UPAs (en miles)
Provincias
m = ( Σ xi ) / n
Mediana (Q2): es el valor que se encuentra en el punto medio, cuando
se ordenan los valores de menor a mayor, se la denota Q2. Si n=2p+1
(impar) entonces Q2=xp+1; y si n=2p (par) entonces Q2=(xp+xp+1)/2
Moda (Mo): es aquel valor que tiene la mayor frecuencia absoluta, se
la representa por Mo.
Si los datos están dispuestos en una tabla de frecuencias agrupados en
clases (subintervalos) aquella que tiene la mayor frecuencia se
denominará clase modal y puede asumirse que, de manera
aproximada, la moda es su punto medio.
Media simétricamente segada al 10%: es igual al promedio de las
observaciones que quedan luego de eliminar el 5% de las que tienen
los valores más bajos y el 5% de las que tienen los valores más altos.
Observemos que si cada dato xi está con su respectiva frecuencia ni ;
la media (el promedio) se puede calcular evidentemente mediante la
expresión:
m = ( Σ ni xi ) / n
Cuando los datos están dispuestos en una tabla de frecuencias
agrupados en clases, se puede calcular el valor aproximado de la
media o la media segada considerando la suma de los productos de los
valores medios de las clases por su frecuencia y dividiendo como
siempre para el número de observaciones, es decir usando la
expresión anterior con xi igual al punto medio de clase i (o sea: xi =
(li+si)/2 donde li y si son respectivamente los límites inferior y
superior de la clase i).
Ejemplo 5: Usando los datos del censo de población, determinar el
promedio del número de hijos vivos que tienen las madres
ecuatorianas. De acuerdo con el cuadro N. 53, se tiene la siguiente
tabla de frecuencias por número de hijos:
Tabla 8
Número de 0 1 2 3 4 5 6 7 8 9 10 y
20
hijos vivos mas
Número de
madres
9 60
0
63
7
53
4
34
6
23
7
17
3
12
2
90 60 74
Asumiendo que en la última categoría las 74 madres tienen en
promedio 11 hijos, se puede obtener que el valor aproximado de la
media es:
(0x9+1x600+. . .+9x60+11x74)/(9+600+. . .+60+74)=3,4736
(hijos/madre)
El promedio exacto de acuerdo al censo es de 3,2753 .
Ejercicio 10: Revisar los ejemplos del texto de Galindo relacionados
con las medidas de localización (tendencia central).
M) MEDIDAS DE DISPERSIÓN
La desviación estándar o típica (denominada s): es igual a la raíz
cuadrada de la suma de los cuadrados de las diferencias entre cada
valor de los datos y su media, dividida para el número de datos menos
uno; se la denomina s, es siempre un valor positivo, y su unidad de
medida es la misma que corresponde a los datos originales.
s = ( ( Σ (xi - m)2
/(n-1) )½
N) DIAGRAMA DE CAJA
El diagrama de caja es una herramienta que describe en un mismo
gráfico algunas características de localización, de dispersión, y los
valores atípicos, al representar la mediana, los cuartiles, el rango
intercuartil y el rango de las observaciones; para su construcción se
procede de la siguiente manera:
21
a) Sobre una línea horizontal se localizan la mediana, los
cuartiles inferior y superior y los datos mínimos y
máximo.
b) Se hace una caja angosta que una a Q1 y Q3, a
continuación se divide esta caja en dos mediante una línea
que pase por Q2.
c) Finalmente se trazan dos rectas, una para cada extremo
de la caja, en los valores: Q1 – 1,5 RIQ ; y , Q3 + 1,5
RIQ.
Q1-1,5RIQ Q1 Q2 Q3
Q3+1,5RIQ
Los datos que caen fuera de estas dos vallas (dadas por las dos rectas
trazadas) se consideran como valores atípicos.
O) TABLA DE CONTINGENCIA
Consideremos ahora un esquema de doble clasificación, por ejemplo
las personas o habitantes del país se pueden agrupar entre los que
viven en el área urbana y los que viven en el área rural, y dentro de
estos dos grupos se los puede clasificar respecto al sexo (es decir en
hombres y mujeres).
Ejemplo 6: de acuerdo a los resultados del censo de población del año
2001 tenemos la siguiente clasificación doble:
Tabla 9
POBLACION Hombres Mujeres Total
Urbana 3.625.96
2
3.805.39
3
7.431.355
Rural 2.392.39 2.332.86 4.725.253
22
1 2
Total 6.018.35
3
6.138.25
5
12.156.608
La clasificación de datos categóricos de acuerdo con dos variables
(X,Y) se denomina cuadro de contingencia, es en definitiva una tabla
de frecuencias (absolutas o relativas) donde una variable se representa
en las filas y la otra en las columnas; se cuentan los individuos que
tienen los valores indicados en las filas y en las columnas.
Se puede encontrar también la frecuencia relativa de la clase (i,j) que
es igual al cociente: fi,j = ni,j / n (donde n es el numero total de
individuos) y proporcionan la distribución empírica conjunta de las
dos variables, y dan una estimación de las probabilidades pij de que
un individuo pertenezca a la categoría conjunta (i,j), es decir a la
categoría i en la variable X y a la categoría j en Y.
En el ejemplo que estamos tratando, la tabla de frecuencias relativas
es:
Tabla 10
POBLACION Hombres Mujeres Total
Urbana 29,8% 31.3% 61,1%
Rural 19,7% 19,2% 38.9%
Total 49,5% 50,5% 100,0%
Propiedades: La sumatoria de todos los valores ni,j (para i desde 1
hasta p, y j desde 1 hasta q) es igual al total de individuos n.
La sumatoria de todos los valores fi,j (para i desde 1 hasta p, y j desde
1 hasta q) es igual a 1.
Distribuciones marginales: En la tabla de contingencia se suelen
incluir los totales de las filas y los totales de las columnas, es decir se
calcula:
ni. = sumatorio en j de los ni,j (para cada categoría i=1,2,...,p)
23
El valor de ni. es la frecuencia absoluta de la primera variable, para la
categoría i, y las frecuencias relativas marginales fi. = ni./n dan la
distribución empírica de la primera variable (X).
De manera similar, para la segunda variable (Y), se incluye una fila
con los valores: n.j que representan sus frecuencias absolutas.
Análogamente las frecuencias relativas f.j = n.j/n proporcionan la
distribución empírica de la segunda variable Y, y da una estimación
de la probabilidad pj de que un individuo pertenezca a la categoría j.
P) REGRESIÓN LINEAL SIMPLE
En algunas aplicaciones se requiere establecer relaciones entre dos
variables; la regresión lineal simple sirve para determinar una relación
lineal entre dos variables: X=(x1,x2,...,xn) y Y=(y1,y2,...,yn).
El modelo determinista plantea: Y = b0 + b1 X
El modelo probabilista (o aleatorio) considera:
Y = b0 + b1 X + e ; donde e es una componente aleatoria del error.
Como sabemos b0 es la ordenada al origen; y, b1 es la pendiente de
la recta; los mismos que se obtienen, usando el método de los mínimos
cuadrados, mediante las siguientes fórmulas:
b1 = SCXY / SCXX ;
Donde: SCXX = Σi (xi – mx)2; y , SCXY = Σi (xi – mx)(yi-my) .
b0 = my – b1 mx
2) Bibliografía:
Berenson M., Levine D., Estadística Básica en Administración,
Prentice Hall Hispanoamericana S. A., México, 1996.
24
Freund J. y Simon G., Estadística elemental, Prentice Hall,
México, 1994.
Galindo E., Estadística para la Administración y la Ingeniería,
Gráficas Mediavilla Hnos., Quito, 1999.
3) LINCOGRAFIA
www.math.epn.edu.ec/IX_memorias/docs/Araujo/Araujo.doc
25

Mais conteúdo relacionado

Mais procurados

Estadística y medidas de tendencia central internet
Estadística y medidas de tendencia central internetEstadística y medidas de tendencia central internet
Estadística y medidas de tendencia central internetkyopilar
 
Organización de datos
Organización de datosOrganización de datos
Organización de datosneurofuzzy
 
Estadística generalidades
Estadística generalidadesEstadística generalidades
Estadística generalidadesinnovalabcun
 
Modulo de estadistica i
Modulo de estadistica iModulo de estadistica i
Modulo de estadistica iVihu DEC
 
APUNTES DE ESTADISTICA DESCRIPTIVA
APUNTES DE ESTADISTICA DESCRIPTIVAAPUNTES DE ESTADISTICA DESCRIPTIVA
APUNTES DE ESTADISTICA DESCRIPTIVAWILSON VELASTEGUI
 
Conceptos de programacion y estadistica 11 5 (2)
Conceptos de programacion y estadistica 11 5  (2)Conceptos de programacion y estadistica 11 5  (2)
Conceptos de programacion y estadistica 11 5 (2)NataliaGarcia721165
 
Primer trabajo tecnologia 2021
Primer trabajo tecnologia 2021Primer trabajo tecnologia 2021
Primer trabajo tecnologia 2021marianapalacio13
 
Introduccion a la estadistica
Introduccion a la estadisticaIntroduccion a la estadistica
Introduccion a la estadisticawcartaya
 
Conceptos de programación y métodos estadísticos
Conceptos de programación y métodos estadísticos Conceptos de programación y métodos estadísticos
Conceptos de programación y métodos estadísticos MarthaTorres3612
 
Organización de datos estadísticos
Organización de datos  estadísticos Organización de datos  estadísticos
Organización de datos estadísticos leonelgranado
 
ESTADISTICA_FLORESSUAREZ_INVESTIGACION_MAEADMON_ZITACUARO.pdf
ESTADISTICA_FLORESSUAREZ_INVESTIGACION_MAEADMON_ZITACUARO.pdfESTADISTICA_FLORESSUAREZ_INVESTIGACION_MAEADMON_ZITACUARO.pdf
ESTADISTICA_FLORESSUAREZ_INVESTIGACION_MAEADMON_ZITACUARO.pdfAleeFlores6
 
1.acuerdo pedagogico
1.acuerdo pedagogico1.acuerdo pedagogico
1.acuerdo pedagogicojeaqueline
 
Manual spss sexto noche tatiana
Manual spss sexto noche tatianaManual spss sexto noche tatiana
Manual spss sexto noche tatianaTatiizz RG
 

Mais procurados (20)

Estadística y medidas de tendencia central internet
Estadística y medidas de tendencia central internetEstadística y medidas de tendencia central internet
Estadística y medidas de tendencia central internet
 
Manual spss 6 to noche (reparado)
Manual spss 6 to noche (reparado)Manual spss 6 to noche (reparado)
Manual spss 6 to noche (reparado)
 
Organización de datos
Organización de datosOrganización de datos
Organización de datos
 
Estadística generalidades
Estadística generalidadesEstadística generalidades
Estadística generalidades
 
Estadistica 2009
Estadistica 2009Estadistica 2009
Estadistica 2009
 
Modulo de estadistica i
Modulo de estadistica iModulo de estadistica i
Modulo de estadistica i
 
APUNTES DE ESTADISTICA DESCRIPTIVA
APUNTES DE ESTADISTICA DESCRIPTIVAAPUNTES DE ESTADISTICA DESCRIPTIVA
APUNTES DE ESTADISTICA DESCRIPTIVA
 
Uso prob unidad_i teoria
Uso prob unidad_i teoriaUso prob unidad_i teoria
Uso prob unidad_i teoria
 
Estadistica I 01
Estadistica  I 01Estadistica  I 01
Estadistica I 01
 
Conceptos de programacion y estadistica 11 5 (2)
Conceptos de programacion y estadistica 11 5  (2)Conceptos de programacion y estadistica 11 5  (2)
Conceptos de programacion y estadistica 11 5 (2)
 
Primer trabajo tecnologia 2021
Primer trabajo tecnologia 2021Primer trabajo tecnologia 2021
Primer trabajo tecnologia 2021
 
Estadistica
EstadisticaEstadistica
Estadistica
 
Introduccion a la estadistica
Introduccion a la estadisticaIntroduccion a la estadistica
Introduccion a la estadistica
 
Conceptos de programación y métodos estadísticos
Conceptos de programación y métodos estadísticos Conceptos de programación y métodos estadísticos
Conceptos de programación y métodos estadísticos
 
Estadística 1
Estadística                                                         1Estadística                                                         1
Estadística 1
 
Organización de datos estadísticos
Organización de datos  estadísticos Organización de datos  estadísticos
Organización de datos estadísticos
 
ESTADISTICA_FLORESSUAREZ_INVESTIGACION_MAEADMON_ZITACUARO.pdf
ESTADISTICA_FLORESSUAREZ_INVESTIGACION_MAEADMON_ZITACUARO.pdfESTADISTICA_FLORESSUAREZ_INVESTIGACION_MAEADMON_ZITACUARO.pdf
ESTADISTICA_FLORESSUAREZ_INVESTIGACION_MAEADMON_ZITACUARO.pdf
 
Módulo de estadística
Módulo de estadísticaMódulo de estadística
Módulo de estadística
 
1.acuerdo pedagogico
1.acuerdo pedagogico1.acuerdo pedagogico
1.acuerdo pedagogico
 
Manual spss sexto noche tatiana
Manual spss sexto noche tatianaManual spss sexto noche tatiana
Manual spss sexto noche tatiana
 

Destaque

Folclore e sua cultura
Folclore e sua culturaFolclore e sua cultura
Folclore e sua culturaAndrea Lemos
 
1 primeiros socorros
1   primeiros socorros1   primeiros socorros
1 primeiros socorrosLeila Neves
 
Treinamento sinalização de segurança
Treinamento sinalização de segurançaTreinamento sinalização de segurança
Treinamento sinalização de segurançaAne Costa
 
Cafferata nores, jose la prueba en el proceso penal
Cafferata nores, jose   la prueba en el proceso penalCafferata nores, jose   la prueba en el proceso penal
Cafferata nores, jose la prueba en el proceso penalSita_carol
 
Modulo 3 Cómo enfrentar situaciones de catástrofe y la gestión del riesgo
Modulo 3 Cómo enfrentar situaciones de catástrofe y la gestión del riesgoModulo 3 Cómo enfrentar situaciones de catástrofe y la gestión del riesgo
Modulo 3 Cómo enfrentar situaciones de catástrofe y la gestión del riesgoAcademia Telecentros Chile
 
Modulo 3 Gestión del Riesgo y Recomendaciones
Modulo 3 Gestión del Riesgo y RecomendacionesModulo 3 Gestión del Riesgo y Recomendaciones
Modulo 3 Gestión del Riesgo y RecomendacionesAcademia Telecentros Chile
 
Preguntas-y-respuestas-neurologia-
 Preguntas-y-respuestas-neurologia- Preguntas-y-respuestas-neurologia-
Preguntas-y-respuestas-neurologia-Matias Rojas
 
Diseño y gestión del canal de distribución
Diseño y gestión del canal de distribuciónDiseño y gestión del canal de distribución
Diseño y gestión del canal de distribuciónNombre Apellidos
 
Modulo 3 Cómo enfrentar situaciones de catástrofe y recomendaciones
Modulo 3 Cómo enfrentar situaciones de catástrofe y recomendacionesModulo 3 Cómo enfrentar situaciones de catástrofe y recomendaciones
Modulo 3 Cómo enfrentar situaciones de catástrofe y recomendacionesAcademia Telecentros Chile
 
Clasificación de instituciones de salud
Clasificación de instituciones de saludClasificación de instituciones de salud
Clasificación de instituciones de saludMayte Mtz
 
Frontera de posibilidades de producción (copia conflictiva de jhon jamer nara...
Frontera de posibilidades de producción (copia conflictiva de jhon jamer nara...Frontera de posibilidades de producción (copia conflictiva de jhon jamer nara...
Frontera de posibilidades de producción (copia conflictiva de jhon jamer nara...Daniel Garcia
 
Cuadro comparativo
Cuadro comparativoCuadro comparativo
Cuadro comparativoRita Cesar
 
Teoria general del derecho
Teoria general del derechoTeoria general del derecho
Teoria general del derechoMaestros Online
 
Regimen Academico Y Disciplinario
Regimen Academico Y DisciplinarioRegimen Academico Y Disciplinario
Regimen Academico Y DisciplinarioUniversidad FESU
 

Destaque (20)

Folclore e sua cultura
Folclore e sua culturaFolclore e sua cultura
Folclore e sua cultura
 
1 primeiros socorros
1   primeiros socorros1   primeiros socorros
1 primeiros socorros
 
Treinamento sinalização de segurança
Treinamento sinalização de segurançaTreinamento sinalização de segurança
Treinamento sinalização de segurança
 
Cafferata nores, jose la prueba en el proceso penal
Cafferata nores, jose   la prueba en el proceso penalCafferata nores, jose   la prueba en el proceso penal
Cafferata nores, jose la prueba en el proceso penal
 
Modulo 3 Cómo enfrentar situaciones de catástrofe y la gestión del riesgo
Modulo 3 Cómo enfrentar situaciones de catástrofe y la gestión del riesgoModulo 3 Cómo enfrentar situaciones de catástrofe y la gestión del riesgo
Modulo 3 Cómo enfrentar situaciones de catástrofe y la gestión del riesgo
 
Derecho alimentario en el peru
Derecho alimentario en el peruDerecho alimentario en el peru
Derecho alimentario en el peru
 
Ejemplos de entidad relacion
Ejemplos de entidad relacionEjemplos de entidad relacion
Ejemplos de entidad relacion
 
Un genie dit au revoir jl
Un genie dit au revoir jlUn genie dit au revoir jl
Un genie dit au revoir jl
 
Modulo 3 Gestión del Riesgo y Recomendaciones
Modulo 3 Gestión del Riesgo y RecomendacionesModulo 3 Gestión del Riesgo y Recomendaciones
Modulo 3 Gestión del Riesgo y Recomendaciones
 
Preguntas-y-respuestas-neurologia-
 Preguntas-y-respuestas-neurologia- Preguntas-y-respuestas-neurologia-
Preguntas-y-respuestas-neurologia-
 
Diseño y gestión del canal de distribución
Diseño y gestión del canal de distribuciónDiseño y gestión del canal de distribución
Diseño y gestión del canal de distribución
 
Ucd火花集
Ucd火花集Ucd火花集
Ucd火花集
 
Ucd火花集
Ucd火花集Ucd火花集
Ucd火花集
 
Modulo 3 Cómo enfrentar situaciones de catástrofe y recomendaciones
Modulo 3 Cómo enfrentar situaciones de catástrofe y recomendacionesModulo 3 Cómo enfrentar situaciones de catástrofe y recomendaciones
Modulo 3 Cómo enfrentar situaciones de catástrofe y recomendaciones
 
Letra de cambio
Letra de cambio Letra de cambio
Letra de cambio
 
Clasificación de instituciones de salud
Clasificación de instituciones de saludClasificación de instituciones de salud
Clasificación de instituciones de salud
 
Frontera de posibilidades de producción (copia conflictiva de jhon jamer nara...
Frontera de posibilidades de producción (copia conflictiva de jhon jamer nara...Frontera de posibilidades de producción (copia conflictiva de jhon jamer nara...
Frontera de posibilidades de producción (copia conflictiva de jhon jamer nara...
 
Cuadro comparativo
Cuadro comparativoCuadro comparativo
Cuadro comparativo
 
Teoria general del derecho
Teoria general del derechoTeoria general del derecho
Teoria general del derecho
 
Regimen Academico Y Disciplinario
Regimen Academico Y DisciplinarioRegimen Academico Y Disciplinario
Regimen Academico Y Disciplinario
 

Semelhante a Estadística en Educación: Tipos de Tablas, Gráficos y Análisis de Datos

Guia del curso estadistica
Guia del curso  estadisticaGuia del curso  estadistica
Guia del curso estadisticaEdith Llanos
 
Estadistica Conceptos Basicos
Estadistica  Conceptos BasicosEstadistica  Conceptos Basicos
Estadistica Conceptos Basicoscarl_moron
 
Coceptos de programacion , metodos, estadistico
Coceptos de programacion , metodos, estadisticoCoceptos de programacion , metodos, estadistico
Coceptos de programacion , metodos, estadisticoanamaramirez19
 
Metodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuenciasMetodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuenciasDanielaSanchez255
 
Métodos estadísticos y distribución de frecuencias
Métodos estadísticos y distribución de frecuenciasMétodos estadísticos y distribución de frecuencias
Métodos estadísticos y distribución de frecuenciassofiarosero5
 
Metodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuenciasMetodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuenciasCata2004
 
Métodos estadísticos y distribución de frecuencias
Métodos estadísticos y distribución de frecuenciasMétodos estadísticos y distribución de frecuencias
Métodos estadísticos y distribución de frecuenciassantiagozuluaga31
 
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdfEXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdfYulianRenteria1
 
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdfEXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdfJuanesViedaEscobar
 
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdfEXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdfIsabella186538
 
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdfEXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdflunarestrepo3
 
Trabajo de tecnologia
Trabajo de tecnologia Trabajo de tecnologia
Trabajo de tecnologia Arnold Riascos
 
Presentación estadística
Presentación estadísticaPresentación estadística
Presentación estadísticaerickkk10998
 
Presentación estadística
Presentación estadísticaPresentación estadística
Presentación estadísticalauriz19
 

Semelhante a Estadística en Educación: Tipos de Tablas, Gráficos y Análisis de Datos (20)

Guia del curso estadistica
Guia del curso  estadisticaGuia del curso  estadistica
Guia del curso estadistica
 
Estadística descriptiva
Estadística descriptivaEstadística descriptiva
Estadística descriptiva
 
Estadistica Conceptos Basicos
Estadistica  Conceptos BasicosEstadistica  Conceptos Basicos
Estadistica Conceptos Basicos
 
Coceptos de programacion , metodos, estadistico
Coceptos de programacion , metodos, estadisticoCoceptos de programacion , metodos, estadistico
Coceptos de programacion , metodos, estadistico
 
Metodos estaditicos
Metodos estaditicosMetodos estaditicos
Metodos estaditicos
 
Metodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuenciasMetodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuencias
 
Métodos estadísticos y distribución de frecuencias
Métodos estadísticos y distribución de frecuenciasMétodos estadísticos y distribución de frecuencias
Métodos estadísticos y distribución de frecuencias
 
Estadisticas descriptiva
Estadisticas descriptivaEstadisticas descriptiva
Estadisticas descriptiva
 
Metodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuenciasMetodos estadisticos y distribucion de frecuencias
Metodos estadisticos y distribucion de frecuencias
 
Métodos estadísticos y distribución de frecuencias
Métodos estadísticos y distribución de frecuenciasMétodos estadísticos y distribución de frecuencias
Métodos estadísticos y distribución de frecuencias
 
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdfEXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
 
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdfEXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
 
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdfEXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
 
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdfEXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
 
Taller 2
Taller 2Taller 2
Taller 2
 
Trabajo de tecnologia
Trabajo de tecnologiaTrabajo de tecnologia
Trabajo de tecnologia
 
Trabajo de tecnologia
Trabajo de tecnologia Trabajo de tecnologia
Trabajo de tecnologia
 
Trabajo de tecnologia_1
Trabajo de tecnologia_1Trabajo de tecnologia_1
Trabajo de tecnologia_1
 
Presentación estadística
Presentación estadísticaPresentación estadística
Presentación estadística
 
Presentación estadística
Presentación estadísticaPresentación estadística
Presentación estadística
 

Último

Los Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la SostenibilidadLos Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la SostenibilidadJonathanCovena1
 
PPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdfPPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdfEDILIAGAMBOA
 
libro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación iniciallibro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación inicialLorenaSanchez350426
 
Día de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialDía de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialpatriciaines1993
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfManuel Molina
 
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxPresentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxYeseniaRivera50
 
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdfOswaldoGonzalezCruz
 
Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Angélica Soledad Vega Ramírez
 
DETALLES EN EL DISEÑO DE INTERIOR
DETALLES EN EL DISEÑO DE INTERIORDETALLES EN EL DISEÑO DE INTERIOR
DETALLES EN EL DISEÑO DE INTERIORGonella
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOweislaco
 
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptxMonitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptxJUANCARLOSAPARCANARE
 
Manejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsaManejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsaLuis Minaya
 
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxLINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxdanalikcruz2000
 
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...fcastellanos3
 
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfFisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfcoloncopias5
 
c3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptxc3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptxMartín Ramírez
 
Técnicas de grabado y estampación : procesos y materiales
Técnicas de grabado y estampación : procesos y materialesTécnicas de grabado y estampación : procesos y materiales
Técnicas de grabado y estampación : procesos y materialesRaquel Martín Contreras
 

Último (20)

Los Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la SostenibilidadLos Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la Sostenibilidad
 
Sesión La luz brilla en la oscuridad.pdf
Sesión  La luz brilla en la oscuridad.pdfSesión  La luz brilla en la oscuridad.pdf
Sesión La luz brilla en la oscuridad.pdf
 
PPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdfPPT_Formación integral y educación CRESE (1).pdf
PPT_Formación integral y educación CRESE (1).pdf
 
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdfTema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
Tema 7.- E-COMMERCE SISTEMAS DE INFORMACION.pdf
 
libro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación iniciallibro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación inicial
 
Día de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundialDía de la Madre Tierra-1.pdf día mundial
Día de la Madre Tierra-1.pdf día mundial
 
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdfTarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
Tarea 5_ Foro _Selección de herramientas digitales_Manuel.pdf
 
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptxPresentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
Presentación de Estrategias de Enseñanza-Aprendizaje Virtual.pptx
 
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
5° SEM29 CRONOGRAMA PLANEACIÓN DOCENTE DARUKEL 23-24.pdf
 
Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...
 
DETALLES EN EL DISEÑO DE INTERIOR
DETALLES EN EL DISEÑO DE INTERIORDETALLES EN EL DISEÑO DE INTERIOR
DETALLES EN EL DISEÑO DE INTERIOR
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
 
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptxMonitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
Monitoreo a los coordinadores de las IIEE JEC_28.02.2024.vf.pptx
 
Manejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsaManejo del Dengue, generalidades, actualización marzo 2024 minsa
Manejo del Dengue, generalidades, actualización marzo 2024 minsa
 
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxLINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
 
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
Estas son las escuelas y colegios que tendrán modalidad no presencial este lu...
 
PPTX: La luz brilla en la oscuridad.pptx
PPTX: La luz brilla en la oscuridad.pptxPPTX: La luz brilla en la oscuridad.pptx
PPTX: La luz brilla en la oscuridad.pptx
 
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfFisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
 
c3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptxc3.hu3.p1.p3.El ser humano como ser histórico.pptx
c3.hu3.p1.p3.El ser humano como ser histórico.pptx
 
Técnicas de grabado y estampación : procesos y materiales
Técnicas de grabado y estampación : procesos y materialesTécnicas de grabado y estampación : procesos y materiales
Técnicas de grabado y estampación : procesos y materiales
 

Estadística en Educación: Tipos de Tablas, Gráficos y Análisis de Datos

  • 1. UNIVERSIDAD TECNICA DEL NORTE FACULTAD DE CIENCIAS ADMINISTRATIVAS Y ECONOMICAS INGENIERIA EN CONTABILIDAD Y AUDITORIA COMPUTACION I TIPOS DE ESTILOS DE TABLAS, GRAFICOS Y CONTENIDOS NOMBRE: DANIEL VILAÑEZ CURSO: TERCERO C1 FECHA: 25-11-2015
  • 2. 2
  • 3. INDICE INDICE......................................................................................................3 INDICE DE GRAFICOS.........................................................................3 INDICE DE TABLAS ............................................................................3 1) La Estadística en la Educación Básica y Media...............................5 A)OBJETIVOS: ........................................................................................5 B)INTRODUCCION..................................................................................5 C)DEFINICIONES BASICAS..................................................................7 D)TIPOS DE DATOS................................................................................7 E)ENCUESTAS POR MUESTREO..........................................................8 F)MUESTREO ALEATORIO SIMPLE....................................................9 G)EVALUACION DE UNA ENCUESTA POR MUESTREO..............10 H)CLASIFICACION ORDENADA DE LOS DATOS...........................11 I)CARACTERÍSTICAS DE LOS DATOS.............................................13 J)DIAGRAMAS Y GRÁFICOS..............................................................13 K)DISTRIBUCIÓN DE FRECUENCIAS E HISTOGRAMAS..............18 L)MEDIDAS DE LOCALIZACIÓN O TENDENCIA CENTRAL.......19 M)MEDIDAS DE DISPERSIÓN............................................................21 N)DIAGRAMA DE CAJA......................................................................21 O)TABLA DE CONTINGENCIA...........................................................22 P)REGRESIÓN LINEAL SIMPLE.........................................................24 2) Bibliografía:..................................................................................24 3) LINCOGRAFIA...............................................................................25 INDICE DE GRAFICOS INDICE DE TABLAS Tabla 1.............................................................................................12 Tabla 2.............................................................................................12 Tabla 3.............................................................................................12 Tabla 4.............................................................................................15 Tabla 5.............................................................................................17 3
  • 4. Tabla 6.............................................................................................17 Tabla 7.............................................................................................18 Tabla 8.............................................................................................20 Tabla 9.............................................................................................22 Tabla 10...........................................................................................23 4
  • 5. 1) La Estadística en la Educación Básica y Media A) OBJETIVOS: Presentar una visión general de la Estadística y sus aplicaciones, los procedimientos para recolección de datos, su clasificación y organización, los requerimientos de una buena investigación por muestreo y los errores que se pueden cometer en una encuesta. Mostrar cómo grandes conjuntos de datos numéricos pueden organizarse y presentarse de manera eficaz, con el propósito de favorecer el análisis y la interpretación de los datos, aspectos claves del proceso de planificación y toma de decisiones. Describir de manera conveniente las características de los datos mediante tablas, diagramas y representaciones gráficas; es decir presentar las técnicas básicas para realizar el análisis de los datos. Motivar a directivos y profesores de colegios para que la estadística sea considerada importante en la formación y el curriculum académico del estudiante, con la finalidad de que forme parte de la cultura general en nuestro país. B) INTRODUCCION La estadística se origina en los propósitos de los gobiernos (naciones o estados) de tener información sobre su población y recabar datos sobre sus ciudadanos, su desarrollo se favorece con el florecimiento en las matemáticas de la teoría de las probabilidades. Cada día es más importante el contar con información para las actividades de planificación y toma de decisiones en cualquier ámbito institucional, por ello las empresas públicas y privadas requieren tener información relevante y confiable sobre su campo de acción con los menores costos posibles. El gobierno es un importante recolector y compilador de datos con propósitos tanto públicos como privados. Hay que distinguir entre el recolector original de los datos, denominado fuente primaria, y el organizador que compila estos 5
  • 6. datos en tablas y diagramas, llamados fuente secundaria. En nuestro país, el Banco Central y el Instituto Nacional de Estadística y Censos, INEC, son entidades responsables de recolectar datos sobre variables económicas, financieras, sociales y demográficas. Sin embargo en muchas ocasiones no existe la información que requerimos, y para obtenerla debemos diseñar un experimento, o realizar un estudio basado en la observación del comportamiento de interés, o hacer una investigación por medio de una encuesta dirigida a una muestra de la población objeto del estudio. En la actualidad se recogen datos con la finalidad de utilizarlos en diversos propósitos relacionados con estudios de investigación científica, planificación para el desarrollo de un proyecto, para contribuir en un proceso de toma de decisiones, medir el desempeño de un proceso de producción o de un servicio, realizar un estudio de mercado, o simplemente para satisfacer nuestra curiosidad. La estadística comprende dos partes fundamentales: a) La estadística descriptiva: que son los métodos que involucran la recolección, presentación y análisis de un conjunto de datos con el fin de describir apropiadamente sus diversas características. Su desarrollo se ha dado por la necesidad de información relevante de amplias poblaciones. b) La estadística inferencial: que puede definirse como aquellos métodos que hacen posible la estimación de una característica de una población basándose solamente en los resultados de una muestra. Su desarrollo se ha dado a principios del siglo XX y tienen amplia aplicación en todos los campos de la investigación en la actualidad. Para aclarar estos términos, en el siguiente tema, se introducen algunas definiciones fundamentales. 6
  • 7. C) DEFINICIONES BASICAS a) Población (o universo): es el conjunto de todos los elementos considerados como objetivo del estudio y del cual queremos obtener sus características. b) Muestra: es la porción de la población que se selecciona para su análisis, es el objetivo de la encuesta o del experimento, que será de utilidad para poder obtener las conclusiones sobre la población. c) Parámetro: es una medida de resumen para describir una característica de toda una población. d) Estadístico(a): es una medida de resumen para describir una característica de una muestra de la población. Para que un análisis estadístico sea útil los datos de entrada no deben contener errores, puesto que si entra basura saldrá basura. D) TIPOS DE DATOS Los datos son los resultados observados de diversas características, de los elementos de una población de estudio, llamadas variables aleatorias. Existen básicamente dos tipos de datos o de variables aleatorias: Datos categóricos (variables cualitativas) y datos numéricos (variables cuantitativas). Las variables categóricas se clasifican en dos grupos, pueden ser 7
  • 8. nominales u ordinales. Variable Nominal, si los datos observados se clasifican en diversas categorías que no implican ningún orden, por ejemplo el estado civil, el sexo, el partido político, o si tiene o no hijos. Variable Ordinal, si los datos se clasifican en categorías que implican algún orden, por ejemplo la medida de satisfacción en el trabajo que desempeña (poco en menos que medianamente y este es menor a mucho). La variable es numérica si sus valores observados son números, es decir representan una cantidad o una medida. Por ejemplo, las respuestas a las preguntas: ¿Cuántos vehículos posee? ¿A cuántas revistas está suscrito actualmente?, ¿Cuántos hijos tiene?, ¿Cuál es su estatura?, ¿Cuánto pesa? son claramente numéricas. Las variables numéricas se clasifican en dos grupos, pueden ser discretas o continuas. Variable discreta si los datos corresponden a respuestas numéricas que provienen de un proceso de conteo. Variable continua si los datos corresponden a respuestas numéricas que surgen de un proceso de medición. E) ENCUESTAS POR MUESTREO Para realizar una encuesta por muestreo previamente se debe determinar con precisión que información se necesita obtener, es decir establecer claramente los objetivos de la investigación, y posteriormente se requiere planificar y ejecutar una serie de actividades para lograr el éxito deseado. Las principales tareas son: definir cuidadosamente la población, establecer el o los marcos de muestreo de manera que la lista de unidades muestrales y la población concuerden lo mejor posible, 8
  • 9. seleccionar el diseño de muestreo y el método de entrevista, elaborar el cuestionario, capacitar a los encuestadores y supervisores, realizar una prueba piloto, organizar el trabajo de campo, sistematizar el manejo, validación y análisis de los datos y finalmente calcular las estimaciones para obtener la información requerida. El cuestionario es un instrumento que contiene varias preguntas que trata sobre una diversidad de fenómenos o características de una población, denominadas variables aleatorias. Una muestra de probabilidad o aleatoria, es aquella en la que los elementos de la muestra se eligen sobre la base de probabilidades conocidas. La única forma de que hagamos inferencias estadísticas correctas de una muestra a una población, es mediante el uso de una muestra de probabilidad. Los cuatro diseños o tipos de muestras probabilísticas de uso común son: la muestra aleatoria simple, la muestra sistemática, la muestra estratificada y la muestra de agrupación o conglomerados; un análisis detallado de estos procedimientos de muestreo pueden encontrarse en libros sobre investigación por muestreo (en inglés: Sample Survey). F) MUESTREO ALEATORIO SIMPLE En una muestra aleatoria simple cada individuo o elemento tiene la misma oportunidad de selección que cualquier otro, y la selección de un elemento en particular no afecta la probabilidad de que se elija cualquier otro. Una muestra aleatoria simple también puede interpretarse como aquella en la que cada posible muestra extraída (de determinado tamaño) tiene la misma probabilidad de selección que cualquier otra muestra que se pueda extraer (de ese mismo tamaño). Por tanto el marco de población es sencillamente una lista 9
  • 10. (numerada) de todas las unidades de muestreo. Se denomina marco de lista de la población si cada unidad de muestreo contiene un solo elemento de la población, en este caso la numeración va desde uno (1) hasta el tamaño de la población (N). Numerados los elementos del marco de lista de la población, se obtiene la muestra aleatoria seleccionando aquellos miembros cuyos códigos concuerden con los dígitos extraídos de la urna. Por ejemplo, si deseamos una muestra, de n=50 elementos distintos, seleccionada de una población de N=782 elementos, se formarán por lo menos cincuenta números de tres dígitos (pues se eliminan los números repetidos y no se toman en cuenta los mayores a 782 y el 000) hasta completar los cincuenta requeridos. G) EVALUACION DE UNA ENCUESTA POR MUESTREO Una buena investigación por muestreo requiere tener los objetivos claros, una apropiada planificación y una buena ejecución de todas las actividades programadas. Es de fundamental importancia realizar una encuesta piloto, con una muestra muy reducida, con la finalidad de probar el cuestionario y todos los instrumentos que se utilizarán en los diversas etapas, de modo que se corrijan los errores y se puedan evaluar los procesos y sus costos. Para una buena recolección de datos se debe adiestrar a los encuestadores sobre las definiciones operacionales de la encuesta, es decir sobre el significado de cada variable, de modo que no existan ambigüedades en las preguntas correspondientes; se requiere además organizar detalladamente el trabajo de campo, estableciendo claramente las obligaciones del personal y las líneas de autoridad. Son extremadamente importantes también las actividades de codificación, validación y análisis de datos, puesto que se deben 10
  • 11. examinar las respuestas buscando su integridad y posibles errores para corregirlos. Para valorar una investigación por muestreo hay que verificar si se han considerado estas recomendaciones y realizado eficientemente todas las actividades antes mencionadas. Es claro que hay una proliferación de investigaciones de encuestas de opinión, pero no toda investigación es buena, significativa o importante. Es esencial que aprendamos a evaluar críticamente lo que leemos o escuchamos y que descartemos las encuestas que carezcan de objetividad y credibilidad. El primer paso para evaluar una encuesta es determinar si se basó en una muestra de probabilidad o en una no probabilística; puesto que la única forma de que hagamos inferencias estadísticas correctas es a través del uso de una muestra aleatoria. H) CLASIFICACION ORDENADA DE LOS DATOS. Cuando se elabora un conjunto de datos, las observaciones numéricas no tienen ningún orden o secuencia particular ni tampoco se encuentran agrupados por similares cualidades o características. Al crecer el número de observaciones, se hace más difícil observar las principales características del conjunto de datos, se requiere entonces organizar las observaciones, de tal manera que entendamos mejor la información que contienen los datos, para lograrlo se han desarrollado diversos métodos, algunos fundamentados en gráficos y diagramas, otros en ciertas medidas numéricas, y varias técnicas fundamentadas en diferentes tipos de análisis matemáticos. Ejemplo 1: los siguientes datos corresponden al número (aproximado y en miles) de Unidades de Producción Agropecuarias (UPAs) de cada provincia del país (resultados del Censo Nacional Agropecuario 11
  • 12. CNA del año 2000) Tabla 1 Prov Azua Boli Caña Carc Coto Chim ElOr Esme Gala Guay Imba UPAs 99 39 32 13 68 82 22 16 1 65 34 Loja LoRi Mana Mo Sa Napo Orel Past Pich Sucu Tung ZaCh ZNAs 66 42 75 17 5 6 5 64 8 71 9 4 La clasificación ordenada de estos datos es la siguiente: Tabla 2 Prov Gala ZNAs Napo Past Orel Sucu ZaCh Carc Esme Mo Sa ElOr UPAs 1 4 5 5 6 8 9 13 16 17 22 Caña Imba Boli LoRi Pich Guay Loja Coto Tung Mana Chim Azua 32 34 39 42 64 65 66 68 71 75 82 99 De esta tabla se puede determinar inmediatamente algunas características, como por ejemplo: la provincia que menos UPAs tiene es Galápagos (aproximadamente un mil), la que tiene mayor cantidad es Azuay (con alrededor de 99 mil); la provincia que corresponde a la mediana es Cañar con 32 mil UPAs. Ejercicio 1: Realizar la clasificación ordenada de los datos correspondientes al número (aproximado y en miles) de habitantes de cada provincia del país (resultados del Censo Nacional de Población y Vivienda del año 2001) Tabla 3 Prov Azua Boli Caña Carc Coto Chim ElOr Esme Gala Guay Imba UPAs 600 169 207 153 350 404 526 385 19 3309 344 Loja LoRi Mana Mo Sa Napo Orel Past Pich Sucu Tung ZaCh ZNAs 12
  • 13. 405 650 1186 115 79 86 62 2389 129 441 77 73 La mejor manera de examinar datos es presentarlos en forma de resumen construyendo tablas y diagramas apropiados, de manera que podamos extraer las características más importantes de los datos. I) CARACTERÍSTICAS DE LOS DATOS Las tres principales características que dan la posición relativa del conjunto de datos son: la localización o tendencia central, la dispersión y la simetría. Tendencia central o localización: es una cantidad cerca de la cual se encuentran los valores del conjunto de datos, se la mide mediante un valor junto al cual se agrupa la mayoría de las observaciones. Una medida de tendencia central es, por ejemplo, la media o promedio de los datos. J) DIAGRAMAS Y GRÁFICOS Puesto que la tabla o matriz de los datos no muestra las cualidades de los datos, se usan representaciones gráficas que ayudan a captar tendencias, apreciar características y establecer modelos probabilísticos de comportamiento global. En general un diagrama o un gráfico, en donde están representados los datos, sirve para resumir el conjunto de las observaciones y advertir sus carácterísticas de localización, de dispersión , de simetría y la presencia de valores atípicos. Los diagramas y gráficos que comúnmente son utilizados, para organizar las observaciones de modo que entendamos mejor la información que contienen y apreciemos sus características, se 13
  • 14. presentan a continuación: Diagrama de puntos: cada observación se representa mediante un punto sobre la recta numérica. GRAFICO 1 Ejercicio 4: hacer el diagrama de puntos de los datos del ejercicio 1. Diagrama de tallo y hojas: a los datos se los clasifica considerando, por ejemplo, las unidades, o las decenas, o las centenas, etc., estas forman el tallo y se las coloca verticalmente, a continuación se coloca los siguientes dígitos para cada observación a la derecha de la barra vertical, estos valores vienen a constituir las hojas, y así se van añadiendo todas las observaciones; pueden realizarse variantes (por ejemplo distinguiendo las cifras altas y las bajas). Un diagrama de tallo y hojas con los datos correspondientes al número de UPAs (ejemplo 1) sería el siguiente: 9 9 8 2 7 1 / 5 6 4 / 5 / 6 / 8 4 2 3 2 / 4 / 9 2 2 1 3 / 6 / 7 0 1 / 4 / 5 / 5 / 6 / 8 / 9 Ejercicio 5: Hacer al menos un diagrama (adicional) de tallo y hojas con los datos del ejemplo 1, y dos diagramas con los datos del ejercicio 1. 14 Representación de puntos del ejemplo 1 0 20 40 60 80 100
  • 15. Gráfico de pastel: es una forma de resumir un conjunto de datos categóricos. Es un círculo dividido en segmentos, donde el área de cada uno de los segmentos es proporcional al número de casos en la categoría correspondiente. Tabla 4 Población Nacional Categorías Total Urbana Rural Número de habitantes 12156 7431 4725 GRAFICO 2 Ejercicio 6: Hacer el gráfico de pastel con los respectivos porcentajes 15 Población Nacional Por Categorías de Area Urbana 61.1% Rural 38.9% Urbana Rural
  • 16. de los siguientes datos del Censo de Población (2001): (a) Población nacional (número de habitantes) por (categorías correspondientes al) sexo (hombre/mujer). (b) Población de la provincia de Pichincha por sexo. (c) Población de la provincia de Guayas por área. (d) Unidades de Producción Agropecuarias (UPAs) por categorías de tenencia de la tierra (referirse a los resultados del CNA 2000) (e) Población (nacional mayor a diez años) de analfabetos por categorías quinquenales de edad. (f) Población de analfabetos por categorías provinciales. (g) Población (nacional masculina mayor a diez años) de analfabetos por categorías quinquenales de edad (respectivamente femenina) (h) Población de hombres analfabetos por categorías provinciales (respectivamente de mujeres). (i) Población nacional mayor a doce años por categorías de estado civil. La representación de pastel se suele usar también con cantidades si se han agregado las mismas en las correspondientes categorías (ver ejercicio 9). Se puede también usar el gráfico de pastel con datos numéricos si previamente se ha creado una tabla de frecuencias (es decir se han clasificado las observaciones en grupos o clases dados por una partición en subintervalos) pero en este caso se usa generalmente el gráfico de barras denominado histograma. Gráfico de barras: los datos categóricos se exhiben mediante un número de rectángulos, del mismo ancho, cada uno de los cuales representa una categoría particular. 16
  • 17. La longitud (y por lo tanto el área) de cada rectángulo es proporcional al número de casos en la categoría que representa. Ejemplo 3: considerar los datos, de la población nacional por grupos de edad quinquenales, que se presentan a continuación: Tabla 5 Grupos Edad 0 a 4 5 a 9 10 a 14 15 a 19 20 a 24 25 a 29 N° habitantes 1337 1362 1341 1241 1169 947 30 a 34 35 a 39 40 a 44 45 a 49 50 a 54 55 a 59 60 a 64 863 775 674 539 463 339 294 65 a 69 70 a 74 75 a 79 80 a 84 85 a 89 90 a 94 95 y más 244 195 143 97 63 39 32 GRAFICO 3 Ejercicio 8: realizar el gráfico de barras con los datos del ejemplo 2. Ejercicio 9: hacer el gráfico de pastel, y el de barras, de los siguientes datos, que corresponden a la superficie (área) nacional según el uso del suelo (resultados del CNA 2000) Tabla 6 17 Número de habitantes por grupos de edad 0 200 400 600 800 1000 1200 1400 1600 0 a 4 años 10 a 14 años 20 a 24 años 30 a 34 años 40 a 44 años 50 a 54 años 60 a 64 años 70 a 74 años 80 a 84 años 90 a 94 años N° habitantes
  • 18. Uso del suelo (en miles de hectáreas) Categ. Cultiv. Perma. Cultiv. Trans. Descan. Pastos Pasto s Páramo Montes Otro y Barbe. Cultiv. Natur . y Bosques Usos Super . 1363 1232 381 3357 1130 600 3881 411 Ejemplo 4: los siguientes datos corresponden al número (aproximado y en miles) de Unidades de Producción Agropecuarias (UPAs) según su condición jurídica (de acuerdo al CNA 2000) Tabla 7 CONDICION JURIDICA Cate- Persona Soc.Hecho sin Soc. Institución Otras goría Individual Contrato Legal Legal Pública Condiciones UPAs 577 56 10 9 13 K) DISTRIBUCIÓN DE FRECUENCIAS E HISTOGRAMAS Para crear la tabla de frecuencias con datos categóricos se cuenta el número de veces en la que aparece cada dato, es decir se calcula el número de elementos de cada una de las categorías. Si los datos son numéricos se tiene que crear una partición del intervalo que contiene a todos los valores, es decir dividirlo en grupos de subintervalos, y se cuentan cuantos elementos están en cada clase. Se determina el número de grupos dependiendo del número de observaciones, por ejemplo: si tenemos menos de 20 observaciones se seleccionar 4 clases, de 20 a 50 observaciones se toman 5 clases, de 18
  • 19. 50 a 100 observaciones se escogen 6 clases, de 100 a 200 observaciones se suele elegir 7 clases, de 200 a 500 observaciones usualmente se seleccionan 8 clases, y más de 500 observaciones se eligen 9 clases o más (en función del número de datos). En el caso de datos numéricos, la longitud de cada clase (subintervalo) es igual a la extensión o rango de los datos dividido para el número de clases. Para cada observación se determina a que clase pertenece para calcular la frecuencia absoluta de cada clase. GRAFICO 4 L) MEDIDAS DE LOCALIZACIÓN O TENDENCIA CENTRAL Una medida de localización es un valor en torno al cual se agrupan la mayoría de datos, es una característica de tendencia central de las observaciones, las más empleadas son: el promedio o media muestral, la mediana, la moda y la media simétricamente segada. Promedio o media muestral (m): es igual a la suma de los valores de las observaciones dividida para el número total de datos (n). Se le denomina m o también x− (x techo). 19 Histograma del ejemplo 1: Provincias por cantidad de UPAs 11 4 5 3 0 5 10 15 De 1 a < 25.5 De 25.5 a <50 De 50 a <74.5 De 74.5 a 99 UPAs (en miles) Provincias
  • 20. m = ( Σ xi ) / n Mediana (Q2): es el valor que se encuentra en el punto medio, cuando se ordenan los valores de menor a mayor, se la denota Q2. Si n=2p+1 (impar) entonces Q2=xp+1; y si n=2p (par) entonces Q2=(xp+xp+1)/2 Moda (Mo): es aquel valor que tiene la mayor frecuencia absoluta, se la representa por Mo. Si los datos están dispuestos en una tabla de frecuencias agrupados en clases (subintervalos) aquella que tiene la mayor frecuencia se denominará clase modal y puede asumirse que, de manera aproximada, la moda es su punto medio. Media simétricamente segada al 10%: es igual al promedio de las observaciones que quedan luego de eliminar el 5% de las que tienen los valores más bajos y el 5% de las que tienen los valores más altos. Observemos que si cada dato xi está con su respectiva frecuencia ni ; la media (el promedio) se puede calcular evidentemente mediante la expresión: m = ( Σ ni xi ) / n Cuando los datos están dispuestos en una tabla de frecuencias agrupados en clases, se puede calcular el valor aproximado de la media o la media segada considerando la suma de los productos de los valores medios de las clases por su frecuencia y dividiendo como siempre para el número de observaciones, es decir usando la expresión anterior con xi igual al punto medio de clase i (o sea: xi = (li+si)/2 donde li y si son respectivamente los límites inferior y superior de la clase i). Ejemplo 5: Usando los datos del censo de población, determinar el promedio del número de hijos vivos que tienen las madres ecuatorianas. De acuerdo con el cuadro N. 53, se tiene la siguiente tabla de frecuencias por número de hijos: Tabla 8 Número de 0 1 2 3 4 5 6 7 8 9 10 y 20
  • 21. hijos vivos mas Número de madres 9 60 0 63 7 53 4 34 6 23 7 17 3 12 2 90 60 74 Asumiendo que en la última categoría las 74 madres tienen en promedio 11 hijos, se puede obtener que el valor aproximado de la media es: (0x9+1x600+. . .+9x60+11x74)/(9+600+. . .+60+74)=3,4736 (hijos/madre) El promedio exacto de acuerdo al censo es de 3,2753 . Ejercicio 10: Revisar los ejemplos del texto de Galindo relacionados con las medidas de localización (tendencia central). M) MEDIDAS DE DISPERSIÓN La desviación estándar o típica (denominada s): es igual a la raíz cuadrada de la suma de los cuadrados de las diferencias entre cada valor de los datos y su media, dividida para el número de datos menos uno; se la denomina s, es siempre un valor positivo, y su unidad de medida es la misma que corresponde a los datos originales. s = ( ( Σ (xi - m)2 /(n-1) )½ N) DIAGRAMA DE CAJA El diagrama de caja es una herramienta que describe en un mismo gráfico algunas características de localización, de dispersión, y los valores atípicos, al representar la mediana, los cuartiles, el rango intercuartil y el rango de las observaciones; para su construcción se procede de la siguiente manera: 21
  • 22. a) Sobre una línea horizontal se localizan la mediana, los cuartiles inferior y superior y los datos mínimos y máximo. b) Se hace una caja angosta que una a Q1 y Q3, a continuación se divide esta caja en dos mediante una línea que pase por Q2. c) Finalmente se trazan dos rectas, una para cada extremo de la caja, en los valores: Q1 – 1,5 RIQ ; y , Q3 + 1,5 RIQ. Q1-1,5RIQ Q1 Q2 Q3 Q3+1,5RIQ Los datos que caen fuera de estas dos vallas (dadas por las dos rectas trazadas) se consideran como valores atípicos. O) TABLA DE CONTINGENCIA Consideremos ahora un esquema de doble clasificación, por ejemplo las personas o habitantes del país se pueden agrupar entre los que viven en el área urbana y los que viven en el área rural, y dentro de estos dos grupos se los puede clasificar respecto al sexo (es decir en hombres y mujeres). Ejemplo 6: de acuerdo a los resultados del censo de población del año 2001 tenemos la siguiente clasificación doble: Tabla 9 POBLACION Hombres Mujeres Total Urbana 3.625.96 2 3.805.39 3 7.431.355 Rural 2.392.39 2.332.86 4.725.253 22
  • 23. 1 2 Total 6.018.35 3 6.138.25 5 12.156.608 La clasificación de datos categóricos de acuerdo con dos variables (X,Y) se denomina cuadro de contingencia, es en definitiva una tabla de frecuencias (absolutas o relativas) donde una variable se representa en las filas y la otra en las columnas; se cuentan los individuos que tienen los valores indicados en las filas y en las columnas. Se puede encontrar también la frecuencia relativa de la clase (i,j) que es igual al cociente: fi,j = ni,j / n (donde n es el numero total de individuos) y proporcionan la distribución empírica conjunta de las dos variables, y dan una estimación de las probabilidades pij de que un individuo pertenezca a la categoría conjunta (i,j), es decir a la categoría i en la variable X y a la categoría j en Y. En el ejemplo que estamos tratando, la tabla de frecuencias relativas es: Tabla 10 POBLACION Hombres Mujeres Total Urbana 29,8% 31.3% 61,1% Rural 19,7% 19,2% 38.9% Total 49,5% 50,5% 100,0% Propiedades: La sumatoria de todos los valores ni,j (para i desde 1 hasta p, y j desde 1 hasta q) es igual al total de individuos n. La sumatoria de todos los valores fi,j (para i desde 1 hasta p, y j desde 1 hasta q) es igual a 1. Distribuciones marginales: En la tabla de contingencia se suelen incluir los totales de las filas y los totales de las columnas, es decir se calcula: ni. = sumatorio en j de los ni,j (para cada categoría i=1,2,...,p) 23
  • 24. El valor de ni. es la frecuencia absoluta de la primera variable, para la categoría i, y las frecuencias relativas marginales fi. = ni./n dan la distribución empírica de la primera variable (X). De manera similar, para la segunda variable (Y), se incluye una fila con los valores: n.j que representan sus frecuencias absolutas. Análogamente las frecuencias relativas f.j = n.j/n proporcionan la distribución empírica de la segunda variable Y, y da una estimación de la probabilidad pj de que un individuo pertenezca a la categoría j. P) REGRESIÓN LINEAL SIMPLE En algunas aplicaciones se requiere establecer relaciones entre dos variables; la regresión lineal simple sirve para determinar una relación lineal entre dos variables: X=(x1,x2,...,xn) y Y=(y1,y2,...,yn). El modelo determinista plantea: Y = b0 + b1 X El modelo probabilista (o aleatorio) considera: Y = b0 + b1 X + e ; donde e es una componente aleatoria del error. Como sabemos b0 es la ordenada al origen; y, b1 es la pendiente de la recta; los mismos que se obtienen, usando el método de los mínimos cuadrados, mediante las siguientes fórmulas: b1 = SCXY / SCXX ; Donde: SCXX = Σi (xi – mx)2; y , SCXY = Σi (xi – mx)(yi-my) . b0 = my – b1 mx 2) Bibliografía: Berenson M., Levine D., Estadística Básica en Administración, Prentice Hall Hispanoamericana S. A., México, 1996. 24
  • 25. Freund J. y Simon G., Estadística elemental, Prentice Hall, México, 1994. Galindo E., Estadística para la Administración y la Ingeniería, Gráficas Mediavilla Hnos., Quito, 1999. 3) LINCOGRAFIA www.math.epn.edu.ec/IX_memorias/docs/Araujo/Araujo.doc 25