1. NOTAS BREVES SOBRE ESTADISTICA DESCRIPTIVA
¿Por qué estudiar Estadística?
El estudio de la Estadística permite, entre otras cosas
• Aprender las reglas y métodos usados en el tratamiento de información
• Evaluar y cuantificar la importancia de los resultados estadísticos obtenidos
• Entender mejor algunos fenómenos de interés (Sociales, Económicos, Biológicos,
Educacionales, etc.)
• Dar una visión más clara acerca de la información proveniente de diversas fuentes.
Algunos aspectos estadísticos manejados en la información obtenida de la radio, la
televisión u otro medio, influencian fuertemente a gran cantidad de personas pero a
veces no proporcionan una descripción cabal de los que pretenden mostrar.
Como una de las tareas de la Estadística es el estudio de fenómenos aleatorios, esto hace
muy pertinente el tratar de explicar la manera como se comportan (Variabilidad).
Entre otras cosas la Estadística se ocupa del manejo de la información que pueda ser
cuantificada. Implica esto la descripción de conjuntos de datos y la inferencia a partir de
la información recolectada de un fenómeno de interés. La función principal de la
estadística abarca:
Resumir, Simplificar, Comparar, Relacionar, Proyectar.
Entre las tareas que debe enfrentar un estudio estadístico están:
1. Delimitar con precisión la población de referencia o el conjunto de datos en estudio,
las unidades que deben ser observadas, las características o variables que serán
medidas u observadas.
2. Estrategias de Observación: Censo, Muestreo, Diseño de Experimental.
3. Recolección y Registro de la información.
4. Depuración de la información.
5. Construcción de Tablas.
6. Análisis Estadístico:
- Producción de resúmenes gráficos y numéricos.
- Interpretación de resultados.
Cuando los datos comprenden toda la población de referencia, hablamos de un Censo y
cuando solo comprometen una parte de ella, hablamos de una muestra. En ambos casos
es pertinente un análisis Descriptivo. En el segundo caso un análisis Inferencial.
A grandes rasgos podemos decir que una Población es el conjunto de toda posible
información, o de los objetos, que permite estudiar un fenómeno de interés.
Ejemplo. En el caso de medir la calificación promedio obtenida por los estudiantes de
Estadística I de la Universidad Nacional de Colombia Sede Medellín, en el semestre
02_2003. La población puede ser el conjunto de todas las notas posibles obtenidas por
los estudiantes o el conjunto de todos los estudiantes registrados en el curso en dicho
2. semestre. La característica de interés que debe ser estimada es la Nota Promedio del
curso en dicho semestre.
Una muestra es un subconjunto de información representativa de una población.
Ejemplo. En el caso de determinar la nota promedio, podríamos optar por seleccionar de
manera aleatoria un grupo de estudiantes de la población y observar de ellos la nota
promedio obtenida al final del semestre. Con estos datos podemos estimar la nota
promedio global de todos los estudiantes en dicha población (Todos los estudiantes de
estadística I). El grupo de estudiantes seleccionados constituye una Muestra.
Las Variables resultan ser aquellas características de interés que desean ser medidas
sobre los objetos o individuos seleccionados.
En la mayoría de los casos lo que se pretende es estimar, a partir de la información
recolectada de una muestra, características desconocidas de los objetos en dicha
población de interés.
Por ejemplo, estimar el costo de vida promedio en cierta comunidad, requiere de un
despliegue muy grande de recursos, personal capacitado, diseño de encuestas o
cuestionarios, ejecución de la misma, tiempo empleado, etc. Sin embargo una muestra
representativa de los objetos de interés en dicha comunidad (posiblemente hogares),
permite registrar las características de los objetos seleccionados que permitirán dar una
aproximación del costo de vida real en la comunidad. El costo promedio de vida en esta
comunidad (costo real) constituye un Parámetro fijo que atañe a la población y el costo
de vida obtenido a partir de la muestra constituye una Estadística o aproximación al
valor real del parámetro.
Los parámetros son fijos, pues no dependen de ninguna muestra; los estadísticos
dependen siempre de la muestra seleccionada.
Las características desconocidas de una población serán llamadas parámetros. Las
características calculadas a partir de una muestra son llamadas estadísticas. Una
Inferencia es una generalización obtenida a partir de una muestra aleatoria.
La Estadística puede dividirse en dos grandes ramas: Estadística Descriptiva y
Estadística Inferencial.
Estadística Descriptiva
Es el conjunto de métodos usados para la organización y presentación (descripción) de
la información recolectada. La información recolectada puede ser catalogada de dos
maneras: Datos Cualitativos y Cuantitativos. Los primeros se refieren a categorías o
atributos que pueden clasificarse según un criterio o cualidad. Ejemplo: Sexo, Color de
Auto, Tipo de Sangre, Estado civil, categoría de un profesor, etc. Los segundos se
refieren a información numérica, como cuanto o cuantos. Ejemplo: Masa, estatura,
Presión Sanguínea, duración de un espécimen, etc.
Algunos datos numéricos pueden ser clasificados como cuantitativos o cualitativos
según su uso. Por ejemplo, la estatura de una persona se mide en centímetros, pies,
metros y es entonces una medida cuantitativa. Pero si se mide como Bajo, Medio y
Alto, se convierte en una medida cualitativa.
3. Los datos cuantitativos pueden ser clasificados como Discretos y Continuos.
Los datos Discretos están relacionados principalmente con conteos, Los datos
Continuos se obtienen principalmente de mediciones. En el primer caso los resultados
conforman un conjunto discreto (finito o numerable), en el segundo caso el conjunto de
posibles resultados está conformado por un intervalo real.
Ejemplo: El número de niños en una familia, número de accidentes por hora en un
cruce, número de horas dedicadas a estudiar semanalmente, pulsaciones por minuto,
número de tiendas por manzana, son datos de tipo discreto. La velocidad de un
automóvil en km/h, la masa de una persona en kgr, la estatura de cierto tipo de árboles
en pulgadas, tiempo de duración de una batería en días, distancia de frenado en metros,
edad de un individuo, son datos de tipo continuo.
Los datos cualitativos a su vez pueden ser clasificados como Nominales y Ordinales.
Los primeros son obtenidos por medio de agrupamientos no ordenados de datos en
categorías discretas, usados principalmente en clasificación o identificación. Los
segundos son obtenidos o medidos en una escala nominal ordenados de alguna manera.
Una escala ordinal coloca las medidas en categorías, cada una de las cuales indica un
nivel distinto respecto a un atributo que se está midiendo.
Ejemplo: La raza, Estado civil, Sexo (M o F), Religión, Tipo de sangre, constituyen
datos nominales. Las categorías A, B, C, D, E como calificación o niveles de
perfeccionamiento, categoría de un profesor (Instructor asistente, Instructor asociado,
Profesor asistente, Profesor asociado y Profesor titular), son datos ordinales.