Organización de datos

Para llevar a cabo nuestra organización de datos se
deben indagar los fenómenos, ya que se realiza una
investigación a fondo, y ese fenómeno que se busca
debe poseer variables sea cualitativa o cuantitativa y a
través de ellas nos damos cuenta si se debe realizar
un análisis estadístico descriptivo o un análisis
estadístico inferencial

Siendo el dato el material que se debe procesar, es
decir, la materia prima de la estadística, el primer paso es
la recolección de datos, para lo cual se emplean
diferentes técnicas, como la entrevista personal, el
cuestionario, la observación, etc. El segundo paso es la
organización y ordenamiento de los datos, lo que se
hace a través de tablas, las cuales pueden ser por medio
de una distribución de frecuencias simples o una
distribución de frecuencias con intervalos, en ambos
casos agrupando todos aquellos que corresponden a un
mismo dato nominal o variable y expresando en una
columna el número de veces que se aparece esa variable.
La frecuencia es el número de veces que aparece
cada variable o dato nominal

Ejemplo
Se desea hacer una tabla que muestre las calificaciones en
matemáticas de un grupo escolar, se ve que hubieron dos
alumnos que sacaron 10 de calificación, siete estudiantes
sacaron 9, etc.; se dice entonces que la frecuencia del dato
nominal 10 es de dos; la frecuencia de la variable 9 es siete, etc.
Una distribución de frecuencia es el resultado de organizar
los datos recolectados en grupos, mostrando la frecuencia de
cada uno. Esta puede ser simple o por intervalo

Distribución de frecuencia
 Gráficos estadísticos
Los gráficos son medios popularizados y a menudo los más convenientes para presentar
datos, se emplean para tener una representación visual de la totalidad de la información. Los
gráficos estadísticos presentan los datos en forma de dibujo de tal modo que se pueda percibir
fácilmente los hechos esenciales y compararlos con otros.

 Gráficos de barras horizontales
Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se
utilizan cuando los textos correspondientes a cada categoría son muy extensos.
• para una serie
• para dos o más series

 Gráficos de barras proporcionales
Se usan cuando lo que se busca es resaltar la representación de los porcentajes
de los datos que componen un total. Las barras pueden ser:
• Verticales
• Horizontales

 Gráficos de barras comparativas: Se utilizan para comparar dos o más series, para comparar
valores entre categorías. Las barras pueden ser: Verticales Horizontales
 Gráficos de barras e usan para mostrar las relaciones entre dos o más series con el total. Las
barras pueden ser: verticales horizontales

Lo que se estudia en cada unidad de información individuo de la muestra son las variables
(edad, sexo, peso, talla, tensión arterial sistólica, etcétera). Los datos son los valores que toma
la variable en cada caso. Lo que vamos a realizar es medir, es decir, asignar valores a las
variables incluidas en el estudio. Deberemos además concretar la escala de medida que
aplicaremos a cada variable.
La naturaleza de las observaciones será de gran importancia a la hora de elegir el método
estadístico más apropiado para abordar su análisis. Con este fin, clasificaremos las variables, a
grandes rasgos, en dos tipos: variables cuantitativas o variables cualitativas.
 Variables cuantitativas. Son las variables que pueden medirse, cuantificarse o
expresarse numéricamente. Las variables cuantitativas pueden ser de dos tipos:
• Variables cuantitativas continuas, si admiten tomar cualquier valor dentro de un rango
numérico determinado (edad, peso, talla).
• Variables cuantitativas discretas, si no admiten todos los valores intermedios en un rango.
Suelen tomar solamente valores enteros (número de hijos, número de partos, número de
hermanos, etc).

 Variables cualitativas. Este tipo de variables representan una cualidad o atributo
que clasifica a cada caso en una de varias categorías. La situación más sencilla es
aquella en la que se clasifica cada caso en uno de dos grupos (hombre/mujer,
enfermo/sano, fumador/no fumador). Son datos dicotómicos o binarios. Como
resulta obvio, en muchas ocasiones este tipo de clasificación no es suficiente y se
requiere de un mayor número de categorías (color de los ojos, grupo sanguíneo,
profesión, etcétera).
En el proceso de medición de estas variables, se pueden utilizar dos
• Escalas nominales: ésta es una forma de observar o medir en la que los datos se
por categorías que no mantienen una relación de orden entre sí (color de los ojos,
profesión, presencia o ausencia de un factor de riesgo o enfermedad, etcétera).
• Escalas ordinales: en las escalas utilizadas, existe un cierto orden o jerarquía entre las
categorías (grados de disnea, estudiaje de un tumor, etcétera).

Tipos de organización de datos
 Organización no estructurada
Utiliza información no estructurada contenixda en libros, artículos, informes.
Es tan grande la información que es muy difícil saber que es lo que nos va a
interesaren el caso de una búsqueda y seria imposible determinar un campo por cada
tema.
 Organización estructurada
Utiliza información estructurada o datos definidos( facturas, recibos de clientes, etc.)
El diseño de una buena base de datos deberá reconocer con método y exactitud los
datos que se van a utilizar, antes de su implementación.
Esta organizada mediante campos

Tipos de organización de datos
• Tratamiento de datos formateados (organizados).
 Sistemas orientados a proceso.
 Sistemas orientados a datos.
 Sistema de Gestión de Datos Relacionales.
• Tratamiento de datos no formateados (No
organizados)
 Documentos.
 Sistemas de Recuperación de Información.
 Sistemas de Gestión de Bases de Datos Documentales.

Operaciones de organización de datos
o La información es un activo fundamental para las empresas e
instituciones, y Widefense provee servicios orientados al
respaldo de información clave.
o Actualmente, el universo de datos puede dificultar la toma de
decisiones en una organización, principalmente, por el exceso
de información existente, su diversidad y lo cambiante en ella.
o “ Vivimos frente a una avalancha d información originada, por
ejemplo, por la música digital, imágenes medicas, fotografías
digitales, redes sociales, redes eléctricas inteligentes, entre
otros factores”

o Una de nuestra soluciones esta orientada al respaldo basado en el uso
de la nube. Esta solución permite administrar los respaldos y la
recuperación de la información de manera sencilla, ágil y rápida. Ideal
para empresas que están llevando sus servicios a la nube tecnológica.
La principal ventaja de este servicio es que genera importante ahorros
para los clientes, ya que dada su naturaleza , no implica incurrir en
gastos de hardware.
o Otra alternativa es obtener la información siempre en el sitio del
cliente. De esta manera , posibilita el respaldo de mayor volumen de
información, en pequeños lapsos de tiempo y necesita un menor
espacio de almacenamiento en el servidor, gracias a la de-duplicación
en el origen de los datos. Mediante ella es posible respaldar equipos
de escritorio y notebooks, maquinas virtuales, oficinas remotas,
sistemas de almacenamiento compartido y aplicaciones empresariales.

Ordenar y construir una tabla de frecuencias con cuatro
intervalos del siguiente conjunto de datos recolectados.
24 20 32 32 29 21
21 22 33 30 27 26
23 24 20 25 26 32
28 22 29 29 33 35
31 28 32 35 33 32
27 21 33 29 25 24

 Solución:
Conviene iniciar de la misma manera que en la organización de
frecuencias simples. Entonces se localizan los números mas chicos y
mas grandes: son el 20 y el 35 y se hace una lista completa de
números desde el 20 hasta el 35. luego se cuentan cuantos datos
nominales aparecen por cada un y se pone una (/), de lo que resulta:
20 // 24 /// 28 // 32 /////
21 /// 25 // 29 //// 33 ////
22 // 26 // 30 / 34
23 / 27 // 31 / 35 //

A manera de comprobación, para tener la seguridad de que no
se escapo alguno o no se contaron de mas, la suma de todas las
marcas (/) debe ser igual al numero de datos recolectados del
conjunto inicial. En este caso existen 36 datos. Despues , se cuenta
cuantos datos nominales existen dentro del conjunto. En este caso
hay 16.
Entonces, como hay 16 datos nominales y se piden cuatro
intervalos, simplemente se dividen, por lo que cada intervalo
incluirá a cuatro datos nominales, como lo muestra la siguiente
tabla:
Intervalo Frecuencia
20-23 8
24-27 9
28-31 8
32-35 11
Total 36

Los procesamientos de la organización de datos se pueden
hallar a través de una recolección de forma directa e indirecta a
través de diferentes medios. Este proceso consiste en
recolectar datos para luego organizarlos y clasificarlos ya sea
en tabulaciones o graficas, para luego ser analizados de forma
veras y lo mas cercano a la realidad.

 Organización de datos, recuperado de:
https://es.slideshare.net/LuiscarlysMaican/organizacion-de-datos-estadstica-
79758764
 Distribución de frecuencia , recuperado de:
https://www.monografias.com/trabajos81/presentacion-datos-
estadisticos/presentacion-datos-estadisticos.shtml
 Tipos de organización de datos , recuperado de: http://ocw.uc3m.es/ingenieria-
informatica/informatica/documentos-teoria/tema-5-organizacion-de-los-datos

Organización de datos

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (20)

Semelhante a Organización de datos

Semelhante a Organización de datos (20)

Último

Último (20)

Organización de datos