SlideShare uma empresa Scribd logo
1 de 17
Baixar para ler offline
Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com
www.maestronline.com
Solicita una cotización a través de nuestros
correos.
Maestros Online
Análisis
Multivariante
Apoyo en
ejercicios
Servicio de asesorías y solución de ejercicios
Ciencias_help@hotmail.com
Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com
www.maestronline.com
nstrucciones:
 Lee con toda atención la explicación del tema y resuelve los siguientes problemas. Puedes
necesitar tablas estadísticas y utilizar algún paquete computacional.
1. Una empresa lleva a cabo una prueba para seleccionar nuevos empleados. Se
sabe que las puntuaciones siguen una distribución normal con media de 80 y
desviación estándar de 25.
a. ¿Qué porcentaje de candidatos obtendrá entre 75 y 100 puntos?
b. Si se presentan 50 candidatos, ¿cuál es la probabilidad de que el
candidato obtenga más de 90 puntos?
2. Para ingresar a cierta universidad se aplica un test con 100 preguntas de las
cuales cada una tiene 4 posibles respuestas y sólo una correcta. Para ser admitido
se requiere que al menos 30 respuestas estén contestadas de forma correcta. Una
persona responde el test al azar.
a. ¿Cuál es el número esperado de respuestas correctas?
b. ¿Qué probabilidad tendrá de superar la prueba?
3. Se tomó una muestra de 12 casas vendidas en cierta ciudad de Estados Unidos en
donde se midió la extensión (miles de pies cuadrados) y el precio de venta (miles
de dólares):
Extensión (miles de pies cuadrados) 1.4 1.3 1.2 1.1 1.4 1 1.3 0.8 1.2 0.9 1.1 1.1
Precio de venta (miles de dólares) 100 110 105 120 80 105 110 85 105 75 70 95
a. Encuentra el coeficiente de correlación e interpreta el resultado.
b. Determina la ecuación lineal que describe el comportamiento de los datos.
c. ¿Qué precio de venta se espera de una casa con 1.5 miles de pies
cuadrados?
4. Se realizó una encuesta de presupuestos familiares y se obtuvieron los siguientes
datos mensuales:
Gasto
teléfono
Renta
familiar
# Habitantes
Gasto
teléfono
Renta
familiar
# Habitantes
2000
1500
780
340
200
850
10000
7500
4000
4000
3560
9850
2
4
3
6
3
4
5000
2500
1250
980
745
600
16000
7500
6500
8000
7000
12000
3
4
4
6
5
5
a. Calcula el coeficiente de correlación y dale una interpretación.
b. Construye un modelo de regresión lineal múltiple para los datos.
c. ¿Qué gasto de teléfono se espera en una familia de 5 integrantes con 10
000 de ingreso?
Instrucciones:
Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com
www.maestronline.com
Investiga en distintas fuentes (como en la biblioteca digital o en Google Libros, disponible
en: http://books.google.com.mx/bkshp?hl=es&tab=wp) un poco más sobre las siguientes
técnicas multivariantes:
1. Análisis factorial y de componentes
2. Análisis multivariado de varianza y covarianza
3. Análisis de conglomerados (cluster)
De cada uno anota un ejemplo que incluya:
 Explicación del problema.
 Tipo de relación entre variables que justifique el uso de la técnica multivariante
aplicada.
 Interpretación o conclusión del problema a resolver.
Instrucciones:
Se hizo una encuesta a personas acerca del calzado deportivo marca Nike. En la siguiente tabla se
presentan los datos recopilados. Se usaron códigos 1, 2, 3 para usuarios esporádicos, intermedios
o frecuentes, respectivamente. El sexo se codificó como 1 o 2 (1 = hombres, 2 = mujeres). La
conciencia, actitud, preferencia, intención y lealtad se midieron en una escala de 7 puntos (1 muy
desfavorable y 7 muy favorable).
Número Uso Sexo Conciencia Actitud Preferencia Intención Lealtad
1
2
3
4
5
3
1
1
3
3
2
1
1
2
2
7
2
3
6
5
6
2
3
5
4
5
4
6
5
7
5
6
7
3
4
6
5
6
2
3
6
7
8
9
10
2
2
1
2
1
2
1
1
2
1
4
5
2
4
3
3
4
1
4
1
5
4
3
3
2
2
3
4
6
4
3
2
5
5
5
11
12
13
14
15
3
3
1
3
1
2
2
1
2
2
6
6
4
6
4
7
5
3
4
3
6
6
3
5
4
4
4
1
3
5
5
4
1
2
6
Para estos datos realiza lo siguiente:
1. Plantear el problema.
2. Elaborar la matriz de correlación.
3. Realizar las pruebas de esfericidad de Bartlett y el índice KMO, a fin de determinar si los
datos son factibles de tratar con un análisis factorial.
4. Encontrar la matriz de factores, así como los eigenvalores para determinar qué factores
son relevantes en el análisis
Se realiza una encuesta respecto a las ventajas de nueve marcas de autos de lujo. Las variables
consideradas fueron éstas:
Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com
www.maestronline.com
V1 Prestigio
V2 Desempeño
V3 Lujo
V4 Valor
La escala utilizada fue de 7 puntos, donde 1 = poco y 7 = excelente.
Las respuestas arrojaron la siguiente tabla:
Marca Prestigio Desempeño Lujo Valor
Lexus
Infinity
BMW
Mercedes
5
5
5
6
7
6
7
6
5
5
6
6
7
7
5
6
Cadillac
Lincoln
Porsche
Bentley
Rolls
5
6
5
7
7
5
6
6
4
5
6
5
5
7
7
5
5
4
3
1
Considerando lo anterior:
1. Realiza el análisis de estos datos mediante el análisis de componentes y el procedimiento
de rotación varimax.
2. Interpreta los factores extraídos.
3. Si tuvieras variables sustitutas, ¿cuáles escogerías?
4. Examina el ajuste del modelo y determina si el análisis factorial es la mejor técnica para
tratar estos datos.
Recuerda incluir todos los resultados del proceso del análisis (los paquetes computacionales
muestran todos los resultados).
nstrucciones:
Descarga una copia a prueba del paquete SPSS indicado en la bibliografía del curso y en el que
podrás realizar el siguiente ejercicio. Esta copia tiene vigencia, así que es importante que abras por
primera vez la aplicación cuando vayas a trabajar con el paquete.
Ejercicio:
La siguiente tabla presenta el resultado de una encuesta acerca de cuántos viajes hizo la gente
en los últimos dos meses. La codificación tiene los siguientes datos:
 Número de viajes (1 = un viaje, 2 = dos viajes, 3 = tres viajes).
 Ingreso (en miles de dólares).
 Actitud, se mide en escala de 1 a 8 (1 = me desagrada viajar, 8 = me gusta mucho viajar).
 Tamaño de la familia (número de integrantes de la familia).
 Edad del jefe de familia (años de edad).
 Cantidad gastada en esos viajes (1 = gasto bajo, 2 = gasto medio, 3 = gasto alto).
No. viajes Ingreso Actitud Tamaño Edad Cantidadgastada
Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com
www.maestronline.com
1 39.7 8 3 40 2
1 49.0 6 3 51 3
1 63.6 7 3 37 3
1 43.7 7 7 51 1
1 36.3 3 3 61 3
1 35.1 8 4 56 3
1 59.8 8 2 64 2
1 34.4 6 4 53 2
1 50.5 4 6 45 3
1 62.2 8 4 40 3
1 35.7 8 4 56 3
1 54.7 1 4 68 3
1 64.5 8 4 44 2
1 54.6 2 4 52 3
1 61.9 2 2 41 3
2 63.5 6 5 49 3
2 55.2 6 4 67 1
2 37.6 3 2 66 1
2 48.9 6 2 45 2
2 54.1 7 3 42 2
2 54.7 4 2 54 2
2 67.4 8 3 66 3
2 66.4 7 6 61 2
2 65.3 7 4 52 3
2 48.1 8 2 53 1
2 36.7 2 3 67 1
2 64.2 8 2 39 1
2 37.3 1 5 53 2
2 53.9 3 2 44 2
2 63.3 6 2 54 3
Considerando los datos de la tabla anterior, realiza lo siguiente:
1. Captura los datos en tu paquete estadístico. Utiliza como variable de agrupación el número
de viajes, y las demás como independientes.
2. Sigue paso a paso el llenado de ventanas, como se te indicó en la explicación del tema, a
fin de tener todos los elementos que se requieren para el análisis y la interpretación.
3. Revisa la hoja de resultados y ubica la tabla que se denomina Estadísticos de grupo:
a. La primera columna es la variable que utilizamos como variable de agrupación,
que en este caso es el “número de viajes” y puedes observar que aparecen los
parámetros que capturaste con algunos datos como: media, desviación típica,
datos ponderados y no ponderados.
Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com
www.maestronline.com
b. Identifica, para cada valor del número de viajes, qué parámetro es el más grande
y repórtalo. Eso nos indica qué variable es la que más influye para que una familia
decida realizar 1, 2 o 3 viajes en un periodo de 2 meses.
Para la elaboración de esta tarea, necesitarás el paquete SPSS, del cual puedes descargar una
copia a prueba, como está indicado en la bibliografía del curso. Ten presente que esta copia tiene
vigencia.
Ejercicio:
Una agencia de viajes está interesada en conocer los factores que más influyen en los viajes de las
personas, para así poder ofrecer promociones adecuadas a ellos. Para llevar a cabo su análisis,
realizó una encuesta acerca de los viajes que realizaron 30 de sus clientes durante los últimos dos
meses.
La siguiente tabla presenta el resultado de la encuesta realizada por la agencia de viajes. La
codificación tiene los siguientes datos:
 Número de viajes (1 = un viaje, 2 = dos viajes, 3 = tres viajes).
 Ingreso (en miles de dólares al mes).
 Actitud (medida en escala de 1 a 8, donde 1 = me desagrada viajar y 8 = me gusta mucho
viajar).
 Tamaño de la familia (número de integrantes de la familia).
 Edad del jefe de familia.
 Cantidad gastada en esos viajes (1 = gasto bajo, 2 = gasto medio, 3 = gasto alto).
Número de
viajes
Ingreso Actitud
Tamaño de
la familia
Edad del jefe de
familia
Cantidad
gastada
1 39.7 8 3 40 2
1 49.0 6 3 51 3
1 63.6 7 3 37 3
1 43.7 7 7 51 1
1 36.3 3 3 61 3
1 35.1 8 4 56 3
1 59.8 8 2 64 2
1 34.4 6 4 53 2
1 50.5 4 6 45 3
1 62.2 8 4 40 3
1 35.7 8 4 56 3
1 54.7 1 4 68 3
1 64.5 8 4 44 2
1 54.6 2 4 52 3
1 61.9 2 2 41 3
2 63.5 6 5 49 3
2 55.2 6 4 67 1
2 37.6 3 2 66 1
2 48.9 6 2 45 2
Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com
www.maestronline.com
2 54.1 7 3 42 2
2 54.7 4 2 54 2
2 67.4 8 3 66 3
2 66.4 7 6 61 2
2 65.3 7 4 52 3
2 48.1 8 2 53 1
2 36.7 2 3 67 1
2 64.2 8 2 39 1
2 37.3 1 5 53 2
2 53.9 3 2 44 2
2 63.3 6 2 54 3
Captura los datos de la tabla anterior en tu paquete estadístico (utiliza como variable de agrupación
el número de viajes, y las demás como independientes). Realiza el análisis discriminante y utiliza
el resumen de resultados para responder lo siguiente:
1. ¿Qué variable es la que más influye para que una familia decida realizar 1, 2 o 3 viajes en
un período de 2 meses?
2. Identifica, mediante el examen de medias, si las medias son estadísticamente iguales para
ambos grupos.
3. Analiza los valores de la λ de Wilks para los datos solos y posteriormente para los datos
agrupados, junto con su transformación en chi cuadrada. A partir de los resultados, indica
el nivel de significancia del análisis.
4. De acuerdo a la matriz de correlaciones agrupadas, identifica si hay alguna que presente
correlación con alguna otra variable.
5. Determina si hay diferencia entre grupos en cuanto al número de viajes, en aspectos como
ingreso, actitud, tamaño de la familia, edad del jefe de familia o cantidad gastada.
6. Ahora realiza la interpretación de datos. Puedes utilizar las cargas canónicas, los
coeficientes estandarizados o los no estandarizados, o los signos de los centroides para
hacerlo.
7. Finalmente, comenta la validez del análisis discriminante y menciona el % de validez que
hay en los datos agrupados originales.
8. Arma la función discriminante para el modelo en particular.
9. Elabora tus conclusiones respecto a lo que podría hacer la agencia de viajes con esta
información.
nstrucciones:
Imagina que trabajas en bienes raíces y estás interesado en conocer la preferencia de selección de
vivienda de un grupo de personas que desean adquirir un inmueble, para así saber lo que les
puedes ofrecer a tus clientes potenciales. Los parámetros que utilizarás son los siguientes:
 Tipo: casa, departamento.
 Recámaras: 1, 2, 3 recámaras.
 Cochera: 1, 2 autos.
 Precio: menos de 1 millón, 1 a 2 millones, más de 2 millones.
A continuación se presentan los pasos a seguir para lograr el objetivo de tu investigación de
mercados:
Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com
www.maestronline.com
1. Diseña una encuesta dirigida a personas que desean adquirir un inmueble.
2. Presenta a 2 personas, por separado, una tarjeta con la combinación de parámetros que te
parezca adecuada (no tienen que ser todas, que sean mínimo 9).
a. Solicita a cada persona que seleccione en escala de 1 a 9 (1 = menor preferencia,
y 9 = mayor preferencia) sus preferencias.
b. Observa si hay algunas combinaciones que no sean posibles o determinantes y
descártalas.
3. Realiza el análisis conjunto de cada tarjeta por separado, incluyendo gráfico de utilidades e
importancia de los resultados. Puedes utilizar variables ficticias en tu análisis.
4. ¿Existe alguna diferencia en los resultados de las dos encuestas?, ¿es significativa?,
¿puedes explicar la diferencia?
Instrucciones:
1. En 8 ciudades en México se ha recogido información sobre la venta, en 1998, de periódico
(variable Y en ejemplares diarios vendidos por cada mil habitantes) relacionándola con su
producción económica en concreto con el PIB por habitante (variable X en miles de
pesos). Los datos se presentan a continuación:
X 8.3 9.7 10.7 11.7 12.4 15.4 16.3 17.2
Y 57.4 106.8 104.4 131.9 144.6 146.4 177.4 186.9
a. Encontrar el coeficiente de regresión y el coeficiente de determinación.
b. Construir el modelo lineal que explica el comportamiento de las variables.
c. ¿Cuántos periódicos esperamos que se vendan si el PIB por habitante es $25,000?
d. Si la venta de periódicos es de 150 por cada mil habitantes, ¿qué PIB podemos
predecir?
2. Una empresa frutícola está por iniciar el cultivo de fresa en un terreno nuevo que acaba
de adquirir y aprovecha los datos de un fruticultor, que ha encontrado una relación muy
significativa entre producción obtenida (miles de toneladas de fresa), el volumen de agua
utilizado (miles de litros) y la cantidad de abono específico utilizado (en kilogramos):
Año Producción
X1
Agua
X2
Abono
X3
2005
2006
2007
2008
2009
120
150
200
270
350
100
130
175
240
310
10
12
14
17
20
a. Encuentra la matriz de correlación entre las variables.
b. Encuentra el coeficiente de correlación y el coeficiente de determinación.
c. Construye el modelo lineal que describa el comportamiento de las variables.
d. Si el agua utilizada fuera 40 mil litros, y el abono 5 kg, ¿qué producción
esperaríamos?
Lee con toda atención la explicación del tema y resuelve los siguientes problemas. Puedes
necesitar tablas estadísticas y utilizar algún paquete computacional si lo deseas.
Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com
www.maestronline.com
1. Cierta ciudad está dividida en cuatro distritos. El jefe de la policía quiere determinar si hay
alguna diferencia en el número promedio de crímenes cometidos en cada distrito. Se lleva
un registro durante seis días. Con un nivel de significancia de 0.05, ¿se puede concluir que
hay diferencia en el número promedio de crímenes?
Distrito I Distrito II Distrito III Distrito IV
13
15
14
15
14
15
21
13
18
19
18
19
12
14
15
13
12
15
16
17
18
15
20
18
2. En cierta oficina se desea estudiar el efecto del cansancio en una tarea rutinaria, para lo
cual se toman datos acerca del tiempo que toma realizar cierta tarea, de acuerdo a la hora
en que se realice. El resultado es el siguiente:
Inicio de la jornada A las 4 horas A las 7 horas
12
12
13
14
11
15
9
9
8
10
11
11
10
9
8
10
10
9
9
9
10
9
7
6
6
9
12
11
10
8
6
9
6
7
9
6
7
6
7
7
8
8
7
9
9
6
5
6
6
7
9
Si suponemos normalidad e independencia entre los grupos y a un nivel de confianza del 95%,
¿podemos afirmar que el tiempo que se tarda en realizar un trabajo rutinario está determinado por
la hora en que se realice?
Resuelve los siguientes ejercicios utilizando el análisis de varianza:
1. Una empresa familiar que fabrica tortillas ha analizado el número de clientes que entran,
en promedio, cada hora por trimestre durante un año. Con un nivel de confianza del 95%
¿existe alguna relación significativa en el número de clientes que entra a la tienda de
acuerdo a la hora y al trimestre en que se tomó la medida?
Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4
8:00AM
9:00AM
10:00AM
11:00AM
7
10
25
50
4
7
15
20
5
8
17
25
9
20
35
67
Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com
www.maestronline.com
12:00AM
1:00PM
2:00PM
3:00PM
4:00PM
75
79
68
52
54
35
40
43
38
34
40
46
49
38
38
85
103
96
85
80
2.
3. Una empresa de cable planea incluir en sus servicios la conexión a Internet, por lo cual
realiza un experimento a fin de saber si existe alguna relación entre la hora y el lugar en
donde se conectan usuarios de Internet. Los resultados reportados son los siguientes:
Lugar A Lugar B Lugar C Lugar D
Horario 1
31
45
46
43
82
110
88
72
43
45
63
76
45
71
66
62
Horario 2
36
29
40
23
92
61
49
124
44
35
31
40
56
102
71
38
Horario 3
22
21
18
23
30
37
38
29
23
25
24
22
30
36
31
33
Determina con un nivel de confianza del 95%, si existe alguna predilección en cuanto a Lugar y
Horario para realizar la planeación de servicios de la compañía por cable.
nstrucciones:
Resuelve los siguientes ejercicios utilizando el análisis que se te indique.
1. Se desea saber si existe alguna diferencia significativa en el rendimiento en millas por
galón en automóviles de 4 cilindros cuando se aplica combustible con aditivo y cuando se
aplica combustible sin aditivo. Los resultados obtenidos son los siguientes:
Automóvil
Millas por galón
Con aditivo
Millas por galón
Sin aditivo
1
2
3
4
5
6
7
8
9
10
36.7
35.8
31.9
29.3
28.4
25.7
24.2
22.6
21.9
24.3
36.2
35.7
32.3
29.6
28.1
25.8
23.9
22.0
21.5
24.4
Emplea la técnica de análisis de varianza por medio de bloques aleatorios para indicar si existe
alguna diferencia significativa en utilizar aditivo o no utilizarlo.
Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com
www.maestronline.com
2. Para mejorar la actitud hacia las matemáticas un grupo de psicólogos aplican dos técnicas
de hipnosis: técnica A y técnica B y quieren saber si hay alguna diferencia en su
efectividad. Ellos toman al azar a 20 voluntarios en dos grupos independientes de 10 cada
uno y al primero se le aplica la técnica A y al resto la técnica B. Cada persona se le aplica
un diagnóstico para saber la susceptibilidad de ser hipnotizado que es una variable
relacionada con la receptividad de cada persona.
Se define X el índice de sugestibilidad y Y el índice de inducción hipnótica.
Las tablas de datos de resultados son las siguientes:
Método A Método B Método A Método B
Xa Ya Xb Yb
A1
A2
A3
A4
A5
5
10
12
9
23
20
23
30
25
34
B1
B2
B3
B4
B5
7
12
27
24
18
19
26
33
35
30
A6
A7
A8
A9
A10
21
14
18
6
13
40
27
38
24
31
B6
B7
B8
B9
B10
22
26
21
14
9
31
34
28
23
22
Identificar si existen diferencias en el resultado de aplicar el método A o el método B tomando en
cuenta la covariable de susceptibilidad a ser hipnotizado.
a siguiente tabla de datos consta de 91 observaciones y 6 variables. Las observaciones
corresponden a 91 países y las variables son indicadores de desarrollo:
 Analiza los bloques 2, 5, 8, 11 y 14. Toma los datos por separado (no en bloque).
a. Identifica entre los países si hay alguna forma de agruparlos de acuerdo con
los parámetros de tasa de mortalidad (TM) o esperanza de vida en hombres
(EH).
b. Identifica entre los países si hay alguna forma de agruparlos de acuerdo con
el PNB, es decir, compara qué pasa en países con mayor PNB con respecto a
los demás parámetros.
c. Sugiere algún procedimiento de conglomerado a utilizar y justifica porqué
seleccionaste ese tipo de procedimiento (el análisis formal lo harás en tu
proyecto final).
Avance del proyecto final
De tarea para este tema, debes entregar a tu profesor el avance de tu proyecto final, el cual, debe
contener lo siguiente:
 Copia del enunciado de cada problema.
 Especificación del método multivariante aplicado por problema y justificación de su
selección.
 Solución del problema por el método multivariante que se seleccionó.
 Interpretación de los resultados.
Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com
www.maestronline.com
Instrucciones:
Para cada uno de los problemas que se te presentan a continuación se debe aplicar alguna técnica
multivariante. Indica qué técnica es más adecuada, por qué y realiza el análisis conveniente.
1. McDonald’s es un restaurante de comida rápida que ha incursionado en el mercado de
ensaladas. Las ensaladas que ofrece son las siguientes: César, Ranch, Diosa Verde y
Rusa. Se probó en 14 restaurantes, durante 14 días, a fin de ver la respuesta de los
clientes y los datos encontrados se presentan a continuación:
Día César Ranch
Diosa
Verde
Rusa
1
2
3
4
5
6
7
155
157
151
146
181
160
168
143
146
141
136
180
152
157
149
152
146
141
173
170
174
135
136
131
126
115
150
147
8
9
10
11
12
13
14
157
139
144
158
184
161
165
167
159
154
169
195
177
178
141
129
167
145
178
201
185
130
119
134
144
177
151
160
a. Determina si existe alguna diferencia significativa entre las preferencias de los
consumidores hacia alguna ensalada.
2. En el análisis taxonómico de las flores para distinguir sus distintas especies se toma en
cuenta cinco aspectos: longitud de los sépalos, anchura de los sépalos, longitud de los
pétalos y anchura de los pétalos y su especie. Se desea probar si las cuatro
variables (longitud sépalo, ancho sépalo, longitud pétalo y ancho pétalo) presentadas
permiten identificar la especie en cuestión (visualizar los datos de forma gráfica para
comprobar si están correctamente diferenciadas). Se toma una muestra de 50
observaciones que se presentan a continuación:
OBS
Long
sépalo
Ancho
sépalo
Long
pétalo
Ancho
pétalo
Especie
Obs1 50 33 14 2 Setosa
Obs2 64 28 56 22 Virginica
Obs3 65 28 46 15 Versicolor
Obs4 67 31 56 24 Virginica
Obs5 63 28 51 15 Virginica
Obs6 46 34 14 3 Setosa
Obs7 69 31 51 23 Virginica
Obs8 62 22 45 15 Versicolor
Obs9 59 32 48 18 Versicolor
Obs10 46 36 10 2 Setosa
Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com
www.maestronline.com
Obs11 61 30 46 14 Versicolor
Obs12 60 27 51 16 Versicolor
Obs13 65 30 52 20 Virginica
Obs14 56 25 39 11 Versicolor
Obs15 65 30 55 18 Virginica
Obs16 58 27 51 19 Virginica
Obs17 68 32 59 23 Virginica
Obs18 51 33 17 5 Setosa
Obs19 57 28 45 13 Versicolor
Obs20 62 34 54 23 Virginica
Obs21 77 38 67 22 Virginica
Obs22 63 33 47 16 Versicolor
Obs23 67 33 57 25 Virginica
Obs24 76 30 66 21 Virginica
Obs25 49 25 45 17 Virginica
Obs26 55 35 13 2 Setosa
Obs27 67 30 52 23 Virginica
Obs28 70 32 47 14 Versicolor
Obs29 6 32 45 15 Versicolor
Obs30 61 28 40 13 Versicolor
Obs31 48 31 16 2 Setosa
Obs32 59 30 51 18 Virginica
Obs33 55 24 38 11 Versicolor
Obs34 63 25 50 19 Virginica
Obs35 64 32 53 23 Virginica
Obs36 52 34 14 2 Setosa
Obs37 49 36 14 1 Setosa
Obs38 54 30 45 15 Versicolor
Obs39 79 38 64 20 Virginica
Obs40 44 32 13 2 Setosa
Obs41 67 33 57 21 Virginica
Obs42 50 35 16 6 Setosa
Obs43 58 26 40 12 Versicolor
Obs44 44 30 13 2 Setosa
Obs45 77 28 67 20 Virginica
Obs46 63 27 49 18 Virginica
Obs47 47 32 16 2 Setosa
Obs48 55 26 44 12 Versicolor
Obs49 50 23 33 10 Versicolor
Obs50 72 32 60 18 Virginica
Datos tomados de Fisher M. (1936). “The Use of Multiple Measurements in Taxonomic Problems”, Annals of Eugenics, 7, pp. 179 – 188.
Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com
www.maestronline.com
Para contestar lo anterior (subrayado) se te sugiere:
a. Encontrar la matriz de correlación entre las variables.
b. Realizar un análisis de regresión múltiple a fin de determinar el modelo
lineal que permita explicar los datos.
c. Hacer el análisis de varianza correspondiente de la muestra completa e
interpretar.
d. Hacer el análisis discriminante e interpretar.
3. La empresa Kimberly-Clark es líder en el mercado de la industria de los pañales desde
1960 que inició en este campo. A la fecha vende más de 3500 millones de dólares,
únicamente en Estados Unidos. Los atributos principales en la fabricación de pañales son
los siguientes:
o Estilo: estampado/ color, blanco.
o Absorbencia: regular, superabsorbente.
o Cierre: cinta normal, cinta resellable.
o Escurrimiento: regular, antiescurrimiento.
e. Diseña los 16 perfiles completos en términos de preferencia. Calcula las funciones
de valor parcial y la importancia de cada atributo.
4. Los siguientes datos corresponden a personas que pertenecen a una comunidad en donde
se realizaron distintas medidas físicas a fin de determinar si existe diferencia entre las
medidas de hombres y mujeres. Responde lo siguiente:
a. ¿Qué análisis multivariante aplicarías? ¿Por qué?
b. Aplica el análisis que mencionaste en el inciso ‘a’ a los datos e interpreta los
resultados.
c. Identifica si hay alguna relación entre las medidas del cuerpo e interprétalas.
Sexo Estatura Peso Pie
Largo
brazo
Ancho
espalda
Diámetro
cráneo
Distancia
rodilla -
tobillo
1 0.00 159.00 49.00 36.00 68.00 42.00 57.00 40.00
2 1.00 164.00 62.00 39.00 73.00 44.00 55.00 44.00
3 0.00 172.00 65.00 38.00 75.00 48.00 58.00 44.00
4 0.00 167.00 52.00 37.00 73.00 41.50 58.00 44.00
5 0.00 164.00 51.00 36.00 71.00 44.50 54.00 40.00
6 0.00 161.00 67.00 38.00 71.00 44.00 56.00 42.00
7 0.00 168.00 48.00 39.00 72.50 41.00 54.50 43.00
8 1.00 181.00 74.00 43.00 74.00 50.00 60.00 47.00
9 1.00 183.00 74.00 41.00 79.00 47.50 59.50 47.00
10 0.00 158.00 50.00 36.00 68.50 44.00 57.00 41.00
11 0.00 156.00 65.00 36.00 68.00 46.00 58.00 41.00
12 1.00 173.00 64.00 40.00 79.00 48.00 56.50 47.00
13 0.00 158.00 43.00 36.00 68.00 43.00 55.00 39.00
14 1.00 178.00 74.00 42.00 75.00 50.00 59.00 45.00
15 1.00 181.00 76.00 43.00 83.00 51.00 57.00 43.00
Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com
www.maestronline.com
16 1.00 182.00 91.00 41.00 83.00 53.00 59.00 43.00
17 1.00 176.00 73.00 42.00 78.00 48.00 58.00 45.00
18 0.00 162.00 68.00 39.00 72.00 44.00 59.00 42.00
19 0.00 156.00 52.00 36.00 67.00 36.00 56.00 41.00
20 0.00 152.00 45.00 34.00 66.00 40.00 55.00 38.00
21 1.00 181.00 80.00 43.00 76.00 49.00 57.00 46.00
22 1.00 173.00 69.00 41.00 74.00 48.00 56.00 44.00
23 0.00 155.00 53.00 36.00 67.00 43.00 56.00 38.00
24 1.00 189.00 87.00 45.00 82.00 53.00 61.00 52.00
25 0.00 170.00 70.00 38.00 73.00 45.00 56.00 43.00
26 1.00 170.00 67.00 40.00 77.00 46.50 58.00 44.50
27 0.00 168.00 56.00 37.50 70.50 48.00 60.00 40.00
Entrega del proyecto final
De tarea para este tema, debes entregar a tu profesor tu proyecto final, el cual, debe contener lo
siguiente:
 Copia del enunciado de cada problema.
 Especificación del método multivariante aplicado por problema y justificación de su
selección.
 Solución del problema por el método multivariante que se seleccionó.
 Interpretación de los resultados.
Instrucciones:
Para cada uno de los problemas que se te presentan a continuación se debe aplicar alguna técnica
multivariante. Indica qué técnica es más adecuada, por qué y realiza el análisis conveniente.
1. Los datos presentados a continuación representan 21 observaciones de 8 variables que
corresponden a publicaciones científicas en distintos países recogidas durante 1982 –
1984. Las variables se organizaron por área:
InterA (interdisciplinaria), InterB (interdisciplinaria), Agric. (Agricultura), Biolo. (Biología),
Medic. (Medicina), Quimi. (Química), Ingen. (Ingeniería) y Física.
INTER.A INTER.B AGRIC. BIOLO. MEDIC. QUIMI. INGEN. FÍSICA
EE.UU 815319 379851 88663 58104 255864 440134 111015 162288
UK 162103 90332 35158 29802 59630 92725 6409 34349
JP 105856 78811 13978 16758 55634 308926 32039 40538
F 118935 76186 13818 11253 49938 120065 9984 35792
G 91099 85037 11740 20337 41233 66087 11304 22093
C 72722 49459 14041 16722 23139 101900 12034 14645
I 42905 29734 7904 13444 31078 36322 5833 11351
A 36121 22236 12419 9863 12186 19641 4898 6299
H 29912 18036 6563 7548 13721 23029 3798 6775
Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com
www.maestronline.com
S 28568 16190 3985 9502 14852 18341 2387 3549
CH 26495 14518 3378 3636 11096 19304 2556 5784
E 16425 11818 3089 3981 7196 15493 1258 2692
B 17311 11791 3240 4011 8098 11964 1772 3417
D 14677 555 2635 5667 8368 14266 1197 1999
AU 10957 13154 1433 2372 5928 6713 1318 2278
FI 11012 6457 2028 4756 5731 6647 1001 1669
N 9075 5432 1803 3299 4801 5326 912 853
Y 4686 2957 2031 1194 1806 7046 801 1861
GR 3720 2749 692 1293 1518 2415 896 1366
IR 6786 214 432 1119 1355 98 522 941
P 1221 1929 388 386 564 12 493 413
a. Identifica si existe redundancia entre los datos, es decir, si podemos reducir el
número de variables para explicar el comportamiento de los datos.
b. Identifica si existe correlación entre las distintas disciplinas y si puedes generar un
modelo lineal para el conjunto de datos.
2. Una importante empresa financiera quiere ganar el liderazgo en el manejo de tarjetas de
crédito para lo cual busca elaborar un conjunto de perfiles de tarjeta y presentarlo a
clientes para conocer sus preferencias. Las características a valorar son las siguientes:
 Tasa de interés: baja, media, alta
 Puntos por uso: sí, no
 Cargo anual: cero, $200, $400
Diseña el total de perfiles completos en términos de preferencia. Calcula las
funciones de valor parcial y la importancia de cada atributo. Algunos atributos son
incompatibles (por ejemplo: a tarjetas que tienen tasa de interés baja no se les dan
puntos por uso o por ejemplo si la tarjeta tiene cargo anual cero generalmente
presenta tasa anual media o alta, o en una tarjeta con cargo anual alto y puntos
puede tener tasa de interés baja -¿por qué?-). Determina los perfiles que sería
conveniente presentar a los clientes en el diseño de esta nueva tarjeta de crédito.
3. La siguiente tabla pertenece a un grupo de datos constituido por 26 observaciones y 9
variables que corresponden a porcentaje de empleo en los distintos sectores en países
europeos. Los sectores son los siguientes:
Agr: agricultura
Min: minería
Man: manufactura
Ene: energía
Con: construcción
SI: servicios industriales
Fin: finanzas
Ser: servicios
TC: transporte y comunicaciones
Fuente: Euromonitor (1979).
Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com
www.maestronline.com
Agr Min Man Ene Con SI Fin Ser TC
Alemania del E. 4.20 2.90 41.20 1.30 7.60 11.20 1.20 22.10 8.40
Alemania del O. 6.70 1.30 35.80 0.90 7.30 14.40 5.00 22.30 6.10
Austria 12.70 1.10 30.20 1.40 9.00 16.80 4.90 16.80 7.00
Bélgica 3.30 0.90 27.60 0.90 8.20 19.10 6.20 26.60 7.20
Bulgaria 23.60 1.90 32.30 0.60 7.90 8.00 0.70 18.20 6.70
Checoslovaquia 16.50 2.90 35.50 1.20 8.70 9.20 0.90 17.90 7.00
Dinamarca 9.20 0.10 21.80 0.60 8.30 14.60 6.50 32.20 7.10
España 22.90 0.80 28.50 0.70 11.50 9.70 8.50 11.80 5.50
Finlandia 13.00 0.40 25.90 1.30 7.40 14.70 5.50 24.30 7.60
Francia 10.80 0.80 27.50 0.90 8.90 16.80 6.00 22.60 5.70
Grecia 41.40 0.60 17.60 0.60 8.10 11.50 2.40 11.00 6.70
Hungría 21.70 3.10 29.60 1.90 8.20 9.40 0.90 17.20 8.00
Irlanda 23.20 1.00 20.70 1.30 7.50 16.80 2.80 20.80 6.10
Italia 15.90 0.60 27.60 0.50 10.00 18.10 1.60 20.10 5.70
Luxemburgo 7.70 3.10 30.80 0.80 9.20 18.50 4.60 19.20 6.20
Noruega 9.00 0.50 22.40 0.80 8.60 16.90 4.70 27.60 9.40
Países Bajos 6.30 0.10 22.50 1.00 9.90 18.00 6.80 28.50 6.80
Polonia 31.10 2.50 25.70 0.90 8.40 7.50 0.90 16.10 6.90
Portugal 27.80 0.30 24.50 0.60 8.40 13.30 2.70 16.70 5.70
Reino Unido 2.70 1.40 30.20 1.40 6.90 16.90 5.70 28.30 6.40
Rumania 34.70 2.10 30.10 0.60 8.70 5.90 1.30 11.70 5.00
Suecia 6.10 0.40 25.90 0.80 7.20 14.40 6.00 32.40 6.80
Suiza 7.70 0.20 37.80 0.80 9.50 17.50 5.30 15.40 5.70
Turquía 66.80 0.70 7.90 0.10 2.80 5.20 1.10 11.90 3.20
USSR 23.70 1.40 25.80 0.60 9.20 6.10 0.50 23.60 9.30
Yugoslavia 48.70 1.50 16.80 1.10 4.90 6.40 11.30 5.30 4.00
a. Analiza la tabla de datos anterior por el método de conglomerados de acuerdo con
las siguientes técnicas:
i. Jerárquico enlace único (vecino más cercano)
ii. Jerárquico procedimiento de centroide
iii. Técnica de Ward
b. Analiza por el método de dos pasos para tratar de encontrar entre 3 y 5 grupos
conglomerados bien identificados.
c. Interpreta y analiza cada grupo de resultados a fin de identificar qué cantidad de
conglomerados es óptima y cuál es el parámetro que conglomera los datos. Utiliza
dendograma o los gráficos que requieras a fin de aclarar tus respuestas.

Mais conteúdo relacionado

Destaque (11)

Power para slideshare
Power para slidesharePower para slideshare
Power para slideshare
 
Educación maestría
Educación maestríaEducación maestría
Educación maestría
 
Nf 32888
Nf 32888Nf 32888
Nf 32888
 
Prédio do Davi. Povoado Antonio Conselheiro em Bom Jardim MA
Prédio do Davi.  Povoado Antonio Conselheiro em Bom Jardim MAPrédio do Davi.  Povoado Antonio Conselheiro em Bom Jardim MA
Prédio do Davi. Povoado Antonio Conselheiro em Bom Jardim MA
 
Marketing de Conteúdo
Marketing de ConteúdoMarketing de Conteúdo
Marketing de Conteúdo
 
Vidrinho dos 40 tinhas
Vidrinho dos 40 tinhasVidrinho dos 40 tinhas
Vidrinho dos 40 tinhas
 
Apresentação1
Apresentação1Apresentação1
Apresentação1
 
Caso 4 responsabilidade civil
Caso 4 responsabilidade civilCaso 4 responsabilidade civil
Caso 4 responsabilidade civil
 
ATAJO DE TECLADO
ATAJO DE TECLADOATAJO DE TECLADO
ATAJO DE TECLADO
 
Formato de prácticas
Formato de prácticasFormato de prácticas
Formato de prácticas
 
Fabiola ferreira encarnacion..
Fabiola ferreira encarnacion..Fabiola ferreira encarnacion..
Fabiola ferreira encarnacion..
 

Semelhante a Analisis multivariante ss13

Investigacion de operaciones 2 io04002
Investigacion de operaciones 2 io04002Investigacion de operaciones 2 io04002
Investigacion de operaciones 2 io04002
Maestros Online
 

Semelhante a Analisis multivariante ss13 (20)

Analisis multivariante ss13
Analisis multivariante ss13Analisis multivariante ss13
Analisis multivariante ss13
 
Analisis multivariante ss13
Analisis multivariante ss13Analisis multivariante ss13
Analisis multivariante ss13
 
Pronostico para la toma de decisiones cn09005
Pronostico para la toma de decisiones cn09005Pronostico para la toma de decisiones cn09005
Pronostico para la toma de decisiones cn09005
 
Estadistica y pronostico para la toma de decisiones s14
Estadistica y pronostico para la toma de decisiones s14Estadistica y pronostico para la toma de decisiones s14
Estadistica y pronostico para la toma de decisiones s14
 
Pronostico para la toma de decisiones ma9108 sep2012
Pronostico para la toma de decisiones ma9108 sep2012Pronostico para la toma de decisiones ma9108 sep2012
Pronostico para la toma de decisiones ma9108 sep2012
 
Pronostico para la toma de decisiones
Pronostico para la toma de decisionesPronostico para la toma de decisiones
Pronostico para la toma de decisiones
 
Estadisticas ii semestral
Estadisticas ii semestralEstadisticas ii semestral
Estadisticas ii semestral
 
Seis sigma
Seis sigmaSeis sigma
Seis sigma
 
Estadistica y pronostico para la toma de decisiones s14
Estadistica y pronostico para la toma de decisiones s14Estadistica y pronostico para la toma de decisiones s14
Estadistica y pronostico para la toma de decisiones s14
 
Control estadistico de calidad cd09103 2013
Control estadistico de calidad cd09103 2013Control estadistico de calidad cd09103 2013
Control estadistico de calidad cd09103 2013
 
Estadistica 2 sept 2012
Estadistica 2 sept 2012Estadistica 2 sept 2012
Estadistica 2 sept 2012
 
Estadistica administrativa
Estadistica administrativaEstadistica administrativa
Estadistica administrativa
 
Estadistica y pronostico para la toma de decisiones
Estadistica y pronostico para la toma de decisionesEstadistica y pronostico para la toma de decisiones
Estadistica y pronostico para la toma de decisiones
 
Seis sigma 9102
Seis sigma 9102Seis sigma 9102
Seis sigma 9102
 
Seis sigma 9102
Seis sigma 9102Seis sigma 9102
Seis sigma 9102
 
Analisis multivariante
Analisis multivarianteAnalisis multivariante
Analisis multivariante
 
Control estadistico de calidad cd09103
Control estadistico de calidad cd09103Control estadistico de calidad cd09103
Control estadistico de calidad cd09103
 
Investigacion de operaciones 2 io04002
Investigacion de operaciones 2 io04002Investigacion de operaciones 2 io04002
Investigacion de operaciones 2 io04002
 
Control estadistico de calidad cd09103 2012
Control estadistico de calidad cd09103 2012Control estadistico de calidad cd09103 2012
Control estadistico de calidad cd09103 2012
 
Estadistica 2 sept 2012
Estadistica 2 sept 2012Estadistica 2 sept 2012
Estadistica 2 sept 2012
 

Mais de Educaciontodos

Mais de Educaciontodos (20)

Asesorías mate en linea
Asesorías mate en lineaAsesorías mate en linea
Asesorías mate en linea
 
Bioestadistica aplus
Bioestadistica aplusBioestadistica aplus
Bioestadistica aplus
 
Inteligencia de mercados ss14
Inteligencia de mercados ss14Inteligencia de mercados ss14
Inteligencia de mercados ss14
 
Instrumentacion ss13
Instrumentacion ss13Instrumentacion ss13
Instrumentacion ss13
 
Ingenieria mecatronica
Ingenieria mecatronicaIngenieria mecatronica
Ingenieria mecatronica
 
Ingenieria electronica ss14
Ingenieria electronica ss14Ingenieria electronica ss14
Ingenieria electronica ss14
 
Ingenieria electrica ss14
Ingenieria electrica ss14Ingenieria electrica ss14
Ingenieria electrica ss14
 
Ingenieria de control mr
Ingenieria de control mrIngenieria de control mr
Ingenieria de control mr
 
Ingenieria de control ic09002
Ingenieria de control ic09002Ingenieria de control ic09002
Ingenieria de control ic09002
 
Historia de la educacion
Historia de la educacionHistoria de la educacion
Historia de la educacion
 
Fundamentos matemáticos aplus
Fundamentos matemáticos aplusFundamentos matemáticos aplus
Fundamentos matemáticos aplus
 
Fundamentos de sistemas mecanicos
Fundamentos de sistemas mecanicosFundamentos de sistemas mecanicos
Fundamentos de sistemas mecanicos
 
Fundamentos de programacion ss14
Fundamentos de programacion ss14Fundamentos de programacion ss14
Fundamentos de programacion ss14
 
Fundamentos de la administración maestría
Fundamentos de la administración maestríaFundamentos de la administración maestría
Fundamentos de la administración maestría
 
Fundamentos de dibujo y dibujo tecnico
Fundamentos de dibujo y dibujo tecnicoFundamentos de dibujo y dibujo tecnico
Fundamentos de dibujo y dibujo tecnico
 
Fundamentos de cadena de suministros ss14
Fundamentos de cadena de suministros ss14Fundamentos de cadena de suministros ss14
Fundamentos de cadena de suministros ss14
 
Fundamentos de cadena de suministros s14
Fundamentos de cadena de suministros s14Fundamentos de cadena de suministros s14
Fundamentos de cadena de suministros s14
 
Fundamentos de cadena de suministros cel20152
Fundamentos de cadena de suministros cel20152Fundamentos de cadena de suministros cel20152
Fundamentos de cadena de suministros cel20152
 
Fundamentos de cadena de suministros cel2015
Fundamentos de cadena de suministros cel2015Fundamentos de cadena de suministros cel2015
Fundamentos de cadena de suministros cel2015
 
Fundamentos de administracion ss14
Fundamentos de administracion ss14Fundamentos de administracion ss14
Fundamentos de administracion ss14
 

Último

2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
RigoTito
 
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxRESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
pvtablets2023
 
6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria
Wilian24
 
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docxTALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
NadiaMartnez11
 

Último (20)

2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
2 REGLAMENTO RM 0912-2024 DE MODALIDADES DE GRADUACIÓN_.pptx
 
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLAACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
ACRÓNIMO DE PARÍS PARA SU OLIMPIADA 2024. Por JAVIER SOLIS NOYOLA
 
Sesión de clase APC: Los dos testigos.pdf
Sesión de clase APC: Los dos testigos.pdfSesión de clase APC: Los dos testigos.pdf
Sesión de clase APC: Los dos testigos.pdf
 
Tema 11. Dinámica de la hidrosfera 2024
Tema 11.  Dinámica de la hidrosfera 2024Tema 11.  Dinámica de la hidrosfera 2024
Tema 11. Dinámica de la hidrosfera 2024
 
Power Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptxPower Point: Fe contra todo pronóstico.pptx
Power Point: Fe contra todo pronóstico.pptx
 
semana 4 9NO Estudios sociales.pptxnnnn
semana 4  9NO Estudios sociales.pptxnnnnsemana 4  9NO Estudios sociales.pptxnnnn
semana 4 9NO Estudios sociales.pptxnnnn
 
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptxRESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
RESULTADOS DE LA EVALUACIÓN DIAGNÓSTICA 2024 - ACTUALIZADA.pptx
 
6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria6°_GRADO_-_MAYO_06 para sexto grado de primaria
6°_GRADO_-_MAYO_06 para sexto grado de primaria
 
TIENDAS MASS MINIMARKET ESTUDIO DE MERCADO
TIENDAS MASS MINIMARKET ESTUDIO DE MERCADOTIENDAS MASS MINIMARKET ESTUDIO DE MERCADO
TIENDAS MASS MINIMARKET ESTUDIO DE MERCADO
 
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docxTALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
TALLER DE DEMOCRACIA Y GOBIERNO ESCOLAR-COMPETENCIAS N°3.docx
 
Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024Tema 19. Inmunología y el sistema inmunitario 2024
Tema 19. Inmunología y el sistema inmunitario 2024
 
Lecciones 06 Esc. Sabática. Los dos testigos
Lecciones 06 Esc. Sabática. Los dos testigosLecciones 06 Esc. Sabática. Los dos testigos
Lecciones 06 Esc. Sabática. Los dos testigos
 
Revista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfRevista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdf
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
 
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
Procedimientos para la planificación en los Centros Educativos tipo V ( multi...
 
Sesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronósticoSesión de clase: Fe contra todo pronóstico
Sesión de clase: Fe contra todo pronóstico
 
origen y desarrollo del ensayo literario
origen y desarrollo del ensayo literarioorigen y desarrollo del ensayo literario
origen y desarrollo del ensayo literario
 
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIASISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
SISTEMA RESPIRATORIO PARA NIÑOS PRIMARIA
 
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxPLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
 

Analisis multivariante ss13

  • 1. Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com www.maestronline.com Solicita una cotización a través de nuestros correos. Maestros Online Análisis Multivariante Apoyo en ejercicios Servicio de asesorías y solución de ejercicios Ciencias_help@hotmail.com
  • 2. Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com www.maestronline.com nstrucciones:  Lee con toda atención la explicación del tema y resuelve los siguientes problemas. Puedes necesitar tablas estadísticas y utilizar algún paquete computacional. 1. Una empresa lleva a cabo una prueba para seleccionar nuevos empleados. Se sabe que las puntuaciones siguen una distribución normal con media de 80 y desviación estándar de 25. a. ¿Qué porcentaje de candidatos obtendrá entre 75 y 100 puntos? b. Si se presentan 50 candidatos, ¿cuál es la probabilidad de que el candidato obtenga más de 90 puntos? 2. Para ingresar a cierta universidad se aplica un test con 100 preguntas de las cuales cada una tiene 4 posibles respuestas y sólo una correcta. Para ser admitido se requiere que al menos 30 respuestas estén contestadas de forma correcta. Una persona responde el test al azar. a. ¿Cuál es el número esperado de respuestas correctas? b. ¿Qué probabilidad tendrá de superar la prueba? 3. Se tomó una muestra de 12 casas vendidas en cierta ciudad de Estados Unidos en donde se midió la extensión (miles de pies cuadrados) y el precio de venta (miles de dólares): Extensión (miles de pies cuadrados) 1.4 1.3 1.2 1.1 1.4 1 1.3 0.8 1.2 0.9 1.1 1.1 Precio de venta (miles de dólares) 100 110 105 120 80 105 110 85 105 75 70 95 a. Encuentra el coeficiente de correlación e interpreta el resultado. b. Determina la ecuación lineal que describe el comportamiento de los datos. c. ¿Qué precio de venta se espera de una casa con 1.5 miles de pies cuadrados? 4. Se realizó una encuesta de presupuestos familiares y se obtuvieron los siguientes datos mensuales: Gasto teléfono Renta familiar # Habitantes Gasto teléfono Renta familiar # Habitantes 2000 1500 780 340 200 850 10000 7500 4000 4000 3560 9850 2 4 3 6 3 4 5000 2500 1250 980 745 600 16000 7500 6500 8000 7000 12000 3 4 4 6 5 5 a. Calcula el coeficiente de correlación y dale una interpretación. b. Construye un modelo de regresión lineal múltiple para los datos. c. ¿Qué gasto de teléfono se espera en una familia de 5 integrantes con 10 000 de ingreso? Instrucciones:
  • 3. Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com www.maestronline.com Investiga en distintas fuentes (como en la biblioteca digital o en Google Libros, disponible en: http://books.google.com.mx/bkshp?hl=es&tab=wp) un poco más sobre las siguientes técnicas multivariantes: 1. Análisis factorial y de componentes 2. Análisis multivariado de varianza y covarianza 3. Análisis de conglomerados (cluster) De cada uno anota un ejemplo que incluya:  Explicación del problema.  Tipo de relación entre variables que justifique el uso de la técnica multivariante aplicada.  Interpretación o conclusión del problema a resolver. Instrucciones: Se hizo una encuesta a personas acerca del calzado deportivo marca Nike. En la siguiente tabla se presentan los datos recopilados. Se usaron códigos 1, 2, 3 para usuarios esporádicos, intermedios o frecuentes, respectivamente. El sexo se codificó como 1 o 2 (1 = hombres, 2 = mujeres). La conciencia, actitud, preferencia, intención y lealtad se midieron en una escala de 7 puntos (1 muy desfavorable y 7 muy favorable). Número Uso Sexo Conciencia Actitud Preferencia Intención Lealtad 1 2 3 4 5 3 1 1 3 3 2 1 1 2 2 7 2 3 6 5 6 2 3 5 4 5 4 6 5 7 5 6 7 3 4 6 5 6 2 3 6 7 8 9 10 2 2 1 2 1 2 1 1 2 1 4 5 2 4 3 3 4 1 4 1 5 4 3 3 2 2 3 4 6 4 3 2 5 5 5 11 12 13 14 15 3 3 1 3 1 2 2 1 2 2 6 6 4 6 4 7 5 3 4 3 6 6 3 5 4 4 4 1 3 5 5 4 1 2 6 Para estos datos realiza lo siguiente: 1. Plantear el problema. 2. Elaborar la matriz de correlación. 3. Realizar las pruebas de esfericidad de Bartlett y el índice KMO, a fin de determinar si los datos son factibles de tratar con un análisis factorial. 4. Encontrar la matriz de factores, así como los eigenvalores para determinar qué factores son relevantes en el análisis Se realiza una encuesta respecto a las ventajas de nueve marcas de autos de lujo. Las variables consideradas fueron éstas:
  • 4. Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com www.maestronline.com V1 Prestigio V2 Desempeño V3 Lujo V4 Valor La escala utilizada fue de 7 puntos, donde 1 = poco y 7 = excelente. Las respuestas arrojaron la siguiente tabla: Marca Prestigio Desempeño Lujo Valor Lexus Infinity BMW Mercedes 5 5 5 6 7 6 7 6 5 5 6 6 7 7 5 6 Cadillac Lincoln Porsche Bentley Rolls 5 6 5 7 7 5 6 6 4 5 6 5 5 7 7 5 5 4 3 1 Considerando lo anterior: 1. Realiza el análisis de estos datos mediante el análisis de componentes y el procedimiento de rotación varimax. 2. Interpreta los factores extraídos. 3. Si tuvieras variables sustitutas, ¿cuáles escogerías? 4. Examina el ajuste del modelo y determina si el análisis factorial es la mejor técnica para tratar estos datos. Recuerda incluir todos los resultados del proceso del análisis (los paquetes computacionales muestran todos los resultados). nstrucciones: Descarga una copia a prueba del paquete SPSS indicado en la bibliografía del curso y en el que podrás realizar el siguiente ejercicio. Esta copia tiene vigencia, así que es importante que abras por primera vez la aplicación cuando vayas a trabajar con el paquete. Ejercicio: La siguiente tabla presenta el resultado de una encuesta acerca de cuántos viajes hizo la gente en los últimos dos meses. La codificación tiene los siguientes datos:  Número de viajes (1 = un viaje, 2 = dos viajes, 3 = tres viajes).  Ingreso (en miles de dólares).  Actitud, se mide en escala de 1 a 8 (1 = me desagrada viajar, 8 = me gusta mucho viajar).  Tamaño de la familia (número de integrantes de la familia).  Edad del jefe de familia (años de edad).  Cantidad gastada en esos viajes (1 = gasto bajo, 2 = gasto medio, 3 = gasto alto). No. viajes Ingreso Actitud Tamaño Edad Cantidadgastada
  • 5. Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com www.maestronline.com 1 39.7 8 3 40 2 1 49.0 6 3 51 3 1 63.6 7 3 37 3 1 43.7 7 7 51 1 1 36.3 3 3 61 3 1 35.1 8 4 56 3 1 59.8 8 2 64 2 1 34.4 6 4 53 2 1 50.5 4 6 45 3 1 62.2 8 4 40 3 1 35.7 8 4 56 3 1 54.7 1 4 68 3 1 64.5 8 4 44 2 1 54.6 2 4 52 3 1 61.9 2 2 41 3 2 63.5 6 5 49 3 2 55.2 6 4 67 1 2 37.6 3 2 66 1 2 48.9 6 2 45 2 2 54.1 7 3 42 2 2 54.7 4 2 54 2 2 67.4 8 3 66 3 2 66.4 7 6 61 2 2 65.3 7 4 52 3 2 48.1 8 2 53 1 2 36.7 2 3 67 1 2 64.2 8 2 39 1 2 37.3 1 5 53 2 2 53.9 3 2 44 2 2 63.3 6 2 54 3 Considerando los datos de la tabla anterior, realiza lo siguiente: 1. Captura los datos en tu paquete estadístico. Utiliza como variable de agrupación el número de viajes, y las demás como independientes. 2. Sigue paso a paso el llenado de ventanas, como se te indicó en la explicación del tema, a fin de tener todos los elementos que se requieren para el análisis y la interpretación. 3. Revisa la hoja de resultados y ubica la tabla que se denomina Estadísticos de grupo: a. La primera columna es la variable que utilizamos como variable de agrupación, que en este caso es el “número de viajes” y puedes observar que aparecen los parámetros que capturaste con algunos datos como: media, desviación típica, datos ponderados y no ponderados.
  • 6. Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com www.maestronline.com b. Identifica, para cada valor del número de viajes, qué parámetro es el más grande y repórtalo. Eso nos indica qué variable es la que más influye para que una familia decida realizar 1, 2 o 3 viajes en un periodo de 2 meses. Para la elaboración de esta tarea, necesitarás el paquete SPSS, del cual puedes descargar una copia a prueba, como está indicado en la bibliografía del curso. Ten presente que esta copia tiene vigencia. Ejercicio: Una agencia de viajes está interesada en conocer los factores que más influyen en los viajes de las personas, para así poder ofrecer promociones adecuadas a ellos. Para llevar a cabo su análisis, realizó una encuesta acerca de los viajes que realizaron 30 de sus clientes durante los últimos dos meses. La siguiente tabla presenta el resultado de la encuesta realizada por la agencia de viajes. La codificación tiene los siguientes datos:  Número de viajes (1 = un viaje, 2 = dos viajes, 3 = tres viajes).  Ingreso (en miles de dólares al mes).  Actitud (medida en escala de 1 a 8, donde 1 = me desagrada viajar y 8 = me gusta mucho viajar).  Tamaño de la familia (número de integrantes de la familia).  Edad del jefe de familia.  Cantidad gastada en esos viajes (1 = gasto bajo, 2 = gasto medio, 3 = gasto alto). Número de viajes Ingreso Actitud Tamaño de la familia Edad del jefe de familia Cantidad gastada 1 39.7 8 3 40 2 1 49.0 6 3 51 3 1 63.6 7 3 37 3 1 43.7 7 7 51 1 1 36.3 3 3 61 3 1 35.1 8 4 56 3 1 59.8 8 2 64 2 1 34.4 6 4 53 2 1 50.5 4 6 45 3 1 62.2 8 4 40 3 1 35.7 8 4 56 3 1 54.7 1 4 68 3 1 64.5 8 4 44 2 1 54.6 2 4 52 3 1 61.9 2 2 41 3 2 63.5 6 5 49 3 2 55.2 6 4 67 1 2 37.6 3 2 66 1 2 48.9 6 2 45 2
  • 7. Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com www.maestronline.com 2 54.1 7 3 42 2 2 54.7 4 2 54 2 2 67.4 8 3 66 3 2 66.4 7 6 61 2 2 65.3 7 4 52 3 2 48.1 8 2 53 1 2 36.7 2 3 67 1 2 64.2 8 2 39 1 2 37.3 1 5 53 2 2 53.9 3 2 44 2 2 63.3 6 2 54 3 Captura los datos de la tabla anterior en tu paquete estadístico (utiliza como variable de agrupación el número de viajes, y las demás como independientes). Realiza el análisis discriminante y utiliza el resumen de resultados para responder lo siguiente: 1. ¿Qué variable es la que más influye para que una familia decida realizar 1, 2 o 3 viajes en un período de 2 meses? 2. Identifica, mediante el examen de medias, si las medias son estadísticamente iguales para ambos grupos. 3. Analiza los valores de la λ de Wilks para los datos solos y posteriormente para los datos agrupados, junto con su transformación en chi cuadrada. A partir de los resultados, indica el nivel de significancia del análisis. 4. De acuerdo a la matriz de correlaciones agrupadas, identifica si hay alguna que presente correlación con alguna otra variable. 5. Determina si hay diferencia entre grupos en cuanto al número de viajes, en aspectos como ingreso, actitud, tamaño de la familia, edad del jefe de familia o cantidad gastada. 6. Ahora realiza la interpretación de datos. Puedes utilizar las cargas canónicas, los coeficientes estandarizados o los no estandarizados, o los signos de los centroides para hacerlo. 7. Finalmente, comenta la validez del análisis discriminante y menciona el % de validez que hay en los datos agrupados originales. 8. Arma la función discriminante para el modelo en particular. 9. Elabora tus conclusiones respecto a lo que podría hacer la agencia de viajes con esta información. nstrucciones: Imagina que trabajas en bienes raíces y estás interesado en conocer la preferencia de selección de vivienda de un grupo de personas que desean adquirir un inmueble, para así saber lo que les puedes ofrecer a tus clientes potenciales. Los parámetros que utilizarás son los siguientes:  Tipo: casa, departamento.  Recámaras: 1, 2, 3 recámaras.  Cochera: 1, 2 autos.  Precio: menos de 1 millón, 1 a 2 millones, más de 2 millones. A continuación se presentan los pasos a seguir para lograr el objetivo de tu investigación de mercados:
  • 8. Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com www.maestronline.com 1. Diseña una encuesta dirigida a personas que desean adquirir un inmueble. 2. Presenta a 2 personas, por separado, una tarjeta con la combinación de parámetros que te parezca adecuada (no tienen que ser todas, que sean mínimo 9). a. Solicita a cada persona que seleccione en escala de 1 a 9 (1 = menor preferencia, y 9 = mayor preferencia) sus preferencias. b. Observa si hay algunas combinaciones que no sean posibles o determinantes y descártalas. 3. Realiza el análisis conjunto de cada tarjeta por separado, incluyendo gráfico de utilidades e importancia de los resultados. Puedes utilizar variables ficticias en tu análisis. 4. ¿Existe alguna diferencia en los resultados de las dos encuestas?, ¿es significativa?, ¿puedes explicar la diferencia? Instrucciones: 1. En 8 ciudades en México se ha recogido información sobre la venta, en 1998, de periódico (variable Y en ejemplares diarios vendidos por cada mil habitantes) relacionándola con su producción económica en concreto con el PIB por habitante (variable X en miles de pesos). Los datos se presentan a continuación: X 8.3 9.7 10.7 11.7 12.4 15.4 16.3 17.2 Y 57.4 106.8 104.4 131.9 144.6 146.4 177.4 186.9 a. Encontrar el coeficiente de regresión y el coeficiente de determinación. b. Construir el modelo lineal que explica el comportamiento de las variables. c. ¿Cuántos periódicos esperamos que se vendan si el PIB por habitante es $25,000? d. Si la venta de periódicos es de 150 por cada mil habitantes, ¿qué PIB podemos predecir? 2. Una empresa frutícola está por iniciar el cultivo de fresa en un terreno nuevo que acaba de adquirir y aprovecha los datos de un fruticultor, que ha encontrado una relación muy significativa entre producción obtenida (miles de toneladas de fresa), el volumen de agua utilizado (miles de litros) y la cantidad de abono específico utilizado (en kilogramos): Año Producción X1 Agua X2 Abono X3 2005 2006 2007 2008 2009 120 150 200 270 350 100 130 175 240 310 10 12 14 17 20 a. Encuentra la matriz de correlación entre las variables. b. Encuentra el coeficiente de correlación y el coeficiente de determinación. c. Construye el modelo lineal que describa el comportamiento de las variables. d. Si el agua utilizada fuera 40 mil litros, y el abono 5 kg, ¿qué producción esperaríamos? Lee con toda atención la explicación del tema y resuelve los siguientes problemas. Puedes necesitar tablas estadísticas y utilizar algún paquete computacional si lo deseas.
  • 9. Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com www.maestronline.com 1. Cierta ciudad está dividida en cuatro distritos. El jefe de la policía quiere determinar si hay alguna diferencia en el número promedio de crímenes cometidos en cada distrito. Se lleva un registro durante seis días. Con un nivel de significancia de 0.05, ¿se puede concluir que hay diferencia en el número promedio de crímenes? Distrito I Distrito II Distrito III Distrito IV 13 15 14 15 14 15 21 13 18 19 18 19 12 14 15 13 12 15 16 17 18 15 20 18 2. En cierta oficina se desea estudiar el efecto del cansancio en una tarea rutinaria, para lo cual se toman datos acerca del tiempo que toma realizar cierta tarea, de acuerdo a la hora en que se realice. El resultado es el siguiente: Inicio de la jornada A las 4 horas A las 7 horas 12 12 13 14 11 15 9 9 8 10 11 11 10 9 8 10 10 9 9 9 10 9 7 6 6 9 12 11 10 8 6 9 6 7 9 6 7 6 7 7 8 8 7 9 9 6 5 6 6 7 9 Si suponemos normalidad e independencia entre los grupos y a un nivel de confianza del 95%, ¿podemos afirmar que el tiempo que se tarda en realizar un trabajo rutinario está determinado por la hora en que se realice? Resuelve los siguientes ejercicios utilizando el análisis de varianza: 1. Una empresa familiar que fabrica tortillas ha analizado el número de clientes que entran, en promedio, cada hora por trimestre durante un año. Con un nivel de confianza del 95% ¿existe alguna relación significativa en el número de clientes que entra a la tienda de acuerdo a la hora y al trimestre en que se tomó la medida? Trimestre 1 Trimestre 2 Trimestre 3 Trimestre 4 8:00AM 9:00AM 10:00AM 11:00AM 7 10 25 50 4 7 15 20 5 8 17 25 9 20 35 67
  • 10. Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com www.maestronline.com 12:00AM 1:00PM 2:00PM 3:00PM 4:00PM 75 79 68 52 54 35 40 43 38 34 40 46 49 38 38 85 103 96 85 80 2. 3. Una empresa de cable planea incluir en sus servicios la conexión a Internet, por lo cual realiza un experimento a fin de saber si existe alguna relación entre la hora y el lugar en donde se conectan usuarios de Internet. Los resultados reportados son los siguientes: Lugar A Lugar B Lugar C Lugar D Horario 1 31 45 46 43 82 110 88 72 43 45 63 76 45 71 66 62 Horario 2 36 29 40 23 92 61 49 124 44 35 31 40 56 102 71 38 Horario 3 22 21 18 23 30 37 38 29 23 25 24 22 30 36 31 33 Determina con un nivel de confianza del 95%, si existe alguna predilección en cuanto a Lugar y Horario para realizar la planeación de servicios de la compañía por cable. nstrucciones: Resuelve los siguientes ejercicios utilizando el análisis que se te indique. 1. Se desea saber si existe alguna diferencia significativa en el rendimiento en millas por galón en automóviles de 4 cilindros cuando se aplica combustible con aditivo y cuando se aplica combustible sin aditivo. Los resultados obtenidos son los siguientes: Automóvil Millas por galón Con aditivo Millas por galón Sin aditivo 1 2 3 4 5 6 7 8 9 10 36.7 35.8 31.9 29.3 28.4 25.7 24.2 22.6 21.9 24.3 36.2 35.7 32.3 29.6 28.1 25.8 23.9 22.0 21.5 24.4 Emplea la técnica de análisis de varianza por medio de bloques aleatorios para indicar si existe alguna diferencia significativa en utilizar aditivo o no utilizarlo.
  • 11. Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com www.maestronline.com 2. Para mejorar la actitud hacia las matemáticas un grupo de psicólogos aplican dos técnicas de hipnosis: técnica A y técnica B y quieren saber si hay alguna diferencia en su efectividad. Ellos toman al azar a 20 voluntarios en dos grupos independientes de 10 cada uno y al primero se le aplica la técnica A y al resto la técnica B. Cada persona se le aplica un diagnóstico para saber la susceptibilidad de ser hipnotizado que es una variable relacionada con la receptividad de cada persona. Se define X el índice de sugestibilidad y Y el índice de inducción hipnótica. Las tablas de datos de resultados son las siguientes: Método A Método B Método A Método B Xa Ya Xb Yb A1 A2 A3 A4 A5 5 10 12 9 23 20 23 30 25 34 B1 B2 B3 B4 B5 7 12 27 24 18 19 26 33 35 30 A6 A7 A8 A9 A10 21 14 18 6 13 40 27 38 24 31 B6 B7 B8 B9 B10 22 26 21 14 9 31 34 28 23 22 Identificar si existen diferencias en el resultado de aplicar el método A o el método B tomando en cuenta la covariable de susceptibilidad a ser hipnotizado. a siguiente tabla de datos consta de 91 observaciones y 6 variables. Las observaciones corresponden a 91 países y las variables son indicadores de desarrollo:  Analiza los bloques 2, 5, 8, 11 y 14. Toma los datos por separado (no en bloque). a. Identifica entre los países si hay alguna forma de agruparlos de acuerdo con los parámetros de tasa de mortalidad (TM) o esperanza de vida en hombres (EH). b. Identifica entre los países si hay alguna forma de agruparlos de acuerdo con el PNB, es decir, compara qué pasa en países con mayor PNB con respecto a los demás parámetros. c. Sugiere algún procedimiento de conglomerado a utilizar y justifica porqué seleccionaste ese tipo de procedimiento (el análisis formal lo harás en tu proyecto final). Avance del proyecto final De tarea para este tema, debes entregar a tu profesor el avance de tu proyecto final, el cual, debe contener lo siguiente:  Copia del enunciado de cada problema.  Especificación del método multivariante aplicado por problema y justificación de su selección.  Solución del problema por el método multivariante que se seleccionó.  Interpretación de los resultados.
  • 12. Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com www.maestronline.com Instrucciones: Para cada uno de los problemas que se te presentan a continuación se debe aplicar alguna técnica multivariante. Indica qué técnica es más adecuada, por qué y realiza el análisis conveniente. 1. McDonald’s es un restaurante de comida rápida que ha incursionado en el mercado de ensaladas. Las ensaladas que ofrece son las siguientes: César, Ranch, Diosa Verde y Rusa. Se probó en 14 restaurantes, durante 14 días, a fin de ver la respuesta de los clientes y los datos encontrados se presentan a continuación: Día César Ranch Diosa Verde Rusa 1 2 3 4 5 6 7 155 157 151 146 181 160 168 143 146 141 136 180 152 157 149 152 146 141 173 170 174 135 136 131 126 115 150 147 8 9 10 11 12 13 14 157 139 144 158 184 161 165 167 159 154 169 195 177 178 141 129 167 145 178 201 185 130 119 134 144 177 151 160 a. Determina si existe alguna diferencia significativa entre las preferencias de los consumidores hacia alguna ensalada. 2. En el análisis taxonómico de las flores para distinguir sus distintas especies se toma en cuenta cinco aspectos: longitud de los sépalos, anchura de los sépalos, longitud de los pétalos y anchura de los pétalos y su especie. Se desea probar si las cuatro variables (longitud sépalo, ancho sépalo, longitud pétalo y ancho pétalo) presentadas permiten identificar la especie en cuestión (visualizar los datos de forma gráfica para comprobar si están correctamente diferenciadas). Se toma una muestra de 50 observaciones que se presentan a continuación: OBS Long sépalo Ancho sépalo Long pétalo Ancho pétalo Especie Obs1 50 33 14 2 Setosa Obs2 64 28 56 22 Virginica Obs3 65 28 46 15 Versicolor Obs4 67 31 56 24 Virginica Obs5 63 28 51 15 Virginica Obs6 46 34 14 3 Setosa Obs7 69 31 51 23 Virginica Obs8 62 22 45 15 Versicolor Obs9 59 32 48 18 Versicolor Obs10 46 36 10 2 Setosa
  • 13. Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com www.maestronline.com Obs11 61 30 46 14 Versicolor Obs12 60 27 51 16 Versicolor Obs13 65 30 52 20 Virginica Obs14 56 25 39 11 Versicolor Obs15 65 30 55 18 Virginica Obs16 58 27 51 19 Virginica Obs17 68 32 59 23 Virginica Obs18 51 33 17 5 Setosa Obs19 57 28 45 13 Versicolor Obs20 62 34 54 23 Virginica Obs21 77 38 67 22 Virginica Obs22 63 33 47 16 Versicolor Obs23 67 33 57 25 Virginica Obs24 76 30 66 21 Virginica Obs25 49 25 45 17 Virginica Obs26 55 35 13 2 Setosa Obs27 67 30 52 23 Virginica Obs28 70 32 47 14 Versicolor Obs29 6 32 45 15 Versicolor Obs30 61 28 40 13 Versicolor Obs31 48 31 16 2 Setosa Obs32 59 30 51 18 Virginica Obs33 55 24 38 11 Versicolor Obs34 63 25 50 19 Virginica Obs35 64 32 53 23 Virginica Obs36 52 34 14 2 Setosa Obs37 49 36 14 1 Setosa Obs38 54 30 45 15 Versicolor Obs39 79 38 64 20 Virginica Obs40 44 32 13 2 Setosa Obs41 67 33 57 21 Virginica Obs42 50 35 16 6 Setosa Obs43 58 26 40 12 Versicolor Obs44 44 30 13 2 Setosa Obs45 77 28 67 20 Virginica Obs46 63 27 49 18 Virginica Obs47 47 32 16 2 Setosa Obs48 55 26 44 12 Versicolor Obs49 50 23 33 10 Versicolor Obs50 72 32 60 18 Virginica Datos tomados de Fisher M. (1936). “The Use of Multiple Measurements in Taxonomic Problems”, Annals of Eugenics, 7, pp. 179 – 188.
  • 14. Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com www.maestronline.com Para contestar lo anterior (subrayado) se te sugiere: a. Encontrar la matriz de correlación entre las variables. b. Realizar un análisis de regresión múltiple a fin de determinar el modelo lineal que permita explicar los datos. c. Hacer el análisis de varianza correspondiente de la muestra completa e interpretar. d. Hacer el análisis discriminante e interpretar. 3. La empresa Kimberly-Clark es líder en el mercado de la industria de los pañales desde 1960 que inició en este campo. A la fecha vende más de 3500 millones de dólares, únicamente en Estados Unidos. Los atributos principales en la fabricación de pañales son los siguientes: o Estilo: estampado/ color, blanco. o Absorbencia: regular, superabsorbente. o Cierre: cinta normal, cinta resellable. o Escurrimiento: regular, antiescurrimiento. e. Diseña los 16 perfiles completos en términos de preferencia. Calcula las funciones de valor parcial y la importancia de cada atributo. 4. Los siguientes datos corresponden a personas que pertenecen a una comunidad en donde se realizaron distintas medidas físicas a fin de determinar si existe diferencia entre las medidas de hombres y mujeres. Responde lo siguiente: a. ¿Qué análisis multivariante aplicarías? ¿Por qué? b. Aplica el análisis que mencionaste en el inciso ‘a’ a los datos e interpreta los resultados. c. Identifica si hay alguna relación entre las medidas del cuerpo e interprétalas. Sexo Estatura Peso Pie Largo brazo Ancho espalda Diámetro cráneo Distancia rodilla - tobillo 1 0.00 159.00 49.00 36.00 68.00 42.00 57.00 40.00 2 1.00 164.00 62.00 39.00 73.00 44.00 55.00 44.00 3 0.00 172.00 65.00 38.00 75.00 48.00 58.00 44.00 4 0.00 167.00 52.00 37.00 73.00 41.50 58.00 44.00 5 0.00 164.00 51.00 36.00 71.00 44.50 54.00 40.00 6 0.00 161.00 67.00 38.00 71.00 44.00 56.00 42.00 7 0.00 168.00 48.00 39.00 72.50 41.00 54.50 43.00 8 1.00 181.00 74.00 43.00 74.00 50.00 60.00 47.00 9 1.00 183.00 74.00 41.00 79.00 47.50 59.50 47.00 10 0.00 158.00 50.00 36.00 68.50 44.00 57.00 41.00 11 0.00 156.00 65.00 36.00 68.00 46.00 58.00 41.00 12 1.00 173.00 64.00 40.00 79.00 48.00 56.50 47.00 13 0.00 158.00 43.00 36.00 68.00 43.00 55.00 39.00 14 1.00 178.00 74.00 42.00 75.00 50.00 59.00 45.00 15 1.00 181.00 76.00 43.00 83.00 51.00 57.00 43.00
  • 15. Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com www.maestronline.com 16 1.00 182.00 91.00 41.00 83.00 53.00 59.00 43.00 17 1.00 176.00 73.00 42.00 78.00 48.00 58.00 45.00 18 0.00 162.00 68.00 39.00 72.00 44.00 59.00 42.00 19 0.00 156.00 52.00 36.00 67.00 36.00 56.00 41.00 20 0.00 152.00 45.00 34.00 66.00 40.00 55.00 38.00 21 1.00 181.00 80.00 43.00 76.00 49.00 57.00 46.00 22 1.00 173.00 69.00 41.00 74.00 48.00 56.00 44.00 23 0.00 155.00 53.00 36.00 67.00 43.00 56.00 38.00 24 1.00 189.00 87.00 45.00 82.00 53.00 61.00 52.00 25 0.00 170.00 70.00 38.00 73.00 45.00 56.00 43.00 26 1.00 170.00 67.00 40.00 77.00 46.50 58.00 44.50 27 0.00 168.00 56.00 37.50 70.50 48.00 60.00 40.00 Entrega del proyecto final De tarea para este tema, debes entregar a tu profesor tu proyecto final, el cual, debe contener lo siguiente:  Copia del enunciado de cada problema.  Especificación del método multivariante aplicado por problema y justificación de su selección.  Solución del problema por el método multivariante que se seleccionó.  Interpretación de los resultados. Instrucciones: Para cada uno de los problemas que se te presentan a continuación se debe aplicar alguna técnica multivariante. Indica qué técnica es más adecuada, por qué y realiza el análisis conveniente. 1. Los datos presentados a continuación representan 21 observaciones de 8 variables que corresponden a publicaciones científicas en distintos países recogidas durante 1982 – 1984. Las variables se organizaron por área: InterA (interdisciplinaria), InterB (interdisciplinaria), Agric. (Agricultura), Biolo. (Biología), Medic. (Medicina), Quimi. (Química), Ingen. (Ingeniería) y Física. INTER.A INTER.B AGRIC. BIOLO. MEDIC. QUIMI. INGEN. FÍSICA EE.UU 815319 379851 88663 58104 255864 440134 111015 162288 UK 162103 90332 35158 29802 59630 92725 6409 34349 JP 105856 78811 13978 16758 55634 308926 32039 40538 F 118935 76186 13818 11253 49938 120065 9984 35792 G 91099 85037 11740 20337 41233 66087 11304 22093 C 72722 49459 14041 16722 23139 101900 12034 14645 I 42905 29734 7904 13444 31078 36322 5833 11351 A 36121 22236 12419 9863 12186 19641 4898 6299 H 29912 18036 6563 7548 13721 23029 3798 6775
  • 16. Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com www.maestronline.com S 28568 16190 3985 9502 14852 18341 2387 3549 CH 26495 14518 3378 3636 11096 19304 2556 5784 E 16425 11818 3089 3981 7196 15493 1258 2692 B 17311 11791 3240 4011 8098 11964 1772 3417 D 14677 555 2635 5667 8368 14266 1197 1999 AU 10957 13154 1433 2372 5928 6713 1318 2278 FI 11012 6457 2028 4756 5731 6647 1001 1669 N 9075 5432 1803 3299 4801 5326 912 853 Y 4686 2957 2031 1194 1806 7046 801 1861 GR 3720 2749 692 1293 1518 2415 896 1366 IR 6786 214 432 1119 1355 98 522 941 P 1221 1929 388 386 564 12 493 413 a. Identifica si existe redundancia entre los datos, es decir, si podemos reducir el número de variables para explicar el comportamiento de los datos. b. Identifica si existe correlación entre las distintas disciplinas y si puedes generar un modelo lineal para el conjunto de datos. 2. Una importante empresa financiera quiere ganar el liderazgo en el manejo de tarjetas de crédito para lo cual busca elaborar un conjunto de perfiles de tarjeta y presentarlo a clientes para conocer sus preferencias. Las características a valorar son las siguientes:  Tasa de interés: baja, media, alta  Puntos por uso: sí, no  Cargo anual: cero, $200, $400 Diseña el total de perfiles completos en términos de preferencia. Calcula las funciones de valor parcial y la importancia de cada atributo. Algunos atributos son incompatibles (por ejemplo: a tarjetas que tienen tasa de interés baja no se les dan puntos por uso o por ejemplo si la tarjeta tiene cargo anual cero generalmente presenta tasa anual media o alta, o en una tarjeta con cargo anual alto y puntos puede tener tasa de interés baja -¿por qué?-). Determina los perfiles que sería conveniente presentar a los clientes en el diseño de esta nueva tarjeta de crédito. 3. La siguiente tabla pertenece a un grupo de datos constituido por 26 observaciones y 9 variables que corresponden a porcentaje de empleo en los distintos sectores en países europeos. Los sectores son los siguientes: Agr: agricultura Min: minería Man: manufactura Ene: energía Con: construcción SI: servicios industriales Fin: finanzas Ser: servicios TC: transporte y comunicaciones Fuente: Euromonitor (1979).
  • 17. Servicio de asesoría y resolución de ejercicios ciencias_help@hotmail.com www.maestronline.com Agr Min Man Ene Con SI Fin Ser TC Alemania del E. 4.20 2.90 41.20 1.30 7.60 11.20 1.20 22.10 8.40 Alemania del O. 6.70 1.30 35.80 0.90 7.30 14.40 5.00 22.30 6.10 Austria 12.70 1.10 30.20 1.40 9.00 16.80 4.90 16.80 7.00 Bélgica 3.30 0.90 27.60 0.90 8.20 19.10 6.20 26.60 7.20 Bulgaria 23.60 1.90 32.30 0.60 7.90 8.00 0.70 18.20 6.70 Checoslovaquia 16.50 2.90 35.50 1.20 8.70 9.20 0.90 17.90 7.00 Dinamarca 9.20 0.10 21.80 0.60 8.30 14.60 6.50 32.20 7.10 España 22.90 0.80 28.50 0.70 11.50 9.70 8.50 11.80 5.50 Finlandia 13.00 0.40 25.90 1.30 7.40 14.70 5.50 24.30 7.60 Francia 10.80 0.80 27.50 0.90 8.90 16.80 6.00 22.60 5.70 Grecia 41.40 0.60 17.60 0.60 8.10 11.50 2.40 11.00 6.70 Hungría 21.70 3.10 29.60 1.90 8.20 9.40 0.90 17.20 8.00 Irlanda 23.20 1.00 20.70 1.30 7.50 16.80 2.80 20.80 6.10 Italia 15.90 0.60 27.60 0.50 10.00 18.10 1.60 20.10 5.70 Luxemburgo 7.70 3.10 30.80 0.80 9.20 18.50 4.60 19.20 6.20 Noruega 9.00 0.50 22.40 0.80 8.60 16.90 4.70 27.60 9.40 Países Bajos 6.30 0.10 22.50 1.00 9.90 18.00 6.80 28.50 6.80 Polonia 31.10 2.50 25.70 0.90 8.40 7.50 0.90 16.10 6.90 Portugal 27.80 0.30 24.50 0.60 8.40 13.30 2.70 16.70 5.70 Reino Unido 2.70 1.40 30.20 1.40 6.90 16.90 5.70 28.30 6.40 Rumania 34.70 2.10 30.10 0.60 8.70 5.90 1.30 11.70 5.00 Suecia 6.10 0.40 25.90 0.80 7.20 14.40 6.00 32.40 6.80 Suiza 7.70 0.20 37.80 0.80 9.50 17.50 5.30 15.40 5.70 Turquía 66.80 0.70 7.90 0.10 2.80 5.20 1.10 11.90 3.20 USSR 23.70 1.40 25.80 0.60 9.20 6.10 0.50 23.60 9.30 Yugoslavia 48.70 1.50 16.80 1.10 4.90 6.40 11.30 5.30 4.00 a. Analiza la tabla de datos anterior por el método de conglomerados de acuerdo con las siguientes técnicas: i. Jerárquico enlace único (vecino más cercano) ii. Jerárquico procedimiento de centroide iii. Técnica de Ward b. Analiza por el método de dos pasos para tratar de encontrar entre 3 y 5 grupos conglomerados bien identificados. c. Interpreta y analiza cada grupo de resultados a fin de identificar qué cantidad de conglomerados es óptima y cuál es el parámetro que conglomera los datos. Utiliza dendograma o los gráficos que requieras a fin de aclarar tus respuestas.