BLOQUE 3.-
COMPRENDE, REPRESENTA Y APLICA LA PROBABILIDAD CONDICIONAL Y DISTRIBUCIÓN DE VARIABLES ALEATORIAS DISCRETAS.
Probabilidad condicional
En gran número de problemas prácticos, los eventos de mayor interés sonaquellos cuya ocurrencia está condicionada a la ocurrencia de otro evento. De aquí que interese introducir el concepto de probabilidad condicional, esto es, la probabilidad condicionada a que haya ocurrido o pudiese ocurrir cierto evento.
EJEMPLOS:Función De Probabilidad Para Una Variable Aleatoria Discreta
Definición
Dada una variable aleatoria , su función de distribución, , esPor simplicidad, cuando no hay lugar a confusión, suele omitirse el subíndice y se escribe, simplemente, . Donde en la fórmula anterior:- , es la probabilidad definida sobre un espacio de probabilidad y una medida unitaria sobre el espacio muestral.
- es la medida sobre la σ-álgebra de conjuntos asociada al espacio de probabilidad.
- es el espacio muestral, o conjunto de todos los posibles sucesos aleatorios, sobre el que se define el espacio de probabilidad en cuestión.
- es la variable aleatoria en cuestión, es decir, una función definda sobre el espacio muestral a los números reales.
Representación de la distribución de la probabilidad para la variable aleatoria discreta
Cálculo de la media y la desviación estándar
Desviación estándar
La desviación estándar (σ) mide cuánto se separan los datos.La fórmula es fácil: es la raíz cuadrada de la varianza. Así que, "¿qué es la varianza?"Varianza
la varianza (que es el cuadrado de la desviación estándar: σ2) se define así:Es la media de las diferencias con la media elevadas al cuadrado.En otras palabras, sigue estos pasos:1. Calcula la media (el promedio de los números)
2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la diferencia elevada al cuadrado).
3. Ahora calcula la media de esas diferencias al cuadrado.La media aritmética
Cuando tenemos que resumir un conjunto de datos numéricos es muy frecuente utilizar la media aritmética. La media aritmética o promedio destaca por representar el reparto equitativo, el equilibrio, la equidad. Es el valor que tendrían los datos, si todos ellos fueran iguales. O, también, el valor que correspondería a cada uno de los datos de la distribución si su suma total se repartiera por igual.
EJERCICIOS
EJERCICIO 1
Los miembros de una cooperativa de viviendas tienen las siguientes edades:
42 60 60 38 60 63 21 66 56 57 51 57 44 45 35
30 35 47 53 49 50 49 38 45 28 41 47 42 53 32
54 38 40 63 48 33 35 61 47 41 55 53 27 20 21
42 21 39 39 34 45 39 28 54 33 35 43 48 48 27
53 30 29 53 38 52 54 27 27 43 28 63 41 23 58
56 59 60 40 24
Elabore una tabla de frecuencias.
Calcule la media y la desviación típica.
SOLUCIÓN:
Para elaborar una tabla de frecuencias es condición imprescindible establecer una serie de clases o categorías (intervalos) a las que vamos a adjudicar a cada uno de los ochenta miembros de la cooperativa. El investigador puede seguir diferentes criterios en función del objetivo del estudio. Una tabla de frecuencias elaborada a partir de estos datos podría ser la siguiente:
Edad n
20-29 14
30-39 17
40-49 22
50-59 18
60-69 9
Total 80
Cálculo de la media:
Puede calcularse directamente sumando las edades de todos los miembros de la cooperativa y dividiendo por el total que en este caso es ochenta, el resultado es una media de 43,29. También:
Edad
|
xi
|
ni
|
xini
|
20-29
|
25
|
14
|
350
|
30-39
|
35
|
17
|
595
|
40-49
|
45
|
22
|
990
|
50-59
|
55
|
18
|
990
|
60-69
|
65
|
9
|
585
|
Total |
80
|
3510
|
, por tanto, podemos decir que la media es de casi 44 años.
Cálculo de la desviación típica:
Edad
|
xi
|
ni
| |||
20-29
|
25
|
14
|
-18,875
|
356,2656
|
4987,71875
|
30-39
|
35
|
17
|
-8,875
|
78,7656
|
1339,01563
|
40-49
|
45
|
22
|
1,125
|
1,2656
|
27,84375
|
50-59
|
55
|
18
|
11,125
|
123,7656
|
2227,78125
|
60-69
|
65
|
9
|
21,125
|
446,2656
|
4016,39063
|
Total |
80
|
12598,75
|
Sx =
La desviación típica es de 12,5 años
EJERCICIO 2
Explique las similitudes y diferencias de estas distribuciones:
Edad n_ Edad n__
20-29 14 20-29 43
30-39 17 30-39 --
40-49 22 40-49 --
50-59 18 50-59 --
60-69 9 60-69 37
Total 80 Total 80
SOLUCIÓN:
La media y la desviación típica de la primera distribución, ha sido calculada en el primer ejercicio.
Calculamos a continuación los mismos estadísticos para la segunda distribución.
Cálculo de la media:
Edad
|
xi
|
ni
|
xini
|
20-29
|
25
|
43
|
1075
|
30-39
|
35
|
-
| |
40-49
|
45
|
-
| |
50-59
|
55
|
-
| |
60-69
|
65
|
37
|
2405
|
Total |
80
|
3480
|
Cálculo de la desviación típica:
Edad
|
xi
|
ni
| |||
20-29
|
25
|
43
|
-18,875
|
356,2656
|
15319,4219
|
30-39
|
35
|
-
|
-8,875
|
78,7656
|
-
|
40-49
|
45
|
-
|
1,125
|
1,2656
|
-
|
50-59
|
55
|
-
|
11,125
|
123,7656
|
-
|
60-69
|
65
|
37
|
21,125
|
446.2656
|
16511,8281
|
Total |
80
|
31831,25
|
La similitud de ambas distribuciones radica fundamentalmente en que tienen la misma amplitud y casi el mismo valor medio. La diferencia es que las frecuencias de la segunda se distribuyen en los intervalos extremos dejando vacíos los del medio. Ello aparece perfectamente reflejado en la desviación típica de 19,9, aproximadamente 20 años. 43 + 20 hacen 63, aproximadamente la mitad del último intervalo, 43 – 20 hacen 23, aproximadamente la mitad del primer intervalo. Recuérdese que la desviación típica es la raíz de la media de las distancias al cuadrado, de cada uno de los elementos de la distribución respecto de la media aritmética.
EJERCICIO 3
En una pregunta del CIS sobre la edad hasta la que consideran convenientes los padres controlar los programas y el tiempo de televisión de los hijos, la media fue de 15,4 años y la desviación típica de 2,11. Teniendo en cuenta que las respuestas se distribuyen aproximadamente como la curva normal y que van de los 7 a los 24 años, calcular:
a)-Cuantos respondieron que la edad debe ser hasta los 13 años
b)-Cuantos dijeron que debe estar entre 14 y 17 años.
c)-Cuantos respondieron que debe estar por encima de los 19 años
SOLUCIÓN:
a)
Sx = 2,1
Consultando las tablas de la curva normal comprobamos que entre la media y un desviación típica de 1,13 encontramos un área de 0,3708 que si situaría a la izquierda de la curva por tener signo negativo. Si el área que queremos calcular es el que queda a la izquierda del valor -1,13, es decir, los de menos de 13 años, restamos a 0,5 (que es la superficie de la mitad de la curva) 0,3708 y obtenemos el resultado de 12,92%
0,5-0,3708= 0,1292
b)
Las áreas correspondientes a estos valores z son 0,2454 y 0,2734 respectivamente.
Como en este caso nos preguntan por el área comprendida entre las unidades z –0,66 y 0,75 sumaremos ambas con el resultado de del 51,88%
0,2454+0,2734 = 0,5188
c)
El área correspondiente es de 0.4554 y los que están por encima de 1,7 unidades z se obtienen restando de 0,5, el 0,4554 de las tablas.
0,5-0,4554 = 0,0446, es decir el 4,46%.
Ejercicio 4
Calcule el tamaño muestral de una encuesta realizada por CIS sobre la Unión Europea que incluía todas las provincias excepto Ceuta y Melilla. El error teórico era de + 2, con un intervalo de confianza de 95,5% y P=Q en el supuesto de un muestreo aleatorio simple.
SOLUCIÓN
Utilizamos la fórmula para muestras infinitas en la que intervienen los tres factores determinantes del tamaño muestral: la probabilidad con la que queremos trabajar (z), el grado de concentración, dispersión de la población (pq) y el error que estamos dispuestos a asumir.
No hay comentarios:
Publicar un comentario