viernes, 3 de mayo de 2013

Bloque 3. COMPRENDE, REPRESENTA Y APLICA LA PROBABILIDAD CONDICIONAL Y DISTRIBUCION DE VARIABLES ALEATORIAS DISCRETAS


BLOQUE 3.-     

                                                      

     COMPRENDE, REPRESENTA Y APLICA LA PROBABILIDAD CONDICIONAL Y DISTRIBUCIÓN DE VARIABLES ALEATORIAS DISCRETAS.





Probabilidad condicional




En gran número de problemas prácticos, los eventos de mayor interés son 
aquellos cuya ocurrencia está condicionada a la ocurrencia de otro evento. De aquí que interese introducir el concepto de probabilidad condicional, esto es, la probabilidad condicionada a que haya ocurrido o pudiese ocurrir cierto evento.

EJEMPLOS:












Función De Probabilidad Para Una Variable Aleatoria Discreta


Definición

Dada una variable aleatoria \scriptstyle X, su función de distribución\scriptstyle F_X(x), es
F_X(x) = \mathrm{Prob}( X \le x ) = \mu_P\{\omega\in \Omega|X(\omega)\le x\}
Por simplicidad, cuando no hay lugar a confusión, suele omitirse el subíndice \scriptstyle X y se escribe, simplemente, \scriptstyle F(x). Donde en la fórmula anterior:
\mathrm{Prob}\,, es la probabilidad definida sobre un espacio de probabilidad y una medida unitaria sobre el espacio muestral.
\mu_P\, es la medida sobre la σ-álgebra de conjuntos asociada al espacio de probabilidad.
\Omega\, es el espacio muestral, o conjunto de todos los posibles sucesos aleatorios, sobre el que se define el espacio de probabilidad en cuestión.
X:\Omega\to \R es la variable aleatoria en cuestión, es decir, una función definda sobre el espacio muestral a los números reales.




Representación de la distribución de la probabilidad para la variable aleatoria discreta










Cálculo de la media y la desviación estándar


Desviación estándar

La desviación estándar (σ) mide cuánto se separan los datos.
La fórmula es fácil: es la raíz cuadrada de la varianza. Así que, "¿qué es la varianza?"

Varianza

la varianza (que es el cuadrado de la desviación estándar: σ2) se define así:
Es la media de las diferencias con la media elevadas al cuadrado.
En otras palabras, sigue estos pasos:
1. Calcula la media (el promedio de los números)
2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la diferencia elevada al cuadrado).
3. Ahora calcula la media de esas diferencias al cuadrado.

La media aritmética 

Cuando tenemos que resumir un conjunto de datos numéricos es muy frecuente utilizar la media aritmética. La media aritmética o promedio destaca por representar el reparto equitativo, el equilibrio, la equidad. Es el valor que tendrían los datos, si todos ellos fueran iguales. O, también, el valor que correspondería a cada uno de los datos de la distribución si su suma total se repartiera por igual.

EJERCICIOS

EJERCICIO 1
Los miembros de una cooperativa de viviendas tienen las siguientes edades:

42 60 60 38 60 63 21 66 56 57 51 57 44 45 35
30 35 47 53 49 50 49 38 45 28 41 47 42 53 32
54 38 40 63 48 33 35 61 47 41 55 53 27 20 21
42 21 39 39 34 45 39 28 54 33 35 43 48 48 27
53 30 29 53 38 52 54 27 27 43 28 63 41 23 58
56 59 60 40 24

Elabore una tabla de frecuencias.
Calcule la media y la desviación típica.

SOLUCIÓN:

Para elaborar una tabla de frecuencias es condición imprescindible establecer una serie de clases o categorías (intervalos) a las que vamos a adjudicar a cada uno de los ochenta miembros de la cooperativa. El investigador puede seguir diferentes criterios en función del objetivo del estudio. Una tabla de frecuencias elaborada a partir de estos datos podría ser la siguiente:

Edad               n                    
20-29              14
30-39              17
40-49                            22
50-59                            18
60-69                                9

Total               80       


Cálculo de la media:

Puede calcularse directamente sumando las edades de todos los miembros de la cooperativa y dividiendo por el total que en este caso es  ochenta, el resultado es una media de  43,29. También:

Edad
xi
ni
xini

20-29
25
14
350
30-39
35
17
595
40-49
45
22
990
50-59
55
18
990
60-69
65
9
585

Total


80
3510

, por tanto, podemos decir que la media es de casi 44 años.
Cálculo de la desviación típica:

Edad
xi
ni
  
20-29
25
14
-18,875
356,2656
4987,71875
30-39
35
17
-8,875
78,7656
1339,01563
40-49
45
22
1,125
1,2656
27,84375
50-59
55
18
11,125
123,7656
2227,78125
60-69
65
9
21,125
446,2656
4016,39063

Total


80


12598,75


Sx =
La desviación típica es de 12,5 años


EJERCICIO 2

Explique las similitudes y diferencias de estas distribuciones:

Edad        n_                                            Edad            n__                       

20-29      14                                             20-29          43
30-39            17                                             30-39           --
40-49      22                                              40-49           --
50-59            18                                             50-59           --
60-69        9                                             60-69          37
Total        80                                             Total          80     


SOLUCIÓN:
La media y la desviación típica de la primera distribución, ha sido calculada en el primer ejercicio.
Calculamos a continuación los mismos estadísticos para la segunda distribución.
Cálculo de la media:

Edad
xi
ni
xini

20-29
25
43
1075
30-39
35
-

40-49
45
-

50-59
55
-

60-69
65
37

2405

Total


80
3480



Cálculo de la desviación típica:

Edad
xi
ni
  
20-29
25
43
-18,875
356,2656
15319,4219
30-39
35
-
-8,875
78,7656
-
40-49
45
-
1,125
1,2656
-
50-59
55
-
11,125
123,7656
-
60-69
65
37

21,125
446.2656
16511,8281

Total


80


31831,25



La similitud de ambas distribuciones radica fundamentalmente en que tienen la misma amplitud y casi el mismo valor medio. La diferencia es que las frecuencias de la segunda se distribuyen en los intervalos extremos dejando vacíos los del medio. Ello aparece perfectamente reflejado en la desviación típica de 19,9, aproximadamente 20 años. 43 + 20 hacen 63, aproximadamente la mitad del último intervalo, 43 – 20 hacen 23, aproximadamente la mitad del primer intervalo. Recuérdese que la desviación típica es la raíz de la media de las distancias al cuadrado, de cada uno de los elementos de la distribución respecto de la media aritmética.

EJERCICIO 3

En una pregunta del CIS sobre la edad hasta la que consideran convenientes los padres controlar los programas y el tiempo de televisión de los hijos, la media fue de 15,4 años y la desviación típica de 2,11. Teniendo en cuenta que las respuestas se distribuyen aproximadamente como la curva normal y que van de los 7 a los 24 años, calcular:
a)-Cuantos respondieron que la edad debe ser hasta los 13  años
b)-Cuantos dijeron que debe estar entre 14 y 17 años.
c)-Cuantos respondieron que debe estar por encima de los 19 años


SOLUCIÓN:

a)
Sx = 2,1



Consultando las tablas de la curva normal comprobamos que entre la media y un desviación típica de 1,13 encontramos un área de 0,3708 que si situaría a la izquierda de la curva por tener signo negativo. Si el área que queremos calcular es el que queda a la izquierda del valor -1,13, es decir, los de menos de 13 años, restamos a 0,5 (que es la superficie de la mitad de la curva) 0,3708 y obtenemos el resultado de 12,92%
0,5-0,3708= 0,1292

b)



Las áreas correspondientes a estos valores z son 0,2454 y 0,2734 respectivamente.
Como en este caso nos preguntan por el área comprendida entre las unidades z –0,66 y 0,75 sumaremos ambas con el resultado de del 51,88%
0,2454+0,2734 = 0,5188


c)


El área correspondiente es de 0.4554 y los que están por encima de 1,7 unidades z se obtienen restando de 0,5, el  0,4554 de las tablas.
0,5-0,4554 = 0,0446, es decir el 4,46%.




Ejercicio 4

Calcule el tamaño muestral de una encuesta realizada por CIS sobre la Unión Europea que incluía todas las provincias excepto Ceuta y Melilla. El error teórico era de + 2, con un intervalo de confianza de 95,5% y P=Q en el supuesto de un muestreo aleatorio simple.

SOLUCIÓN



Utilizamos la fórmula para muestras infinitas en la que intervienen los tres factores determinantes del tamaño muestral:  la probabilidad con la que queremos trabajar (z), el grado de concentración, dispersión de la población (pq) y el error que estamos dispuestos a asumir.








No hay comentarios:

Publicar un comentario