BIOESTADISTICA I UNIDAD: INFERENCIA ESTADISTICA EJERCICIOS Y PROBLEMAS 2016.

Slides:



Advertisements
Similar presentations
Procesadores superescalares
Advertisements

RECTAS EN EL ESPACIO. Algebra lineal Rectas en el espacio.
METODOLOGÍA DE LA INVESTIGACIÓN CURSO: DESARROLLO DE COMPETENCIAS CURSO HUMANISTA 2009.
Definición La resolución de problemas ayuda a reducir o eliminar los pensamientos negativos que llevan a la persona a creerse incapaz de manejar una decisión,
Las 4F’s del Marketing Digital
Unidad 1: ECUACIONES DIFERENCIALES DE PRIMER ORDEN
Estadística Aplicada a la Ingeniería
Probabilidad Profr. Eliud Quintero Rodríguez.
Ecuaciones diferenciales
APLICACIÓN DE LAS PILAS: BACKTRACKING
Algoritmos y programas
Evaluación economómica y financiera de proyectos Parte 3. Criterios de rentabilidad.
Origen del Cálculo de Probabilidades
CALIDAD La calidad es una propiedad inherente de cualquier cosa que permite que esta sea comparada con cualquier otra de su misma especie.
Paridad Cambiaria Integrantes: Johanna Peña Eduardo Inalaf David Fuentes.
(UN MODELO PARA CREAR EQUIPOS DE ALTO RENDIMIENTO)
PROBLEMAS FLUIDOS HOJA PARTE #3
LAS FRACCIONES.
FRACCIONES EQUIVALENTES operador de una cantidad
Ejercicios clase anterior
Los Números Racionales
Roger Fabián Urióstegui Ejercicios. Pagina 18 Ejercicios. 1.-Organice los números 15,7,3,32,6,18, en orden: a)De menor a mayor: 3,6,7,15,18,32 b)De mayor.
ANALISIS DE VENTAS.
Para otros usos de este término, véase Moda (desambiguación).
Fundamentos de Programación Netbeans – If –Else - Switch
TEMA 5. La economía monetaria
III. MÉTODO O TRADICIÓN METODOLÓGICA. PREGUNTA DE INVESTIGACIÓN Y MÉTODO Cada estrategia (MÉTODO) entrega determinada información que ilumina ciertos.
Russ Shafer-Landau El punto de partida para estudio de la ética es para algunos un problema, pues se piensa que no hay un punto apropiado donde apalancar.
Ejercicios de Física en la Kinesiología
Seminario Virtual 2do Grado. Trabajando con Power Point ENTORNO DE TRABAJO.
Geometría de Proporción Prof: Isaías Correa M.. Geometría de Proporción I.
Es necesaria a la razón Busca la Verdad Se pregunta por el fundamento de todo lo real: LA REALIDAD RADICAL.
Un hombre debe darse cuenta que no puede hacer. Todas nuestras actividades son mecánicas, todo es por impulso externo. G. I. Gurdjieff.
SEMEJANZA..
Presentación Censo Empresarial Censo Empresarial 2010 – Municipio de Soacha.
La Importancia de la Intranet en el modernismo empresarial.
La gestión de los recursos humanos es consubstancial al elemento de integración principal de la sociedad actual: la organización, están conformadas por.
Si mueres antes que yo, pregunta si puedes llevar contigo a un amigo. Si vives cien días, yo quiero vivir 100 menos uno, para no tener que vivir sin tí.
4. RECOMENDACIONES GENERALES 4.1 Sistemas de energía eléctrica 4.2 Generación y distribución de vapor 4.3 Refrigeración y aire acondicionado 4.4 Equipos.
@ Angel Prieto BenitoApuntes 2º Bachillerato C.S.1 MATEMÁTICAS A. CS II TEMA 1 Sistemas de ecuaciones lineales.
PLANIFICADOR DE AMBIENTE DE APRENDIZAJE MEDIADO POR TIC Salón 86 Grupo 03 Lic. María Elizabeth Castillo Villota Lic. Nancy Jaramillo Alarcón Lic. Atalívar.
Introducción a programación web Martin Esses. Una base de datos se puede definir como un conjunto de información relacionada que se encuentra agrupada.
Introducción Programación Lineal (PL) Muchas personas clasifican el desarrollo de La Programación Lineal (PL) entre los avances científicos mas importantes.
UNIDAD 5 PRODUCTOS Y COCIENTES NOTABLES. MAPA DE NAVEGACIÓN Exponentes y Radicales Índice Objetivo General Ejemplos Objetivo 1 Objetivo 2 Objetivo 3 Objetivo.
SUMADEENTEROS. Jorge recibe como regalo de cumpleaños dinero por parte de algunos parientes. Su abuela le da un sobre con $15, su padrino le regala $50.
Tema: 8 Gráficas, estadística y azar 1Matemáticas 1º Recuerda. Ejes de coordenadas IMAGEN FINAL Observa: La nariz del payaso está en el punto (3, 2).
TEMA 5.2 : FIABILIDAD II PSICOMETRÍA Tema 5.2 Evaluación del instrumento de medida: FIABILIDAD II Salvador Chacón Moscoso Susana Sanduvete Chaves Agradecemos.
Por favor utilizar mouse. Bienvenidos a conocer los resultados del Día e de nuestra institución.
Organización del Computador 1 Lógica Digital 1 Algebra de Boole y compuertas.
MAXIMO COMUN DIVISOR. Es el mayor de los divisores comunes a dos o mas números. Un número entero d se llama máximo común divisor (MCD) de los números.
Caracterización de Carbohidratos Emily N. González Martínez Yessica Bautista De la Rosa Cristian Díaz Marrero Universidad Interamericana de Puerto Rico.
ECUACIONES Y POTENCIAS 2do trimestre. Ecuaciones Para organizar mejor el procedimiento de resolver una ecuación vamos a definir dos operaciones: Reducir.
Métodos de enseñanza aprendizaje. Actividades 1.- Comparar las definiciones y clasificaciones de métodos que se ofrecen en el material. 2.- Expresar valoraciones.
Capìtulo 19 La Maximizaciòn del Beneficio. Beneficio Econòmico u Una empresa emplea los factores j = 1…,m para producir los bienes i = 1,…n. u Los volùmenes.
ENERGÍA CONCEPTOS BÁSICOS. ENERGÍA La energía es una magnitud física que asociamos con la capacidad que tiene los cuerpos para producir trabajo mecánico,
Métodos Cuantitativos de Análisis de Datos I. Medidas de Posición y de Tendencia Central.
¿ QUÉ ES EL SUBPROGRAMA DE SEGURIDAD INDUSTRIAL? Es el conjunto de técnicas y actividades desarrolladas para la identificación y control de los accidentes.
 2.1 Actividad de Evaluación Dina J. Rodriguez Pastor Prof. Lorena Llerandi SOSC 1020.
MAPAS DE PROGRESO DEL APRENDIZAJE: LA PROPUESTA NACIONAL DE ESTÁNDARES DE APRENDIZAJE.
SISTEMAS DE NUMERACIÓN Facultad de Ingeniería.  Conjunto de símbolos y reglas que permiten representar datos numéricos. Sistema de numeración posicional:
1 Las mujeres y la economía. María Luisa Moltó CALCULO TRABAJO NO REMUNERADO.
Mapas Conceptuales. Introducción "Un mapa conceptual es un recurso esquemático para presentar un conjunto de significados conceptuales incluidos en una.
Estadística Administrativa II USAP 1. Números índice Número índice es una herramienta muy utilizada en Macroeconomía que permite conocer el comportamiento.
Blueberry Field Day Diseño y Manejo de Sistemas de Fertirriego en Arándanos.
CONCLUSIONES SIN DUDA ALGUNA, LA MEJOR FORMA DE EVITAR ESTAS CONSECUENCIAS ES CONSEGUIR QUE LOS ADOLESCENTES NO SE IMPLIQUEN EN CONDUCTAS QUE PUEDAN SUPONER.
Prof. Alex Iparraguirre Zavaleta 1 Universidad Alas Peruanas - Facultad de ciencias empresariales.
 Son inevitables.  Siempre va a existir diferencias de opiniones entre los miembros del equipo.  Es un error tratar de suprimirlos.  Proporcionan.
Soluciones o Disoluciones
Intervalos de Confianza Inferencia Estadística. Intervalos de Confianza Métodos de estimación: Estimación puntual: utilización de datos de la muestra.
Análisis, Diseño e Implementación de Bases de Datos Análisis, Diseño e Implementación de Bases de Datos Conceptos Generales.
Presentation transcript:

BIOESTADISTICA I UNIDAD: INFERENCIA ESTADISTICA EJERCICIOS Y PROBLEMAS 2016

I- INFERENCIA ESTADISTICA La Teoría de la Inferencia Estadística puede definirse como aquellos métodos que permiten hacer inferencias o generalizaciones sobre una población a partir de una muestra. Existen dos métodos para estimar parámetros de la población : El Método Clásico y Método Bayesiano. El Método Clásico.- Se basa estrictamente en la información obtenida en una muestra aleatoria tomada de una población.

El Método Bayesiano.- Utiliza el conocimiento subjetivo previo acerca de la distribución de probabilidades de los parámetros desconocidos junto con la información proporcionada por los datos de la muestra. La Inferencia Estadística puede dividirse en dos áreas principales : Estimación y Prueba de Hipótesis.

2.1 ESTIMACION La Estimación se ocupa del estudio de parámetros de la población y consiste en encontrar o determinar una estadística que constituya una buena estimación del valor de un parámetro desconocido . A esta estadística se le llama estimador del parámetro desconocido . Estudiaremos la estimación puntual y la estimación por intervalos.

2.1.1 ESTIMACIÓN PUNTUAL La Estimación Puntual de algún parámetro  de la población es un valor simple de una estadística tomada de la muestra. Por ejemplo, si el valor de  x es la estadística calculada a partir de una muestra de tamaño n, entonces  x es una estimación puntual de  media población, es decir =  x y  = . La Estadística que se emplea para obtener una estimación puntual recibe el nombre de “Estimador “.

PROPIEDADES DESEABLES DE LOS ESTIMADORES PUNTUALES a) Estimador insesgado Si tenemos un gran número de muestras de tamaño n y obtenemos el valor del estimador en cada una de ellas, sería deseable que la media de todas estas estimaciones coincidiera con el valor de μ. Se dice que un estimador es insesgado si su esperanza matemática coincide con el valor del parámetro a estimar.

b) Estimador eficiente Se dice que los estimadores son eficientes cuando generan una distribución muestral con el mínimo error estándar,es decir, entre dos estimadores insesgados de un parámetro dado es má.s eficiente el de menor varianza Es decir si

c) Estimador consistente Un estimador se dice consistente cuando su valor tiende hacia el verdadero valor del parámetro a medida que aumenta el tamaño de la muestra. Es decir, la probabilidad de que la estimación sea el verdadero valor del parámetro tiende a 1.

d) Estimador suficiente Se dice de un estimador que es suficiente cuando es capaz de extraer de los datos toda la información importante sobre el parámetro.

Ejemplo: Los siguientes datos corresponden a los valores de una muestra de la actividad (micro moles por minuto por gramo de tejido) de cierta enzima medida en el tejido gástrico normal de 35 pacientes con carcinoma gástrico

Determinar: a)La estimación de la media poblacional b)La estimación de la varianza poblacional c)Cual es la desviación estándar de la muestra d)Cual es la estimación del error estándar para la media muestral e)La proporción de pacientes que tienen por debajo del.600 de la actividad de la enzima medida en tejido gástrico normal. f)Estime el total de enzima que tienen esta enfermedad si se tiene una población de 4800 Pacientes en la población.

1.2 ESTIMACION POR INTERVALOS E n vez de estimar el parámetro  a partir de un valor ( estimación puntual ) ahora se trata de estimar un intervalo [ a, b ] llamado intervalo de confianza que debe contener al parámetro  con una probabilidad dada 1 -  llamado nivel de confianza, en base a una muestra aleatoria y la correspondiente estadística  ; esto es : P ( a    b) = 1 - 

2.2.1 ) INTERVALOS CONFIDENCIALES PARA LA MEDIA POBLACIONAL a1 ) Cuando  es conocida o n > 30 Sea  x   ( ,  2  n )  Z = (  x -  ) / (   n ) P ( - Z  2 < ( (  x -  ) / (   n ) < Z  2 ) = 1 -  P (  x – Z   n <  <  x + Z   n ) = 1 -  Por lo tanto   [  x – Z   n ] Donde :  x : media muestral Z  : se encuentra en la tabla Z n. : tamaño de la muestra  : desviación estándar conocida  : nivel de significación NOTA.-Cuando n  30 y no se conoce  2 se reemplaza por s 2 de la muestra

Ejemplo Se ha calculado que la media y desviación estándar de una muestra aleatoria de 36 mediciones del contenido de arsénico del agua del reservorio de la Ciudad Universitaria son respectivamente 2.6 y 0.3 …. ¿Encuentre el intervalo de confianza al 95% y al 99% para la media de arsénico de todo el reservorio ?. Solución:  x = 2.6 s = 0.3  /2 = Z  = 1.96 P ( 2.6 – 1.96 (0.3/  36)    (0.3/  36) ) = 95% De donde P( 2.5 <  < 2.7 ) = 95% La probabilidad de que la medición promedio del contenido de arsénico se encuentre entre 2.5 y 2.7 es de 95%.

a2) Cuando  es desconocido n  30 Cuando no se conoce la varianza poblacional  2 y es imposible obtener una muestra n  30 pues el costo es un factor que limita el mayor tamaño de muestra. En la medida que la población se distribuye normalmente entonces podemos usar la distribución t. t = (  x -  )/ ( s/  n) El procedimiento es el mismo que en el caso anterior excepto que se usa la distribución T en lugar de la normal, luego se puede afirmar: P ( - t  /2 < t < t  /2 ) = 1 -  P (  x - t  /2 s /  n <  <  x + t  /2 s /  n ) = 1 -  Por lo tanto   x  t  /2 s/  n donde t  /2 es el valor de t con n – 1 grados de libertad

Ejemplo 1 Lloyd y Mailloux informaron los siguientes datos acerca del peso de la glándula pituitaria en una muestra de 4 ratas de Wistar Furth Media = 9.0 mg error estándar para la media =3 Determinar: La desviación estándar para la muestra Construya un intervalo de confianza de 95% para el peso medio de las glándulas pituitarias para una población similar de ratas.

Ejemplo Los contenidos de ácido sulfúrico en siete recipientes similares son : 9.8, 10.2, 10.4, 9.8, 10.0, 10.2 y 9.6 litros. Encuentre un intervalo de confianza al 95% para la media del contenido de todos los recipientes. Suponiendo una distribución aproximadamente normal. Solución:  x = 10 ; s = ; t  /2 = t (0.025) (6) = luego :    x  t  /2 s/  n  10.0  ( ) ( 0.283)/  7  10.0  0.26 P ( 9.74 <  < ) = 95 %

B) INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS Si se tiene una población con medias  1,  2 y varianzas  1 2,  2 2 respectivamente y si se toma muestras n 1 y n 2 respectivamente, entonces se puede obtener intervalos confidenciales para la diferencia de medias. b1) Si  1 2,  2 2 son conocidas y n 1  30 y n 2  30 entonces un intervalo confidencial para  1 -  2 es: P [(  x 1 --  x 2 ) - Z   (  1 2 / n 1 +  2 2 /n 2 )   1 -  2  (  x 1 -  x 2 ) + Z   (  1 2 / n 1 +  2 2 /n 2 ) ] = 1 -  por lo tanto (  1 -  2 )  [(  x1 --  x 2 )  Z   (  1 2 / n 1 +  2 2 /n 2 )] Donde  x 1,  x 2 son las medias muestras aleatorias independientes de tamaño n 1, n 2, tomadas de poblaciones con varianzas conocidas  1 2,  2 2 respectivamente, y - Z  es el valor de la distribución normal estándar.

Ejemplo : 50 Mujeres y 30 hombres se presentaron a un examen de admisión para ocupar un cargo : las mujeres obtienen una calificación promedio de 76 puntos con una desviación estándar de 6, mientras que los hombres obtienen una calificación promedio de 82 puntos con una desviación estándar de 8. Encuentre un intervalo de confianza del 96% para la diferencia de medias. SOLUCI0N n 1 = 50 n 2 = 75,  x 1 = 76 y  x 2 = 82, s 1 = 6 y s 2 = 8 Como n 1, n 2 > 30  s 1 =  1 y s 2 =  2 Se aplica P [(  x 1 --  x 2 ) - Z   (  1 2 / n 1 +  2 2 /n 2 )   1 -  2  (  x 1 -  x 2 ) + Z   (  1 2 / n 1 +  2 2 /n 2 ) ] = 1 -  Remplazando datos se obtiene : P ( 3.42 )   1 -  2  8.58 ) = 95 %

b 2 ) Si  1 2,  2 2 son desconocidas y n 1 y n 2  30 Donde las medias y varianzas de muestras independientes pequeñas de tamaños n 1 y n 2 son tomadas de distribuciones aproximadamente normales y t  es el valor de la distribución t con n 1 + n grados de libertad: P [(  x 1 --  x 2 ) - t   (s 1 2 / n 1 + s 2 2 /n 2 )   1 -  2  (  x 1 -  x 2 ) + t   (s 1 2 / n 1 + s 2 2 /n 2 ) ] = 1 -  por lo tanto (  1 -  2 )  [(  x1 --  x 2 )  t   (s 1 2 / n 1 + s 2 2 /n 2 )] Ejemplo: Los registros de los últimos 15 años muestran que la precipitación fluvial promedio. durante el mes de mayo es de 4.93 cm. con una desviación estándar 1.14 cm. en Perú, en Chile la precipitación fluvial promedio fue de 2.64 con una desviación estándar de 0.66 durante los 10 años pasados. Encuentre un intervalo confidencial del 95% para la diferencia verdadera de las precipitaciones fluviales promedio en estos países, suponiendo que las muestras se han tomado de poblaciones normales con variancias diferentes.

Solución: Perú  x = 4.93 s = 1.14 n = 15 Chile  x = 2.64 s = 0.66 n = 10.t ( ) ( –2 ) = Remplazando en la fórmula se tiene : P [( 0.29 – )  ( / /10 )   1 -  2   ( / /10 ) ] = 1 -  P( 2.02   1 -  2  2.56 ) = 0 95 % Significa que se tiene una confianza del 95% de que el intervalo de 2.02 a 2.56 contenga el verdadero valor promedio de la precipitación fluvial.

C) I NTERVALOS CONFIDENCIALES PARA LAS PROPORCIONES Si la estadística p = x /n es la proporción de éxitos en una muestra de tamaño n extraída de. una distribución binomial en la que P es la proporción de éxitos en la población  los límites de confianza para P, cuando n   se tiene que : E(p) = P, V(p) = PQ /n por lo tanto también se tiene: P ( - Z  2 < Z < Z  2 ) = 1 -  Z = (p – P)/  ( PQ /n ) por lo tanto P [ p - Z  2  ( PQ /n ) < P < p +Z  2  ( PQ /n ) ] = 1 -  Luego P  [ p  Z  2  ( PQ /n ) ]

Ejemplo: En una muestra aleatoria de n = 500 familias de cierta ciudad que poseen televisores, se observó que 340 poseían TV a color. Encuentre un intervalo de confianza del 95% para la proporción real de las familias en dicha ciudad con TV a color. Solución: p = 340/500 = 0.68 Z ( 0.025) = 1.96 Usando la fórmula : P [ p - Z  2  ( PQ /n ) < P < p +Z  2  ( PQ /n ) ] = 1 -  P[ 0.68 – 1.96  ( 0.68*0.32) /500 < P <  ( 0.68*0.32) /500 ] = 95% Por lo tanto P ( 0.64 < P < 0.72 ) = 95 %

D) INTERVALOS DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES Dada dos poblaciones binomiales de las cuales se extrae dos muestras aleatorias independientes de tamaños n 1, n2 se puede encontrar un intervalo de confianza para la verdadera diferencia de proporciones, es decir P 1, P 2 mediante : P [( p 1 - p 2 ) - Z  /2  ( p 1 q 1 /n 1 + p 2 q 2 /n 2 ) < P 1 – P 2 < ( p 1 - p 2 ) + Z  /2  ( p 1 q 1 /n 1 + p 2 q 2 /n 2 )] Por lo tanto (P 1 – P 2 )  [ ( p 1 - p 2 )  Z  /2  ( p 1 q 1 /n 1 + p 2 q 2 /n 2 ) ] Ejemplo: En el proceso de fabricación de cierto componente se considera un cambio con el objeto de determinar si el nuevo procedimiento es mejor. Se toma muestras del procedimiento existente y del nuevo si se detecta que 75 de 1500 componentes tomados del procedimiento existente fueron defectuosos, así como 80 de 2000 del nuevo procedimiento fueron defectuosos. Encuentre un intervalo de confianza al 90% para la diferencia real de proporción de componentes defectuosos.

Solución: p 1 = 75/1500 = 0.05 n 1 = 1500 p 2 = 80/200 = 0.04 n 2 = 2000 Z  /2 = Según fórmula : 0.01   ( 0.05*0.95/ *0.96/2000 ) P ( < P1 – P 2 < ) = 90 % Como el intervalo contiene el valor 0 no hay razones, que el nuevo componente produzca una disminución significativa en la proporción de componentes defectuosos con respecto al método existente.

E ) INTERVALOS CONFIDENCIALES PARA LA VARIANZA Supongamos que tenemos una muestra aleatoria x 1,x 2, x 3,... x n de una distribución de media  y una varianza  2, ambas desconocidas luego: n  ( x i -  x ) 2 = (n –1 ) s 2 i=1  2  2 Tiene una distribución  2 con n-1 grados de libertad cuando las muestras se escogen de una población normal entonces : P (  2  /2   2  (  2 1-  /2 ) = P (  2  /2  (n –1 ) s 2  (  2 1-  /2 ) = 1 -   2 P( ( n –1 ) s 2   2  (n –1 ) s 2 ) = 1 -   2 1-  /2  2  /2 Donde s 2 es la varianza de la muestra aleatoria n,  2  /2 y  2 1-  /2 son valores de la distribución  2 con n – 1 grados de libertad hacia la derecha.

Ejemplo Un experimentador quiere verificar la variabilidad de un equipo diseñado para medir el volumen de una fuente de audio frecuencia. Tres mediciones independientes registraron con este equipo fueron 4.1, 5.2 y Estime  2 con un coeficiente de confianza de 0.9. Solución Si se supone normalidad en las mediciones registradas por este equipo, se puede aplicar el intervalos de confianza desarrollado anteriormente. Para los datos ofrecidos, s 2 = con  /2 = 0.05 y n- 1 = 2 grados de libertad, en la tabla de la distribución Chi – cuadrado nos da  2  /2 = y  2 1-  /2 = por lo tanto el intervalo de confianza para  2 es P ( 2*10.57 /   2  2*10.57 / ) = 0.90 P ( 3.53   2  ) = 0.90 Obsérvese que este intervalo para  2 es muy amplio, básicamente porque n es muy pequeño.

Ejemplo propuesto: Los siguientes valores son los pesos en decigramos de 10 paquetes de semilla distribuidos por cierta compañia : 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.8, 45.2 y Encuentre un intervalo de confianza al 95% para la varianza de dichos paquetes de semilla distribuidos por esta compañia.