PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS Con el soporte de MATLAB para cálculos y gráficos estadísticos ISBN: 978-9942-922-02-1 Escuela Superior Politécnica del Litoral Instituto de Ciencias Matemáticas Guayaquil - Ecuador 2007 Luis Rodríguez Ojeda, MSc. [email protected] CONTENIDO 1 Fundamentos de la Estadística 8 1.1 Objetivo 8 1.2 Definiciones preliminares 8 1.3 Desarrollo de un proyecto estadístico 9 1.3.1 Preguntas 10 2 Estadística Descriptiva 11 2.1 Recopilación de datos 11 2.2 Simbología 11 2.2.1 Preguntas 12 2.3 Descripción de conjuntos de datos 13 2.4 Tabla de distribución de frecuencia 13 2.4.1 Ejercicios 15 2.5 Representación gráfica de conjuntos de datos 17 2.5.1 Histograma de frecuencias 17 2.5.2 Polígono de frecuencias 18 2.5.3 Ojiva 18 2.5.4 Gráficos de frecuencias con formas especiales 19 2.5.5 Ejercicios 20 2.6 Medidas de tendencia central 22 2.6.1 Media muestral 22 2.6.2 Moda muestral 22 2.6.3 Mediana muestral 22 2.7 Medidas de dispersión 23 2.7.1 Rango 23 2.7.2 Varianza muestral 24 2.7.3 Desviación estándar muestral 22 2.8 Medidas de posición 24 2.8.1 Cuartiles 24 2.8.8 Deciles 25 2.8.9 Percentiles 25 2.9 Coeficiente de variación 25 2.9.1 Ejercicios 26 2.10 Fórmulas para datos agrupados 28 2.10.1 Ejercicios 30 2.11 Instrumentos gráficos adicionales 31 2.11.1 Diagrama de caja 31 2.11.2 Diagrama de puntos 31 2.11.3 Diagrama de Pareto 31 2.11.4 Diagrama de tallo y hojas 32 2.11.5 Ejercicios 33 2.12 Muestras bivariadas 36 2.12.1 Correlación 37 2.12.2 Covarianza muestral 37 2.12.3 Signos de la covarianza muestral 38 2.12.4 Coeficiente de correlación lineal muestral 38 2.12.5 Matriz de varianzas y covarianzas 39 2.12.6 Matriz de correlación 39 2.12.7 Ejercicios 42 3 Fundamentos de la teoría de la probabilidad 44 3.1 Fórmulas de conteo 44 3.1.1 Permutaciones 45 3.1.2 Permutaciones con todos los elementos 46 3.1.3 Arreglo circular 47 3.1.4 Permutaciones con elementos repetidos 47 3.1.5 Combinaciones 48 3.1.6 Ejercicios 51 3.2 Experimento estadístico 53 3.3 Espacio muestral 53 3.4 Eventos 54 3.5 Sigma-álgebra 54 3.6 Probabilidad de eventos 54 3.6.1 Asignación de valores de probabilidad a eventos 55 3.6.2 Probabilidad de eventos simples 57 3.7 Axiomas de probabilidad de eventos 58 3.8 Propiedades de la probabilidad de eventos 58 3.8.1 Demostraciones basadas axiomas de probabilidad 58 3.8.2 Ejercicios 62 3.9 Probabilidad condicional 63 3.9.1 Ejercicios 65 3.10 Eventos independientes 66 3.11 Regla multiplicativa de la probabilidad 68 3.11.1 Ejercicios 70 3.12 Probabilidad total 71 3.13 Teorema Bayes 73 3.14 Ejercicios 75 4 Variables aleatorias discretas 76 4.1 Distribución de probabilidad de una variable aleatoria discreta 77 4.2 Distribución de probabilidad acumulada 80 4.2.1 Ejercicios 82 4.3 Valor esperado de una variable aleatoria discreta 83 4.3.1 Valor esperado de expresiones con una variable aleatoria 84 4.3.2 Propiedades del valor esperado 85 4.3.3 Corolarios 85 4.4 Varianza de una variable aleatoria discreta 86 4.4.1 Fórmula calcular la varianza 87 4.4.2 Propiedades de la varianza 87 4.4.3 Corolarios 87 4.4.4 Ejercicios 88 4.5 Momentos de una variable aleatoria discreta 89 4.5.1 Momentos alrededor del origen 89 4.5.2 Momentos alrededor de la media 89 4.5.3 Coeficientes para comparar distribuciones 89 4.5.4 Equivalencia entre momentos 90 4.6 Función generadora de momentos 90 4.6.1 Obtención de momentos 90 4.6.2 Unicidad de funciones de distribución de probabilidad 92 4.7 Teorema de Chebyshev 92 4.8 Ejercicios 93 5 Distribuciones de probabilidad discretas 95 5.1 Distribución discreta uniforme 95 5.1.1 Media y varianza 96 5.2 Distribución de Bernoulli 96 5.3 Distribución binomial 97 5.3.1 Parámetros y variables 98 5.3.2 Distribución de probabilidad binomial acumulada 98 5.3.3 Gráfico de la distribución binomial 99 5.3.4 Media y varianza 100 5.3.5 Ejercicios 101 5.4 Distribución binomial negativa 103 5.4.1 Media y varianza 104 5.5 Distribución geométrica 104 5.5.1 Media y varianza 104 5.6 Distribución hipergeométrica 105 5.6.1 Media y varianza 106 5.6.2 Aproximación de la distribución hipergeométrica con la distribución binomial 107 5.6.3 Ejercicios 107 5.7 Distribución de Poisson 110 5.7.1 Media y varianza de la distribución de Poisson 111 5.7.2 Aproximación de la distribución binomial con la distribución de Poisson 111 5.7.3 Ejercicios 112 6 Variables aleatorias continuas 114 6.1 Función de densidad de probabilidad 114 6.2 Función de distribución 115 6.2.1 Ejercicios 116 6.3 Media y varianza de variables aleatorias continuas 118 6.3.1 Propiedades de la media y la varianza 118 6.3.2 Valor esperado de expresiones con una variable 119 aleatoria continua 6.4 Momentos y función generadora de momentos 119 6.5 Teorema de Chebyshev 120 6.6 Ejercicios 120 7 Distribuciones de probabilidad continuas 121 7.1 Distribución discreta uniforme 121 7.1.1 Media y varianza 121 7.1.2 Función de distribución de probabilidad 122 7.1.3 Ejercicios 123 7.2 Distribución normal 124 7.2.1 Distribución normal estándar 125 7.2.2 Estandarización de la distribución normal 127 7.2.3 Valores referenciales de la distribución normal 129 7.2.4 Aproximación de la distribución binomial con la distribución normal estándar 129 7.2.5 Ejercicios 131 7.3 Distribución gamma 133 7.3.1 Media y varianza 134 7.4 Distribución exponencial 135 7.4.1 Media y varianza 136 7.4.2 Una aplicación de la distribución exponencial 137 7.4.3 Ejercicios 138 7.5 Distribución de Weibull 141 7.5.1 Media y varianza 141 7.6 Razón de falla 142 7.7 Distribución beta 142 7.7.1 Media y varianza 143 7.8 Distribución de Erlang 144 7.8.1 Media y varianza 144 7.9 Distribución ji-cuadrado 145 7.9.1 Media y varianza 145 7.9.2 Ejercicios 146 7.10 Distribución empírica acumulada 148 7.10.1 Ejercicios 149 8 Distribuciones de probabilidad conjunta 150 8.1 Caso discreto bivariado 150 8.1.1 Distribución de probabilidad conjunta 150 8.1.2 Distribución de probabilidad acumulada 150 8.1.3 Distribuciones de probabilidad marginal 151 8.1.4 Distribuciones de probabilidad condicional 153 8.1.5 Variables aleatorias discretas independientes 154 8.2 Caso discreto trivariado 155 8.2.1 Ejercicios 157 8.3 Caso continuo bivariado 159 8.3.1 Densidad de probabilidad conjunta 159 8.3.2 Distribución de probabilidad acumulada conjunta 159 8.3.3 Densidades de probabilidad marginal 160 8.3.4 Densidades de probabilidad condicional 161 8.3.5 Variables aleatorias continuas independientes 162 8.4 Caso continuo trivariado 164 8.4.1 Ejercicios 165 8.5 Media para variables aleatorias conjuntas bivariadas 166 8.5.1 Casos especiales 167 8.6 Covarianza para variables aleatorias conjuntas bivariadas 167 8.6.1 Signos de la covarianza 169 8.6.2 Matriz de varianzas y covarianzas 171 8.6.3 Coeficiente de correlación lineal 172 8.6.4 Matriz de correlación 172 8.7 Media y varianza para variables aleatorias conjuntas trivariadas 174 8.7.1 Ejercicios 177 8.8 Distribución multinomial 180 8.8.1 Media y varianza 180 8.9 Distribución hipergeométrica multivariada 181 8.9.1 Ejercicios 183 8.10 Propiedades de las variables aleatorias conjuntas 184 9 Muestreo Estadístico 186 9.1 Distribuciones de Muestreo 188 9.2 Distribución de muestreo de la media muestral 189 9.2.1 Corrección de la varianza 189 9.2.2 Media muestral de una población normal 190 9.3 Teorema del Límite Central 191 9.3.1 Ejercicios 193 9.4 La distribución T 194 9.4.1 Gráfico de la distribución T 194 9.5 La distribución ji-cuadrado 196 9.5.1 Gráfico de la distribución ji-cuadrado 196 9.6 Distribución F 198 9.6.1 Gráfico de la distribución F 198 9.7 Estadísticas de orden 200 9.7.1 Densidad de probabilidad de las estadísticas de orden 200 9.7.2 Ejercicios 202 10 Estadística inferencial 205 10.1 Inferencia estadística 205 10.2 Métodos de inferencia estadística 205 10.2.1 Estimación puntual 205 10.2.2 Estimación por intervalo 206 10.2.3 Prueba de hipótesis 206 10.3 Propiedades de los estimadores 206 10.3.1 Ejercicios 212 10.4 Inferencias relacionadas con la media 215 10.4.1 Estimación puntual (muestras grandes) 215 10.4.2 Tamaño de la muestra (muestras grandes) 217 10.4.3 Estimación por intervalo (muestras grandes) 218 10.4.4 Intervalos de confianza unilaterales (muestras grandes) 219 10.4.5 Ejercicios 220 10.4.6 Estimación puntual (muestras pequeñas) 221 10.4.7 Estimación por intervalo (muestras pequeñas) 223 10.4.8 Ejercicios 224 10.5 Prueba de hipótesis 226 10.5.1 Prueba de hipótesis relacionada con la media 227 (muestras grandes) 10.5.2 Ejercicios 230 10.5.3 Prueba de hipótesis relacionada con la media 232 (muestras pequeñas) 10.5.4 Ejercicios 233 10.5.5 Valor-p de una prueba de hipótesis 235 10.5.6 Cálculo del error tipo I 236 10.5.7 Cálculo del error tipo II 237 10.5.8 Curva característica de operación 238 10.5.9 Potencia de la prueba 238 10.5.10 Ejercicios 245 10.6 Inferencias relacionadas con la proporción (muestras grandes) 247 10.6.1 Estimación puntual 247 10.6.2 Estimación por intervalo 248 10.6.3 Prueba de hipótesis 249 10.6.4 Ejercicios 251 10.7 Inferencias relacionadas con la varianza 252 10.7.1 Intervalo de confianza 252 10.7.2 Prueba de hipótesis 253 10.7.3 Ejercicios 255 10.8 Inferencias relacionadas con la diferencia de dos medias 256 10.8.1 Estimación puntual e intervalo de confianza 256 (muestras grandes) 10.8.2 Prueba de hipótesis (muestras grandes) 258 10.8.3 Intervalo de confianza (muestras pequeñas) 260 10.8.4 Prueba de hipótesis (muestras pequeñas) 262 10.8.5 Ejercicios 265 10.9 Inferencias para la diferencia entre dos proporciones 266 (muestras grandes) 10.9.1 Intervalo de confianza 267 10.9.2 Prueba de hipótesis 268 10.9.3 Ejercicios 268 10.10 Inferencias para dos varianzas 269 10.10.1 Intervalo de confianza 269 10.10.2 Prueba de hipótesis 270 10.10.3 Ejercicios 272 10.11 Prueba para la diferencia de medias con muestras pareadas 273 10.11.1 Prueba de hipótesis 273 10.11.2 Ejercicios 275 10.12 Tablas de contingencia 277 10.12.1 Prueba de hipótesis 278 10.12.2 Ejercicios 279 10.13 Pruebas de bondad de ajuste 281 10.13.1 Prueba ji-cuadrado 281 10.13.2 Ejercicios 284 10.13.3 Prueba de Kolmogorov-Smirnov 286 10.13.4 Ejercicios 288 10.14 Análisis de varianza 290 10.14.1 Tabla ANOVA 291 10.14.2 Prueba de hipótesis 291 10.14.3 Ejercicios 292 11 Regresión lineal simple 294 11.1 Recta de mínimos cuadrados 296 11.2 Coeficiente de correlación 297 11.3 Análisis del modelo de regresión lineal simple 298 11.4 Análisis de varianza 299 11.5 Coeficiente de determinación 300 11.6 Tabla ANOVA 301 11.7 Prueba de dependencia lineal del modelo 301 11.8 Estimación de la varianza 302 11.9 Inferencias con el modelo de regresión lineal 302 11.10 Inferencias acerca de la pendiente de la recta 303 11.10.1 Intervalo de confianza 303 11.10.2 Prueba de hipótesis 303 11.11 Inferencias para la intercepción de la recta 304 11.11.1 Intervalo de confianza 304 11.11.2 Prueba de hipótesis 305 11.12 Prueba de la normalidad del error 305 11.13 Ejercicios 307 12 Regresión lineal múltiple 310 12.1 Método de mínimos cuadrados 311 12.2 Método de mínimos cuadrados para k = 2 311 12.3 Regresión lineal múltiple en notación matricial 312 12.4 Análisis de varianza 315 12.5 Coeficiente de determinación 316 12.6 Tabla ANOVA 316 12.7 Prueba de dependencia lineal del modelo 317 12.8 Estimación de la varianza 317 12.9 Matriz de varianzas y covarianzas 318 12.10 Inferencias con el modelo de regresión lineal 319 12.10.1 Estadísticos para estimación de parámetros 319 12.10.2 Intervalos de confianza 319 12.10.3 Prueba de hipótesis 320 12.11 Prueba de la normalidad del error 321 12.12 Ejercicios 322 Anexos 1 Alfabeto griego 325 2 Tabla de la distribución normal estándar 326 3 Tabla de la distribución T 328 4 Tabla de la distribución ji-cuadrado 329 5 Tabla de la distribución F 330 6 Tabla para la prueba de Kolmogorov-Smirnov 331 7 Descripción de los utilitarios DISTTOOL y RANDTOOL 332 Bibliografía 334 PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS Con el Soporte de MATLAB para Cálculos y Gráficos Estadísticos PREFACIO Esta obra es una contribución bibliográfica para los estudiantes que toman un primer curso de Probabilidad y Estadística a nivel universitario en las carreras de ingeniería. El pre-requisito es el conocimiento del cálculo diferencial e integral y alguna experiencia previa con el programa MATLAB para aprovechar el poder de este instrumento computacional como soporte para los cálculos y gráficos estadísticos. Este libro se originó en la experiencia desarrollada por el autor en varios años impartiendo el curso de Estadística en forma presencial y a distancia que ofrece el Instituto de Ciencias Matemáticas para estudiantes de ingeniería de la ESPOL y contiene el material del curso con algunos ejemplos basados en temas propuestos en exámenes receptados. El enfoque de esta obra también tiene como objetivo que los estudiantes aprecien el uso de un instrumento computacional moderno y flexible que en forma integradora puede ser usado como soporte común para los diferentes cursos básicos de matemáticas, incluyendo Probabilidad y Estadística. Este soporte lo proporciona el programa MATLAB que dispone de un amplio repertorio de funciones especializadas para manejo estadístico y de muchas otras áreas de las ciencias y la ingeniería. Todos los cálculos en esta obra, incluyendo el manejo matemático simbólico y gráfico fueron realizados con estas funciones. Al final de este libro se incluye la descripción de dos instrumentos computacionales interactivos para experimentar con modelos de probabilidad y con la generación de muestras aleatorias. Otro objetivo importante de esta obra se relaciona con el desarrollo de textos virtuales para ser usados interactivamente, reduciendo el consumo de papel y tinta, contribuyendo así con el cuidado del medio ambiente. Una ventaja adicional de los libros virtuales es la facilidad para su actualización y mejoramiento continuo del contenido. El libro ha sido compilado en formato pdf. El tamaño del texto en pantalla es controlable, contiene un índice electrónico para facilitar la búsqueda de temas y dependiendo de la versión del programa de lectura de este formato, se pueden usar las facilidades disponibles para resaltar digitalmente texto, insertar comentarios, notas, enlaces, revisiones, búsqueda por contenido, lectura, etc. Esta obra tiene derechos de autor pero es de libre uso y distribución. Su realización ha sido factible por el apoyo de la Institución a sus profesores en el desarrollo de sus actividades académicas Luis Rodríguez Ojeda, M.Sc. [email protected] Profesor titular Instituto de Ciencias Matemáticas Escuela Superior Politécnica del Litoral, ESPOL Guayaquil, Ecuador 2007 8 1 FUNDAMENTOS DE LA ESTADÍSTICA 1.1 OBJETIVO El objetivo fundamental de la Estadística es analizar datos y transformarlos en información útil para tomar decisiones. El conocimiento de la Estadística se remonta a épocas en las que los gobernantes requerían técnicas para controlar a sus propiedades y a las personas. Posteriormente, el desarrollo de los juegos de azar propició el estudio de métodos matemáticos para su análisis los cuales con el tiempo dieron origen a la Teoría de la Probabilidad que hoy es el sustento formal de la Estadística. El advenimiento de la informática ha constituido el complemento adecuado para realizar estudios estadísticos mediante programas especializados que facilitan enormemente el tratamiento y transformación de los datos en información útil. La Estadística ha alcanzado un nivel de desarrollo muy alto y constituye actualmente el soporte necesario para todas las ciencias y para la investigación científica, siendo el apoyo para tomar decisiones en un entorno de incertidumbre. Es importante resaltar que las técnicas estadísticas deben usarse apropiadamente para que la información obtenida sea válida. 1.2 DEFINICIONES PRELIMINARES ESTADÍSTICA Ciencia inductiva que permite inferir características cualitativas y cuantitativas de un conjunto mediante los datos contenidos en un subconjunto del mismo. POBLACIÓN OBJETIVO Conjunto total de individuos u objetos con alguna característica que es de interés estudiar. PARÁMETRO Es alguna característica de la población en estudio y que es de interés conocer. MUESTRA Es un subconjunto de la población y contiene elementos en los cuales debe estudiarse la característica de interés para la población. VARIABLE Representación simbólica de alguna característica observable de los elementos de una población y que puede tomar diferentes valores. OBSERVACIÓN o DATO Cada uno de los valores obtenidos para los elementos incluidos en la muestra. Son el resultado de algún tipo de medición.
Description: