Introdução à Probabilidade e à Estatística Com complementos de Excel Amostra? População? Maria Eugénia Graça Martins Departamento de Estatística e Investigação Operacional da FCUL Sociedade Portuguesa de Estatística Junho 2005 Introdução à Probabilidade e à Estatística Com complementos de Excel Maria Eugénia Graça Martins Departamento de Estatística e Investigação Operacional da FCUL Sociedade Portuguesa de Estatística Junho 2005 FICHA TÉCNICA Título – INTRODUÇÃO À PROBABILIDADE E À ESTATÍSTICA Com complementos de Excel Autor – Maria Eugénia Graça Martins Copyright © Sociedade Portuguesa de Estatística ISBN – 972–8890–03-6 Depósito Legal nº 228501/05 Junho 2005 Nota prévia Estas folhas têm como objectivo transmitir os conhecimentos básicos de uma disciplina na área de Probabilidades e Estatística, dando uma visão geral do que é que se pretende com a Estatística e qual a sua utilidade, e ainda porque é que é necessário saber Probabilidade, para fazer Estatística. Nesta edição, revista a partir de uma edição de 2000, introduzimos alguns complementos de Excel. Embora esta folha de cálculo não seja um software de Estatística, já nos permite fazer muita da Estatística necessária, a nível elementar, e tem a grande vantagem de estar acessível em todos os computadores, que não é o caso de qualquer software de Estatística. Achamos também que o saber trabalhar com esta folha de cálculo, permitirá minimizar os erros e as falhas cometidas ao utilizá-la para fazer Estatística. Não pretendemos apresentar estas folhas como um produto acabado, mas sim como um novo passo para um trabalho que possa ser continuamente melhorado com as críticas e sugestões, que desde já agradeço, da parte dos alunos a que se destinam e da parte dos colegas. A autora Aos meus alunos Índice Capítulo 1 O que é a Estatística 1 1.1 – Introdução 1 1.2 – Aquisição de dados: sondagens e experimentações. População e amostra 2 1.2.1 – Sondagens 2 Técnicas de amostragem aleatória 6 Amostra aleatória simples 6 Como obter uma tabela de números aleatórios 8 Utilização do Excel na selecção de uma amostra aleatória simples 8 Amostra aleatória sistemática 12 Amostragem estratificada 12 Amostragem por “Clusters” ou grupos 13 Amostragem multi-etapas 13 Utilização do Excel na selecção de uma amostra aleatória sistemática 13 Qual a dimensão que se deve considerar para a amostra? 14 Pode-se aumentar a precisão estratificando? 17 1.2.2 – Experimentações 19 1.3 – Exploração de dados 21 1.4 – Inferência Estatística 22 1.5 – Estatística Descritiva e Inferência Estatística 23 Interpretação do intervalo de confiança 25 1.6 – Exemplos de aplicação da Estatística 26 Exercícios 28 Capítulo 2 Análise, representação e redução de dados 29 2.1 – Introdução 29 2.2 – Tipos de dados 30 2.2.1 – Dados qualitativos 30 Variáveis nominais 30 Variáveis ordinais 30 2.2.2 – Dados quantitativos 33 Variáveis intervalares 33 Variáveis percentuais 33 Outras classificações 33 Como organizar os dados 34 2.2.2.1 – Organização de dados discretos 34 2.2.2.2 – Organização de dados contínuos 35 Utilização do Excel na obtenção de tabelas de frequência 37 2.3 – Representação gráfica de dados 43 2.3.1 – Variáveis discretas. Diagrama de barras 43 Utilização do Excel na construção de diagramas de barras 44 2.3.2 – Variáveis contínuas. Histograma 46 Utilização do Excel na construção de histogramas 48 2.3.3 – Outras representações gráficas 50 2.3.3.1 – Diagrama circular 50 2.3.3.2 – Caule-e-folhas 51 Utilização do caule-e-folhas para comparar duas amostras 55 Utilização do Excel na construção de um caule-e-folhas 56 2.3.3.3 – Função distribuição empírica 58 2.3.3.4 – Box-plot ou Box-and-whisker plot (caixa-com-bigodes) 61 Utilização do Excel na construção de uma Box-plot 66 Exercícios 69 2.4 – Dados bivariados 73 Utilização do Excel na construção de uma tabela de contingência 77 Exercícios 79 Capítulo 3 Características amostrais 81 3.1 – Introdução 81 3.2 – Medidas de localização 82 3.2.1 – Média 82 3.2.2 – Mediana 86 3.2.3 – Quantis. Quartis e quartos 88 3.2.4 – Médias aparadas e trimédia 89 3.2.5 – Moda 90 Exercícios 91 3.3 – Medidas de dispersão 94 3.3.1 – Variância 94 3.3.2 – Desvio padrão 95 3.3.3 – Amplitude inter-quartil 98 3.3.4 – Dispersão relativa 99 Exercícios 100 Utilização do Excel na obtenção das estatísticas descritivas 101 3.4 – Associação de variáveis 102 3.4.1 – Coeficiente de correlação 102 Utilização do Excel na construção do diagrama de pontos e no cálculo da correlação 108 Exercícios 109 3.4.2 – Associação de variáveis qualitativas 109 Paradoxo de Simpson 112 Exercício 115 Capítulo 4 Regressão 117 4.1 – Introdução 117 4.2 – Recta dos mínimos quadrados 118 Utilização do Excel na construção da recta de regressão 123 Exercícios 123 Capítulo 5 Probabilidade 125 5.1 – Introdução 125 5.2 – Experiência aleatória. Espaço de resultados. Acontecimentos 130 5.2.1 – Operações com acontecimentos 136 5.3 – Probabilidade de um acontecimento 138 5.3.1 – Probabilidade frequencista 139 Utilização do Excel na simulação de experiências aleatórias 142 5.3.2 –Probabilidade Laplaciana (ou definição clássica) 145 5.3.3 –Probabilidade subjectivista ou Bayesiana 147 5.3.4 – Definição axiomática de Probabilidade 148 Propriedades da Probabilidade 150 5.4 – Probabilidade condicional. Acontecimentos independentes 152 5.4.1 – Probabilidade condicional 152 Árvore de probabilidades 157 5.4.2 – Probabilidade da Intersecção de acontecimentos ou probabilidade conjunta dos acontecimentos A e B ou regra do produto 159 5.4.3 – Acontecimentos independentes 160 5.5 – Teorema de Bayes 163 Teorema da Probabilidade Total 165 Exercícios 166 Capítulo 6 Variáveis aleatórias 173 6.1 – Introdução 173 6.2 – Variável aleatória 173 6.2.1 – Variável aleatória discreta 175 Função massa de probabilidade 177 Utilização do Excel na simulação da experiência do lançamento 180 de três dados 6.2.2 – Variável aleatória contínua 181 6.3 – Função distribuição 182 6.4 – Função densidade de probabilidade 186 Exercícios 189 6.5 – Pares de variáveis aleatórias 191 6.5.1 – Introdução 191 6.5.2 – Distribuição de probabilidade conjunta 191 6.5.3 – Variáveis aleatórias independentes 193 Exercícios 193 Capítulo 7 Características populacionais 195 7.1 – Introdução 195 7.2 – Valor médio 196 Lei dos grandes números 197 7.2.1 – Propriedades do valor médio 199 7.3 – Quantil de probabilidade p 200 Mediana 201 7.4 – Variância (populacional) 202 7.4.1 – Desvio padrão (populacional) 202 7.5 – Covariância 204 7.5.1 – Coeficiente de correlação 205 7.6 – Regressão de Y em X 206 Coeficiente de determinação 210 Exercícios 211 Capítulo 8 Alguns modelos de probabilidade 213 8.1 – Introdução 213 8.2 – Modelos discretos 214 8.2.1 – Modelo Uniforme 214 8.2.2 – Modelo Binomial 214 Amostragem com reposição 219 Amostragem sem reposição em populações infinitas 219 8.2.3 – Modelo Binomial Negativa 220 8.2.4 - Modelo de Poisson 223 Aproximação da distribuição Binomial pela distribuição de Poisson 224 8.2.5 – Modelo Hipergéométrico 228 Utilização do Excel para calcular probabilidades dos Modelos Discretos 231 8.3 – Modelos contínuos 233 8.3.1 – Modelo Normal 233 8.3.2 – Modelo Uniforme 238 Transformação uniformizante 240 8.3.3 – Modelo Exponencial 240 Utilização do Excel para calcular probabilidades dos Modelos Contínuos. 241 8.4 – Compreender a simulação 242 Utilização do Excel para gerar números pseudo-aleatórios com determinadas distribuições 244 Exercícios 244 Capítulo 9 Distribuições de amostragem 249 9.1 – Introdução 249 9.2 – Distribuição de amostragem da média 251 9.2.1 – Valor médio e desvio padrão da média 251 9.2.2 – Distribuição da média para populações Normais 252 9.2.2.1 – Desvio padrão σ conhecido 252 9.2.2.2 – Desvio padrão σ desconhecido 252 9.2.3 – Distribuição da média para populações não Normais. Teorema do Limite Central 253 Aplicações do Teorema Limite Central 258 Aproximação da Distribuição Binomial, pela Normal 258 Aproximação da Distribuição de Poisson, pela Normal 259 9.3 – Distribuição de amostragem da proporção 262 9.3.1 – Valor médio e variância do estimador da proporção populacional 265 9.3.2 – Distribuição de amostragem do estimador da proporção 265 Exercícios 266 Capítulo 10 Introdução à Estimação 269 10.1 – Noções prelimunares sobre estimação. Estimadores pontuais e intervalares 269 10.2 – Estimação da proporção. Intervalo de confiança 270 Confiança e precisão 273 10.3 – Estimação do valor médio. Intervalo de confiança para o valor médio 275