Universidade de S˜ao Paulo Escola Superior de Agricultura “Luiz de Queiroz” Uma abordagem para an´alise de dados com medidas repetidas utilizando modelos lineares mistos Michele Barbosa Disserta¸c˜ao apresentada para obten¸c˜ao do t´ıtulo de Mestre em Agronomia. A´rea de concentrac¸˜ao: Estat´ıstica e Experi- menta¸c˜ao Agronˆomica Piracicaba 2009 Michele Barbosa Licenciatura em Matem´atica Uma abordagem para an´alise de dados com medidas repetidas utilizando modelos lineares mistos Orientador: Prof. Dr. CE´SAR GONC¸ALVES DE LIMA Disserta¸c˜ao apresentada para obten¸c˜ao do t´ıtulo de Mestre em Agronomia. A´rea de concentra¸c˜ao: Es- tat´ıstica e Experimentac¸˜ao Agronˆomica Piracicaba 2009 Dados Internacionais de Catalogação na Publicação DIVISÃO DE BIBLIOTECA E DOCUMENTAÇÃO - ESALQ/USP Barbosa, Michele Uma abordagem para análise de dados com medidas repetidas utilizando modelos lineares mistos / Michele Barbosa. - - Piracicaba, 2009. 118 p. : il. Dissertação (Mestrado) - - Escola Superior de Agricultura “Luiz de Queiroz”, 2009. Bibliografia. 1. Análise de dados longitudinais 2. Leite - Experimentos 3. Medidas repetidas 4. Modelos lineares 5. Software livre I. Título CDD 519.535 B238a “Permitida a cópia total ou parcial deste documento, desde que citada a fonte – O autor” 3 Dedicat´oria Aos meus pais e familiares, Camila, Jo˜ao Pedro e Marcos. 4 “Aventure-se, pois da mais insignificante pista surgiu toda riqueza que o homem j´a conheceu”(John Masefield). 5 AGRADECIMENTOS Desejo externar os meus agradecimentos aos meus pais Antˆonio e Marlene e `a minha irm˜aCamilapeloincentivo,valorizac¸˜aodeminhasdecis˜oespessoaiseprofissionais,ajudaemtodos os momentos e alegria de tˆe-los ao meu lado sempre. Ao meu irm˜ao Jo˜ao Pedro, pelo seu divertimento, seu olhar brilhante e a alma cheia de esperan¸ca que me permitiu ter o lado infantil bem conservado. AoMarcos,pelacompreens˜aoduranteaelabora¸c˜aodestetrabalho,porcompartilhar pequenas e grandes alegrias e fazer uma grande e maravilhosa diferen¸ca. Appreciate your help! Prof. Dr. C´esar Gon¸calves Lima, por toda a experiˆencia, serenidade e sabedoria transmitidas durante todas as etapas do trabalho e por toda a amizade e paciˆencia. Ao Prof. Dr. Gerson Barreto Mour˜ao, pela confian¸ca depositada quando do in- gresso como estagi´aria do programa PAE e a cada um dos alunos da gradua¸c˜ao, por todos os ensinamentos, contribuindo para a minha forma¸ca˜o pessoal e profissional. Aos participantes do grupo R Stat, em especial a Walmes Zeviani e F´abio Mathias Cˆorrea por todas as contribui¸c˜oes oferecidas, que foram fundamentais para o desenvolvimento da pesquisa e ao grupo GEMMIX, que atrav´es das trocas de informa¸c˜oes com professores e colegas do departamento proporcionou est´ımulo constante. Aos professores do departamento de Ciˆencias Exatas ESALQ/USP com os quais tive o prazer de conviver, muito ou pouco, pelos conhecimentos, pela experiˆencia, pelo gosto pela pesquisa e pelo apoio. ` A Simone que me acolheu em sua casa na chegada a Piracicaba, `a Divis˜ao de Atendimento a Comunidade-Servi¸co de Promo¸ca˜o Social Vila Estudantil, em especial a todos os alunos moradores da Vila Estudantil, no per´ıdo de mar¸co de 2007 `a agosto de 2008, por criarem espa¸cos de encontro entre semelhan¸cas e diferen¸cas, permitindo mais que estar, viver e se doar. Aos colegas e amigos que me ajudaram, de diferentes formas, em momentos im- portantes desta trajet´oria e compartilharam essa experiˆencia comigo, `a turma do doutorado, em especial a Fernanda (Loira linda). ` Aturmademestrado, emespecialasamigasClaudiaeElizabeth, aosamigosC´assio, Elton e Raphael, pelo companheirismo, convivˆencia e cumplicidade. Aos funcion´arios da ESALQ e do Departamento de Ciˆencias Exatas, por toda a presteza em fornecer orienta¸co˜es, contribuindo para a qualidade do curso. 6 Aos t´ecnicos da FZEA, F´abio e Elisˆangela, pela colabora¸c˜ao prestada. ` A Andrezza Maria Fernandes, por disponibilizar os dados. ` A Juliana Almeida de Barros (prima querida), pelas devidas corre¸c˜oes. Aos professores da Unesp de Rio Claro, Henrique Lazari e Jos´e Silvio Govone, por todo o incentivo para que eu viesse cursar o mestrado na ESALQ. ` A Coordena¸c˜ao de Aperfei¸coamento de Pessoa de N´ıvel Superior - CAPES, pelo aux´ılio financeiro prestado. AosmeusamigosdePiracicaba, AndradasedeoutrascidadesdoBrasiledomundo. A convivˆencia com cada um de vocˆes foi inesquec´ıvel e imprescind´ıvel. 7 SUMA´RIO RESUMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 LISTA DE FIGURAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 LISTA DE TABELAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 ˜ 1INTRODUC¸AO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2DESENVOLVIMENTO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.1Revis˜ao bibliogr´afica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.1.1Modelos Lineares Mistos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.1.1.1Introdu¸c˜ao e exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 2.1.1.2Especifica¸c˜ao do modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 2.1.2Estruturas das Matrizes de Covariaˆncia . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2.1.3Estima¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 2.1.4Sele¸c˜ao de modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 2.1.4.1Crit´erios de informa¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.1.4.2Teste da Raz˜ao de Verossimilhan¸ca . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 2.1.4.3Teste de Wald . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 2.1.5Predi¸c˜ao dos efeitos aleat´orios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 2.2O Software R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.2.1Estruturas da Matriz Positiva Definida (pdMat) . . . . . . . . . . . . . . . . . . . . . 39 2.2.2Estruturas de Correla¸c˜ao e Fun¸ca˜o de Variˆancia . . . . . . . . . . . . . . . . . . . . . 40 2.3O Software SAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 2.3.1Estruturas da Matriz de Covariaˆncias . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 ´ 3MATERIAL E METODOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.1Material . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.2M´etodos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 ˜ 4RESULTADOS E DISCUSSAO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4.1Concentrac¸˜ao de α -case´ına no leite UAT . . . . . . . . . . . . . . . . . . . . . . . . . 55 S1 4.1.1Ajuste de estruturas `a matriz de covariaˆncias intra-indiv´ıduos (R ) . . . . . . . . . . 60 i 4.1.2Diagn´ostico do modelo A7.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 4.2Concentrac¸˜ao de β-case´ına no leite UAT . . . . . . . . . . . . . . . . . . . . . . . . . . 64 4.2.1Ajuste de estruturas `a matriz de covariaˆncias intra-indiv´ıduos (R ) . . . . . . . . . . 68 i 8 4.2.2Diagn´ostico do modelo B9.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 4.3Pesos de frango de corte da linhagem Hubbard . . . . . . . . . . . . . . . . . . . . . . . 72 4.3.1Ajuste de estruturas `a matriz de covariˆancias intra-indiv´ıduos (R ) (pesos de frangos i de corte) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 4.3.2Diagn´ostico do modelo F6.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 4.4 Algumas compara¸co˜es entre o R e o proc mixed do SAS . . . . . . . . . . . . . . . . . 79 ˜ 5CONCLUSOES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 ˆ REFERENCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 ANEXOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89 9 RESUMO Uma abordagem para an´alise de dados com medidas repetidas utilizando modelos lineares mistos No presente trabalho propˆos-se uma abordagem simples visando `a escolha de um modelo linear misto a ser ajustado a dados com medidas repetidas. A constru¸ca˜o do modelo envolveu a escolha dos efeitos aleat´orios, dos efeitos fixos e da estrutura de covariaˆncias utilizando t´ecnicas gr´aficas e anal´ıticas. O uso do Teste da Raz˜ao de Verossimilhan¸ca e dos Crit´erios de Informa¸ca˜o de Akaike - AIC e de Schwarz - BIC pode levar a escolhas diferentes da estrutura de covariaˆncias, o que pode influenciar os resultados das inferˆencias feitas sobre os parˆametros de efeitos fixos. A abordagem foi aplicada a conjuntos de dados resultantes de estudos agropecu´arios utilizando o software livre R. Foram feitas compara¸co˜es dos resultados obtidos de modelos im- plementados com o proc mixed do SAS e com a fun¸ca˜o lme() do R, observando as vantagens e restri¸co˜es destes dois softwares. Palavras-chave: Modelo linear misto; Medidas repetidas; Estrutura de covariaˆncia; Informa¸ca˜o de Akaike; Software R.
Description: