Université de Montréal Approximation du calcul de la taille échantillonnale pour les tests à hypothèses multiples lorsque r parmis m hypothèses doivent être significatives par Philippe Delorme Département de mathématiques et de statistique Faculté des arts et des sciences Mémoire présenté à la Faculté des études supérieures en vue de l’obtention du grade de Maître ès sciences (M.Sc.) en statistique Décembre 2012 (cid:2)c Philippe Delorme, 2012 Université de Montréal Faculté des études supérieures Ce mémoire intitulé Approximation du calcul de la taille échantillonnale pour les tests à hypothèses multiples lorsque r parmis m hypothèses doivent être significatives présenté par Philippe Delorme a été évalué par un jury composé des personnes suivantes : Martin Bilodeau (président-rapporteur) Pierre Lafaye de Michaux (directeur de recherche) François Perron (membre du jury) Mémoire accepté le: 20 décembre 2012 v SOMMAIRE Généralement, dans les situations d’hypothèses multiples on cherche à rejeter toutes les hypothèses ou bien une seule d’entre d’elles. Depuis quelques temps on voit apparaître le besoin de répondre à la question : « Peut-on rejeter au moins r hypothèses? ». Toutefois, les outils statisques pour répondre à cette question sont rares dans la littérature. Nous avons donc entrepris de développer les for- mules générales de puissance pour les procédures les plus utilisées, soit celles de Bonferroni, de Hochberg et de Holm. Nous avons développé un package R pour le calcul de la taille échantilonnalle pour les tests à hypothèses multiples (multiple endpoints), où l’on désire qu’au moins r des m hypothèses soient significatives. Nous nous limitons au cas où toutes les variables sont continues et nous présen- tons quatre situations différentes qui dépendent de la structure de la matrice de variance-covariance des données. Mots clés : Taille d’échantillon, Puissance, Hypothèses multiples. vii SUMMARY Generally, in multiple endpoints situations we want to reject all hypotheses or at least only one of them. For some time now, we see emerge the need to answer thequestion:"Canwerejectatleastr hypotheses?"However,thestatisticaltools to answer this new problem are rare in the litterature. We decide to develop ge- neral power formulas for the principals procedures : Bonferroni’s, Hochberg’s and Holm’s procedures. We also develop an R package for the sample size calculation for multiple endpoints, when we want to reject at least r hypotheses. We limit ourselves in the case where all the variables are continuous and we present four different situations depending on the structure of the data’s variance-covariance matrix. Keywords : Sample size, Power, Multiple endpoints. ix TABLE DES MATIÈRES Sommaire........................................................ v Summary........................................................ vii Liste des figures ................................................. xiii Liste des tableaux ............................................... xv Remerciements .................................................. 1 Introduction..................................................... 3 Chapitre 1. Définitions......................................... 7 1.1. Risques d’erreur à contrôler....................................... 8 1.1.1. Taux d’erreurs par comparaisons (PCER)..................... 9 1.1.2. Taux d’erreurs par-famille (PFER)............................ 10 1.1.3. Familywise error rate (FWER)................................ 10 1.1.4. Generalized familywise error rate (gFWER).................... 12 1.1.5. Taux de fausses découvertes (FDR)............................ 12 1.1.6. Taux positif de fausses découvertes (pFDR).................... 12 1.2. Puissance......................................................... 13 1.3. Seuil de significativité et grandeur d’effet.......................... 14 Chapitre 2. Les procédures de tests............................. 17 2.1. Procédures Single-Step............................................ 17 2.1.1. La procédure de Simes......................................... 17 2.1.2. La procédure de Bonferroni.................................... 18 x 2.1.3. La procédure de Dunn-Šidák................................... 19 2.1.4. La procédure de Dunnett ...................................... 19 2.2. Procédures Step-Up .............................................. 20 2.2.1. Procédure de Hochberg......................................... 20 2.2.2. Procédure de Rom............................................. 21 2.2.3. Procédure de Hommel ......................................... 22 2.2.4. Procédure Dunnett-Tamhane................................... 23 2.3. Procédures Step-Down............................................ 24 2.3.1. Procédure de Holm ............................................ 24 2.3.2. Procédure Step-Down Dunnett ................................. 25 2.4. Autre procédure Step-Wise ....................................... 26 2.4.1. Procédure Step-Up-Down de Tamhane-Liu-Dunnett............ 26 Chapitre 3. Rappels pour le cas d’une hypothèse unique sur la différence entre deux moyennes..................... 29 3.1. Test d’égalité..................................................... 29 3.2. Test de non-infériorité ............................................ 32 3.3. Test de supériorité................................................ 33 3.4. Test d’équivalence ................................................ 34 Chapitre 4. Présentation de la problématique................... 37 4.1. Cas où Var(X ) = σ2............................................ 39 ijk 4.2. Cas où Var(X ) = σ2............................................ 41 ijk i 4.3. Cas où Var(X ) = σ2............................................ 42 ijk k 4.4. Cas où Var(X ) = σ2 ........................................... 44 ijk ik Chapitre 5. Équations générales pour la puissance.............. 45
Description: