MASTER ECONOMETRIE ET STATISTIQUE APPLIQUEE (ESA) Université d’Orléans Econométrie des Variables Qualitatives Chapitre 1 Modèles Dichotomiques Univariés Modèles Probit, Logit et Semi-Paramétriques Christophe Hurlin Polycopié de Cours Master Econométrie et Statistique Appliquée (ESA) Université d’Orléans Faculté de Droit, d’Economie et de Gestion Bureau A 224 Rue de Blois – BP 6739 45067 Orléans Cedex 2 www.univ-orleans.fr/deg/masters/ESA/ January 21, 2003 Contents 1 Modèles Dichotomiques Univariés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.1 Spécification linéaire des variables endogènes dichotomiques . . . . . . . . . . . . 8 1.2 Modèles Logit et Probit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.3 Comparaison des modèles probit et logit . . . . . . . . . . . . . . . . . . . . . . . 11 1.4 Présentation des modèles dichotomiques en termes de variable latente . . . . . . 21 2 Estimation des Paramètres par la Méthode du Maximum de Vraisemblance . . . . . . 26 2.1 Estimation par maximum de vraisemblance . . . . . . . . . . . . . . . . . . . . . 26 2.1.1 Matrices Hessiennes et Matrices d’information de Fischer . . . . . . . . . 28 2.1.2 Unicité du maximum global de la fonction de log-vraisemblance . . . . . . 30 2.2 Algorithmes de maximisation de la vraisemblance . . . . . . . . . . . . . . . . . . 32 3 Propriétés Asymptotiques des Estimateurs du Maximum de Vraisemblance. . . . . . . 35 3.1 Convergence du Critères de MV. . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 3.1.1 Convergence d’estimateurs dans les modèles non linéaires . . . . . . . . . 36 3.1.2 Application aux modèles Logit et Probit . . . . . . . . . . . . . . . . . . . 38 3.2 Lois et variance asymptotiques de l’estimateur de MV . . . . . . . . . . . . . . . 39 4 Méthodes d’Estimation non Paramétriques . . . . . . . . . . . . . . . . . . . . . . . . . 42 4.1 La méthode du score maximum . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 4.2 Estimation semi-paramétrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 4.3 Comparaisondesestimateursparamétriques,nonparamétriquesetsemiparamétriques 47 5 Tests de Spécification et Inférence. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 5.1 Tests d’hypothèse sur les paramètres . . . . . . . . . . . . . . . . . . . . . . . . . 48 5.1.1 Test de Wald . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 5.1.2 Tests du rapport des maxima de vraisemblance . . . . . . . . . . . . . . . 49 5.1.3 Test du score ou du multiplicateur de Lagrange . . . . . . . . . . . . . . . 50 5.2 Tests de spécification des modèles dichotomiques . . . . . . . . . . . . . . . . . . 50 6 Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 A Annexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 A.1 Rappels sur les notions de convergence . . . . . . . . . . . . . . . . . . . . . . . . 54 A.1.1 Convergence en probabilité . . . . . . . . . . . . . . . . . . . . . . . . . . 54 A.1.2 Convergence en moyenne quadratique . . . . . . . . . . . . . . . . . . . . 55 A.1.3 Convergence en loi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 Econométrie des Variables Qualitatives. Cours C. Hurlin 4 Introduction Un des développements majeurs de l’économétrie dans les années 60 et 70, fut sans con- teste lié à l’utilisation croissante des données microéconomiques relatives à des caractéristiques économiquesd’agentsindividuels(firmes,consommateurs,centresdeprofits...). Acetteépoque, les bases de données microéconomiques ont en effet pu être constituées, puis exploitées prin- cipalement du fait de l’extension des capacités informatiques et de la réduction de leur coût. Biensouvent,lesdonnéesstatistiquesdisponiblesdanscesbasessontrelativesàdescaractères qualitatifs comme par exemple la catégorie socio-professionnelle, le type d’études suivies, le fait de travailler ou au contraire d’être au chômage, d’acheter ou de ne pas acheter un cer- tain produit etc.. Or, comme nous allons le voir dans ce chapitre, les méthodes d’inférence traditionnelles ne permettent pas de modéliser et d’étudier des caractères quantitatifs : des méthodes spécifiques doivent être utilisées tenant compte par exemple de l’absence de continu- ité des variables traitées ou de l’absence d’ordre naturel entre les modalités que peut prendre le caractère qualitatif. Ce sont ces méthodes spécifiques les plus usuelles qui seront l’objet de ce cours d’économétrie des variables qualitatives. Historiquementl’étudedes modèles décrivant lesmodalités prisesparuneouplusieursvari- ables qualitatives date des années 1940-1950. Les travaux les plus marquants de cette époque sont sans conteste ceux de Berkson (1944, 1951) consacrés notamment aux modèles di- chotomiques simples (modèles logit et probit). Les premières applications ont alors essentiellement été menées dans le domaine de la biologie, de la sociologie et de la psycholo- gie. Ainsi, ce n’est finalement que récemment, que ces modèles ont été utilisés pour décrire des données économiques avec notamment les travaux1 de Daniel L. MacFadden (1974) et de James J. Heckman (1976). Or, l’application des techniques économétriques propres aux variables qualitatives à des problématiques économiques a d’une part largement contribué à améliorer l’interprétation des modèles simples (comme par exemple le modèle logit avec les travaux de MacFadden), et d’autre part à identifier des problèmes économiques dont la struc- ture, si elle n’est pas qualitative au sens propre du terme, en mathématiquement très proche (c’estparexemplelecasdelaconsommationdebiendurableaveclemodèledeTobinde1958). Ces développements ont ainsi conduit à introduire un modèle intermédiaire entre les modèles qualitatifs et le modèle linéaire habituel : le modèle tobit. Danslasuiteducours,noussupposeronsl’existenced’uncaractèrequalitatifquipeutpren- dre K modalités disjointes. Si K = 2, on dit que la variable est dichotomique. Exemple : être au chômage ou ne pas être au chômage. Dans le cas général K N∗, on dit que la vari- ∈ able est polytomique. Aceniveaudel’exposé,laquestionquiseposeestdesavoircomment représenterun caractèrequalitatif dans lecadred’un modèleéconométrique? Sil’on considère 1Il convient ici de rappeler que ces deux économètres ont obtenu conjointement le prix nobel d’économie en 2000,cf. documenten annexe. Econométrie des Variables Qualitatives. Cours C. Hurlin 5 par exemple le type d’études suivies par un étudiant (université, école d’ingénieur etc..), la catégorie socio-professionnelle (ouvrier, employé, cadre..), ou le fait d’être au chômage, com- ment doit on représenter ces différents caractères qualitatifs ? La réponse naturelle à ces questions consiste à associer une variable quantitative (ou codage) au caractère qualitatif. Considérons l’exemple de la variable qualitative y = ”niveau d’étude” pouvant prendre 3 modalités : ”licence”, ”master”, ”doctorat”. Plusieurs choix sont possible pour coder cette variable qualitative. La première consiste tout simplement à associer à y une variable quanti- tative x pouvant prendre trois valeurs réelles distinctes (a,b,c) R3 suivant les modalités de ∈ y. La connaissance de la valeur prise par la variable x permet alors de connaître la modalité de la variable y et inversement. Le choix du triplet de valeurs (a,b,c) est alors à priori non contraint : on peut par exemple prendre (1,2,3) ou (3,5,8) en référence au nombre d’années d’étude suivies. Ainsi, on définit par exemple la variable x de la façon suivante : 3 si y =”licence” x= 5 si y =”master” 8 si y =”doctorat” Maisd’autresformesdecodageauraientpuêtreenvisagéesdanscecas. Onpeutparexemple représenter la variable qualitative par le vecteur z = (z ,z ,z ) où les variables z , i = 1,2,3 1 2 3 i sont de type dichotomique avec : 1 si y =”licence” z = 1 0 sinon (cid:29) 1 si y =”master” z = 2 0 sinon (cid:29) 1 si y =”doctorat” z = 3 0 sinon (cid:29) Lesvariablesz sontappeléesvariables dummy ouvariables muettes. Ils’agiticid’une i autre représentation quantitative de y à valeur cette fois dans (0,1)3. Ainsi, de façon générale toutes les représentations quantitatives de y s’écrivent sous la forme d’une application injective de ”licence”,”master”,”doctorat” dans un espace Rp, p N∗. { } ∈ L’intérêtprincipalducodage(oudelareprésentationquantitativedesvariablesqualitatives) estdepouvoirserameneràdesloisdiscrètessurRp.Ainsi,sil’onconsidèrel’exempleprécédent la loidez est une loi multinomiale (1;p ,.,p ,..,p ) où p désigne laprobabilité que la ie`me 1 i K i M modalité de la variable y se réalise. De la même façon, la variable z suit une loi de Bernouilli 1 (1,p ). Il faut toutefois utiliser avec prudence la loi d’une telle représentation : elle est en 1 B effet, par nature, conditionnelle au codage choisi. Les seules caractéristiques véritablement liéesàlavariablequalitativesontcellesquinedépendentpasdelareprésentationchoisie, etne sont autres que les probabilités p ,...,p . Ainsi, les moments (moyenne, variance etc..) de la 1 K variable codée ont en général peu de sens. Dans l’exemple précédent, l’espérance de la variable codéex n’apasdesignificationparticulière. En revanche, l’espérancedes variables dummies z i permet de retrouver les probabilités p . De plus, le calcul d’un coefficient de corrélation entre i deux variables codées x et z dépend naturellement des codages retenus, et ne peut donc être interprété économiquement. En revanche, la notion d’indépendance entre deux variables codée reste indépendante du codage retenu. Econométrie des Variables Qualitatives. Cours C. Hurlin 6 Danslecadredecepremierchapitre,nousallonsnousintéresseraumodèleleplussimple,à savoir le modèle dichotomique, danslequellavariableexpliquéedumodèlenepeutprendre quedeuxmodalités. Leplandecechapitreestlesuivant. Nouscommenceronsparprésenterles principaux modèles dichotomiques, et en particulier les modèles logit et probit. Puis, dans une secondesection, nous intéresserons au problèmedel’estimationdes paramètres deces modèles, notamment par la méthode du maximum de vraisemblance. Dans une troisième partie, nous étudierons la convergence des estimateurs du maximum de vraisemblance. Enfin, dans une dernièresectionnousaborderonslestestsdespécificationdecesmodèlesainsiquelesdifférents problèmes d’inférence. Econométrie des Variables Qualitatives. Cours C. Hurlin 7 1. Modèles Dichotomiques Univariés Par modèle dichotomique, on entend un modèle statistique dans lequel la variable expliquée ne peut prendre que deux modalités (variable dichotomique). Il s’agit alors généralement d’expli- quer la survenue ou la non survenue d’un événement. Hypothèse On considère un échantillon de N individus indicés i = 1,..,N. Pour chaque individu, on observe si un certain évenément s’est réalisé et l’on note y la variable codée i associée à évenement. On pose, i [1,N] : ∀ ∈ 1 si l’événement s’est réalisé pour l’individu i y = (1.1) i 0 si l’événement ne s’est pas réalisé pour l’individu i (cid:29) Onremarqueicilechoixducodage(0,1)quiesttraditionnellementretenupourlesmodèles dichotomique. Eneffet,celui-cipermetdéfinirlaprobabilitédesurvenuedel’événementcomme l’espérance de la variable codée y , puisque : i E(y )=Prob(y =1) 1+Prob(y =0) 0=Prob(y =1)=p i i i i i × × L’objectif des modèles dichotomiques consiste alors à expliquer la survenue de l’événement considéré en fonction d’un certain nombre de caractéristiques observées pour les individus de l’échantillon. Comme nous le verrons par la suite, on cherche dans ces modèles, à spécifier la probabilité d’apparition de cet événement. Quels sont alors les principaux champs d’application des modèle dichotomiques ? Nous pouvons ici évoquer quelques pistes, sur lesquelles nous reviendrons par la suite. Un des do- maines d’application traditionnel consiste en l’étude des choix d’éducation. Ainsi, parmi les premiers travaux utilisant les modèles à réponses qualitatives, plusieurs s’intéressaient aux comportements des étudiants que ce soit en terme de choix de filières, ou en termes de choix d’établissements. Il s’agissait alors de modéliser ces comportements en fonction d’un certain nombresdecaractéristiquespropresauxuniversités(présencedecampus,débouchésprofession- nels etc..) ou aux étudiants (CSP des parents, études antérieures etc..). Typiquement, il s’agit par exemple, de modéliser le choix des étudiants entre une université en ville ou un campus, ce choixétantreprésentéparunevariabledichotomiquequel’onvachercheàmodéliserenfonction deplusieursfacteurscommelerevenu,lesexedel’étudiant,ladistancedomicile-universitéetc.. Dufaitdel’organisationprivéedesétudesauxEtats-Unis,detellesmodélisationsontconnuun grand intérêt, que ce soit dans une perspective purement académique ou dans une perspective appliquée. On peut citer ici par exemple l’étude de Radner et Miller (1970). Un autre domaine d’application consiste en la modélisation des risques de défaillance dans une relation de prêt, ou dans tout autre forme de contrat d’engagement (contrat d’abonnement téléphonique, contrat d’assistance etc...). On considère par exemple une variable dichotomique prenant deux modalités : ”rupture du contrat” et ”poursuite du contrat”, et l’on cherche à expliquer variables par différents facteurs socio-économiques. Il s’agit ici des techniques de Econométrie des Variables Qualitatives. Cours C. Hurlin 8 bases des méthodes de scoring largement utilisées dans le secteur bancaire et dans le secteur des télécommunications. Cette liste d’application n’est bien entendu pas exhaustive. Nous allons à présent montrer que la modélisation des variables dichotomiques ne peut se faire à l’aide d’une spécification linéaire standard. 1.1. Spécification linéaire des variables endogènes dichotomiques En effet, la question que l’on peut naturellement se poser à ce stade de l’exposé, est de savoir en quoi les modèles dichotomiques, et plus généralement les modèles à variables endogènes qualitatives, se distinguent du modèle linéaire classique étudié en cours de licence. En effet, il s’agit de comprendre pourquoi l’utilisation de méthodes d’estimation particulières s’avère indispensable pour ce type de modèles. Pour ce faire, appliquons naïvement une modélisation linéaire simple au cas d’une variable endogène dichotomique. Supposons que l’on dispose de N observations y , i = 1,..,N d’une variable endogène i ∀ dichotomique codée y =1 ou y =0 par convention, lorsque parallèlement les observations de i i K variables exogènes sont x = x1..xK , i = 1,..,N. Dans ce cas, le modèle linéaire simple i i i ∀ s’écrit : (cid:3) (cid:4) y = x β + ε i=1,..,N (1.2) i i i ∀ (1,1) (1,K)(K,1) (1,1) où β =(β1...βK)(cid:51) ∈RK désigne un vecteur de K paramètres inconnus et où les perturbations ε sontsupposéesêtreindépendammentdistribuées. Onpeutalorsmettreenévidenceplusieurs i problèmes liés à l’utilisation de cette spécification linéaire simple pour modéliser notre variable dichotomique. Premièrement,lestermesdegaucheetdedroitedel’équation(1.1)sontdenaturedifférentes. Lavariabley estdetypequalitativetandisquelasommex β+ε estunevariablequantitative. i i i On peut répondre à ceci que le membre de gauche correspond en fait au codage (ici 0 ou 1) associéàlavariablequalitative; dèslors, iln’yauraitplusdeproblème. Mais ilest évidentque ce codage est lui même par nature arbitraire, et que les valeurs de β obtenues pour ce codage sont nécessairement différentes de celles obtenues pour tout autre codage. Elles seraient par exempledeαβsilecodageétaitdetype(0,α). Ainsi,lepremierproblèmedel’application du modèle linéaire simple à une variable dichotomique, est que le paramètre β du modèle (1.1) n’est pas interprétable. Deuxièmement, une étude graphique montre que l’approximation linéaire est peu adaptée au problème posé. Considérons pour cela le modèle linéaire avec une seule variable explicative (K =1), notée x1i, et une constante. On pose β =(β0 β1)(cid:51) et l’on considère le modèle linéaire suivant : y =β +x β +ε i=1,..,N (1.3) i 0 i 1 i ∀ Pour constater l’inadéquation de ce modèle à reproduire correctement la variable endogène dichotomique y , il suffit de se placer dans un repère x1,y et de reproduire les N différents i couples x1,y , i = 1,..,N. Naturellement, du fait du statut dichotomique de la variable i i ∀ (cid:3) (cid:4) endogène, le nuage de points ainsi obtenu se situe soit sur la droite y = 0, soit sur la par- (cid:3) (cid:4) allèle y = 1. Ainsi, comme on l’observe sur la figure (??), il est impossible d’ajuster de Econométrie des Variables Qualitatives. Cours C. Hurlin 9 Figure 1.1: Ajustement Linéaire d’une Variable Endogène Dichotomique y droite d’ajustement linéaire y = y = x 0 façon satisfaisante, par une seule droite, le nuage de points, associé à une variable dichotomique qui, par nature, est réparti sur deux droites parallèles. Troisièmement,laspécificationlinéairestandardneconvientpasauxvariablesdichotomiques, et plus généralement aux variables qualitatives, car elle pose un certain nombre de problèmes mathématiques. 1. Sachantquedanslacasd’unevariableendogèney dichotomique,celle-cinepeutprendre i que les valeurs 0 ou 1, la spécification linéaire (1.1) implique que la perturbation ε ne i peut prendre, elle aussi, que 2 valeurs, conditionnellement au vecteur x : i ε =1 x β avec une probabilité de p =Prob(y =1) i i i i − ε = x β avec une probabilité de 1 p i i i − − Ainsi,laperturbationε dumodèle(1.1)admetnécessairementuneloidiscrète, i ce qui exclut en particulier l’hypothèse de normalité des résidus. 2. Lorsque l’on suppose que les résidus ε sont de moyenne nulle, la probabilité p associée i i à l’événement y =1 est alors déterminée de façon unique. En effet, écrivons l’espérance i des résidus : E(ε )=p (1 x β) (1 p )x β =p x β =0 i i i i i i i − − − − On en déduit immédiatement que : p =x β =Prob(y =1) (1.4) i i i Ainsilaquantitéx β correspondàuneprobabilitéetdoitparconséquentsatis- i faireuncertainnombredepropriétésetenparticulierapparteniràl’intervalle fermé [0,1]. 0 x β 1 i=1,..,N (1.5) i ≤ ≤ ∀ Or rien n’assure que de telles conditions soient satisfaites par l’estimateur des Moindres Carrés utilisé dans le modèle linéaire (1.1). Si de tels contraintes ne sont pas assurées, le modèle y =β +x β +ε E(ε )=0 i=1,..,N i 0 i 1 i i ∀ n’a pas de sens. Econométrie des Variables Qualitatives. Cours C. Hurlin 10 3. Enfin,mêmesil’onparvenaitàassurerlefaitquelescontraintes(1.5)soientsatisfaitespar l’estimateur des Moindres Carrés des paramètres du modèle linéaire, il n’en demeurerait pas moins une difficulté liée à la présence d’hétéroscedasticité. En effet, on constate immédiatement que, dans le modèle (1.1), la matrice de variance covariance des résidus varie entre les individus en fonction de leur caractéristiques associées aux exogènes x i puisque : V (ε )=x β(1 x β) i=1,..,N (1.6) i i i − ∀ Pour démontrer ce résultat il suffit de considérer la loi discrète des résidus et de calculer la variance : V (ε ) = E ε2 =(1 x β)2Prob(y =1)+( x β)2Prob(y =0) i i − i i − i i = (1 x β)2p +( x β)2(1 p ) (cid:3) (cid:4)i i i i − − − Sachant que d’après la relation (1.4) on a p =x β, on en déduit que : i i V (ε ) = (1 x β)2x β+( x β)2(1 x β) i i i i i − − − = (1 x β)x β[(1 x β)+x β] i i i i − − = (1 x β)x i i − Or, de plus ce problème d’hétéroscédascticité ne peut pas être résolu par une méthode d’estimation des Moindres Carrés Généralisés tenant compte de la contrainte d’inégalité (1.5),puisquelamatricedevariancecovariancedesperturbations(1.6)dépendduvecteur β des paramètres à estimer dans la spécification linéaire, qui est par nature supposé inconnu. Pour toutes ces différentes raisons, la spécification linéaire des variables endogènes quali- tatives, et plus spécialement dichotomiques, n’est jamais utilisée et l’on recourt à des modèles logit ou probit, que nous allons à présent étudier, pour représenter ces variables. 1.2. Modèles Logit et Probit Les modèles dichotomiques probit et logit admettent pour variable expliquée, non pas un codage quantitatif associé à la réalisation d’un évenement (comme dans le cas de la spécification linéaire), mais la probabilité d’apparition de cet évenement, conditionnellement aux variables exogènes. Ainsi, on considère le modèle suivant : p =Prob(y =1 x )=F(x β) (1.7) i i i i | où la fonction F(.) désigne une fonction de répartition. La choix de la fonction de répartition F(.) est a priori non contraint. Toutefois, on utilise généralement deux types de fonction : la fonction de répartition de la loi logistique et la fonction de répartition de la loi normale centréeréduite. Achacunedecesfonctionscorrespondunnomattribuéaumodèleainsiobtenu : modèle logit et modèle probit2. Definition 1.1. On considère le modèle dichotomique suivant : p =Prob(y =1 x )=F (x β) i=1,..,N (1.8) i i i i | ∀ 2Quiselon toute logique auraitdu être nommé modèle nomit etnon modèle probit. Econométrie des Variables Qualitatives. Cours C. Hurlin 11 Dans le cas du modèle logit, la fonction de répartition F (.) correspond à la fonction logistique w R : ∀ ∈ ew 1 F(w)= = =Λ(w) (1.9) 1+ew 1+e w − Dans le cas du modèle probit, la fonction de répartition F(.) correspond à la fonction de répartition de la loi normale centrée réduite w R : ∀ ∈ F(w)= w 1 e−z22dz =Φ(w) (1.10) √2π (cid:93)−∞ Ainsi, pour une valeur donnée du vecteur des exogènes et du vecteur des paramètres β, on peut définir les deux modèles d’une façon équivalente : Definition 1.2. Le modèle logit définit la probabilité3 associé à l’événement y = 1, i comme la valeur de la fonction de répartition de la loi logistique considérée au point x β : i 1 Modèle logit : p =Λ(x β)= i=1,..,N (1.11) i i 1+e−xiβ ∀ Dans le cas du modèle probit, cette probabilité est définie comme la valeur de la fonction de répartition de la loi normale centrée réduite (0,1) considérée au point N x β : i Modèle probit : pi =Φ(xiβ)= xiβ 1 e−z22dz i=1,..,N (1.12) √2π ∀ (cid:93)−∞ A ce stade de l’exposé, la question que l’on se pose immédiatement est de savoir quelles sont les différences fondamentales entre les modèles probit et logit ? Quand doit on utiliser l’un plutôt que l’autre ? Quelles sont les propriétés particulières de ces deux modèles ? Bien entendu,cesdeuxmodèlesnediffèrentqueparlaformedelafonctionderépartitionF(.).Ainsi, il faut donc se rappeler quelles sont les propriétés respectives des lois logistiques et normales, pour comprendre quelles peuvent être les différences et les similitudes entre les modèle logit et probit. 1.3. Comparaison des modèles probit et logit Historiquement, les modèles logit ont été introduits comme des approximations de modèles probit permettant des calculs plus simples. Dès lors, il n’existe que peu de différences entre ces deux modèles dichotomiques. Ceci s’explique par la proximité des familles de lois logistiques et normales. Les deux fonctions de répartition Λ(w) et Φ(w) sont en effet sensiblement proches, comme on peut le constater à partir du tableau (1.1) où sont reportées les valeurs de ces fonctionspourdifférentesvaleursdew.Maiscettesimilitudeestencoregrandesil’onconsidère uneloilogistiquetransformée desorteàcequelavariancesoitidentiqueàcelledelaloinormale réduite. Eneffet, nousavonsvuquelaloilogistiqueusuelleadmetpourfonctionderépartition 1 Λ(w)= 1+e w − 3La variable yi étant dichotomique, la probabilité d’apparition de l’événement complémentaire yi = 0 est définiepar1 pi avec : − 1−pi= 1+e−ex−ixβiβ
Description: