Statistik 11 Induktive Statistik Roland Dillmann Statistik 11 Induktive Statistik Mit 3 Abbildungen Physica-Verlag Heidelberg Professor Dr. Roland Dillmann Fachbereich Wirtschaftswissenschaft Bergische Universität Gesamthochschule Wuppertal Gauss-Straße 20 D-5600 Wuppertall ISBN -13: 978-3-7908-0470-6 e-ISBN-13: 978-3-642-61533-7 DOI: 10.1007/978-3-642-61533-7 Dieses Werk ist urheberrechtlich geschützt. Die dadurch begründeten Rechte, insbesondere die der Übersetzung, des Nachdruckes, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendungen, der Mikroverfilmung oder der Vervielfältigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vor behalten. Eine Vervielfaltigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestimmungen des Urheberrechtsgesetzes der Bundesrepu blik Deutschland vom 9. September 1965 in der Fassung vom 24. Juni 1985 zulässig. Sie ist grund sätzlich vergütungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urhe berrechtsgesetzes. © Physica-Verlag Heidelberg 1990 Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, daß solche Namen im Sinne der Warenzeichen-und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Bindearbeiten: J. Schäffer GmbH u. Co. KG, Grünstadt 214217130-543210 Vorwort Die Ausführungen in diesem Buch sind Grundlage meiner Lehrveranstaltungen in Statistik II im Grundstudium an der BUGH Wuppertal am Fachbereich Wirtschafts wissenschaft. Sie sind im Anschluß an den ersten Teil konzipiert, der den wahrscheinlichkeitstheoretischen Grundlagen der Statistik gewidmet ist. Da der Inhalt des zugrundegelegten Wahrscheinlichkeitsbegriffs bestimmt, was Gegen stand der Statistik zu sein hat, werden hier zwei Positionen dargestellt; die des Subjektivismus mit seiner Formulierung des "Lernens aus Erfahrung" und die des Objektivismus,für den die Sprechweise von unbekannten, aber existierenden Wahrscheinlichkeiten eine sinnvolle ist. Im Objektivismus unterscheidet man Testprobleme und Schätzprobleme. Der Subjektivismus ist grundlegend für moderne neoklassische Auffassungen be züglich des Umgangs mit Unsicherheit, praktische Durchführungen des subjekti vistischen Programms sind rar. Wegen der theoretischen Bedeutung des Subjekti vismus werden die Grundkonzepte der subjektivistischen Auffassung dargelegt, wegen des hohen theoretischen Anspruchs, den Neoklassiker für ihre theoreti schen Auffassungen einfordern, erscheint eine Kritik des Subjektivismus wich tig. Dabei ist zu unterscheiden zwischen solchen Kritiken, die dem Subjektivi sten letztlich vorwerfen, das Weltbild des Kritikers nicht zu teilen, und einer Kritik, die sich auf die Grenzen des Subjektivismus bezieht. Wegen der Bedeutung der Behandlung von Unsicherheit in der Okonomie als Weg zur überwin dung der Voraussetzung vollständiger Information erscheint bedeutsam, daß der Subjektivismus nicht in der Lage ist, das Problem unerwarteter Hypothesen in einer akzeptablen Weise anzugehen. Für eine sich auf den Subjektivismus stüt zende Variante der Neoklassik heißt das, daß alle denkbaren Erklärungsmuster von vornherein bekannt sein müssen und sich nicht innerhalb der geschichtli chen Entwicklung des ökonomischen Wissensstandes erst ergeben dürfen. Diese Konsequenz erscheint niederschmetternd, setzt man sie in Beziehung zum Selbst verständnis zahlreicher Vertreter der neoklassischen Theorie. Eine andere For mulierung des gleichen Phänomens legt folgender Kernsatz des subjektivisti schen "Lernens aus Erfahrung" nahe: Gemäß subjektivistischer Auffassung kommen bei hinreichend langer "gemeinsamer Erfahrung" alle Personen zur gleichen Ein schätzung von Wahrscheinlichkeiten unabhängig von ihren a - priori Auffas- - VI - sungen, wenn nur alle Alternativen a - prior i nicht ausgeschlossen waren. Die ses "Lernen aus Erfahrung" stützt sich allerdings auf das Konzept der beding ten Wahrscheinlichkeit, und zu dessen Anwendung ist es gleichgültig, ob die gemeinsame Erfahrung hypothetisch gedacht oder real existent ist. Von Gescheh nissen sind aber verschiedene Personen unterschiedlich betroffen; trotz dieses unterschiedlichen Grades an Betroffenheit ist das Ergebnis des Lernprozesses das gleiche, ja, es reicht sogar aus, Erfahrungen von anderen zu übernehmen oder gar nur als Alternativen gedanklich durchzuspielen, um die entsprechenden Konsequenzen daraus zu ziehen. Die Wertungen bleiben also davon unberührt, ob man etwas nur durchdenkt oder ob man etwas als Betroffener erlebt. Der Homo Okonomicus mit stabilen Wertungen grüßt in neuem Gewande. Ist so die überwin dung der Prämisse vollständiger Information wirklich überzeugend gelungen? Die meiste praktisch geleistete Tätigkeit von Statistikern beruht auf Konzep ten des Objektivismus. Hier ist zunächst einmal festzuhalten, daß der Objekti vist größte Schwierigkeiten hat mit dem, was er unter Wahrscheinlichkeit ver steht. Ursprüngliche Versuche, Wahrscheinlichkeiten durch relative Häufigkei ten zu messen, waren nicht erfolgreich. Der einzige Weg besteht also darin, Wahrscheinlichkeit als einen Begriff zu verstehen, der seine Bedeutung erst innerhalb der Theorie erfährt, in der er als Schlüsselbegriff auftritt. Für die meisten Anwendungen in der Okonomie liegt aber eine derartige Theorie nicht vor. Der Objektivist in der Okonomie steht also vor dem Dilemma, einen Begriff als theoretischen Begriff zu benutzen, für den ihm die Theorie fehlt. Damit kann Statistik als methodische Disziplin nicht alle die Erwartungen er füllen, die ihr im Wissenschaftsbetrieb von Seiten der Realwissenschaftler oft und gern voreilig zugeschoben werden. Man wird feststellen, daß diese Erwar tungen von keiner Methodik einlösbar sind, da man immer wieder auf die bis heute ungelöste Frage stößt: Wie gelangt man zu Erkenntnissen über objektive Tatbestände? Ist unser Reden von Kausalbeziehungen ein die objektiven Gegeben heiten oder unser Denken über diese objektiven Gegebenheiten charakterisieren des Reden? Genaueres Nachdenken über die methodischen Grundlagen der Wissen schaft führt bisweilen zu der schmerzlichen Einsicht, daß viele Sachverhalte, die man als vorbehaltlos richtig unterstellt, nicht in einer Weise begründbar sind, daß sie neugierigen Fragen uneingeschränkt standhalten. Wir müssen also täglich entscheiden, ohne die Konsequenzen unserer Entscheidungen auch nur - VII - annähernd zu kennen. In dieser Situation werden politische Entscheidungen ge fällt, die unsere Umwelt in einer Weise verändern können, daß wir möglicher weise diese Veränderungen nicht überleben können. Es wäre leicht, könnte man derartige Entscheidungen umgehen; die an solchen Entscheidungen Beteiligten führen aber Sachzwänge als Argument ins Feld, die ihrer Auffassung nach das Eingehen derartiger Risiken unabdingbar machen, weil nichts tun auch hohe, oft höhere Risiken in sich birgt. Wissenschaftliche Argumentationen über solche Risiken benutzen oft statistische Methoden. Verunsicherung über die Aussage kraft derartiger Methoden führt also zu Existenzängsten, denen man sich ohne Not nicht aussetzen will. Ich hoffe, dargelegt zu haben, daß der Statistiker nicht von einem anderen Stern spricht, sondern von täglichen, sehr unangenehmen Problemen. Insbesonde re nimmt Statistik als methodische Disziplin eine wichtige Rolle in zahlrei chen Studiengängen ein, ohne allerdings zu beanspruchen, einzige methodische Disziplin zu sein. Methodenstudium ist Studium des Erkenntnisproblems und da mit unabdingbar Voraussetzung für ein Studium beliebiger Realdisziplinen. Wuppertal, im Januar 1990 Roland Dillmann Inhaltsverzeichnis 10. Die Wahrscheinlichkeitskonzeption der Subjektivisten 1 10.1. Der Wettansatz der Subjektivisten 1 10.2. Der Begriff der Austauschbarkeit 6 10.3. Gemischte Verteilungen und das Lernen aus Erfahrung 8 10.4. Ein Beispiel zum Lernen aus Erfahrung 11 10.5. Die Konzepte a - priori -, a - posteriori - Verteilung 12 und Likelihood 10.6. Gleiche Erfahrungen führen zu gleichen Wahrscheinlich 13 keitsbewertungen 10.7. Das Wissenschaftsprogramm der Subjektivisten 17 10.8. Gemischte Verteilungen 19 11. Beispiele für parametrische Klassen 22 11.1. Binomial - Verteilung und Poisson - Verteilung 22 11.2. Rechteckverteilung 22 11. 3. Negative Binomialverteilung 22 11.4. n - dimensionale Normalverteilung 23 11. 5. Eindimensionale Normalverteilung 23 11.6. Beta{r, s) - Verteilung 23 11. 7. N2{n) - Verteilung mit Parameter n E ~ 28 11. 8. r - Verteilung 30 11. 9. Inverse r - Verteilung 31 11.10. Fisher's F - Verteilung 32 11.11. Student's t - Verteilung 34 11.12. Nicht - zentrale Verteilungen 36 11.13. Zusammenfassung 39 12. Das Konzept suffizienter (erschöpfender) Statistiken 44 12.1. Einleitung 44 12.2. Definition suffizienter Statistiken 45 12.3. Beispiele 49 12.3.1. Normalverteilung 49 12.3.2. r - Verteilung 50 - X - 12.3.3. Poisson - Verteilung 50 12.3.4. Binomial - Verteilung 51 13. Natürlich konjugierte a - proiri ~ Verteilungen als 55 Konzept der mathematisch leichten Durchführbarkeit des Lernens aus Erfahrung 13.1. Überlegungen zur Wahl der a - priori - Verteilung 55 13.2. Beispiele 57 13.2.1. Binomial - Verteilung 57 13.2.2. Eindimensionale Normalverteilung 58 13.2.2.1. Bei bekannter Varianz 58 13.2.2.2. Bei bekanntem Erwartungswert 59 13.2.2.3. Erwartungswert und Varianz unbekannt 61 13.2.3. Poisson - Verteilung 63 13.2.4. Die a - posteriori - Wahrscheinlichkeit von Ereignissen 64 13.3. Kritik am Subjektivismus 64 14. Die Wahrscheinlichkeitskonzeption der Objektivisten 67 14.1. Einige einleitende Bemerkungen 67 14.2. Die Wahrscheinlichkeitsauffassungen verschiedener 68 Objektivisten 14.2.1. Die relative - Häufigkeitsinterpretation 68 14.2.2. Das Problem der Wahrscheinlichkeit des Einzelereignisses 69 14.2.3. Die Einzelfall - Interpretation der Wahrscheinlichkeit 70 14.2.4. Wahrscheinlichkeit als ungeklärtes Konzept mit hohem 73 pragmatischem Wert 14.2.5. Bemerkungen zum Einsatzbereich objektiver Wahrschein 74 lichkeitsauffassungen 14.3. Diskussion der Möglichkeiten der Beantwortung verschie 76 dener Fragen aus objektivistischer Sicht 14.4. Likelihood als komparatives Stützungsmaß 81 14.4.1. Anforderungen an ein komparatives Stützungsmaß 81 14.4.2. Die Likelihood als objektivistisches Konzept 82 14.4.2.1. Likelihood und zusammengesetzte Hypothesen 83 14.4.2.2. Likelihood und unterschiedliche Erfahrungen für 85 unterschiedliche Hypothesen - XI - 15. Objektivistische Testtheorien 88 15.1. Klassifikation der objektivistischen Testtheorien 88 15.2. Die Testtheorie von Neyman - Pearson 90 15.2.1. Wie Neyman - Pearson die Konsequenzen des Hypothesen 90 tests einbeziehen 15.2.2. Mathematische Beschreibung eines Tests 92 15.2.3. Überblick über die hier präsentierten Ergebnisse der 96 Neyman - Pearson - Testtheorie 15.2.4. Das Neyman - Pearson - Fundamentallemma 98 15.2.5. Beispiele zum Neyman - Pearson - Fundamentallemma 103 15.2.5.1. Normalverteilung 103 15.2.5.2. Binomial - Verteilung 106 15.2.5.3. Poisson - Verteilung 107 15.2.5.4. Rechteck - Verteilung 108 15.2.6. Das Konzept des monotonen Dichtequotienten und 110 einseitige Testprobleme 15.2.7. Zweiseitige Testprobleme bei einparametrischen Klassen 113 von Verteilungen: das verallgemeinerte Neyman - Pearson - Fundamentallemma 15.2.7.1. Einseitige Tests sind nicht universell beste zwei 113 seitige Tests 15.2.7.2. Unverzerrte Tests und das verallgemeinerte Neyman - 114 Pearson - Fundamentallemma 15.2.7.3. Zweiseitige Testprobleme in der Exponentialfamilie 117 15.2.7.3.1. Beidseitige Tests in der einparametrischen Exponential 123 familie 15.2.7.3.2. Beispiele 126 15.2.7.3.2.1. Normalverteilung bei bekannter Varianz 126 15.2.7.3.2.2. Normalverteilung bei bekanntem Erwartungswert 127 15.2.7.3.2.3. Binomial - Verteilung bei bekanntem n 128 15.2.7.3.2.4. Poisson - Verteilung 129 15.2.8. Zusammenfassung 129 15.3. Testprobleme bei mehrparametrischen Klassen von 130 Verteilungen 15.3.1. Das Konzept der Ähnlichkeit 130 15.3.2. Ähnliche Tests und Exponentialfamilien 132 - XII - 15.3.2.1. Die Schwierigkeit beim Testen in mehrparametrischen 132 Familien 15.3.2.2. Bedingte Tests und Tests mit Neyman - Struktur 134 15.3.2.3. Bedingte Tests und Transformation der suffizienten 136 Statistiken 15.3.2.4. Beispiele 139 15.3.2.4.1. Testen des Erwartungswertes bei Normalverteilung 139 (t - Test) 15.3.2.4.2. Varianztest bei Normalverteilung (<<2 - Test) 142 15.3.2.4.3. Varianzvergleich unter der statistischen Ober 144 hypothese der Normalverteilung 15.3.2.4.4. Vergleich der Erwartungswerte auf der Basis zweier 148 Stichproben 15.3.3. Das Invarianzprinzip 152 15.3.4. Zusammenfassung und Lösungsprinzip für die Beispiele 154 15.4. Tests ohne explizite Formulierung der Gegenhypothese 156 15.4.1. Likelihood - Quotienten - Tests 156 15.4.2. Signifikanz - Tests 157 15.4.3. Beispiele für Signifikanz - Tests 158 15.4.3.1. Kolmogoroff - Tests zum Vergleich von einer theoreti 158 schen mit einer empirischen Verteilungsfunktion 15.4.3.2. Smirnoff - Tests zur Prüfung, ob zwei Zufallsstichproben 159 die gleiche stetige Wahrscheinlichkeitsverteilung zugrundeliegt 15.4.3.3. Die Pearson'sche «2 - Anpassungsfunktion 161 16. Das Schätzproblem 174 16.1. Modell und Struktur 174 16.2. Das Schätzproblem 176 16.3. Ziele der Schätzung 177 16.4. Eigenschaften von Schätzern 180 16.4.1. Erwartungstreue 180 16.4.2. Effizienz 181 16.4.3. Konsistenz 182 16.4.4. Asymptotisch erwartungs treu 182 16.4.5. Asymptotische Effizienz 183