www.ssoar.info Sind Sozialstrukturanalysen mit Umfragedaten möglich? Analysen zur Repräsentativität einer Sozialforschungsumfrage Hartmann, Peter H.; Schimpl-Neimanns, Bernhard Veröffentlichungsversion / Published Version Zeitschriftenartikel / journal article Empfohlene Zitierung / Suggested Citation: Hartmann, P. H., & Schimpl-Neimanns, B. (1992). Sind Sozialstrukturanalysen mit Umfragedaten möglich? Analysen zur Repräsentativität einer Sozialforschungsumfrage. Kölner Zeitschrift für Soziologie und Sozialpsychologie, 44(2), 315-340. https://nbn-resolving.org/urn:nbn:de:0168-ssoar-49423 Nutzungsbedingungen: Terms of use: Dieser Text wird unter einer Deposit-Lizenz (Keine This document is made available under Deposit Licence (No Weiterverbreitung - keine Bearbeitung) zur Verfügung gestellt. Redistribution - no modifications). We grant a non-exclusive, non- Gewährt wird ein nicht exklusives, nicht übertragbares, transferable, individual and limited right to using this document. persönliches und beschränktes Recht auf Nutzung dieses This document is solely intended for your personal, non- Dokuments. Dieses Dokument ist ausschließlich für commercial use. All of the copies of this documents must retain den persönlichen, nicht-kommerziellen Gebrauch bestimmt. all copyright information and other information regarding legal Auf sämtlichen Kopien dieses Dokuments müssen alle protection. You are not allowed to alter this document in any Urheberrechtshinweise und sonstigen Hinweise auf gesetzlichen way, to copy it for public or commercial purposes, to exhibit the Schutz beibehalten werden. Sie dürfen dieses Dokument document in public, to perform, distribute or otherwise use the nicht in irgendeiner Weise abändern, noch dürfen Sie document in public. dieses Dokument für öffentliche oder kommerzielle Zwecke By using this particular document, you accept the above-stated vervielfältigen, öffentlich ausstellen, aufführen, vertreiben oder conditions of use. anderweitig nutzen. Mit der Verwendung dieses Dokuments erkennen Sie die Nutzungsbedingungen an. SIND SOZIALSTRUKTURANALYSEN MIT UMFRAGEDATEN MÖGLICH?* Analysen zur Repräsentativität einer Sozialforschungsumfrage Von Peter H. Hartmann und Bernhard Schimpl-Neimanns I. Einleitung Umfrageforschung wie amtliche Statistik verfolgen das Ziel, Eigenschaften der Bevöl- kerung und von Bevölkerungsteilen korrekt wiederzugeben. Wahrend einer der Schwerpunkte der amtlichen Statistik in der Beschreibung ,,objektivern Merkmale von Bevölkerungs- und Sozialstruktur liegt, zielt die sozialwissenschaftliche Umfragefor- schung darüber hinaus vor allem auf subjektive Merkmale wie Einstellungen und auf Verhaltensweisen, die in der amtlichen Statistik nicht oder nur ansatzweise ausgewie- sen werden. Auch Sozialforschungsumfragen enthalten einen Kanon von Variablen, der die Bevölkerung in ihren grundlegenden biologischen und demographischen Merk- malen wie Alter, Geschlecht und Familienstand einerseits und gemäß Merkmalen des Erwerbslebens wie Beruf, Stellung im Beruf und Einkommen andererseits beschreibt. Diejenigen demographischen und sozialstrukturellen Merkmale, die sowohl in den Umfragedaten wie in der amtlichen Statistik vorhanden sind, können für den Vergleich der Ergebnisse der beiden Erhebungsformen verwendet werden. Weiterhin kann man, vorausgesetzt man hält die Ergebnisse der amtlichen Statistik für korrekt, auf Basis dieser Merkmale Randverteilungen der Umfragedaten an die amtliche Statistik anpas- sen (,,RedressmentU). Über diese methodischen Anwendungen hinaus bietet es sich aber auch an, neben der amtlichen Statistik die demographischen und sozialstrukturellen Merkmale der Umfrageforschung für die Beschreibung und Erklärung grundlegender Merkmale von Bevölkerung und Sozialstruktur zu verwenden. Die Gründe für eine solche Nutzung von Umfragen liegen insbesondere in der leichteren Zugänglichkeit von Umfragen und in deren rechentechnisch einfacheren Handhabung. Auch stehen oft selbst bei Sekundäranalysen in Umfragen mehr und detailliertere Merkmale zur Verfügung als sie die amtliche Statistik bieten kann. Neben der Beschreibung der Bevölkerungs- und Sozialstruktur interessiert den Sozialforscher besonders deren Erklärung. Probleme beim Datenzugang erschweren dabei aber den + Die vorliegende Arbeit ist aus einem ZUMA-Grundlagenforschungsprojekt hervorgegan- gen, das ursprünglich von Prof. Dr. Walter Müller angeregt wurde. Wir danken Herrn RD Hans Joachim Heidenreich und Frau ORRn Hannelore Pöschl (Statistisches Bundesamt) für die Bereitstellune der Mikrozensusdaten und für methodische Hinweise zum Mikrozensus. " Riv.-Doz. Dr. Siegfried Gabler gab wertvolle Ratschläge zum verwendeten statistischen Verfahren. Wichtige Hinweise zum Manuskri~et rhielten wir von Robert Kecskes, Dr. Rainer Schnell, Heike ~GthC,h ristof Wolf sowie vin Achim Koch, der uns auch bei der Rekodie- rung der Allbus-Variablen unterstützte. Kölner Zeitschrift für Soziologie und Sozialpsyc/~ologie,J g. 44, Heft 2,1992, S. 315-340. 316 Peter H. Hartmann und Bernliard Sdiimpl-Neimanns Rückgriff auf die Ergebnisse der amtlichen Statistik, dem die amtlichen Einzeldaten - stehen den meisten Forschern aus Datenschutz- und auch aus finanziellen Gründen nur in Form veröffentlichter Tabellen zur verfügung.' Weiterhin kam es sein, daß wichtige unabhängige Variablen für demographische und sozialstrukturelle Analysen nur von der Umfrageforschung, nicht jedoch von der amtlichen Statistik geliefert werden. Da die Umfrageforschung im Gegensatz zur amtlichen Statistik nicht auf das Instrument der Auskunftspflicht zurückgreifen kann, kommt es hier aber zu einem wesentlich höheren Anteil an Nichtantworten. Zunächst beziehen sich die üblichen Bevölkerungsumfragen der Markt- und Meinungsforschung auf einen engeren Perso- nenkreis als die Großzählungen der amtlichen Statistik. Ausländer, Kinder und Per- sonen in Anstaltshaushalten werden in der Regel nicht befragt.2 Darüber hinaus werden Personen, die für die Stichprobe ausgewählt wurden, nicht erreicht. Ein Teil der er- reichten Personen antwortet gar nicht, sei es, weil sie nicht teilnehmen können (bei- spielsweise aufgrund bestimmter Behinderungen), oder weil sie nicht teilnehmen möchten (Teilnahmeverweigerungen). Andere nehmen zwar an der Umfrage teil, be- antworten aber bestimmte, als kritisch empfundene Fragen nicht. Statistisch Iäßt sich bei einer freiwilligen Befragung nur auf die Grundgesamtheit der Erreichten, Befra- gungsfähigen und Befragungswilligen schließen. Die Verwendung von Umfragedaten zur Beschreibung demographischer und so- zialstruktureller Merkmale kam also zu Verzerrungen führen. Unterschiedliche Aus- fallwahrscheinlichkeiten verschiedener gesellschaftlicher Gruppen führen zu Abwei- chungen in der Verteilung von Merkmalen, nach denen sich diese Gruppen unter- scheiden. Weme twa Arbeiter häufiger nicht an Umfragen teilnehmen als Angestellte, wird die Verteilung des Merkmals Stellung im Beruf durch die Umfrageforschung verzerrt wiedergegeben.3 1 Nach dem bisher üblichen Verfahren der absoluten Anonymisierung gemäß 5 16(1)4 Bun- desstatistikgesetz (BStatG) gestaltete sich eine Weitergabe von Mikrodaten an die Wissen- schaft sehr langwierig und teuer. Verfahren zur Weitergabe faktisch anonymisierter Daten gemäß 5 16(1)6 BStatG wurden erst kürzlich beschlossen (Müller et al. 1991). Die Verfahren zur Auswertung amtlicher Mikrodaten auf dem Rechner des Statistischen Bundesamts mit dem Analysesystem STATIS-BUNsiDn d wenig bekannt und setzen einen Rechneranschluß sowie Kenntnisse in der Steuersprache des Systems voraus. 2 Eine wichtige Ausnahme bildet hier allerdings das vom Deutschen Institut für Wirtschafts- forschung (DIW) durchgeführte Sozio-ökonomische Panel (SOEP), das auch Ausländer und Kinder einschließt. 3 Das Problem dieser Abweichungen ist altbekannt und für ganz unterschiedliche Umfragen nachgewiesen worden, so etwa für den Sozialwissenschaften-Bus des ZUMA (Pappi 1979), die Lebensverlaufsstudie des Max-Planck-Instituts für Bildungsforschung (Blossfeld 1987), den Allbus (Hartmann 1990) und auch das Sozio-ökonomische Panel (Helberger 1987). Ein Problem der bisherigen Analysen zur Repräsentativität mittels Vergleichen von Umfrage und amtlicher Statistik liegt allerdings im Sachverhalt, daß diese Analysen zumeist von Forschern, die mit der betreffenden Umfrage inhaltlich arbeiteten, durchgeführt wurden. Der Vergleich der Umfragen mit den amtlichen Daten dient meist dem Zweck, die Nutzung des Umfragematerials für spezielle inhaltliche Untersuchungen zu legitimieren. So wurden oft Abweichungen bei einzelnen Variablen als unwesentlich dargestellt, ohne die Systematik zu beachten, daß bei den meisten Umfragen die Abweichungen bei denselben Merkmalen auftreten. Als es andererseits um die Repräsentativität des amtlichen Mikrozensus ging, wurden dieselben Abweichungen, die bei der Beurteilung der Qualität von Umfragen als gering galten, als wesentliches Argument gegen eine Freiwilligkeit der Erhebung herange- zogen (Esser et al. 1989). Sind Sozialstrukturanalysen mit Umfragedaten möglicli? 317 Auch der weitergehende Versuch, die Verteilung demographischer und sozialstruk- tureller Merkmale mittels Umfragematerial zu erklären, ist nicht unproblematisch. Werden diese Merkmale als Explanandum, also als abhängige Variablen betrachtet, so führen ausfallbedingte Verzerrungen bei diesen Merkmalen zu systematischen Fehlern bei den Koeffizienten multivariater Modelle. In dieser Hinsicht ist der Vergleich von Umfragedaten mit Ergebnissen der amtlichen Statistik nicht nur von methodischem Interesse. Der Vergleich kam zeigen, welche Verzerrungen bei Analysen mit Umfra- gedaten auftreten können. Wir konzentrieren uns dabei auf die Auswirkungen des sogenannten Mittelschichtbias. Schichtspezifische Ausfälle wurden in früheren Untersuchungen vorwiegend uni- variat betrachtet. So konnte zwar im Rahmen der Diskussion um den sogenannten Mittelschichtbias festgestellt werden, daß Beamte und Angestellte einerseits und Per- sonen mit hohem Bildungsabschluß andererseits in den realisierten Stichproben der Umfrageforschung überrepräsentiert sind. Nicht klären ließen sich bisher aber Bil- dungseffekte unter Kontrolle der Stellung im Beruf bzw. die Effekte der beruflichen Stellung unter Kontrolle der Bildung. Die Ursachen der Verteilungsabweichungen blieben damit im Dunkeln. 11. Abweichungen zwischen amtlicher Statistik und Umfrageforschung Will man Verteilungsabweichungen zwischen amtlicher Statistik und Umfragedaten nachgehen, so bieten sich unterschiedliche Wege an. Abweichungen zwischen Erhe- bungen sind möglich, wenn sich diese auf unterschiedliche Zielpopulationen beziehen. Die Variablen sollten weiterhin in vergleichbaren Kategorien erhoben worden sein. Schließlich bilden Nichterreichbarkeit und Nichtkooperation mögliche Ursachen von Verteilungsabweichungen. Die Grundgesamtheit der amtlichen Großzählungen wie Volkszählung und Mikro- zensus umfaßt die gesamte Bevölkerung, die Grundgesamtheit von Sozialforschungs- umfragen ist im allgemeinen die wahlberechtigte Bevölkerung in Privathaushaushal- ten. Üblicherweise nicht enthalten sind Ausländer, Personen in Anstaltshaushalten und Kinder. Damit die Bevölkerungskonzepte beider Datenquellen übereinstimmen, müssen vor einem Vergleich zwischen amtlichen und Umfrageergebnissen die Daten dieser Personen durch Verwendung geeigneter Filter aus den amtlichen Zählungen entfernt werden. Wahrend die Kategorien von Umfrageforschung und amtlicher Sta- tistik nicht immer vergleichbar sind, existiert doch mit der ZUMA-Standarddemogra- phie ein Instrument zur Abfrage demographischer und sozialstruktureller Kategorien, dessen Vergleichbarkeit mit der amtlichen Statistik auf konzeptioneller Ebene bereits ausführlich geprüft wurde (Statistisches Bundesamt 1988). Weiterhin können unterschiedliche Verfahren der Stichprobenziehung Ursachen von Verteilungsabweichungen sein. So basiert der amtliche Mikrozensus auf einer im Prinzip einstufigen Auswahl systematisch angeordneter Flächeneinheiten und kann als Haushaltsstichprobe sowohl auf Personen-, wie auch auf Haushaltsebene ausge- wertet werden, da jedem Haushaltsmitglied ein Fall entspricht (Krug und Nourney 1987, S. 207). 318 Peter H. Hartmann und Bernhard Schimpl-Neimanns Dagegen liegt allgemeinen Bevölkerungsumfragen meist das A D M - D ~ szu~- ~ ~ ~ grunde: eine dreistufige Auswahl von erstens Stimmbezirken, zweitens Haushalten im Stimmbezirk und drittens Personen im Haushalt. Da jeder Haushalt die gleiche Auswahlchance hat, haben Personen in kleinen Haushalten eine größere Auswahl- chance als Personen in großen Haushalten. Für Auswertungen auf Personenebene ist deshalb aus stichprobentheoretischen Gründen eine Umgewichtung mit der sogenann- ten reduzierten Haushaltsgrösse, also eine Gewichtung mit der Zahl wahlberechtigter Personen im Haushalt, erforderlich. Abweichungen zwischen Umfragen und amtlicher Statistik sind weiterhin aufgrund von Nichterreichbarkeit und Nichtkooperation mög- lich. Die Forschung über Verteilungsabweichungen ist bisher methodisch vor allem die folgenden Wege gegangen:5 1. Man hat mit Hilfe von Nachbefragungen bei Umfragedaten versucht, Eigenschaften der Gruppen der Nichtteilnehmer zu erforschen. In der Annahme, daß ein großer Teil dieser Personengruppe an den Pflichterhebungen der amtlichen Statistik teilnimmt, kann man so versuchen, die Abweichungen aus Ausfällen der Umfrageforschung zu erklären (Erbslöh und Koch 1988). Aus rechtlichen und praktischen Gründen gestaltet sich aber bei diesem Verfahren die Ermittlung von 'harten' Verweigerern schwierig. Das sind Personen, die unter Bezug auf eine fehlende Auskunftsverpflichtung die Teilnahme an einer Umfrage grundsätzlich ablehnen. 2. Durch systematische zusätzliche Erhebungen hat man versucht, die Größe derjenigen Gruppen zu bestimmen, die in der Umfrageforschung untererfaßt werden. So ermittelte Schnell (1991) die Größe einzelner Gruppen der Anstaltsbevölkerung, wie z.B. die Zahl der Behinderten in bestimmten Kategorien, die häufig schon aus physiologischen Gründen von der Teilnahme an Umfragen ausgeschlossen sind. Ein zentraler Nachteil dieses Verfahrens ist die Schwierig- keit, kombinierte Verteilungen zu berechnen. 3. Man hat Randverteilungen publizierter amtlicher Daten mit Randverteilungen aus der Umfrageforschung verglichen. Dabei ergaben sich jedoch Probleme hinsichtlich der Identität der Bevölkerungskonzepte und der Vergleichbarkeit der Merkmale (Wiedenbeck 1984; Helber- ger 1987). Diese Probleme konnten zu einem späteren Zeitpunkt durch die Verwendung von Sonderauswertungen amtlicher Einzeldaten, insbesondere aus dem Mikrozensus, überwunden werden (Blossfeld 1987; Hartmann 1990). Es wurde festgestellt, daß Personen in kleinen Haushalten und Personen in den unteren sozialen Schichten bei den Ergebnissen der Umfrage- forschung gegenüber amtlichen Großzählungen unterrepräsentiert sind. Die Güte der Ergeb- nisse der amtlichen Großzählungen konnte durch den Vergleich mit weiteren Quellen (Hoch- schulstatistik, Beschäftigtenstatistik, Personalstandstatistik) sichergestellt werden (Hartmann 1990; Esser et al. 1989; Helberger 1987). Die folgenden empirischen Analysen werden mit der Sozialforschungsumfrage Allbus durchgefühk6 Der Allbus wurde erstens ausgewählt, da seine Eigenschaften reprä- sentativ für eine Vielzahl anderer Umfragen nach dem ADM-Design sein dürften. 4 Dieses Design wurde als mehrstufige Random-Route Stichprobe von der Arbeitsgemein- schaft Deutscher Marktforschungsinstitute (ADM) entwickelt. Eine Alternative zum ADM- Design stellen Melderegisterstichproben dar, über deren Qualität in diesem Aufsatz nichts ausgesagt werden kann, vgl. zu diesen jedoch Alt (1991) und Alt, Bien und Krebs (1991). 5 Wir beschränken uns hier auf die Phänomene der Untererfassung (,,Undercoverage") und der Nichtteilnahme an der ganzen Erhebung (,,Unit Nonresponse"). Das Problem der Nichtbeantwortung einzelner Fragen (,,Item Nonresponse") wird von uns nicht untersucht. 6 Diese Mehrthemenumfrage wurde ab 1980 in zweijährige Abständen vom ZUMA (Mann- heim) durchgeführt; sie wird vom Zentralarchiv für Empirische Sozialforschung (Köln) vertrieben und archiviert. Sind Sozialstrukturanalysen mit Umfragedaten möglich? 319 Zweitens steht er der sozialwissenschaftlichen Forschung über das Zentralarchiv frei zur Verfügung. Drittens werden die Ergebnisse unterschiedlicher Allbus-Erhebungen der Forschung in vergleichbarer und vergleichbar aufbereiteter Form zur Verfügung gestellt. Viertens ist die Beziehung der demographischen und sozioökonomischen Merkmale im Allbus zu denen der amtlichen Statistik theoretisch geklärt (Hoffmey- er-Zlotnik und Hartmann 1991).F ünftens wird beim Allbus die eigentliche Erhebungs- arbeit im Wechsel von verschiedenen Meinungsforschungsinstituten geleistet, so daß etwaige Effekte der Praktiken einzelner Institute für uns kontrollierbar sind.7 Zum Vergleich mit den Umfragedaten wird der Mikrozensus herangezogen. Die Analyse anonymisierter Einzeldaten des Mikrozensus mit dem Statistischen Informa- tionssystem des Bundes (STATIS-BUND, vgl. Kühn, Pfrommer und Schrey 1984) er- möglichte uns die exakte Abgrenzung der Allbus-Zielpopulation und eine dem Allbus weitgehend äquivalente Operationalisierung der Variablen des Mikrozensus. Seit die Erhebung des Mikrozensus wegen der Volkszählungsdiskussion in den Jahren 1983 und 1984 ausgesetzt wurde, liegen die im Abstand von zwei Jahren erhobenen Bil- dungsmerkmale für den Mikrozensus nur für die ungeraden Jahre ab einschließlich 1985 vor. Da der Allbus nur in geraden Jahren erhoben wurde, folgt daraus, daß beide Umfragen nur mit einer Verschiebung von einem Jahr verglichen werden können. Diese Zeitverschiebung scheint wenig problematisch zu sein, weil sich Strukturmerk- male in der Regel nur langsam ändern. Iii. Zahl der Haushalte und Haushaltsgrö$e Aus unterschiedlichen Gründen ist zu erwarten, daß die Ergebnisse von Sozialfor- schungsumfragen gegenüber amtlichen Zählungen beim Merkmal Haushaltsgröße abweichen. Die Stichprobe des Allbus bezieht sich, wie bereits erwähnt - in ungewichteter Form - nur auf Privathaushalte, in denen Deutsche im Alter von 18 Jahren und mehr leben, nicht jedoch auf Personen in diesen Haushalten. Um aus dem Allbus personen- repräsentative Ergebnisse (für deutsche Personen über 18 Jahren in Privathaushalten) zu erhalten, muß jeder Haushalt mit der Zahl der wahlberechtigten Deutschen im Haushalt gewichtet werden. Dieses Merkmal bezeichnet man auch als reduzierte Haus- haltsgröße.' Die Umgewichtung kann aber nur dann korrekte Ergebnisse liefern, wenn die reduzierte Haushaltsgröße nicht selbst verzerrt ist. Aus drei Gründen ist aber mit Verzerrungen gerade bei dieser Variable zu rechnen: Erstens basiert das ADM-Design auf einer Stichprobe von Wahlbezirken. Für diese ist zwar die aktuelle Zahl der Wahlberechtigten bekannt, nicht jedoch die Zahl der Privathaushalte mit deutscher Bezugsperson. Deren Zahl muß aus anderen Datenquellen (insbesonderea us Ergeb- nissen von Volkszählung und Bevölkerungsfortschreibung) geschätzt werden (Kirschner 1984, 7 Die von uns berichteten Ergebnisse basieren auf den Erhebungen der Jahre 1986,1988 und 1990, die von den Instituten Infratest (1986),G FM-Getas (1988) und Infas (1990) durchge- führt wurden. 8 Wenn im folgenden in Text und Tabellen von Gewichtung gesprochen wird, dann ist damit die Umgewichtung mit der reduzierten Haushaltsgröße gemeint, und nicht die Anpassung an Randverteilungen der amtlichen Statistik (,,redressment"). 320 Peter H. Hartmann und Bernliard Scliimpl-Neimanns S. 122; Hanefeld 1987, S. 148). Dabei wird die Zahl der entsprechenden Haushalte in Stimmbe- zirken überschätzt, wo im Verhältnis zur Zahl der Haushalte besonders viele Wahlberechtigte leben. Diese Bezirke werden deshalb innerhalb einer Gemeinde mit überhöhter Chance gezogen (Wasmer, Koch und Wiedenbeck 1991, S. 40). Es ist also aus diesem stichprobentheoretischen Grund für das ADM-Design mit einer Überrepräsentierung von Haushalten aus Stimmbezir- ken zu rechnen, in denen die durchschnittliche Zahl der wahlberechtigten Deutschen pro Haushalt eher groß ist.9 Nun sind aber zweitens größere Haushalte für die Interviewer leichter erreichbar als kleinere Haushalte. In größeren Haushalten wird häufiger ein Haushaltsmitglied anwesend sein als in kleineren. Dies ist bereits seit Hilgard und Payne (1944) bekannt und gilt insbesondere für Haushalte mit Kindern und innerhalb dieser Gruppe wiederum besonders für traditionelle Familienhaushalte, in denen die Frau die Kinder zuhause betreut.'' Drittens beruht die ,,reduzierte Haushaltsgröße" (Wahlbevölkerung im Haushalt) auf Angaben des Befragten über die Haushaltsmitglieder. So kann es zu Meßfehlern kommen, die unabhängig von den Problemen der Stichprobe und der Erreichbarkeit sind. Tabelle 1 zeigt die Verteilung der Zahl wahlberechtigter Deutscher pro Haushalt für Privathaushalte mit deutscher Bezugsperson gemäß Allbus und Mikrozensus. Die linke Seite der Tabelle gibt an, wie hoch der Anteil der jeweiligen Haushalte an der Gesamtzahl der Privathaushalte mit wahlberechtigter Bezugsperson ist, die rechte Seite gibt den Anteil aller wahlberechtigten Personen an, die Privathaushalten der jeweiligen Größe angehören. Zur Ermittlung des letzgenannten Anteils wurde beim Allbus mit der Zahl der wahlberechtigten Personen im Haushalt gewichtet. Wie Tabelle 1 zeigt, enthält die Sozialforschungsumfrage Allbus wesentlich mehr große Haushalte als der Mikrozensus. Dagegegen fehlen in der Sozialforschungsum- frage besonders Einpersonenhaushalte. Die Verzerrung ist überraschend stark. Der Anteil der Haushalte mit nur einer wahlberechtigten Person wird von der Bevölke- rungsumfrage um 26 bis 31 Prozent unterschätzt, wobei die Unterschätzung von 1985/86: 31 Prozent über 1987/88: 28 Prozent auf 1989/90: 26 Prozent abnimmt.'' Auf der Personenebene bietet sich ein ähnliches Bild. Aussagen über Merkmale der Haushaltsgröße, die mit Hilfe von Umfragen nach dem ADM-Stichprobenplan gewonnen werden, sind also problematisch. Die Überre- präsentierung großer Haushalte hat aber nicht nur die Konsequenz, daß die Beschrei- bung der Haushaltsgröße mit Umfragedaten zum Problem wird. Da das Merkmal reduzierte Haushaltsgröße als zentrale Basis für Hochrechnungen benötigt wird, um die Daten auf Personenebene zu gewichten, sind Verzerrungen von Analysen auf Personenebene zu erwarten. Eine Umgewichtung mit dem Merkmal reduzierte Haushaltsgröße wirkt sich nur 9 Daneben gibt es auch eine Überschätzung der Zahl der Haushalte für Stimmbezirke aus Gemeinden mit überdurchschnittlich hohem Ausländeranteil. Auch diese Bezirke werden überproportional oft in die Stichprobe aufgenommen. Es ist also auch mit einer Überreprä- sentierung von Haushalten aus Gemeinden mit hohem Ausländeranteil zu rechnen. 10 Ein besonders krasses Beispiel für die Auswirkung der höheren Erreichbarkeit von Haus- halten mit Kindern berichten Thomsen und Siring (1983, S. 37): Bei einer norwegischen Studie zur Fertilität nahm die mittlere Kinderzahl pro Frau mit jedem weiteren Versuch, den Haushalt zu erreichen, monoton ab. 11 Ein - auch der Größenordnung nach ähliches Resultat: massive Unterschätzung der Zahl der Ein-Personen-Haushalte - zeigt sich auch für das Sozio-ökonomische Panel (Bedau 1988, S. 65), das allerdings, da dort Daten über alle Personen im Haushalt erhoben werden, für personenrepäsentative Aussagen also nicht mit der Zahl der wahlberechtigten Personen gewichtet werden muß. Sind Sozialstrukturanalysen mit Umfragedaten möglicli? 321 Tabelle 1: Randverteilungen beim Merkmal Haushaltsgröße: Anteile der Deutschen im Alter von 18 und mehr Jahren im Haushalt (in Prozent)* Haushalte Personen Deutsche Allbus 18 u.älter Mikrozensus 1 Allbus Mikrozensus 2 Allbus Mikrozensus 3 Allbus Mikrozensus 4 Allbus Mikrozensus 2 5 Allbus Mikrozensus Der Allbus enthielt 1986 3095,1988 3052 und 1990 3051 Haushalte, in denen jeweils genau eine Person befragt wurde. Im Mikrozensus waren bei vergleichbarer Abgrenzung 1985 249,7 Tsd., 1987 255,2 Tsd. und 1989 262,9 Tsd. Haushalte enthalten, in denen 462,3 Tsd., 470,l Tsd. bzw. 476,2 Tsd. wahlberechtigte Personen lebten. Diese Fallzahlen gelten auch für die folgenden Tabellen. stark auf Randverteilungen von Variablen aus, die mit diesem Merkmal korreliert sind. Beispiele für solche Merkmale sind das Alter, das Geschlecht und der Familien- stand. Besonders alte Menschen wohnen oft in Einpersonenhaushalten. Frauen wohnen häufiger in Einpersonenhaushalten als Männer. Weiterhin wohnen ledige, verwitwete und geschiedene Personen im Vergleich zu Verheirateten eher in Haushalten mit nur einer wahlberechtigten Person. Ungewichtete und personenrepräsentativ gewichtete Anteile für verschiedene Alters- und Familienstandskategorien sollten sich also bei der Sozialforschungsumfrage deutlich unterscheiden. Betrachten wir nun die Altersverteilung der Bevölkerung gemäß Allbus und Mi- krozensus. Abbildung 1 zeigt Abweichungen des Bevölkerungsanteils in verschiedenen Altersgruppen beim Allbus vom Erwartungswert. Eine Abweichung etwa von 0,4 nach oben bedeutet, daß der Anteil von Personen in der jeweiligen Alterskategorie im Allbus um 40 Prozent über dem Erwartungswert liegt. Der Erwartungswert wird unter der Annahme berechnet, daß die Variable Alter bei Allbus und Mikrozensus gleich verteilt ist. In einer Alterskategorie, in der 10 Prozent der Deutschen über 18 Jahren zu erwarten wären, befänden sich dann beim Allbus 14 Prozent. Wahrend die linke Ceite von Abbildung 1 die Ergebnisse für den ungewichteten Allbus zeigt, werden auf der rechten Ceite die Ergebnisse für die personenrepräsentativ gewichteten Daten wiedergegeben.12 12 Technisch gesprochen: Es werden die relativen Differenzen zwischen erwarteten und beim Allbus beobachteten Prozentwerten berichtet (Arminger 1990, S. 168, Formel 8). Die relative Unter- oder Übererfassung des Allbus bezieht sich auf die Differenz zwischen der beobach- teten und der geschätzten Verteilung im Allbus relativ zum Erwartungswert gemäß Allbus und Mikrozensus. 322 Peter H. Hartmann und Bernliard Schimpl-Neimanns Abbildung 1: Relative Differenzen beim Merkmal 'Alter' Ungewichtete ALLBUS-Daten T 0.4 AIt er Alter Betrachtet man die ungewichteten Daten, so gibt es bei allen drei Allbus-Erhebungen deutliche Unterschätzungen bei den ganz jungen und den ganz alten Personen. Ge- wichtet man nun, wie vom Stichprobenplan gefordert, die Daten des Allbus mit der reduzierten Haushaltsgröße, dann fällt zwar die Unterschätzung bei den ganz jungen Personen weg, die Unterschätzung bei den Älteren verstärkt sich aber noch. So un- terschätzt der Allbus 86 dann den Anteil der über 70jährigen Personen gegenüber dem Erwartungswert um nahezu 46 Prozent, während die Unterschätzung ungewichtet nur 27 Prozent betrug.13 Weiterhin betrachten wir nun in den Tabellen 2 und 3 die Verteilung der Merkmale Geschlecht und Familienstand anhand der Umfrage Allbus und anhand des Mikro- zensus. Ungewichtet stimmen die Daten des Allbus hier recht gut mit denen des Mikrozensus überein. Gewichtet man jedoch - wie es der Stichprobenplan fordert - Die Fallzahlen bei Allbus und Mikrozensus sind stark unterschiedlich. Aufgrund der hohen Fallzahl beim Mikrozensus und der geringen beim Allbus wird der Erwartungswert nahezu vollständig vom Mikrozensus determiniert. Abweichungen vom Erwartungswert entpre- chen deshalb bei uns näherun~sweiseA bweichungen vom Mikrozensus. 13 Die Unterschätzung hoher ~Rers~ru~in ~deer"n!5 0zialforschung ist übrigens nicht ,,zu einem großen Teil durch den Ausschluß der Anstaltsbevölkerung aus den Stichproben des ADM-Designs erklärbar" (Schnell 1991, C. 108), wie durch eine Gegenüberstellung von Mikrozensus-Ergebnissens owohl mit als auch ohne Berücksichtigung der Anstaltsbevolke- rung festgestellt werden konnte. Sind Sozialstrukturannlysen mit Umfragedaten möglich? Tabelle 2: Randverteilungen beim Merkmal Geschlecht (in Prozent) Allbus 1986 1988 Geschlecht Mikrozensus 1985 1987 männlich Allbus 46,7 44,4 Allbus (gewichtet) 49,2 46,5 Mikrozensus 46,5 46,9 weiblich Allbus 53,3 55,6 Allbus (gewichtet) 50,8 53,3 Mikrozensus 53,5 53,l Tabelle 3: Randverteilungen beim Merkmal Familienstand (in Prozent) Allbus 1986 1988 1990 Familienstand Mikrozensus 1985 1987 1989 ledig Allbus Allbus (gewichtet) Mikrozensus verheiratet Allbus Allbus (gewichtet) Mikrozensus verwitwet Allbus Allbus (gewichtet) Mikrozensus geschieden Allbus Allbus (gewichtet) Mikrozensus mit der reduzierten Haushaltsgröße, dann zeigt sich eine deutliche Verschlechterung: Insbesondere die Zahl der Mamer und die der Verheirateten wird nun über-, die der Verwitweten und Geschiedenen dagegen deutlich unterschätzt. Um die Effekte der Gewichtung mit dem Merkmal reduzierte Haushaltsgröße zu verstehen, ist eine Betrachtung der kombinierten Verteilungen von Alter, Geschlecht oder Familienstand und der reduzierten Haushaltsgröße hilfreich. So lebten gemäß Mikrozensus (Allbus) im Jahr 1989 (1990) 33,9 (31,8) Prozent der 18-19jährigen Deutschen in Haushalten mit 4 oder mehr wahlbe- rechtigten Personen und nur 5,2 (6,3) Prozent in Haushalten mit lediglich einer wahlberechtig- ten Person. In der Kategorie 70 Jahre und älter dagegen lebten nur 3,8 (1,l) Prozent in Haushalten mit 4 oder mehr Personen gegenüber 48,O (53,5) Prozent in Haushalten mit nur einem wahlberechtigten Deutschen. Beide Gruppen: die der 18-19jährigen und die der Personen im Alter von 70 und mehr, sind univariat bei ungewichteter Betrachtung im Allbus unterproportional vertreten (vgl. Abbil- dung 1). Gewichtet man nun mit der reduzierten Haushaltsgroße, dann zeigt sich eine Verrin- gerung der Abweichung bei den Jungen, weil diese oft in großen Haushalten (sprich: noch bei den Eltern) leben. Bei den Älteren dagegen zeigt sich eine Verschlechterung, weil diese ohnehin für Umfragen schwer zugängliche Gruppe vorwiegend in kleinen Haushalten lebt und durch die Gewichtung noch stärker unterschätzt wird. Ähnlich wie bei den Personen in der obersten Altersgruppe stellt sich das Problem bei den Frauen, von denen nach den Ergebnissen des Mikrozensus 1989 (Allbus 1990) 27,O (33,9) Prozent in Haushalten mit nur einer wahlberechtig- ten Person lebten gegenüber 15,7 (24,3) Prozent bei den Männern.
Description: