Ewa Frątczak, Janina Jóźwiak, Barbara Paszek ZASTOSOWANIA ANALIZY HISTORII ZDARZEŃ W DEMOGRAFII NIEPARAMETRYCZNA I SEMIPARAMETRYCZNA ANALIZA DANYCH BADANIA RETROSPEKTYWNEGO 1988 „Droga życiowa - biografia rodzinna, zawodowa i migracyjna” 2 SPIS TREŚCI Wstęp Rozdział 1. Badania retrospektywne, analiza historii zdarzeń (E.Frątczak) 1.1. Badania retrospektywne źródłem danych do analizy historii zdarzeń. 1.2. Polskie badania retrospektywne 1988 „Droga życiowa - biografia rodzinna, zawodowa i migracyjna” 1.2.1. Cel i zakres badania 1.2.2. Ocena jakości uzyskanych wyników Rozdział 2. Modele przeżycia (J.Jóźwiak) 2.1. Wprowadzenie 2.2. Funkcje charakteryzujące model przeżycia 2.3. Wybrane parametryczne modele przeżycia 2.4. Nieparametryczny model przeżycia; tablica trwania życia 2.5. Problemy estymacji modelu przeżycia 2.6. Przykład zastosowania modeli przeżycia Rozdział 3. Badanie powiązań kariery rodzinnej i migracyjnej przy zastosowaniu metod ana- lizy nieparametrycznej (E.Frątczak, B.Paszek) 3.1. Wprowadzenie 3.2. Metoda zależnych ryzyk konkurencyjnych 3.2.1. Teoria zależnych ryzyk konkurencyjnych 3.2.2. Estymacja modelu zależnych ryzyk konkurencyjnych 3.2.3. Wyniki estymacji modelu zależnych ryzyk konkurencyjnych 3.3. Metoda standaryzacji, nieparametryczna 3.3.1. Metoda analizy nieparametrycznej D. Courgeau i jej modyfikacja do danych pol- skich - podstawowe algorytmy 3.3.2. Wyniki analizy nieparametrycznej 3.3.2.1. Oceny dotyczące kariery płodności. 3.3.2.2. Oceny dotyczące kariery migracji. 3.4. Tablice i wykresy 3 Rozdział 4. Badanie powiązań kariery rodzinnej i migracyjnej przy zastosowaniu metod ana- lizy semiparametrycznej (E.Frątczak) 4.1. Wprowadzenie do teorii modeli semiparametrycznych 4.2. Zastosowania modeli semiparametrycznych 4.2.1. Estymacja modeli przy zastosowaniu programu EVACOV, interpretacja otrzyma- nych wyników 4.2.2. Estymacja modeli przy zastosowaniu programu LOGLIN, interpretacja otrzyma- nych wyników Literatura 4 Wstęp Coraz częściej metody analizy historii zdarzeń maja zastosowanie w ocenach zjawisk spo- łecznych, ekonomicznych , w tym również zjawisk i procesów demograficznych. Popular- ność tych metod, które swoim zakresem obejmują modelowanie: parametryczne, nieparame- tryczne i semiparametryczne wzrasta znacząco w ostatnich latach. Wzrost popularności za- stosowań tych metod wynika z wielu przyczyn , w tym min. z faktu, że: - wykorzystywane metody analiz oparte są na bazie analizy istoty badanego procesu czy zjawiska, - dokonał się olbrzymi postęp w metodologii badań, głównie poprzez wzrost zainteresowań badaniami retrospektywnymi i panelowymi, - dokonał się postęp w procedurach analitycznych (procedurach estymacyjnych), który to postęp związany jest częściowo z powszechnością i udoskonalaniem techniki komputerowej, - zostały udoskonalone systemy rejestracji danych w tym również bieżącej sprawozdawczo- ści i danych z badań statystycznych. Oddawana do rąk Czytelnika praca jest pierwszą w Polsce publikacją z zakresu zastoso- wań analizy historii zdarzeń w demografii. Znajdzie w niej Czytelnik zarówno metodologię analizy jak również przykłady aplikacji wraz z interpretacją otrzymanych wyników. Mamy na- dzieję, że książka ta przybliży Czytelnikowi w ogólnym zarysie istotę metod analizy historii zdarzeń i zachęci do ich stosowania. Praca składa się z czterech rozdziałów. Rozdział pierwszy ma charakter wstępu wprowadzającego w problematykę. Przedstawio- no w nim w ogólnym zarysie istotę analizy historii zdarzeń zwracając uwagę na podstawowe rodzaje badań statystycznych i ich użyteczność do analizy historii zdarzeń. Najwięcej miejsca poświęcono badaniom retrospektywnym w tym pierwszemu polskiemu badaniu retrospek- tywnemu „Droga życiowa - biografia rodzinna, zawodowa i migracyjna” zrealizowanemu w Polsce w 1988 roku. Został scharakteryzowany cel i zakres badania, sposób jego realizacji , zamieszczono również ocenę jakości uzyskanych z badania wyników. Rozdział drugi to systematyczny wykład na temat modeli przeżycia uzupełniony na koń- cu wybranymi przykładami zastosowań. Czytelnik znajdzie w nim informacje na temat funkcji charakteryzujących model przeżycia , opis wybranych parametrycznych modeli przeżycia , w tym: modelu Moivre’a, modelu wykładniczego,modelu Weibulla, rozkładu normalnego, mo- delu Gompertza. Dość szegółowo został opisany w tym rozdziale nieparametryczny model przeżycia (tablica trwania życia) oraz problemy estymacji modelu , w tym estymacji przy za- stosowaniu metody największej wiarogodności (MNW). Przykład zastosowania modelu prze- 5 życia do danych polskiego badania retrospektywnego 1988 zawiera konstrukcję tablic trwa- nia życia dla urodzeń małżeńskich pierwszej kolejności i pierwszej w małżeństwie migracji. Estymowane parametry tablic trwania życia (dokładniej funkcje przeżycia) przy wykorzysta- niu równań charakterystycznych użyto do oceny parametrycznej estymacji modeli przeżycia o konkretnej postaci analitycznej. Oceny dotyczą dwóch modeli : Weibulla i Gompertza. Rozdział trzeci w całości poświęcony jest zagadnieniu badania powiązań wydarzeń z dwóch karier: rodzinnej i migracyjnej. Do badania powiązań wykorzystano metody analizy nieparametrycznej w tym: metodę zależnych ryzyk konkurencyjnych oraz metodę standary- zacji. Wykorzystywane procedury analityczne opierały się głównie na programach przygoto- wanych według własnych algorytmów , stąd uznano za stosowne zamieścić w tym rozdziale wybrane algorytmy w postaci schematów blokowych. Zamieszczone schematy algorytmów mają ułatwić Czytelnikowi zrozumienie kolejnych etapów przeprowadzonych obliczeń. Na uwagę szczególną w tym rozdziale zasługuje teoria modelu zależnych ryzyk konkurencyj- nych i wprowadzona do analizy statystyka , która jest wykorzystywana do oceny powiązań pomiędzy wydarzeniami z dwóch karier. Statystyka ta definiowana jest jako iloraz dwóch funkcji intensywności, której rozkład jest uciętym rozkładem Cauche’go. Autorki są wdzięczne prof.Danielowi Courgeau z INED za dyskusję i konsultację me- rytoryczną nad badaniem statystyki definiowanej jako iloraz dwóch funkcji intensywności i określeniem jej rozkładu ( podanej dystrybuantą i funkcją gęstości). Przedmiotem rozdziału czwartego są elementy teorii i przykłady estymacji modeli semi- parametrycznych wykorzystanych do badania powiązań pomiędzy wydarzeniami z dwóch karier . Modele , których zastosowanie w ostatnich latach bardzo wzrosło , umożliwiają po- miar jednoczesnego wpływu wielu zmiennych na intensywność badanego zjawiska(procesu) . W naszym przypadku była to intensywność pierwszej i drugiej migracji w małżeństwie. Do estymacji modeli wykorzystano dwa programy: EVACOV i LOGLIN podając specyfikę za- stosowania i wykorzystania każdego z nich. Autorka jest wdzięczna prof. J.M.Hoemowi z Uniwersytetu Sztokholmskiego i prof.M.Bottai Z Uniwersytetu w Pisie za współpracę i merytoryczną dyskusję w czasie prac nad estymacją modeli. Zawarty w pracy materiał to wynik kilku lat pracy nad analizą danych polskiego badania retrospektywnego „Droga życiowa biografia rodzinna zawodowa i migracyjna”. Prace anali- tyczne uległy przyśpieszeniu ( ze względu na dużą pracochłonność obliczeń) po otrzymaniu funduszy z grantu KBN (grant nr 1 P11301305 „Proces formowania i rozpadu rodzin, warunki bytu - teoria, praktyka, aplikacje modelowe”) zrealizowanego w latach 1983-1995 w Instytu- cie Statystyki i Demografii SGH. Podtytuł tej pracy jest zgodny z zakresem prac wykonanych w grancie , które dotyczą głównie rozdziału trzeciego i czwartego pracy. Warto zaznaczyć, że część tekstu zamieszczonego w rozdziałach trzecim i czwartym pracy była wcześniej prezentowana w postaci artykułów bądź referatów w wersji angielskiej. 6 Jednak zamieszczony w publikacji tekst w stosunku do wcześniej prezentowanych został istotnie poszerzony i uzupełniony. Rozdział 1. Badania retrospektywne, analiza historii zdarzeń 1.1. Badania retrospektywne żródłem danych do analizy historii zdarzeń Od lat siedemdziesiątych wzrasta zainteresowanie i zakres zastosowań analizy , która nosi nazwę „ANALIZA HISTORII ZDARZEŃ”. W porównaniu z tradycyjnymi badania- mi typu poprzecznego bądź badaniami panelowymi zaletą tych badań jest to, że dostarczają informacji o dynamice badanego procesu (zjawiska). O każdej jednostce uczestniczącej w badaniu otrzymuje się informacje dotyczące: czasu pobytu w określonym stanie, przejścia z jednego stanu do drugiego, jak również określonego typu zdarzeń, ich sekwencji i rozkładu w czasie. Analiza historii zdarzeń i metody tej analizy mają zastosowanie w wielu dyscypli- nach naukowych. Dla przykładu podamy, że dotyczy to w: - medycynie - procesu dożycia określonego stanu po zabiegu operacyjnym; - ekonomii - sytuacji na rynku pracy (okresów aktywności zawodowej, bezrobocia, bierno- ści); - polityce - czasu pobytu na scenie politycznej; - psychologii - czasu reakcji na określone testy (czasy zapamiętywania); - marketingu - czasu życia produktu; - demografii - intensywności migracji, cyklu życia jednostki, rodziny; - naukach technicznych - czasu bezawaryjnej pracy urządzeń. Uogólniając można powiedzieć, że zakres analizy historii zdarzeń sprowadza się do: - zdefiniowania istoty badanego procesu (tzw. substantive process), - zbierania we właściwy sposób danych liczbowych opisujących proces, ze szczególnym uwzględnieniem sposobu ewidencji i kodowania danych, - stosowania odpowiednich metod analizy, - stosowania odpowiednich pakietów i programów komputerowych. - właściwej interpretacji otrzymanych wyników, J.Coleman charakteryzuje istotę badanego procesu (tzw. substantive process) w na- stępujący sposób (Coleman, 1991 s. 6 i 7): 1. Pierwszym dość ważnym aspektem badanego procesu jest to, że zmiany dotyczące jed- nostki objętej badaniem dokonują się pomiędzy stanami dyskretnymi. Dla przykładu: jeśli 7 jednostką jest osoba, stanem może być: aktywny, bezrobotny. Jeśli jednostką badaną jest mieszkanie, stanem może być: zamieszkałe i niezamieszkałe. Jeśli jednostką badaną jest kobieta, stanami mogą być liczby urodzonych dzieci. W przypadku państwa - stanami mogą być formy rządu. 2. Zmiany stanów mogą występować w dowolnym momencie czasu i nie są ograniczone z góry ustalonymi punktami w czasie. 3. Zmiany mogą być odwracalne lub nieodwracalne w różnych formach procesu. 4. Zmiany nie są z góry ustalone przez bieżący stan, w którym znajduje się proces. 5. Istnieją czynniki wpływające na proces, a analiza procesu pozwala na wykrycie ich skut- ków. 6. W szczególnym przypadku może wystąpić sytuacja, że stan jednostki nie będzie w pełni obserwowalny i proces zmian wśród nieobserwowalnych stanów nie będzie także obser- wowalny, jeśli na przykład stanami procesu będą postawy, które mogą być trudne do ob- serwacji. Z tak zdefiniowanym zakresem badanego procesu wiąże się odpowiedni sposób zbierania informacji o samym procesie i właściwy sposób ich ewidencji. W badaniach staty- stycznych, szerzej: w empirycznych badaniach społecznych można, wyodrębnić trzy podsta- wowe przekroje badań. Jeśli przedmiotem badania będzie kariera rodzinna jednostki (do- kładniej kariera stanu cywilnego) z wyróżnioną przestrzenią stanów: wolny, zamężny, roz- wiedziony, owdowiały to ilustracja graficzna trzech typów badań przedstawia się jak na wy- kresie 1.1. W wykresie 1.1.a podano schemat jednorazowego (poprzecznego) badania staty- stycznego. Na osi czasu przedstawiony jest jeden moment czasu t dla którego została za- 3 rejestrowana informacja o stanie cywilnym jednostki (jest to moment badania). Nic nie wia- domo o zmianach, czy też historii stanu cywilnego jednostki przed i po okresie badania. Z punktu widzenia analizy historii zdarzeń tego typu informacje są mało użyteczne. Wykres 1.1.b to graficzna ilustracja badania panelowego z pięcioma ścieżkami (realizowane pięcio- krotnie). W czasie tego badania rejestruje się informacje o stanie cywilnym dla pięciu mo- mentów czasu. Jeśli badany proces jest w miarę jednorodny, tzn. zachowuje dużą stabil- ność w czasie to istnieje możliwość umownej (przy pewnych założeniach) rekonstrukcji hi- storii procesu pomiędzy badanymi momentami czasu, chociaż z reguły, do badań panelo- wych stosuje się właściwe dla nich procedury analityczne. Wykres 1.1.c. to graficzna ilustracja badania retrospektywnego (dokładniej: rejestracji wydarzeń właściwej dla analizy historii zdarzeń) według odpowieniego schematu rejestracji. Na wykresie odtworzona jest historia sześciu pełnych epizodów, przy czym epizod siódmy jest epizodem uciętym. Pod pojęciem epizod należy rozumieć okres czasu pomiędzy kolejnymi zdarzeniami. Znane są zatem czasy wystąpienia zdarzeń powodujących zmiany 8 stanów oraz znana jest informacja o długości pobytu jednostki w każdym z wyróżnionych stanów. Ten typ badań jest odpowiedni do zbierania informacji empirycznych stanowiących podstawę do analizy historii zdarzeń. Odpowiednio do istoty badanego procesu, jak i do zakresu posiadanych informacji statystycznych, stosowane w analizie historii zdarzeń metody dzielą się na metody (modele): nieparametryczne, parametryczne i semiparametryczne. Metodologię dotyczącą ich Czytel- nik może znależć m.in. w pracach: Allison (1984), Blossfeld, Hamerle, Mayer (1989), Cole- man (1981), Courgeau, Lelievre (1992), Frątczak, Jóźwiak, Paszek (1991), Willekens (1989), Yamaguchi (1991). Przykłady aplikacji metod nieparametrycznych i semiparametrycznych zawierają ko- lejne rozdziały publikacji. Warto nadmienić, że oprócz podanej uprzednio klasyfikacji, modele analizy mogą być modelami: 1. Pojedynczych epizodów ( tzw. single epizode models), w skład których wchodzą takie któ- re posiadają: a) jeden stan wyjścia (tzw.origin state) i jeden stan przeznaczenia, inaczej stan końcowy (tzw. destination state) 1(O) 2(D) b) jeden stan wyjścia i wiele stanów kończących (przeznaczenia) 2(D ) 1 1(O) 3(D ) 2 4(D ) 3 9 Wykres 1.1. Ilustracja graficzna zakresu badań statystycznych (obserwacja kariery rodzinnej - dokładniej stanu cywilnego w badaniu: poprzecznym, panelowym i retrospektywnym) Wykres 1.1.a. Badanie jednorazowe (poprzeczne) Przestrzeń stanów owdowiały rozwiedziony zamężny wolny t t t t t Czas (t) 1 2 3 4 5 Wykres 1.1.b. Badanie panelowe (5 scieżek) Przestrzeń stanów owdowiały rozwiedziony zamężny wolny t t t t t Czas (t) 1 2 3 4 5 Wykres 1.1.c. Badanie retrospektywne Przestrzeń stanów e 7 owdowiały e e 3 5 rozwiedziony e e e 2 4 6 zamężny e 1 10 wolny Czas (t) 2. Modele wielu epizodów, w których jest wiele stanów wyjścia i wiele stanów kończących z reguły są to modele oparte na procesach stanowych. (1) (2) (3) (4) . . . Upowszechnienie metod analizy historii zdarzeń wymagało rozwoju i popularyzacji badań retrospektywnych. W obszarze demografii pierwszym zakrojonym na szeroką skalę badaniem retrospektywnym w Europie, u podstaw którego leżała idea upowszechniania i weryfikacji metod analizy historii zdarzeń w demografii było badanie „The Triple Biographie- Survey” przeprowadzone we Francji we Francuskim Narodowym Istytucie Demograficznym (INED) pod kierunkiem prof. D.Courgeau. Badanie francuskie odtwarzające historię trzech biografii (rodzinnej, zawodowej i migracyjnej) było kontynuacją doświadczeń wyniesionych z badania retrospektywnego na mniejszą skalę zrealizowanego na próbie mieszkańców Pary- ża w 1961 roku przez G. Purcher’a (por. Courgeau, Lelievre 1992, s.13). W latach osiem- dziesiątych wiele krajów europejskich przeprowadziło badania retrospektywne. Dla przykła- du: ORIN Project - badanie zrealizowane w NIDI w Holandii w 1984 r.; badanie włoskie pod kierunkiem prof. M. Bottai na Uniwersytecie w Pisie w 1987; badanie niemieckie w Max- Planck-Institut w Berlinie pod kierunkiem prof.K.U.Mayer’a w 1987 r. Do krajów, w których zrealizowano badania retrospektywne dołączyła Polska, badaniem w 1988 r.(szerzej na ten temat p.1.2 rozdz. 1). Badania tego typu stają się coraz bardziej powszechne. Świadczy o tym m.in. fakt, że w Europie na przełomie lat osiemdziesiątych i dziewiędziesiątych rozpoczęto cykl badań o zasięgu międzynarodowym, kierowanych przez Population Activities Unit, DEAP, Economic Commission for Europe w Genewie o nazwie „Family and Ferility Survey”. Dość rozbudowa- ny formularz wywiadu wykorzystanego w badaniu umożliwiał m.in. rekonstrukcję czterech biografii jednostki: rodzinnej, edukacyjnej, zawodowej i migracyjnej. W ramach tego cyklu badań Instytut Statystyki i Demografii SGH we współpracy z Departamentem Badań Demo- graficznych GUS przeprowadził badanie ankietowe „Przemiany rodziny i wzorce dzietności w Polsce w 1991”, którym objęto próbę 4313 gospodarstw domowych (8544 osób) w wieku 18-49 lat (por. Holzer, Kowalska 1995). Polskie badanie retrospektywne z 1988 roku objęło osoby w wieku 45 lat i więcej, a z roku 1991 osoby w wieku 18-49 lat. Wyniki tych dwóch badań (retrospekcja czterech karier jednostek: edukacyjnej, zawodowej, rodzinnej i migra- cyjnej) należy uznać za uzupełniające się.
Description: