Loglineáris modellezés

  Loglineáris modellezés


Loglineáris modellezés

Kiemeljük: a félév során a többi anyagrésszel való ismerkedés miatt, illetve amiatt, hogy általában azok sűrűbben alkalmazottak a pszichológiai elemzések során, ezzel az elemzési technikával a gyakorlatokon ritkán szoktunk tudni megismerkedni. Ennek ellenére – vagy éppen ezért – egy gyakorlati megvalósítást bemutatunk azért, hogy ha mégis szükség lenne erre az elemzési technikára, akkor a reprodukció lehetőségét megteremtsük.

A loglineáris modellezést akkor alkalmazzuk, ha kettőnél több kategória-változó közötti kapcsolatrendszert szeretnénk feltárni. Ennek lényegéhez a kétváltozós modell alap-gondolatát kell megérteni. Tegyük fel, hogy adott egy X és egy Y kategóriaváltozó, az egyszerűség kedvéért mindkettő két-két értékkel. Legyen X változó a „nem”, míg az Y változó, hogy a vizsgálati alany „dohányzik, vagy nem dohányzik”. Ekkor az alábbi kombinációkkal dolgozunk:

Nem/Dohányzás

Dohányzik

Nem dohányzik

Férfi

Dohányzó férfi

Nem dohányzó férfi

Dohányzó nő

Nem dohányzó nő


Tekintsük azt a feladatot, amikor annyit tudunk, hogy van 50 férfi és 50 nő, illetve 50 dohányzó és 50 nem dohányzó alanyunk. Amennyiben meg kéne adnunk annak a valószínűségét, hogy dohányzó nőt választunk, úgy bárminemű többletinformáció nélkül, a két változót függetlennek tekintve 0,5 x 0,5 lenne a válasz, tehát 25%-os valószínűséget tudnánk annak tulajdonítani, hogy véletlenszerűen választva valakit éppen egy dohányzó nőt találunk.

Ez azt jelenti, hogy ilyen esetben a táblázat belső változó-együttállásait vizsgálva a függetlenség melletti eloszlásunk az, hogy minden belső kategória-együttállás azonos valószínűségekkel fordul elő – azaz, mindegyik kimenetelnek azonos a valószínűsége.

Ez azon a valószínűség-elméleti tényen alapul, hogy ha adott egy A és egy B esemény, melyek egyenként P(A) és P(B) valószínűséggel következnek be, akkor az együttes bekövetkezés valószínűsége az A és B esemény függetlensége esetén:

P(AB) = P(A) P(B)

Könnyen megállapítható viszont az is, hogy ha eláruljuk, hogy a méréseink szerint 15 dohányzó férfi volt a mintában (azaz eláruljuk lényegében az együttes bekövetkezések valószínűségét is, hiszen ezzel megadtuk azonnal, hogy hány nem dohányzó férfi volt, illetve dohányzó és nem dohányzó nő), azzal lényegében kiiktattuk a véletlent a modellből, hiszen tudjuk, hogy a 15 dohányzó férfi mellett 35 nem dohányzó férfi volt. Továbbá azt is tudjuk, hogy 35 dohányzó és 15 nem dohányzó nőt sikerült megkérdeznünk – ezzel pedig az előző kérdésfelvetés – sőt, valójában bármely együttes bekövetkezés valószínűsége – könnyedén becsülhető és megadható.

Azaz a dohányzó nők valószínűsége így 35%-os, de ezzel lényegében bármely más valószínűséget is megadtunk. Azonban vegyük figyelembe, hogy így a változók külön-külön vett ismerete mellett megadtuk a két változó együttes eloszlását is (azaz X és Y mellett az XY változó együttes eloszlását is ismerjük: a modellben ezt X és Y interakciójának nevezzük).

A loglineáris modell esetében tehát megállapítható, hogy ha tetszőleges számú változónk van, akkor a kérdés az, hogy a létező összes változó eloszlása, illetve az összes leképezhető interakció figyelembe vétele helyett mely kevesebb információ az, melynek segítségével a modell felírható.

Más megközelítésben feltehető az a kérdés is, hogy elhagyhatók-e interakciók a modellből, vagy a változók oly mértékben függetlenek egymástól, hogy minden marginális mellett minden interakció megismerésére is szükségünk van ahhoz, hogy a teljes eloszlást megismerjük (a marginális eloszlások lényegében a változók egyenkénti gyakoriságai, figyelmen kívül hagyva a többi változó viselkedését).

Az eddig megismert modellekkel ellentétben itt nem az lesz a cél, hogy minél alacsonyabb szignifikancia-szinteket érjünk el, hanem ellenkezőleg: a modell illeszkedését szeretnénk a lehető legjobban biztosítani – tehát azt fogjuk erőltetni, hogy a lehető legnagyobb SIG-értéket érjük el a modellben, hiszen akkor megállapíthatjuk, hogy a figyelembe vett interakciókkal már „kellően pontosan” leírható a változók kombinálása, együttes eloszlása.

A cél tehát: a lehető legkevesebb interakció figyelembe vételével a lehető legjobban illeszkedő modell elérése.

A megvalósítás leginkább a legózáshoz hasonlítható: az esetek döntő többségében lényegében játszunk a modellekkel egészen addig, amíg egy számunkra elfogadható és jól magyarázható modellig eljutunk, melyben a különböző marginálisokat és beválogatott interakciókat magyarázzuk – illetve örülünk, ha valamely interakciók kihagyásával egyszerűsíteni tudjuk a modellünket.