
Ebben a fejezetben olyan kérdéseket tárgyalunk, amikor legalább 3 csoport kerül összehasonlításra valamely vizsgált változó mentén. (Hasonló az előző fejezethez, csak több csoporttal). A kérdésfelvetés szakmailag többek között az alábbi módon fogalmazható meg:
Ismét olyan hipotézist fogalmaztunk meg, mely nem egészen a statisztikai hipotézis – hiszen nem egyenlőség, hanem eltérés szerepel benne. A statisztikai hipotézis, melyet vizsgálni tudunk:
Ezt már tudjuk kezelni statisztikailag. Matematikailag az előző blokk általánosítása történik hagyományos esetben. Sztochasztikus homogenitás / egyenlőség esetén nem triviális az általánosítás, így itt némi többlet végiggondolásra lesz szükségünk. A hagyományos eljárásban továbbra is feltétel lesz a normalitás és a szóráshomogenitás (a hagyományos eljárás itt a varianciaanalízis, vagy VA vagy ANOVA).
A normalitás sérülése esetén alkalmazott rangstatisztikai eljárások során használt sztochasztikus homogenitás azonban egy érdekes sajátosságot hordoz a hagyományos módszerrel szemben: ha a hagyományos módszerben az átlagokat összehasonlítjuk, akkor igaz lesz az alábbi:
Azonban sztochasztikus homogenitás esetén ez bonyolultabb. Eddig is úgy próbáltuk meg kezelni a sztochasztikus fölényt, hogy ha egyik vagy másik csoportból kivennénk 1-1 egyedet, és versenyeztetnénk, akkor valamely csapat szisztematikusan legyőzné-e a másik csapatot. Azonban ebben az esetben a legkönnyebb a sportból vett „körbeverés” esetét felidézni: A mindig megveri B-t, B mindig megveri C-t, de C mindig megveri A-t. Tehát, bár PÁRONKÉNT mindig van domináns csoport, összességében mégsem mondhatunk senkit dominánsnak. Ez lesz a rangstatisztikák egyik érdekessége ebben az esetben: itt akkor mondunk majd valakit sztochasztikusan dominánsnak, ha MINDENKIT meg tud verni.
Ha minden beállítás megegyezik a fentivel, ezt az outputot nyerjük:
Független minták egyszempontos összehasonlítása
A beolvasott összes eset száma: 94
Csoportosító változó: IQ (IQ of subjects)
Jelölés: +: p < 0,10 *: p < 0,05 **: p < 0,01 ***: p < 0,001
FÜGGŐ VÁLTOZÓ: Feminin (Femininity)
Csoportonkénti alapstatisztikák
| Index | IQ | Esetek | Átlag | Szórás | Min. | Max. | Ferdeség | Csúcsosság |
| 1 | low | 22 | 13,59 | 2,282 | 10 | 18 | 0,188 | -0,897 |
| 2 | middle | 36 | 13,61 | 2,032 | 8 | 17 | -0,689+ | 0,416 |
| 3 | high | 24 | 14,00 | 2,341 | 10 | 18 | 0,155 | -0,556 |
Ha a Ferdeség vagy a Csúcsosság szignifikáns, az a normalitás sérülését jelzi.
Elméleti szórások egyenlőségének tesztelése
- O'Brien-próba (Welch-féle): F(2,0; 48,2) = 0,384 (p = 0,6830)
- Levene-próba (Welch-féle): F(2; 47,5) = 0,642 (p = 0,5306)
Elméleti átlagok egyenlőségének tesztelése
Hagyományos eljárás, amely feltételezi a szóráshomogenitást:
- Varianciaanalízis: F(2; 79) = 0,278 (p = 0,7579)
Hatásvariancia = 1,3375, Hibavariancia = 4,8085
Korrelációs hányados (nemlineáris korrelációs együttható): eta = 0,084
Megmagyarázott variancia-arány: eta-négyzet = 0,007
Robusztus eljárások, amelyeknél nem szükséges a szóráshomogenitás:
- Robusztus Welch-féle varianciaanalízis: W(2; 45,6) = 0,253 (p = 0,7777)
- James-próba: U = 0,513 (p > 0,10)
- Brown-Forsythe-próba: BF(2; 67) = 0,267 (p = 0,7661)
Az (ANO)VA-elemzésnél a normalitás vizsgálata a ferdeség és csúcsosság paraméterek segítségével történik – látható, hogy egyik csoportban sem sérül a normalitás. Szintén ebben a táblázatban láthatók az átlagok, szórások, esetszámok.
A próba másik feltétele a szórások egyezése. Ennek megszokott próbáit láthatjuk a következő blokkban, ahonnan leolvashatjuk, hogy a csoportok szórásai szignifikánsan nem különböznek egymástól.
Az átlagok összehasonlítása megtörténik, a páros összehasonlításokat viszont azért nem látjuk, mert a kapott eredmények alapján nincsenek szignifikáns eltérések a csoportok között. Ezt az első sorban lévő varianciaanalízis-értékből tudjuk kiolvasni – a hozzá tartozó p-érték elég magas, tehát a feminitás nem mutat eltérést a különböző IQ-kategóriákban.
Amennyiben nem teljesülne a szóráshomogenitás feltétele, úgy a következő blokkban tudnánk a megfelelő varianciaanalízis-statisztikákat kiolvasni, innen általában a Brown–Forsythe-próbát szokás használni. A robusztus tesztek szintén azt mutatják, hogy nincsenek szignifikáns eltérések.
Amennyiben sérül a normalitás, úgy a következő eljárást kell alkalmazni:
Ekkor az alábbi outputot kapjuk:
Az input fájl neve: C:\_vargha\ropstat\dat\CPI.msw
Független minták egyszempontos összehasonlítása
A beolvasott összes eset száma: 94
Csoportosító változó: IQ (IQ of subjects)
Jelölés: +: p < 0,10 *: p < 0,05 **: p < 0,01 ***: p < 0,001
FÜGGŐ VÁLTOZÓ: Feminin (Femininity)
Csoportonkénti alapstatisztikák
| Sztochasztikus dominancia | ||||||
| Index | IQ | Esetek | Rang-átlag | Rang-szórás | Súlyozott | Nem súlyozott |
| 1 | low | 22 | 39,52 | 25,54 | 0,476 | 0,476 |
| 2 | middle | 36 | 41,28 | 22,00 | 0,497 | 0,498 |
| 3 | high | 24 | 43,65 | 24,83 | 0,526 | 0,526 |
Megjegyzés:
Minden csoport esetében a sztochasztikus dominancia annak a valószínűségét jelzi,
hogy egy random megfigyelés ebből a csoportból (Xj) nagyobb lesz, mint egy random
megfigyelés az egész mintából (X), plusz az egyenlőség valószínűségének a fele:
SZTDj = P(Xj > X) + 0,5P(Xj = X)
A sztochasztikus homogenitás definíciója: SZTD1 = SZTD2 = SZTD3 = ... = 0,50
Elméleti rangszórások egyenlőségének tesztelése
- O'Brien-próba (Welch-féle): F(2,0; 46,1) = 0,866 (p = 0,4275)
- Levene-próba (Welch-féle): F(2; 47,9) = 1,058 (p = 0,3550)
Sztochasztikus homogenitás tesztelése
Hagyományos eljárás, amely feltételezi a szóráshomogenitást:
- Kruskal-Wallis-próba: H(2) = 0,357 (p = 0,8366)
Szóráshomogenitást nem igénylő robusztus közelítő eljárás:
- Korrigált rang Welch-próba: rW3(2; 45,4) = 0,155 (p = 0,8568)
KULLE-féle aszimptotikusan egzakt próbák
- Populációk azonos súlyozása:
Khi2(1,93) = 0,351 (p = 0,8257) F(1,93; 79,0) = 0,182 (p = 0,8261)
- Mintaelemszámokkal arányos súlyozás:
Khi2(1,92) = 0,354 (p = 0,8228) F(1,92; 79,0) = 0,184 (p = 0,8232)
Ebben az esetben a rangátlagokkal kell elsősorban dolgozni – ezeket fogjuk összehasonlítani. Ennek is feltétele a szóráshomogenitás – de itt a rangsorok szórásainak egyenlősége szükséges. Ennek is a szokásos tesztjei láthatóak az első blokkban, melyekből megállapítható, hogy a rangszórások nem különböznek szignifikánsan egymástól.
A sztochasztikus homogenitás hagyományos, szóráshomogenitási feltétel megléte melletti tesztje a Kruskal–Wallis-próba, mely azt mutatja, hogy nincsen sztochasztikusan domináns csoport.
Amennyiben nem állna fent a szóráshomogenitás, úgy a korrigált Welch-próbát kellene figyelnünk (most ez sem jelez eltérést).
Megállapíthatjuk tehát, hogy bármely eljárást nézzük is – átlagok, rangsorok – nem állapítható meg eltérés a feminitás értékeiben az IQ által övezetekre bontott populációban.
Amennyiben mindent jól állítottunk be, az alábbi outputot nyerjük:
A táblázatok hasonló információkat tartalmaznak, mint a ROPstat esetén. Először itt is a leíró statisztikákkal találkozhatunk. A következő output itt is a szóráshomogenitás – bár az SPSS csak a Levene-tesztet használja.
Az ANOVA-táblázat a hagyományos varianciaanalízis táblája, melyben az F-érték és a Sig.-érték számít – itt is megfigyelhetjük, amit már a ROPstatnál, hogy nem jelez szignifikáns eltéréseket. A hagyományos után a robusztus, szóráshomogenitást nem igénylő Brown–Forsythe-tesztet láthatjuk (ez sem jelez eltérést, bár ezt most úgyis figyelmen kívül hagyjuk).
Az első és legnagyobb eltérés a ROPstat és az SPSS között ebben az eljárásban, hogy az SPSS mindenképpen kiszámolja és kiírja a páros összehasonlítások táblázatait – függetlenül attól, hogy vannak-e szignifikáns eltérések vagy sem.
Ezek közül az első táblázatban páronként (egy-egy sorban egy-egy páros összehasonlítása látható) írja ki az eredményeket, ahol az átlagok közötti különbségek, annak standard hibája, illetve az eltérés 0 voltának tesztelési eredménye látható (Sig.-érték). Amennyiben a Sig.-érték 0,05 alá csökken, akkor van a két csoport között szignifikáns eltérés.
A Tukey-féle teszt a szóráshomogenitás megléte mellett értelmezhető, míg a Games–Howell-statisztika robusztus a szóráshomogenitás feltételére nézve.
A másik, hasonló tartalommal bíró táblázat az átlagokat csoportosítva jeleníti meg, tehát tömörebb, vizuálisabb formában örökíti meg az eredményeket számunkra.
Amennyiben nem teljesül a normalitás, úgy rangstatisztikai eljárást tudunk alkalmazni, azonban ez nem lesz annyira részletes, mint a ROPstat hasonló rutinja (így azt javasoljuk, hogy amennyiben rangstatisztikai eljárásra van szükségünk, használjuk a ROPstatot).
Amennyiben mindent beállítottunk, az alábbi outputot nyerjük:
A rangstatisztikai eljárás az SPSS-ben lényegesen rövidebb, itt csak a Kruskal–Wallis-teszt látható, illetve az értelmezéshez, interpretációhoz szükséges rangstatisztikai leíró statisztikák. Ez alapján, a benne lévő khi-négyzet statisztika és a hozzá tartozó Asymp. Sig-érték alapján elmondható, hogy, hasonlóan a ROPstat eredményéhez, itt sem láthatunk semmifajta szignifikáns eltérést a rangátlagok között, nincsen szignifikánsan domináns csoport.
E kérdések változatos módokon interpretálhatók egy műhelymunkában, hiszen elég összetett eljárásról van szó – annak ellenére, hogy maga a hipotézis egyszerű, nagyon sok részeljárás van, melyekről mindenképpen kell írni, hogy valid legyen a vizsgálatunk.
A feminitás-változó IQ-övezetek szerinti összehasonlítása
Az IQ-változót 3 övezetre bontottuk (alacsony, közepes és magas), majd e 3 övezetben vizsgáltuk a feminitás-változó nagyságszintjét. Bár a csoportonként kiszámított ferdeségi és csúcsossági mutatók egyike sem mutatott szignifikáns eltérést a normális eloszlás megfelelő paramétereitől, rangstatisztikai eszközökkel is megvizsgáltuk a kérdést.
Azt tapasztaltuk, hogy mind a hagyományos eljáráshoz szükséges szóráshomogenitás fennáll (Levene-próba: F(2; 47,5) = 0,642 (p = 0,5306)), mind a rangstatisztikákhoz szükséges rangsorok szórásának homogenitása teljesül (Welch-féle Levene-próba: F(2; 47,9) = 1,058 (p = 0,3550)). Így az átlagoknak és rangátlagoknak a hagyományos eljárásait alkalmazhattuk.
Az átlagok hagyományos eljárással sem (F(2; 79) = 0,278 (p = 0,7579)), illetve Kruskal–Wallis-féle rang-ANOVA eljárással sem (H(2) = 0,357 (p = 0,8366)) különböznek egymástól szignifikánsan.
Megállapíthatjuk tehát, hogy az IQ növekedő csoportjaiban a feminitás átlaga szignifikánsan nem különbözik egymástól
Fontos észrevenni és megemlíteni, hogy ha páros összehasonlításokat teszünk, akkor azt táblázatos formában vagy akár oszlopdiagramos formában is érdemes lehet ábrázolni (az átlagokat feltüntetve), vagy pontdiagrammal, összekötve az átlagokat, stb. Ezen a ponton már nagyon nagyfokú szabadságunk van, hiszen az eredmények értelmezése, interpretációja változatos lehet. Figyeljünk azonban oda, hogy a szükséges hivatkozások minden esetben pontosan jelenjenek meg a dolgozatban.
Ne felejtsük el, hogy a ROPstat csak abban az esetben vizsgálja a páros összehasonlításokat, ha a varianciaanalízisben szignifikáns különbséget talál – egyéb esetben ezt az elemét az outputnak nem fogjuk látni. Nyilván, ha nincsenek különbségek, akkor a páros összehasonlítások bemutatása sem lehet kötelező.