A DUMMY változók segítségével elérhetjük, hogy nominális változókat is értékelni tudjunk többszörös lineáris regressziós modellekben. Ehhez azonban először ennek technikai megvalósítását kell megismerni.
A feladatot a 2003-mas OECD PISA adatfájlon fogom bemutatni, annak is az iskolatípust meghatározó változóján.
Ennek kódjai sajnálatosan nem szerepelnek az adatbázisban, így most ezeket hiánypótlásként megadom:
KÓD |
ISKOLA TÍPUSA |
1 |
Általános Iskola |
2 |
Gimnázium |
3 |
Szakközépiskola |
4 |
Szakiskola |
Az adatfájlban ezt a változót, azaz az iskola típusát ST01Q02 néven fogjuk megtalálni. A gyakorisági elemzés segítségével is ellenőrizhetjük, hogy valóban 4 értéke van a változónknak, így összesen 3 DUMMY változót fogunk létrehozni.
Hogy ne egészen szokványos módon oldjuk meg a feladatot, az alábbi változókat fogjuk létrehozni:
Azaz, lesz egy gimnáziumi, egy szakközépiskolai és egy szakiskolai DUMMY változó. Ezek jelentése (rendre):
Ennek értelmében tehát, ha valaki mindhárom fent felsorolt DUMMY változóra 0-s értéket kap, akkor tudhatjuk, hogy még nem középiskolás, hanem az eredeti változó 1-es kódján szereplő, általános iskolás diák.
A DUMMY változók létrehozására bemutatom a menüvezérelt és a syntax segítségével létrehozott változatot is.