Bináris logisztikus regresszió

A bináris logisztikus regresszióban olyan helyzeteket tudunk megoldani, amikor a függő változónk kétértékű (dichotóm, vagy más néven bináris változó). Ezen eseteknél gondolhatunk arra, hogy egy adott katasztrófahelyzetet túlél-e valaki, vagy sem, kaphat-e egy banktól hitelt, vagy sem, stb. Független változókra olyan jellegű kritériumokat, mint amiket pl. a lineáris regressziónál (együttes normalitás) tettünk, most nem teszünk – bár a folytonosság itt sem árt, illetve ha diszkrét változókkal dolgozunk, akkor a DUMMY-zás szintén jól jöhet.

Az eljárást egy olyan adatfájlon mutatjuk be, ahol különböző történeteket pontoztak több szempont szerint egymástól függetlenül bírálók, majd ezeket a pontszámokat összesítették, és a történetek szereplőihez rendelték. A pontszámokból 4 skálát alkottunk: egymás közötti viszony, a történetben leírt versenyhelyzetben való motiváció és szabálykövetés, illetve a versenyhelyzet okozta stressz mértéke.

Ezen kívül a bírálók megítélték azt is, hogy az egyes történetekben erős együttműködés alakult-e ki a versengő felek között, vagy sem.

Ezen utóbbi változóra szeretnénk egy előrejelzést nyerni. Más megközelítésben: arra keressük a választ, hogy a fenti 4 szempont (viszony, motiváció stb.) alapján meg tudjuk-e jósolni, hogy a versenyhelyzetben erős együttműködés alakul-e ki, vagy sem?

Ennek eldöntésére, illetve a becslésünk értelmezéséhez azt kell tudni, hogy ilyen helyzetekben nem egy „0 vagy 1” döntést hozunk, hanem megadjuk a mért változók segítségével, hogy a mért adatok alapján milyen valószínűséggel várhatunk együttműködést a felek között.

A felsorolt 4 változó mindegyikét standardizáltuk, azaz az átlaguk 0 és a szórásuk 1, tehát az adatokat majd ennek megfelelően kell tudnunk értelmezni. A 0-s érték (a standardizálás miatt) tehát egy alapvetően közömbös egymás közötti viszonyt, átlagos motivációt, a szabályok általános betartását jelenti, egészséges, átlagos – versenyhelyzetben átlagos – stressz-mértékkel. Természetesen ez nem jelenti azt, hogy mindenképpen standardizált változókkal kell a bináris logisztikus regresszióban dolgoznunk.