oktatás, elemzés, kutatástervezés

Címke: pszichológusoknak

A Cohen’s d és használata

Valószínűleg tanulmányaid során találkoztál már vele – vagy legalábbis kellett volna, ugyanis a Cohen’s d az egyik leggyakoribb hipotézisvizsgálatnak, a t-próbának a hatásnagyság-mutatója; így például szakdolgozat-íráskor érdemes számolni vele.

A hatásnagyságra azért van szükség, mert önmagában a „szignifikánsság” csak azt mutatja meg, hogy a vizsgált jelenség létezik a populációban (tehát például ha egy mindfullness tanfolyam hatását vizsgáljuk a depresszióra, és az előtte-utána mérések között az eltérés szignifikáns, akkor igazoltuk, hogy az eltérés nem csak a mintánkban mutatkozik meg, hanem általánosságban is létezik).

Azt azonban ekkor még nem tudjuk, hogy a különbség mekkora horderejű, milyen jelentős; de terjedhet a jelentéktelentől a nagyon komoly jelentőségűig. Éppen ennek a mérésére valóak a hatásnagyság-mutatók; amikből némi túlzással élve minden hipotézisvizsgálathoz van egy külön verzió – a t-próbáknál éppen a Cohen’s d.

A nagy és gyakorta használt statisztikai szoftverek könnyen kiszámolják, a leggyakoribb értelmezése pedig így néz ki:

Előfordulhat, hogy a különbség szignifikáns, de a mértéke teljesen jelentéktelen; ezért érdemes mindig figyelembe venni a hatásnagyságot az eredményeink értelmezésénél!


forrás: Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2nd ed.). Hillsdale, NJ: Lawrence Erlbaum Associates.

T-teszt, vagy Welch féle t-próba?

Nézzük meg az előző témát (két csoport összehasonlítása akkor, ha az összehasonlítást egy folytonos változó szerint végezzük) egy kicsit más szemszögből: vegyük elő a szóráshomogenitást.

Ez a normalitás mellett a másik alapfetétele a t-próba alkalmazhatóságának; ugyanakkor mégis valahogy gyakran elsikkad. A fogalom nem jelent mást, minthogy a két, összehasonlítandó csoportnak egyforma szórással kell rendelkeznie – és ezt azért kell külön hipotézisvizsgálattal ellenőrizni, mert a szórásoknak a populációkban kell egyezniük. Nem elég tehát, ha ránézésre a leíró statisztikában „nagyjából egyformák”; kell hozzá egy teszt (ez leggyakrabban a Levene-teszt).

Ha nem szignifikáns (tehát a p-érték 0,05 fölött van), a szórások egyezőségét elfogadottnak tekintjük; ha nincs, akkor jön a Welch-féle t-teszt; ez általában minden szoftverben könnyen elérhető, az SPSS-ben egyenesen automatikusan kiíródik (ez az „Equal variances not assumed” sor):

Nade mi van akkor, ha a szóráshomogenitás is sérül, és az előző blogposztban tárgyalt normalitás is? A gyakorlatban (például szakdolgozatban, műhelymunkában) ilyenkor is a Mann-Whitney próbát használjuk; de nem árt tudni, hogy annak pedig az eloszlások egyezősége a feltétele – ezt azonban ellenőrizni szinte soha nem szokták.

Független mintás t-teszt vagy Mann-Whitney próba? – ha gyorsan kell döntened :)

Röviden: ami közös bennük, hogy mindkettőt két (azaz kizárólag kettő) csoport összehasonlítására használjuk. Jobban parkolnak -e a férfiak, mint a nők? A nevelőotthonban felnőtt gyerekeknek más -e a szorongásszintje, mint a családban nevelekdőkének? A 25 év alattiak többet használják -e közösségi médiát, mint a 25 év felettiek?

Míg azonban a t-teszt parametrikus (ez alatt itt azt értjük, hogy feltétele a normáleloszlás), addig a Mann-Whitney rangsoroláson alapul. Ez tulajdonképpen azt jelenti, hogy a Mann-Whitney során elvész az egymást követő adatok távolságának különbözősége, minden érték között 1 egység lesz a távolság:

Ennek az az előnye, hogy az eloszlás normalitása itt már nem fontos; hiszen az egymás után sorban beszámozott értékekben az úgysem mutatkozna meg; de ugyanez a tulajdonsága okozza a kisebb erejét is. Az óráimon viszonylag rendszeresen felmerül a kérdés, hogy miért nem használjuk automatikusan a nemparaméteres teszteket, ha egyszer ugyanazt a funkciót töltik be, mint a paraméteresek, csak sokkal kevesebb előfeltétellel? A válasz az erőben rejlik: a nemparaméteres próbák egyszerűen kevésbé hatékonyak – ami viszont nem az elsődleges szempont akkor, amikor a normalitás sérülése miatt paraméteres próbát nem használhatunk…

A gyakorlatban úgy tudunk a kétféle teszt közül választani, hogy ha a normalitás rendben van (ellenőrizni leggyakrabban a Shapiro-Wilk teszttel szoktuk), akkor t-tesztet használunk; ha a normalitás nem teljesül, akkor viszont Mann-Whitney tesztet. Annak ellenére így van ez, hogy a szóráshomogenitásra is figyelnünk kellene közben, de a gyakorlatban, még műhelymunkákban és szakdolgozatokban is, a normalitás, mint feltétel, általában mindent visz. Az is igaz viszont, hogy a szóráshomogenitás sokkal ritkábban sérül, mint a normalitás.

Köszönjük WordPress & A sablon szerzője: Anders Norén