oktatás, elemzés, kutatástervezés

Címke: módszertan

A Cohen’s d és használata

Valószínűleg tanulmányaid során találkoztál már vele – vagy legalábbis kellett volna, ugyanis a Cohen’s d az egyik leggyakoribb hipotézisvizsgálatnak, a t-próbának a hatásnagyság-mutatója; így például szakdolgozat-íráskor érdemes számolni vele.

A hatásnagyságra azért van szükség, mert önmagában a „szignifikánsság” csak azt mutatja meg, hogy a vizsgált jelenség létezik a populációban (tehát például ha egy mindfullness tanfolyam hatását vizsgáljuk a depresszióra, és az előtte-utána mérések között az eltérés szignifikáns, akkor igazoltuk, hogy az eltérés nem csak a mintánkban mutatkozik meg, hanem általánosságban is létezik).

Azt azonban ekkor még nem tudjuk, hogy a különbség mekkora horderejű, milyen jelentős; de terjedhet a jelentéktelentől a nagyon komoly jelentőségűig. Éppen ennek a mérésére valóak a hatásnagyság-mutatók; amikből némi túlzással élve minden hipotézisvizsgálathoz van egy külön verzió – a t-próbáknál éppen a Cohen’s d.

A nagy és gyakorta használt statisztikai szoftverek könnyen kiszámolják, a leggyakoribb értelmezése pedig így néz ki:

Előfordulhat, hogy a különbség szignifikáns, de a mértéke teljesen jelentéktelen; ezért érdemes mindig figyelembe venni a hatásnagyságot az eredményeink értelmezésénél!


forrás: Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2nd ed.). Hillsdale, NJ: Lawrence Erlbaum Associates.

T-teszt, vagy Welch féle t-próba?

Nézzük meg az előző témát (két csoport összehasonlítása akkor, ha az összehasonlítást egy folytonos változó szerint végezzük) egy kicsit más szemszögből: vegyük elő a szóráshomogenitást.

Ez a normalitás mellett a másik alapfetétele a t-próba alkalmazhatóságának; ugyanakkor mégis valahogy gyakran elsikkad. A fogalom nem jelent mást, minthogy a két, összehasonlítandó csoportnak egyforma szórással kell rendelkeznie – és ezt azért kell külön hipotézisvizsgálattal ellenőrizni, mert a szórásoknak a populációkban kell egyezniük. Nem elég tehát, ha ránézésre a leíró statisztikában „nagyjából egyformák”; kell hozzá egy teszt (ez leggyakrabban a Levene-teszt).

Ha nem szignifikáns (tehát a p-érték 0,05 fölött van), a szórások egyezőségét elfogadottnak tekintjük; ha nincs, akkor jön a Welch-féle t-teszt; ez általában minden szoftverben könnyen elérhető, az SPSS-ben egyenesen automatikusan kiíródik (ez az „Equal variances not assumed” sor):

Nade mi van akkor, ha a szóráshomogenitás is sérül, és az előző blogposztban tárgyalt normalitás is? A gyakorlatban (például szakdolgozatban, műhelymunkában) ilyenkor is a Mann-Whitney próbát használjuk; de nem árt tudni, hogy annak pedig az eloszlások egyezősége a feltétele – ezt azonban ellenőrizni szinte soha nem szokták.

Egy klasszikus mintavételi hiba – a nem megfelelő lefedettség NAGYON téves eredményekhez vezethet

Nemrég járta be a sajtót a hír, hogy Nagy-Britanniában néhány évtizede tévesen számolták ki, hogy egy szál cigaretta átlagosan hány évvel rövidíti meg egy ember életét. A történtekről szóló cikkekben „jelentős módszertani hibákat” említettek, én pedig arra gondoltam, ezekből talán érdemes tanulni.

Mind a régi, téves, mind a frissebb, kiigazító kutatás Nagy-Britanniában zajlott; ez azért különösen érdekes, mert Anglia volt az egyik, ha nem a legjelentősebb ország a dohányzás európai elterjedésének történetében. I. Jakab király, és a dohányt az angolokkal megismertető Sir Walter Raleigh annyira nem szívelhették egymást, hogy miután vitatkoztak egy sort arról, be kell -e tiltani, vagy meg kell-e adóztatni a dohányzást, I.Jakab lefejeztette a Sir-t. A képen még fejjel együtt látható, miközben látványos pipájából boldogan pöfékel (a háttérben pedig a szolgáló épp készül vízzel eloltani gazdáját, azt gondolván, hogy az azért füstöl, mert meggyulladt):

Egyszóval a szigetországnak és a dohányzásnak nagyon hosszú, közös története van; de ugyanez igaz a dohányzás káros hatásainak kutatására is. Sőt, brit tudósoktól származik az első olyan tanulmány, ami egészen komoly módszertannal, elsőként bizonyította be kétséget kizáróan, hogy a dohányzás tüdőrákot okoz. Ebben az 1950-es tanulmányban Doll és Hill szem előtt tartották például azt az irányelvet, hogy a kontroll-, és a hatásnak kitett csoportnak a hatáson kívül érdemes teljesen egyformának lennie, különben nem fogjuk tudni, mi okozza az eltérést a kimenetelben. Ez például egy fantasztikus táblázat arról, hogy hogyan alakultak az illesztett mintájuk számai (amikor is nem, életkori sáv, társadalmi osztály, és lakóhely szerint is igyekeztek a beteg és nem beteg mintát illeszteni, hogy valóban csak a betegség ténye különböztesse meg egyik csoportot a másiktól):

Ugyanakkor a 2000-es eredeti, a British Medical Journal-ban megjelent kutatásban kizárólag férfiak egészségét és dohányzási szokásait vetették össze; ezen belül kizárólag férfi orvosokét. Az akkori eredmény szerint egyetlen szál cigaretta elszívása 11 perccel rövidíti meg az életet – és a másik félmondat, amit akkoriban a média már nem jelentetett meg – hogy ez a kijelentés csak akkor igaz, ha az ember Nagy Britanniában él, férfi, és orvos.

Egy adott mintából mindig csak arra a populációra következtethetünk vissza, amiből a mintát vettük! Ha ezt nem tartjuk szem előtt, az úgynevezett lefedettségi hibát követjük el – mert nem látjuk a teljes populációt, mégis arra vonatkozóan teszünk becsléseket. A 2000-es kutatás eredményei csak a dohányzásnak a férfiakra gyakorolt hatásairól mondanak el valamit.

Az új kutatás egyébként a férfiakra vonatkozó számokat is korrigálta az újabb adatok alapján. Egyéb, potenciális összemosó változókra való kontrollálás után (társadalmi-gazdasági státusz, testmozgás) úgy becsülték, a férfiak életét átlagosan 17-; míg a nőkét 22 perccel rövidíti meg egyetlen szál cigaretta elszívása.

A tanulság tehát az, hogy akármihez is készítünk statisztikát (legyen ez publikáció, poszter, szakdolgozat), ne felejtsük el, hogy a következtetéseink csak arra a populációra lesznek kivetíthetőek, amelyből a minta származik!


Források:

Ennyi időt rabol el az életéből egyetlen szál cigaretta

Just One Cigarette Could Shorten A Smoker’s Life By 20 Minutes

The price of a cigarette: 20 minutes of life?

Mortality in relation to smoking: 40 years’ observations on male British doctors

Köszönjük WordPress & A sablon szerzője: Anders Norén