oktatás, elemzés, kutatástervezés

Címke: statisztika

Rövid, de hasznos – regressziós egyenes egyenletének kiíratása egyszerűen excelben

Mi a mediáció?

Az összemosó változókhoz szorosan kapcsolódó téma következik!

A mediációs elemzés hasznos lehet, amikor egy, két változó kapcsolatát vizsgáló, egyszerű modellt kiegészítve egy harmadik változó hatását szeretnénk igazolni. A mediátor változó olyan változó, ami kapcsolatot képez a független, és a függő változó között; valahogy így:

Egyrészt a független változó hatással van a függőre – ez természetes, ez az alapállás egy elemzésben; például az edzés mennyisége hatással van a sprintelés sebességére. Ugyanakkor a test magnézium-ellátottsága, mint mediáló változó, szintén hat a sebességre (minél kevesebb a magnézium, annál rosszabb a teljesítmény); és amitől a magnézium mediátor lesz, az nem más, minthogy az edzés elfogyasztja a szervezetből. Így tehát az edzés közvetetten (a magnéziumszint csökkentésén keresztül) IS hat a sebességre – ezért ha nem vesszük figyelembe egy elemzés során, nem fogjuk a teljes képet látni.

Egy másik példa lehet a következő hármas: matematikai képességek, és a matekszakon továbbtanulás iránti érdeklődés, mint független és függő változók – természetesnek vehetjük, hogy aki jobb matekból, azt jobban érdekli a matek-témájú továbbtanulás. És persze a harmadik változó, a példában a matekkal kapcsolatos önbizalom; ami közvetetten, a matekhoz való tehetség közvetlen hatása mellett, hat arra, vannak -e valakinek matek szakra továbbtanulási szándékai:

Az ábrán látható (a kis csillagok jelzik), hogy a közvetett és a közvetlen hatások is szignifikánsak; vagyis a matekos önbizalom általánosságban véve is (nem csak abban a mintában, amit éppen vizsgálunk) hat a továbbtanulási szándékra.

Mediációs elemzést SPSS-ben is végezhetünk, csak telepíteni kell hozzá az úgynevezett PROCESS makrót.

Összességében tehát ha túl akarunk lépni a gyakran félrevezető kétváltozós elemzéseken, érdemes a mediációs vizsgálatot is elővenni a statisztikai módszereink közül!

Összemosó változók – bár a grafikon azt mutatja, nem a gólya hozza a gyereket

Fontos statisztikai alapvetés, hogy a kétváltozós elemzések nagyon félrevezetőek lehetnek,többek között az úgynevezett összemosó változók miatt. Az „összemosódás” egy olyan helyzet, amikor X és Y között a kapcsolat csak látszólagos, és csak azért találjuk meg egy elemzés során, mert egy harmadik változó jár együtt mindkettővel, egyszerre. Klasszikus példa a jelenségre a ráncok és az ősz hajszálak mennyiségének kapcsolata. Minél több a ránca valakinek, annál több az ősz hajszála is? Igen. Ha korrelációt futtatnánk, szoros kapcsolatot találnánk a két változó között? Minden bizonnyal. De mégsem a sok ránc okozza az ősz hajat, és nem is az ősz hajszálak magasabb aránya a több ráncot; hanem mindkettőt egy harmadik -mediátor, vagy itt specifikusabban összemosó változó- az életkor.

Itt van továbbá még a híres „gólya hozza a gyereket” sztori, tudományosan alátámasztva:

Itt az összemosó változó a falusias, vagy városias környezet; az urbanizáltság mértéke! A nagyvárosokban kevesebb a gólya, és átlagosan kevesebb gyereket vállalnak a párok. Érdemes megfigyelni, hogy a grafikon nem „hazudik”. Igaz, hogy minél több a gólya egy településen, annál magasabb a gyerekszám. Mindössze csupán két változó kapcsolatát boncolgatva ritkán látjuk a teljes képet-a világ általában komplexebb ennél.

Ezért minden, szakdolgozó tanítványomnak azt szoktam javasolni, hogy keressenek potenciális összemosó változókat egy-egy, a szakterületükön furcsának, meglepőnek számító, kétváltozós összefüggés mögött.

Nagyon apró, de nagyon hasznos tanács elemzéshez

A válaszadóknak, vagy a kísérletben résztvevőknek LEGYEN SORSZÁMUK! Sok későbbi problémától megkíméled magad, ha a sorok beazonosíthatóak akkor is, ha sokadszorra rendezed őket eltérő módon, vagy ha valakit törölsz, ésatöbbi.

Szóval, ha a platform, ahonnan letöltöd az adatbázist, nem teszi meg automatikusan, akkor nulladik lépésként adj mindenkinek egyedi sorszámot. Apróság, viszont ennek hiányában nagyon keserves helyzetek állhatnak elő elemzés közben. Ha esetleg másik adatbázist, új változókat illesztenél az eredetihez, az egyedi azonosítók elengedhetetlenek. De egyszerűen csak ha többször eltérő szempontok alapján rendezted sorba a válaszokat; és szeretnéd visszaállítani ez eredeti verziót, akkor is kelleni fog egy változó, ami mentén ezt megteheted. Sorszámot mindenkinek!

SONY DSC

Egy klasszikus elemzési hiba- az ökológiai tévkövetkeztetés

Egyszer majd végiggondolom, vajon miért egy jóóó nagy hibaforrás jutott eszembe, mint blogindító téma…addig is írok róla kicsit, mert egyrészt nagyon érdekes, másrészt elég gyakori.

Az ökológiai tévkövetkeztetés az a jelenség, amikor nem egyéni , hanem összesített adatokból vonunk le következtetést két változó kapcsolatára, feltételezvén, hogy a kapcsolat az egyének szintjén is fennáll – és ez a feltételezés maga a TÉVkövetkeztetés. Abból például, hogy azokban a kerületekben, ahol sokan keresnek a minimálbér alatt, magas a bűnözési arány, nem következik, hogy a szegényebbek gyakrabban követnek el bűncselekményeket. Lehet, hogy ez így van, de kerületenkénti megoszlások korrelációjából nem lehet erre következtetni; ugyanis nem biztos, hogy egy-egy kerületen belül UGYANAZOK keresnek keveset, mint akik bűnözők. Ezt biztonsággal csak egyedi adatokból lehetne megállapítani!

És íme egy példa arra, hogy milyen gyakori ez a tévedés: ezt a plotot egy 2022-es, népszerű, elemzéseket bemutató amerikai oldalon megjelent tanulmányból emeltem ki. A tanulmány úgy vizsgálja a szegénység és a bűnözés kapcsolatát, hogy 40 ORSZÁG megoszlási adatait veti egybe, és ebből egyénekre vonnak le következtetéseket; kimerítve ezzel az ökológiai tévkövetkeztetés fogalmát…

3 / 3 oldal

Köszönjük WordPress & A sablon szerzője: Anders Norén