oktatás, elemzés, kutatástervezés

Hónap: 2023 március

Nagyon apró, de nagyon hasznos tanács elemzéshez

A válaszadóknak, vagy a kísérletben résztvevőknek LEGYEN SORSZÁMUK! Sok későbbi problémától megkíméled magad, ha a sorok beazonosíthatóak akkor is, ha sokadszorra rendezed őket eltérő módon, vagy ha valakit törölsz, ésatöbbi.

Szóval, ha a platform, ahonnan letöltöd az adatbázist, nem teszi meg automatikusan, akkor nulladik lépésként adj mindenkinek egyedi sorszámot. Apróság, viszont ennek hiányában nagyon keserves helyzetek állhatnak elő elemzés közben. Ha esetleg másik adatbázist, új változókat illesztenél az eredetihez, az egyedi azonosítók elengedhetetlenek. De egyszerűen csak ha többször eltérő szempontok alapján rendezted sorba a válaszokat; és szeretnéd visszaállítani ez eredeti verziót, akkor is kelleni fog egy változó, ami mentén ezt megteheted. Sorszámot mindenkinek!

SONY DSC

Egy klasszikus elemzési hiba- az ökológiai tévkövetkeztetés

Egyszer majd végiggondolom, vajon miért egy jóóó nagy hibaforrás jutott eszembe, mint blogindító téma…addig is írok róla kicsit, mert egyrészt nagyon érdekes, másrészt elég gyakori.

Az ökológiai tévkövetkeztetés az a jelenség, amikor nem egyéni , hanem összesített adatokból vonunk le következtetést két változó kapcsolatára, feltételezvén, hogy a kapcsolat az egyének szintjén is fennáll – és ez a feltételezés maga a TÉVkövetkeztetés. Abból például, hogy azokban a kerületekben, ahol sokan keresnek a minimálbér alatt, magas a bűnözési arány, nem következik, hogy a szegényebbek gyakrabban követnek el bűncselekményeket. Lehet, hogy ez így van, de kerületenkénti megoszlások korrelációjából nem lehet erre következtetni; ugyanis nem biztos, hogy egy-egy kerületen belül UGYANAZOK keresnek keveset, mint akik bűnözők. Ezt biztonsággal csak egyedi adatokból lehetne megállapítani!

És íme egy példa arra, hogy milyen gyakori ez a tévedés: ezt a plotot egy 2022-es, népszerű, elemzéseket bemutató amerikai oldalon megjelent tanulmányból emeltem ki. A tanulmány úgy vizsgálja a szegénység és a bűnözés kapcsolatát, hogy 40 ORSZÁG megoszlási adatait veti egybe, és ebből egyénekre vonnak le következtetéseket; kimerítve ezzel az ökológiai tévkövetkeztetés fogalmát…

A statisztika izgalmas – ezért szeretem, és ezért tudok neked segíteni benne

Egy statisztikai elemzés éppen olyan, mint egy nyomozás. A folyamat közben ugyanaz a célunk, mint Sherlocknak, vagy akármelyik skandináv nyomozónak: összegyűjteni minél több információt; kiválogatni közülük a lényegeseket (és gondosan kiszűrni azokat, amik félrevezethetnek), végül levonni a következtetést – bár az elemzés során jellemzően nem a gyilkosról, hanem esetleg egy összemosó változóról, vagy a változók között létező összefüggésekről.

…statisztikai következtetések segítségével lehet többek között lerántani a leplet Mendelről (emlékszel rá és a borsós kísérleteire biológia óráról?) aki, bár kétségkívül valós és jelentős összefüggésekre bukkant, valamilyen okból erősen szépített az eredményein…Mendel és az ő hamisított kutatási eredményei

A statisztika révén tudunk új információkat szerezni a világról; és ha nem állna rendelkezésünkre ez a módszer, nem létezhetne modern tudomány – így gyakorlatilag semmi, ami a minket most körülvevő világot alkotja.

…például gondos adatgyűjtés és következtetések nyomán sikerült Semmelweisnek rájönnie, hogy a gyermekágyi lázat a szülés előtt boncolást végző orvosok fertőzött keze okozza…az anyák megmentője

És ha mindezzel nem győztelek meg, semmi gond: tulajdonképpen elég, ha kettőnk közül csak én vagyok oda a statisztikáért.  Írj nekem, ha segíthetek; vagy foglalj hozzám időpontot, hogy ne fájjon a fejed a statisztika miatt!

Köszönjük WordPress & A sablon szerzője: Anders Norén