Statisztikai tanulmányaink során jellemzően olyankor kerülnek szóba a mérési szintek, amikor még nem nagyon tudjuk mihez kötni őket. Nem segíti a megértési folyamatot az sem, hogy a skálák mérési szintjei azután összemosódnak a változók típusaival; és ez nem is csoda, hiszen a gyakorlatban inkább a változókkal dolgozunk, tehát ezekkel sokkal gyakrabban találkozunk. Sőt, a skálák mérési szintjeinek elnevezéseit gyakran változókategóriákként is használjuk…Mindehhez jön még az a jelenség, miszerint a változók többféleképpen is csoportosíthatók – és így válik teljessé a káosz.

Ha ebben a káoszban rendet nem is tudok tenni, azért az eligazodásban próbálok segíteni.

A mérési szintek tulajdonképpen azt jelenítik meg, hogy egy-egy adat milyen módon alakítható matematikává. A nominális szintű adatok például sehogy; ezért is nominális, azaz névleges ennek a kategóriának a neve, mert a számok, amiket az adatokhoz rendelünk, egyáltalán semmiféle matematikai jelentéssel nem bírnak. Klasszikusan például 1-es jelöli a férfiakat, 2-es a nőket; de ezeket a számértékeket nincs értelme kivonni egymásból, sem összeszorozni, ésatöbbi. Csak címkék; ennélfogva elvben felcserélhetőek más címkékre; jelölhetné mondjuk 83 a férfiakat, és 243 a nőket, mivel ezekkel az értékekkel úgysincs értelme számolni. Ugyanígy lehetne például arról gondolkodni, hogy kinek milyen háziállata van. Lehetne 1-es a kutya, 2-es a macska, és 3-as az egyéb; de a kategóriákat számozhatnánk teljesen máshogy is; legfeljebb ahhoz lenne érdemes ragaszkodni, hogy az „egyéb” kategória, mint afféle „maradék”, legyen a legutolsó számérték.

Ezzel szemben mondjuk a településkategóriákat (főváros, megyeszékhely, város, község, egyéb) nagyon furcsa lenne nem a nagyságrendjüket lekövető számokkal jelölni. Ugyanez igaz a végzettségi szintekre. Elviekben jelölhetné 4-es az általános iskolát, mint legmagasabb végzettséget, és például 2-es a mesterképzést, 1-es pedig az érettségit; de ebben az esetben nem használnánk ki a mérendő értékek közötti természetes sorrendet. Ha tehát létezik egy ilyen természetes sorrend abban az adatban, amit számszerűsíteni akarunk, érdemes ordinális, azaz sorrendi skálát használni a mérésére. Így a kategóriák jelölésére használt számok, bár továbbra sem összeadhatóak, legalább az egymásutániságot megfelelően jelölik; további példa lehet erre a típusú adatra egy úszóversenyen résztvevők beérkezési sorrendje; vagy az egymást követő időszakok beszámozása egy idősoros elemzésnél.

A következő mérési szint az intervallumskála. Ezt olyan jellegű adatok számszerűsítésére használjuk, amelyek már rendelkeznek azzal a tulajdonsággal, hogy az általuk felvehető értékek között mindig azonos a távolság. (Szemben az előző, ordinális skálával, ahol az úszóverseny első és második helyezettének ideje között egyáltalán nem biztos, hogy ugyanakkora az eltérés, mint a második és a harmadik helyezett között; ott tehát az 1-2, és a 2-3 közötti „lépéshossz” nem azonos). Az intervallumskálán, éppen mivel már azonosak az osztásközei, az összeadás és a kivonás is értelmes eredményre vezet. Klasszikusan ezzel a mérési szinttel mér a hőmérő. Nagyon is van értelme azt mondani, hogy mivel ma 18 fok van, tegnap pedig 9 volt, ma 9 fokkal melegebb van, mint tegnap. Ugyanakkor a két érték osztással való összehasonlítása, ami arra az eredményre vezetne, hogy ma kétszer olyan meleg van, mint tegnap volt, megint csak nem értelmes fogalmilag, holott matematikailag nyilván tényleg kettőt kapunk, ha a 18-at 9-cel elosztjuk. Ha szeretnénk a szorzást és az osztást is értelmessé tenni a mérés során, akkor olyan skálát kell használnunk, aminek létezik úgynevezett abszolút nulla pontja.

Emlékszem, amikor én tanultam először a mérési szintekről, ezt az abszolút nulla dolgot egyáltalán nem értettem. Ha van egy abszolút nullánk, akkor már arányskáláról beszélünk; ami a nevében is mutatja, hogy ezen a mérési szinten már oszthatunk és szorozhatunk is. Így kell mérnünk például a testmagasságot. Mondhatjuk, hogy egy 160 cm magas ember 80 centiméterrel magasabb egy 80 cm magas gyereknél; de már azt is, hogy a 160 cm magas kétszer olyan magas, mint aki 80 cm. Tehát ami matematikailag nem működik a Celsius-skálán, az működik a testmagasságnál – és a két verzió között az abszolút nulla a különbség; ez pedig nem jelent mást, minthogy olyan skálával dolgozunk, aminél a 0, mint felvett érték lehetetlen; másképpen fogalmazva az a dolog, amihez a skálán 0 érték tartozna, az nem létezik. 0 fok, mint hőmérséklet- igen, ilyen van. 0 cm magas ember nem létezik, mint ahogy 0 kg tömegű ember sem. Abban azonban megegyezik az intervallum- és az arányskála, hogy mindkettő azonos osztásközökkel rendelkezik; a gyakorlati elemzési munka során nem is nagyon teszünk különbséget a kettő között.

Az eddig sorra vett mérési szinteket mind használhatjuk egy-egy változó típusának megnevezéseként is. Tehát például a jövedelmet arányskálán mérjük (ez a mérés eszköze), és maga a jövedelem egy skála-típusú változó. A lóverseny befutójának sorrendjét ordinális-, azaz sorrendi skálán mérjük; és a változó, amivel dolgozunk, ordinális típusú. A családi állapotot nominális skálán mérjük; így a családi állapot egy nominális típusú változó.

Ha ez eddig követhető volt, akkor még egy kicsit tovább oszlatjuk majd a zavart a következő bejegyzésben, ami arról fog szólni, hogy a változóknak milyen egyéb csoportosítási lehetőségei vannak.