Mivel rendszeresen kapok kérdéseket, kommenteket statisztikai adatokkal kapcsolatban, mint pl. átlagéletkor, átlagjövedelem, várható életkor, stb. és sokszor kiderül, hogy ezek értelmezésébe vagy megfelelő használatába hiba csúszik, arra gondoltam, hogy röviden adok egy áttekintést az alap statisztikai adatok és számítások értelmezéséhez.
Remélem nem rettentél el a bevezetéstől, mert nagyonis életszagú dolgokról fogok írni. Nem garantálom, hogy ennek a posztnak az elolvasása után mindent meg fogsz érteni, de kiindulási alapnak jó, és érdemes lesz időnként visszanézni, mert folyamatosan fogom frissíteni/bővíteni az írást.
Szinte minden egyes nyugdíjjal kapcsolatos írás alatt megjelennek az „úgysem fogom megérni” típusú kommentek, mondván, az átlag életkor mennyire alacsony. De félreértéseket okoz az is, hogy a KSH negyedévente közzéteszi az átlagjövedelmet, aminek az emelkedését sokan nem érzik saját bőrükön. Statisztika az is, hogy mennyien születnek és halnak meg egy adott hónapban/évben, ebből milyen következtetéseket lehet levonni (politikusok kedvenc manipulációs játéktere), sőt az átlagos hitel nagyság, az egy főre eső GDP vagy az öngyilkossági arányok mind statisztikai adatok. De az egyes árfolyamok technikai elemzéseinél is használhatunk statisztikai adatokat, mint. pl. a különböző időtávú mozgóátlagokat. Sajnos sokan csak az átlagolást értik valamennyire, pedig ennél jóval többről van szó, már-már élvezetes szakterület a statisztika.
Nézzük sorjában a főbb alap mutatószámokat
Számtani átlag
A legegyszerűbben és talán ezért a legszélesebb körben használható mutatószám. Pl. az említett átlagéletkor meghatározásához használják.
Képlet: átlag = egyedi értékek összege / egyedi értékek darabszáma
Pl. az Ződség Bt. zöldségesnél 4 féle paradicsom kapható: 200, 350, 400 és 700 Ft-os. Mennyi a paradicsom átlagára a Ződség Bt-nél? (200+350+400+700) / 4= 412,5 Ft
DE! A korábban említett nyugdíj pesszimizmust nem alapozza meg az átlagéletkor, mert az a jelenleg életben lévő emberek életkorának átlagát jelenti és NEM egyenlő a várható élettartammal. Tehát élnek pár hónapos csecsemők, de 90 év felettiek is. Ha mindenkinek az korát összeadjuk és elosztjuk az összes ember „darabszámával”, akkor megkapjuk az átlagot. Tehát ha hazánkban él 10M ember, és az éveik számának összege (még egyszer az 1 évesnél 1, a 100 évesnél 100) 450M, akkor az átlag életkor 450/10 = 45 év. Ennyi jelenleg nagyjából a budapesti nők átlagéletkora. De mint láthatod, ez önmagában nem jelent semmit pl. a nyugdíjprobléma feltárásánál, de hasznos kiindulópont a társadalom elöregedésének megállapításához.
Súlyozott számtani átlag
Ennek akkor van értelme, ha sok adattal dolgozunk és sávokat határozunk meg, így csoportosítva az adatokat. Pl. átlagéletkort úgy számolunk, hogy meghatározzuk a 0-10, 11-20, 21-30 …. életkor sávokat. Ekkor úgy átlagolunk, hogy az egyes sávok közepét (5, 15, 25, ….) megszorozzuk a sávokba tartozó emberek számával és ezt osztjuk az összes darabszámmal.
Példa: 0-10 évesig 1M, 11-20 évesig 800e, 21-30 évesig 1,2M, 31-40 évesig 2M, 41-50 évesig 1M, 51-60 évesig 2M, 61-70 évesig 1,5M, 71 évestől 0,5M. Összesen 10M fő. Minden sávközepet megszorzunk a darabszámmal, tehát 5*1M+15*0,8M+25*1,2M+35*2M+45*1M+55*2M+65*1,5M+75*0,5M = 407M, majd osztjuk 10M-val. Így 40,7 év jön ki eredményként. Nyilván nem annyira pontos, mint az átlag lenne, de ha sok az egyedi adatunk, akkor jó közelítő eredményt kaphatunk. Egyébként pont ennyi a budapesti fériak átlagéletkora.
És akkor nézzük, hogy lehet ezzel trükközni? Elvégre Mo-on vagynk. J A sávok felvétele remek lehetőségeket rejt. Nézzünk egy példát átlagjövedelem meghatáozására. tegyük fel, hogy 5M jövedelemmel rendelkező ember átlagjövedelmére vagyunk kíváncsiak:
- A jövedelmi sávokat így határozzuk meg: 0-150ezer Ft: 2M fő; 150-250: 2M fő, 250-:1M
A sávközepek: 100, 200, 300e Ft. Össz. átlag: (2M*100+2M*200+ 1M*300) / 5M = 180e Ft.
- De meghatározhatjuk a sávokat ugyanannál a sokaságnál így is: 0-100ezer: 1,5M, 100-200: 2M, 200-300:1M, 300-: 0,5M
Ekkor a sávközepek: 50, 150, 250, 350. Össz. átlag: (1,5M*50+2M*150+1M*250+0,5M*350) = 160e Ft.
Tehát ugyanannak a sokaságnak más sávokkal dolgozva 20ezer Ft-tal különbözik az átlagjövedelme.
Várható érték
Ez egy adott érték, ami múltbeli statisztikai adatokból és azok trendjéből állapít meg, jelez előre jövőbeli értékeket. Vagy véletlenszerű események esetében a valószínűségszámítás eszközeit hívja segítségül. Ezeket aztán korrigálhatja szezonális (pl. nyáron várhatóan több ásványvíz fogy) vagy ciklikus hatásokkal (pl. ismert a gazdaság ciklikussága), sőt egyedi hatásokkal is (pl. a Ratkó gyerekek 20-25 éves korukat elérve várható volt a születésszám megugrása) stb., de mi most maradjunk az alapoknál.
Tehát példánknál maradva az átlagéletkortól jelentősen eltérő a születéskor várható élettartam, amit minden évben meghatároz a KSH. Ez a mutató azt jelenti, hogy az adott évben született csecsemők várhatóan meddig fognak élni. Ettől különbözik az egyes életkorokban várható élettartam. Ennek az az oka, hogy kiveszi a statisztikából a fiatalabb életkorban elhalálozottakat. Így lehetséges az, hogy a születéskor még csak 74 éves élettartam várható, de 65 éves korban – a nyugdíjkorhatár elérésekor – már további 16-18 évet fogunk élni. Hogy még életszerűbb legyen: ha a veszélyeztetett 45-55 éves kort túléled, akkor jó eséllyel sokáig fogsz élni.
Fentiekből következik, hogy mindenkire az adott évben meghatározott várható élettartam vonatkozik, és míg a ma 17 éves budapesti férfiak várható élettartama 69,28 év, addig a tavaly születetteké már 74,27 év. Az egyéves lányoké pedig több mint 80 év.
Tehát van egy „rossz” hírem: meg fogjuk érni a nyugdíjas kort.
Medián
Ez röviden a középértéket jelenti. Tehát ha a Magyarországon élő összes embert évszámaik szerint sorba állítanánk, akkor a középen lévőt kiválasztva ő lenne a medián. Ez természetesen megegyezhet az átlaggal is, de ha az ún. eloszlás nem szimmetrikus, akkor az átlagtól teljesen eltérő mediánt is kaphatunk. Ez talán érthetőbb a jövedelmek számolásánál. Hiába húzza ugyanis fel a néhány száz kiemelkedő jövedelmű az átlagot, a medián ettől még nem emelkedik. Viszont a szórás igen (erről később).
Módusz
Leggyakoribb érték. Ez az az érték, amely a leggyakrabban fordul elő a statisztikai sokaságban, tehát a leggyakoribb kor, jövedelem, stb. Ha jövedelmi sávokat határozunk meg, akkor módusz lehet az a sáv, amelybe a legtöbben tartoznak (pl. a 150-200e Ft jövedelemmel rendelkezők). Ez nyilván sokkal hasznosabb a jövedelmek statisztikáinál társadalmi szempontból, mint az átlagjövedelem.
Szórás
Ha nagyon leegyszerűsíteném, akkor a szórás az a szám, amellyel átlagosan eltérnek az átlagtól az egyes értékek. Ha megint a jövedelmeket nézzük, akkor az átlagjövedelemtől való eltéréseket mutatja meg, népszerűbben a jövedelmi olló nyílásának nagyságát, mely az átlagtól felfelé és lefelé eltérő jövedelműek anyagi helyzetéről ad információt. Nyilvánvaló, hogy minél kisebb a szórás, annál több értelme van az átlagjövedelemről beszélni.
A számításnál először átlagot nézünk, majd utána átlagos négyzetes eltérést – bocs, de így nevezik, amikor az átlag és az adott pontos érték különbségét négyzetre emeljük és összegezzük, így egyúttal az előjelektől is megszabadulunk – majd az egész gyökét vesszük.
Példa:
Maradjunk az előző átlagjövedelmes példánál, amikor súlyozott átlaggal számoltunk.
- Tehát az átlag 180. Sávközepek 100, 200 és 300. Darabszámok 2, 2, ill. 1M fő.
Átl. négyzetes eltérés: (2M*(180-100)^2+2M*(200-180)^2+1M*(300-180)^2) / 5M= (2M*6400 + 2M*400 + 1M*14400) / 5M = (12800+800+14400) / 5 = 28000 / 5 = 5600, ebből a szórás = 74,83. Tehát átlagosan ennyivel tér el a jövedelem a 180ezres átlagtól.
Ezután a relatív szórást számoljuk ki, amit az átlag és a szórás aránya határoz meg (0 és 1 közötti szám lehet), tehát 74,83/180 = 0,41 (41%, ami elég magas). És akkor az értelmezés: 30% feletti relatív szórásra azt mondjuk, hogy olyan magas, hogy az átlag nem alkalmas a sokaság jellemzésére. Így érthető, hogy pusztán az átlagjövedelmek értelmezésénél miért jelenhetnek meg lelki szemeink előtt kérdőjelek…
Mindennek mi a haszna? Elsősorban az, hogy értelmezni tudj alap szinten egy statisztikai elemzést, hírt, ne dőlj be elnagyolt kutatásoknak, nézz a dolgok mögé és próbáld helyesen értelmezni.
Az is a célom, hogy az itt a blogon megjelenő írásaim megértésében segítsen. Kérdés esetén írj bátran vagy kommentelj alul!