Ugye van az a híres Churchill idézet, amit mindenki szeret emlegetni, ha egy statisztikai elemzés nem tetszik neki. A jelenség oka egyszerű: jó statisztikát csinálni nehéz, bármilyet meg könnyű.
Először is, tisztázzuk a fogalmat. A statisztika lényege, hogy szeretnénk megsaccolni egy közvetlenül nem megmérhető dolgot úgy, hogy sok következményét ismerjük. Például a közvélemény-kutatók arra kíváncsiak, hogy az országban az emberek egy kérdésre milyen választ adnak. A pontos válaszért mindenkit meg kéne kérdezni, ami nehéz, lassú és drága, ezért csak viszonylag ritkán, népszámlálásonként van rá mód. Ehelyett kevesebb embert kérdeznek meg, és azt mondják, hogy az így kapott eredmény körülbelül igaz mindenkire. Ha csak eddig lenne a történet, akkor nem jönne ki a lépés: ugyanezt akkor is mondhatjuk, ha csak egyvalakit kérdeznénk meg, sőt, egyszerűen a saját véleményünket mondanánk: én így gondolom, és egy vagyok a sokból, körülbelül mindenki így gondolja és kész.
A jó statisztika rendelkezik azzal a tulajdonsággal, hogy pontosan meg lehet róla mondani, hogy mekkora valószínűséggel igaz. Ezt konfidenciának hívják. A közvélemény-kutató a jó statisztikája mellé mindig odaírja, hogy mekkora intervallumban van benne mekkora eséllyel a valódi eredmény. Pl 1000 ember megkérdezésekor 95% eséllyel a kapott eredmény +- 3% tartományban van egy válasz aránya. Tehát van 5% esély, hogy ezen kívül esik. És ezt a jó statisztika bevallja. Itt lehet megnézni, hogy tényleg annyi-e.
Van egy másik fontos ismérve a jó statisztikának: azt méri, amire aztán a következményét is megfogalmazza. Ez talán a legnehezebb. Egy példa: ha megkérdezik sok embertől, hogy mennyire boldog, akkor a válaszokból az fog kiderülni, hogy mit válaszolnak az emberek arra a kérdésre, hogy mennyire boldogok. Ez (érdekes módon nagyon) nem esik egybe azzal, amire vélhetően kíváncsiak voltunk. És nem azért, mert mindenki hazudik, hanem mert ez így, direktben megkérdezve nem mérhető. Egy másik példa a átlagos jövedelem. Ez nem az átlagember jövedelme (azt mediánnak hívják, és sajnos alacsonyabb) Az átlagjövedelmet sokféleképpen lehet kiszámolni, és mindig mást jelent, lehet pl. a teljes bérkifizetésből származó adóból számolni, visszaosztani a népességre, akkor az "a legális jövedelem egy főre", aminek nem sok köze van ahhoz, amit az emberek keresnek. Esetleg két ország összehasonlítására lehet jó.
Rossz statisztikára sajnos sok a példa. A reklámok hemzsegnek a (vélhetően hasból felírt) százalékoktól, amik általában nem is mérhetőek. Ott van a szociális népszavazás, amiről eleve tudni lehetett, hogy a kérdések szövege mellékes, senki sem arra a kérdésre válaszolt, ami le volt írva, hanem hogy elmenjen-e a rákba a kormány. Tetszőleges reklámanyag, legyen az piaci vagy politikai, ha tartalmaz statisztikát, szórakoztató játék megkeresni benne a "hibát".
Ajánlott bejegyzések:
A bejegyzés trackback címe:
Kommentek:
A hozzászólások a vonatkozó jogszabályok értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a Felhasználási feltételekben és az adatvédelmi tájékoztatóban.
Bálintínusz2 2009.02.09. 14:28:59