5.1.5. Valószínűségi változó, várható érték, szórás

Ebben a szakaszban a valószínűségszámítás néhány matematikailag kissé bonyolultabb, de a valószínűségen és statisztikán alapuló következtetések helyes értékeléséhez szükséges fogalmát ismertetetjük - nem törekedve matematikai egzaktságra, csupán madártávlatból.

Ha az elemi eseményeket egy-egy számmal jellemezhetjük, akkor ezt úgy mondjuk, hogy az elemi események halmazán egy valószínűségi változót értelmeztünk, és ennek értékei az egyes elemi eseményekhez tartozó értékek. Egy valószínűségi változó szemléletes értelemben voltaképpen nem más, mint egy véletlentől függő mennyiség; olyan mennyiség, amelynek számértéke valamilyen véletlen esemény kimenetelétől függ. Eddigi példáink csaknem mindegyikével kapcsolatban kézenfekvő módon értelmezhetünk valószínűségi változókat. A legegyszerűbb, ha a kockadobásnál az eredményt tekintjük egy ξ valószínűségi változó értékének. Az összes esemény, amelyről a kockadobással kapcsolatban említést tettünk, kifejezhető ennek a változónak a segítségével. Például a hármasnál nagyobb dobás az az esemény lesz, hogy ξ>3, és az eddigieknek megfelelően, ha a kockánk szabályos, állíthatjuk, hogy p(ξ>3)=1/2. Kézenfekvőnek tűnik, hogy a tízes pénzfeldobás-sorozatokban a fejek számát tekintsük egy η valószínűségi változó értékeinek.

Itt azonban a továbbiak érdekében célszerű lesz még egy kicsit bonyolítani a dolgot. Rendeljünk minden egyes dobáshoz egy ξ1, ξ2,...10 valószínűségi változót úgy, hogy mindegyiknek legyen az értéke 1, ha a megfelelő dobás fej, és 0, ha a dobás írás. Az előbb értelmezett η változó nem más, mint ezek összege, azaz η = ξ1210 A lottóhúzás eredményét nem tudjuk célszerű módon egy számmal jellemezni, hanem az tűnik kézenfekvőnek, ha öt valószínűségi változót értelmezünk: az első, a második, a harmadik, stb. húzás eredményét, vagy a legkisebb, a sorrendben második, stb. kihúzott számot. Ezek között a változók között még az sem teljesül, amit az előző tíz változónk esetében joggal feltehettünk: hogy az értékük független egymástól. (Elegendő, ha a függetlenségnek most csak a szemléletes értelmére gondolunk. A lottóhúzás változói már csak azért sem függetlenek, mert különbözőeknek kell lenniük; nem lehet ugyanazt a számot egy húzásban kétszer kihúzni. Tehát ha tudjuk az egyiknek az értékét, ez már ad valamennyi információt a többinek az értékéről. Valószínűségi változók függetlenségét pontosan definiálni a szorzási szabály általánosításával lehet, de ezzel most nem foglalkozunk.)

A vonalazott lapra ejtett pálcika esetében sem tudjuk a kísérlet kimeneteleit egy számmal jellemezni. Két változó elegendő a vizsgálathoz: az egyik lehet a középpont távolsága a legközelebbi vonaltól, a másik a hajlásszög. De ezek a változók nem csak véges sok értéket vehetnek föl, mint az előzőek, hanem értékek egy folytonos skáláját: meghatározott határok között bármely valós számot. De más, véletlen tényezőktől függő mennyiségeket is tekinthetünk valószínűségi változóknak: például egy személy hátralévő élettartamát.

Vegyünk most egy olyan kísérletet, amelynek véges sok lehetséges kimenetele van, és ezeket egy ξ valószínűségi változó értékeivel jellemezhetjük. Mi történik, ha ezt kísérletet sokszor megismételjük azonos feltételek között (azaz ha az egyes lehetséges kimeneteleknek minden ismétlésnél ugyanaz a valószínűsége)? Azt várhatjuk, hogy ξ lehetséges értékei a közelítőleg valószínűségeinek megfelelő relatív gyakorisággal fordulnak elő. Ebből pedig egyszerűen adódik, hogy ξ értékeinek átlaga (azaz az értékek összege osztva az ismétlések számával) közel lesz a ξ lehetséges értékeinek a valószínűségeikkel súlyozott közepéhez, azaz a következő, M(ξ)-vel jelölt mennyiséghez:

M(ξ)=p(ξ= x1)x1 +p(ξ= x2)x2+K+p(ξ= xn)xn

ha ξ lehetséges értékei x1, x2, ..., xn. Ezt a mennyiséget nevezzük ξ várható értékének.[specker] Kicsit kevesebb szakkifejezést használva úgy is mondhatjuk, hogy ha sokszor megfigyelünk egy véletlentől függő mennyiséget, vagy sokszor elvégzünk egy véletlentől függő, számszerű eredménnyel járó kísérletet, akkor az eredmények átlaga közelíteni fog a mennyiség várható értékéhez, azaz egyes lehetséges értékei valószínűségükkel súlyozott közepéhez. (Azért beszélünk itt súlyozott középről, mert a lehetséges különböző értékek valószínűségeinek, azaz az alkalmazott szorzótényezőknek az összege 1.) Ez az állítás semmi más, mint azon korábbi feltevésünk általánosítása, hogy egy kimenetel relatív gyakorisága a valószínűségéhez közelít. Tovább is általánosíthatnánk, elvetve azt a feltételt, hogy véges sok lehetséges kimenetel van, de ebben az esetben integrálszámításra lenne szükségünk.

A százforintos egyszeri feldobása esetén a fejek számának (tehát a fenti ξi változók bármelyikének) várható értéke 1/2. Ezzel persze nem sokat tudtunk meg, legfeljebb azt, hogy a tényleges eredmény el fog térni a várható értéktől, mégpedig 1/2-del. Van viszont egy egyszerű, gyakran alkalmazható szabály, amelynek segítségével többre is juthatunk ebből az egyszerű megállapításból: az, hogy valószínűségi változók összegének várható értéke az egyes változók várható értékének összege. Ebből már adódik, hogy a fenti η változó várható értéke 5 (amint ezt sejthettük is). Arról viszont még nem tudunk semmit, hogy sokszor elvégezve a tíz dobásból álló dobássorozatot, mennyire fog ingadozni a fejek száma ekörül a várható érték körül. Az is előfordulhat, hogy az eltérés értéke 5 lesz, tudniillik ha tízszer egymás után fejet, vagy tízszer írást dobunk, bár ennek elég kicsi a valószínűsége: nem nehéz kiszámítani, hogy a csupa fejből, és a csupa írásból álló sorozat valószínűsége is 1/1024 . Annak a valószínűsége azonban, hogy az eltérés 1 legyen, nagyobb, mint az, hogy éppen a várható eredmény, az öt fej jöjjön ki. Ugyanis az 1024=210 lehetséges sorozatból 210-210 olyan van, amelyben a fejek száma 4, illetve 6, ez összesen 420, az olyan sorozatok száma pedig, amelyekben éppen 5 fej van, csak 252. (A megfelelő valószínűségeket a klasszikus szabály szerint kaphatjuk meg.) Általában egy ξ változó eltérését a várható értékétől úgy fejezhetjük ki, mint a változó értéke és a várható érték közötti különbség abszolút értékét (képletben: ξ-M(ξ)). Ez a mennyiség maga is egy valószínűségi változó, amelynek várható értékét az eredeti változó várható eltérésének nevezzük. (A fenti η várható eltérése (1260/1024)≈1,23). Ha feljegyezzük a változó egyes kísérletek során megfigyelt értékeinek a várható értéktől való eltérését (előjel nélkül számolva), és a kapott értékek számtani közepét vesszük, akkor az (nagy valószínűséggel) a várható eltérést fogja közelíteni. A gyakorlatban azonban nem a várható eltérést szokták használni egy valószínűségi változó ingadozásának jellemzésére, hanem egy matematikailag könnyebben kezelhető és ráadásul érzékenyebb mércét, az úgynevezett szórást. A szórás nem az abszolút értékben vett eltérések számtani, hanem a négyzetes közepének a (valószínű) határértéke. Úgy fejezhetjük ki, mint az eltérés négyzete várható értékének négyzetgyökét, azaz ha a ξ változó szórását σ(ξ)-vel jelöljük,