Számítsd ki egy adathalmaz mintavarianciáját és populációs varianciáját online kalkulátorunkkal. Találd meg könnyedén a statisztikai szóródást. Tizedesjelként pontot használj.
Mintavariancia (s2)
Populációs variancia (σ2)
A variancia egy statisztikai mérték, amely egy adathalmaz szóródását vagy változékonyságát számszerűsíti a statisztikai átlaghoz képest. Lényegében a variancia azt mutatja, mennyire távol állnak az egyedi értékek az adathalmaz átlagától.
Egyszerűbben fogalmazva: ha egy adathalmaz minden adata nagyon hasonló egymáshoz, a variancia alacsony lesz, ami kevés szórást jelez. Ezzel szemben, ha az adatok jelentősen változnak, a variancia magas lesz, nagyobb szórást jelezve.
Két fő varianciatípus létezik, amelyeket a statisztikában használnak az adatok szóródásának mérésére: a mintavariancia és a populációs variancia. Mindegyik különböző kontextusban alkalmazható, attól függően, hogy mintával vagy teljes populációval dolgozunk.
A mintavariancia akkor számítható, ha csak a populáció egy mintájával rendelkezünk. A populáció varianciájának becslésére szolgál, és úgy számítjuk, hogy az egyes adatok és a mintaátlag közötti különbségek négyzetösszegét elosztjuk a minta adatszámánál eggyel kevesebbel (n-1). Ez a Bessel-korrekcióként ismert módosítás kijavítja a torzítást a populációs variancia becslésében.
A populációs variancia akkor számítható, ha a teljes populáció adataival rendelkezünk. Az egyes adatok és a populációátlag közötti különbségek négyzetösszegének elosztásával kapjuk a populáció teljes adatszámával (N). Ez a képlet nem igényel korrekciót, mivel minden rendelkezésre álló adaton alapul.
A variancia kiszámításához először meg kell találnod adataid statisztikai átlagát. Ezután vonj ki minden egyedi értékből a számított átlagot, emeld négyzetre az eredményt, és add össze ezeket a négyzeteket. Ha mintával dolgozol, oszd el a négyzetösszeget a teljes adatszám mínusz eggyel (n-1) a mintavariancia megszerzéséhez. Ha a teljes populációval dolgozol, oszd el a teljes adatszámmal (N) a populációs variancia megszerzéséhez.
Ahol:
Ahol:
A statisztikai átlag x úgy számítható, hogy összeadjuk a minta összes értékét és elosztjuk a teljes adatszámmal.
Ahol:
A variancia segít megérteni, mennyire konzisztensek vagy változékonyak az adatok egy halmazban. Képzeld el, hogy egy diákcsoport vizsgaeredményeit értékeled. Ha a variancia alacsony, ez azt jelenti, hogy a diákok többsége hasonló eredményt ért el, ami arra utal, hogy a vizsga mindenkinek igazságos volt. Ezzel szemben magas variancia azt jelzi, hogy az eredmények nagyon szétszórtak, ami arra utalhat, hogy egyes diákoknak sokkal nehezebb volt a vizsga, mint másoknak.
Összefoglalva, a variancia lehetővé teszi, hogy lásd, hogyan csoportosulnak az adatok az átlag körül, és mennyi a változékonyság a halmazban.