Számítsd ki egy adathalmaz mintaszórását és populációs szórását ezzel az online kalkulátorral. Találd meg a statisztikai szóródást. Tizedesjelként pontot használj.
Mintaszórás (s)
Populációs szórás (σ)
A szórás egy statisztikai mérték, amely egy adathalmaz szóródását vagy változékonyságát számszerűsíti a statisztikai átlaghoz képest. Lényegében a szórás azt mutatja, mennyire távol állnak az egyedi értékek az adathalmaz átlagától.
Egyszerűbben fogalmazva: ha egy adathalmaz minden adata nagyon hasonló egymáshoz, a szórás alacsony lesz, ami kevés szórást jelez. Ezzel szemben, ha az adatok jelentősen változnak, a szórás magas lesz, nagyobb szórást jelezve.
Két fő szórástípus létezik, amelyeket a statisztikában használnak az adatok szóródásának mérésére: a mintaszórás és a populációs szórás. Mindegyik különböző kontextusban alkalmazható, attól függően, hogy mintával vagy teljes populációval dolgozunk.
A mintaszórást akkor használjuk, ha adatmintával rendelkezünk a teljes populáció helyett. A mintavariancia négyzetgyökének vételével számítjuk, amelyet úgy kapunk, hogy az egyes adatok és a mintaátlag közötti különbségek négyzetösszegét elosztjuk a minta adatszámánál eggyel kevesebbel (n-1). Ez a Bessel-korrekcióként ismert módosítás segít pontosabb becslést adni a populációs szórásról mintából.
A populációs szórást akkor használjuk, ha a teljes populáció adataival rendelkezünk. A populációs variancia négyzetgyökének vételével számítjuk, amelyet úgy kapunk, hogy az egyes adatok és a populációátlag közötti különbségek négyzetösszegét elosztjuk a populáció teljes adatszámával (N). Ez a képlet pontos mértéket ad a szóródásra a teljes populáció kontextusában további módosítások nélkül.
A szórás kiszámításához először meg kell találnod adataid statisztikai átlagát. Ezután vonj ki minden egyedi értékből a számított átlagot, emeld négyzetre az eredményt, és add össze ezeket a négyzeteket. Ha mintával dolgozol, oszd el a négyzetösszeget a teljes adatszám mínusz eggyel (n-1) a mintavariancia megszerzéséhez. Ha a teljes populációval dolgozol, oszd el a teljes adatszámmal (N) a populációs variancia megszerzéséhez. Végül vedd a variancia négyzetgyökét a szórás megszerzéséhez.
Ahol:
Ahol:
A statisztikai átlag x úgy számítható, hogy összeadjuk a minta összes értékét és elosztjuk a teljes adatszámmal.
Ahol:
A szórás és a variancia közötti fő különbség abban rejlik, hogyan mérik az adatok szóródását. A variancia a szórást úgy számszerűsíti, hogy kiszámítja az egyes adatok és az átlag közötti különbségek négyzetének átlagát, ami négyzetes egységekben mért eredményt ad. Ezzel szemben a szórás a variancia négyzetgyöke, visszaadva a szórás mértékét az eredeti adatokkal azonos egységekbe.