オンライン計算機でデータセットの標本分散と母分散を計算します。統計的なばらつきを簡単に求められます。小数点にはピリオドを使用してください。
標本分散 (s2)
母分散 (σ2)
分散は、データの集合が平均値に対してどの程度ばらついているかを定量化する統計指標です。本質的に、分散は個々の値がデータセットの平均からどれだけ離れているかを示します。
より簡単に言えば、データセット内のすべてのデータが互いに非常に似ている場合、分散は低くなり、ばらつきが少ないことを示します。逆に、データが大きく変動する場合、分散は高くなり、ばらつきが大きいことを示します。
統計でデータのばらつきを測定するために使用される分散には、主に2つの種類があります:標本分散と母分散です。それぞれ、標本を扱っているか母集団全体を扱っているかによって、異なる文脈で適用されます。
標本分散は、母集団の一部の標本のみが利用可能な場合に計算されます。母分散を推定するために使用され、各データと標本平均との差の二乗の合計を標本のデータ数マイナス1(n-1)で割ることで計算されます。ベッセルの補正として知られるこの調整は、母分散の推定におけるバイアスを補正します。
母分散は、母集団全体のデータがある場合に計算されます。各データと母平均との差の二乗の合計を母集団のデータ総数(N)で割ることで求められます。すべての利用可能なデータに基づいているため、この公式は補正を必要としません。
分散を計算するには、まずデータの平均値を求める必要があります。次に、各個別の値から計算した平均を引き、結果を二乗し、これらの二乗を合計します。標本を扱っている場合は、二乗の合計をデータ総数マイナス1(n-1)で割って標本分散を求めます。母集団全体を扱っている場合は、データ総数(N)で割って母分散を求めます。
ここで:
ここで:
平均値 x は、標本のすべての値を合計し、データの総数で割ることで計算されます。
ここで:
分散は、データセット内のデータがどの程度一貫しているか、またはどの程度ばらついているかを理解するのに役立ちます。例えば、試験における学生グループの成績を評価しているとしましょう。分散が低い場合、ほとんどの学生が似た成績を取ったことを意味し、試験が全員にとって公平であったことを示唆します。一方、分散が高い場合、成績が大きくばらついていることを示し、一部の学生にとって試験がはるかに難しかったことを示唆する可能性があります。
まとめると、分散はデータが平均の周りにどのように集まっているか、またデータセット内のばらつきが大きいか小さいかを確認することができます。