度数分布表とは?基本概念と重要性
データ分析の第一歩として、データの全体像を把握することは非常に重要です。度数分布表(tabela de frequência)は、集めたデータを整理し、各値やカテゴリがどれだけの頻度で出現するかを一覧できる統計の基本ツールです。この表を用いることで、大量のデータの中から傾向や偏りを読み取りやすくなり、分析の基盤が整います。例えば、学校のテストの点数をそのまま並べただけでは、どの点数帯に生徒が集中しているのか分かりにくいですが、度数分布表に変換すれば分布の特徴が一目で分かります。また、度数分布表はヒストグラムや度数分布多角形といったグラフ表現の元データとしても活用され、統計学の入口として欠かせない存在です。本記事では、度数分布表の作り方から見方までを、具体例を交えながらわかりやすく解説します。
度数分布表の構成要素を知る
度数分布表にはいくつかの重要な要素があります。まず最も基本的なのが絶対度数です。絶対度数は、各データの値や区間が出現した回数をそのまま表した数値です。例えば、あるクラスの数学テストで80点を取った生徒が5人いる場合、80点の絶対度数は5となります。次に相対度数は、絶対度数をデータの総数で割った値で、比率や百分率で表現されます。相対度数を用いると、データ全体に対する各値の割合を比較しやすくなります。累積度数は、データの小さい方から順に度数を積み上げた値で、ある値以下のデータが全体のどれくらいを占めるかを知ることができます。連続量のデータを扱う場合には、データを範囲ごとに区切った階級を用います。階級の幅はデータのばらつきに応じて適切に設定する必要があり、この設定が分析結果に大きく影響します。

度数分布表の作り方:ステップを追って解説
実際に度数分布表を作成する手順は以下の通りです。まずデータを収集し、そのデータの中で重複する値を確認します。次に、値を大きさの順に並べ替えて、どの値が存在するかをリストアップします。その後、各値がデータの中に何回出現するかを数え上げ、絶対度数を記録します。必要に応じて相対度数や累積度数を計算し、表にまとめます。連続データの場合は、適切な階級幅を決めて度数を集計します。
具体的な作成手順を箇条書きで示します。

- データを収集し、記録する。
- データを小さい順またはカテゴリ順に並べる。
- 各値または各階級の出現回数を数え、絶対度数を求める。
- 絶対度数を総数で割り、相対度数を計算する。
- 必要に応じて累積度数を計算する。
- 見やすい形式で表にまとめ、項目名を明記する。
この手順に従えば、初めての方でも簡単に度数分布表を作成できます。特に階級を設定する場合、階級の数はデータ数に応じて5から20程度に設定するのが一般的です。階級幅が広すぎると情報が失われ、狭すぎると細かくなりすぎて傾向が見えにくくなるため、バランスが重要です。
度数分布表の見方:データの特徴を読み解く
度数分布表を読み取る際には、まず絶対度数に注目し、どの値や階級にデータが集中しているかを確認します。例えば、テストの点数データであれば、最も多くの生徒が含まれる点数帯が平均点の目安になります。また、相対度数を見ることで、全体に対する割合を直感的に理解できます。累積度数を活用すれば、特定の値以下にどれだけのデータが存在するかが分かるため、順位や基準を満たす割合を算出するのに便利です。度数分布表では、外れ値やデータの偏りも発見しやすくなります。例えば、極端に高い値や低い値が一つだけ存在する場合、その絶対度数は1ですが、他のデータと大きく離れていることが表から読み取れます。このように、度数分布表は単なる集計表ではなく、データの背後にある構造を明らかにする強力なツールです。

具体例で理解する度数分布表
ここで、架空のクラス30人の数学テストの点数データを用いて度数分布表を作成してみます。点数は0点から100点までとし、10点刻みの階級を設定します。以下の表は、各階級の絶対度数、相対度数、累積度数を示しています。
| 階級(点数) | 絶対度数(人) | 相対度数 | 累積度数(人) |
|---|---|---|---|
| 0以上10未満 | 1 | 0.033 | 1 |
| 10以上20未満 | 2 | 0.067 | 3 |
| 20以上30未満 | 3 | 0.100 | 6 |
| 30以上40未満 | 4 | 0.133 | 10 |
| 40以上50未満 | 5 | 0.167 | 15 |
| 50以上60未満 | 6 | 0.200 | 21 |
| 60以上70未満 | 4 | 0.133 | 25 |
| 70以上80未満 | 3 | 0.100 | 28 |
| 80以上90未満 | 1 | 0.033 | 29 |
| 90以上100未満 | 1 | 0.033 | 30 |
この表から、50点以上60点未満の階級に最も多くの生徒がいることが分かります。また、累積度数を見ると、40点未満の生徒は10人で全体の約33パーセントを占めることが分かります。このように、度数分布表を用いるとデータの分布を具体的に把握できます。

さらに、度数分布表を基にヒストグラムを作成すれば、視覚的にも分布の形状を理解できます。統計分析の基本として、度数分布表とグラフを組み合わせて使うことをおすすめします。具体的な分析手法については、絶対度数に関するToda Matériaの記事も参考になります。
度数分布表の応用と注意点
度数分布表は、アンケート調査の結果整理や品質管理における不良品の分析、経済データの分布把握など、様々な分野で応用されています。特に、データの特徴を簡潔に要約できる点が評価されています。ただし、作成時にはいくつか注意点があります。まず、階級の幅を恣意的に設定すると、データの特徴が歪んで伝わる可能性があります。例えば、階級幅を広く取りすぎると、細かい変動が失われます。逆に狭すぎると、データが分散して傾向が見えにくくなります。適切な階級数は、データの数や分布の形状に応じて調整する必要があります。また、相対度数を扱う際には、小数点以下の桁数を統一して表示することで、読み手の誤解を防げます。さらに、度数分布表だけではデータの平均値や標準偏差といった統計量が直接計算できないため、必要に応じて元データからそれらの値を算出する必要があります。

度数分布表の作成方法や解釈についてさらに詳しく知りたい方は、Statorialsの度数分布表ガイドも役立つ情報を提供しています。
まとめ
度数分布表は、データを整理し、分布の特徴を把握するための基本的かつ強力な統計ツールです。絶対度数、相対度数、累積度数といった要素を理解することで、データの傾向や偏りを読み取る力が身につきます。本記事で紹介した手順や具体例を参考に、実際のデータ分析に挑戦してみてください。最初は手作業で表を作成しても良いですし、Excelや統計ソフトを利用すれば効率的に処理できます。データを可視化し、その背後にある情報を引き出す楽しさをぜひ体験してください。
参考資料
本記事の作成にあたり、以下の情報源を参考にしました。 Toda MatériaのFrequência Absolutaに関するページ(https://www.todamateria.com.br/frequencia-absoluta/)、StatorialsのHow to Create a Frequency Table(https://statorials.org/pt/tabela-de-frequencia/)、IBM SPSS Statisticsの度数表に関するドキュメント(https://www.ibm.com/docs/pt-br/spss-statistics/30.0.0?topic=proportions-frequency-table)、WikiCiênciasのTabela de Frequências(https://wikiciencias.casadasciencias.org/wiki/index.php/Tabela_de_frequ%C3%AAncias)、QuestionPro BlogのTabela de Frequênciasガイド(https://www.questionpro.com/blog/pt/tabela-de-frequencias-o-que-e-elementos-e-como-cria-la/)。これらの資料から、度数分布表の定義や作成方法、実践的な応用例について学び、本記事の内容に反映しています。


