表内のバリエーション シリーズ データ。 バリエーションシリーズの定義

定性的または定量的な性質の共通の特徴または特性によって結合されたオブジェクトまたは現象のセットは、と呼ばれます。 観察の対象 .

統計的観察の対象はすべて個別の要素で構成されています - 観測単位 .

統計観察の結果は数値情報です - データ . 統計データ - これは、研究者が関心のある特性が統計母集団内でどのような値を採用したかに関する情報です。

特徴の値が数値で表される場合、その特徴は次のように呼ばれます。 定量的 .

特徴が母集団の要素の何らかのプロパティまたは状態を特徴づける場合、その特徴は次のように呼ばれます。 品質 .

母集団のすべての要素が研究 (継続的観察) の対象である場合、統計母集団は次のように呼ばれます。 全般的。

一般母集団の要素の一部が調査の対象となる場合、統計母集団はと呼ばれます。 選択的(選択的) 。 母集団からのサンプルはランダムに抽出され、n 個のサンプル メンバーのそれぞれが選択される確率が等しくなります。

属性の値は、母集団のある要素から別の要素に移動すると変化(変動)するため、統計では、属性の異なる値とも呼ばれます。 オプション 。 オプションは通常、小さなラテン文字 x、y、z で表されます。

シリアルナンバーバリアント(特徴量)と呼ばれます ランク 。 x 1 - 1 番目のオプション (1 番目の特徴量)、x 2 - 2 番目のオプション (2 番目の特徴量)、x i - i 番目のオプション (i 番目の値サイン)。

対応する重みを使用して昇順または降順に並べられた一連の属性値 (オプション) は、と呼ばれます。 バリエーションシリーズ(流通シリーズ)。

として 天秤 周波数または周波数が表示されます。

周波数(m i) は、統計母集団内でこのバリアント (特徴量) が何回発生するかを示します。

周波数または相対周波数(w i) は、人口単位のどのくらいの割合が 1 つまたは別のバリアントを持っているかを示します。 頻度は、系列内のすべての頻度の合計に対する 1 つまたは別のバリアントの頻度の比率として計算されます。

. (6.1)

すべての周波数の合計は 1 です。

. (6.2)

変分系列は離散系列と区間系列です。

離散変化系列これらは通常、研究対象の特性の値が少なくともある有限の値だけ互いに異なる可能性がある場合に構築されます。

離散変分系列では、特徴のポイント値が指定されます。

離散変化系列の全体像を表 6.1 に示します。

表6.1

ここで、i = 1、2、…、 l.

各区間における区間変動系列では、区間の上限と下限が区別される。

間隔の上限と下限の差を次のように呼びます。 間隔の差 また 間隔の長さ(サイズ) .

最初の間隔 k 1 の値は、次の式で決定されます。

k1 = 2 - 1;

2 番目: k 2 = a 3 - a 2; …

最後: k l = a l - a l -1 。

一般に 間隔の差 k i は次の式で計算されます。

k i \u003d x i (最大) - x i (最小) 。 (6.3)

間隔に両方の境界がある場合、それは呼び出されます。 閉まっている .

最初と最後の間隔は次のとおりです。 開ける 、つまり 境界線は 1 つだけです。

たとえば、最初の間隔は「最大 100」、2 番目は「100 ~ 110」、...、最後から 2 番目は「190 ~ 200」、最後の間隔は「200 以上」と指定できます。 最初の区間には下限がなく、最後の区間には上限がなく、両方とも開いていることは明らかです。

多くの場合、開いた間隔は条件付きで閉じる必要があります。 これを行うには、通常、最初の間隔の値が 2 番目の間隔の値と等しいとみなされ、最後の間隔の値は最後から 2 番目の間隔の値とみなされます。 この例では、2 番目の間隔の値は 110-100=10 であるため、最初の間隔の下限は条件付きで 100-10=90 になります。 最後から 2 番目の間隔の値は 200-190=10 であるため、最後の間隔の上限は通常 200+10=210 になります。

さらに、一連の間隔変化には、異なる長さの間隔が発生する可能性があります。 変化系列の間隔が同じ長さ (間隔の差) を持つ場合、それらは次のように呼ばれます。 大きさが等しい 、 さもないと - 不平等。

間隔変動系列を構築する場合、間隔のサイズ (間隔の差) を選択するという問題がよく発生します。

間隔の最適なサイズを決定するには (系列が等間隔で構築されている場合)、次を適用します。 スタージェスの公式:

, (6.4)

ここで、n は人口単位の数です。

x (最大) と x (最小) - 系列のバリエーションの最大値と最小値。

変分系列を特徴付けるには、周波数と周波数とともに、累積された周波数と周波数が使用されます。

累積度数 (度数)指定された値 (オプション) x を超えない人口単位の数 (それらのどの部分) を示します。

累積周波数 ( v 私) 離散系列データに応じて、次の式を使用して計算できます。

. (6.5)

間隔変動系列の場合、これは、この間隔を超えないすべての間隔の頻度 (頻度) の合計です。

離散 バリエーションシリーズでグラフィカルに表すことができます 周波数または周波数のポリゴン分布.

分布ポリゴンを構築する場合、横軸に属性(オプション)の値、縦軸に度数または度数がプロットされます。 特性値とそれに対応する周波数(周波数)の交点に点がプロットされ、それらはセグメントによって接続されます。 このようにして得られた折れ線を度数(周波数)の分布の多角形と呼びます。

Xのk
×2
×1×i


米。 6.1.

区間変分系列は、次を使用してグラフで表現できます。 ヒストグラム、つまり 棒グラフ。

横軸に沿ってヒストグラムを作成する場合、調査対象の特徴(間隔の境界)の値がプロットされます。

間隔が同じサイズの場合、周波数または周波数を y 軸に沿ってプロットできます。

間隔が 異なるサイズ、y 軸に沿って、絶対または相対分布密度の値をプロットする必要があります。

絶対密度- 間隔の周波数と間隔のサイズの比率:

; (6.6)

ここで、 f(a) i - i 番目の間隔の絶対密度。

m i - i 番目の間隔の頻度。

k i - i 番目の間隔の値 (間隔の差)。

絶対密度は、単位間隔あたりの人口単位の数を示します。

相対密度- 間隔の周波数と間隔のサイズの比率:

; (6.7)

ここで、 f(o) i - i 番目の間隔の相対密度。

w i - i 番目の間隔の頻度。

相対密度は、人口単位のどの部分が間隔単位に該当するかを示します。

ある
1×i
2

離散変動系列と間隔変動系列はどちらも、cumulate および ogive としてグラフで表すことができます。

建てるとき 蓄積する離散系列データによれば、横軸は属性(オプション)の値を示し、縦軸は累積頻度または頻度を示します。 機能(オプション)の値とそれらに対応する累積周波数(周波数)の交差点に点が構築され、それらはセグメントまたは曲線によって接続されます。 このようにして得られた折れ線(曲線)を累積(累積曲線)と呼ぶ。

区間系列のデータに従って累積を構築する場合、区間の境界は横軸に沿ってプロットされます。 点の横座標は間隔の上限です。 縦軸は、対応する間隔の累積周波数(周波数)を形成します。 多くの場合、もう 1 つの点が追加されます。その横軸は最初の間隔の下限であり、縦軸は 0 です。 点を線分または曲線で接続すると、累積値が得られます。

オギバは、累積と同様に構築されますが、唯一の違いは、累積された周波数(周波数)に対応する点が横軸にプロットされ、特性値(オプション)が縦軸に沿ってプロットされることです。

現代の科学開発を行う際に特に重要となる大量の情報を処理する場合、研究者は初期データを正しくグループ化するという重大な課題に直面します。 データが離散的であれば、これまで見てきたように、問題はありません。各特徴の頻度を計算するだけで済みます。 研究中の形質が 継続的な(実際にはこれが一般的です)、フィーチャをグループ化するための最適な間隔数を選択することは、決して簡単な作業ではありません。

連続確率変数をグループ化するには、特徴量の変動範囲全体が特定の数の間隔に分割されます。 に。

グループ化された間隔 (継続的な) 変分級数特徴の値によってランク付けされた間隔 () と呼ばれるもので、対応する頻度 () とともに、r 番目の間隔に該当する観測値の数、または相対頻度 () が示されます。

特性値の間隔

私の周波数

棒グラフ累積 (オギバ)、すでに詳しく説明しましたが、データ構造の基本的な理解を可能にする優れたデータ視覚化ツールです。 このようなグラフ(図1.15)は、連続データが離散データの場合と同じ方法で構築されていますが、連続データがその可能な値の領域を完全に満たし、任意の値を取るという事実のみを考慮しています。

米。 1.15。

それが理由です ヒストグラム上の列と累積は接触している必要があり、属性値が可能な範囲に収まらない領域があってはなりません(つまり、ヒストグラムと累積には、図1.16のように、調査対象の変数の値が落ちない横軸に沿った「穴」があってはなりません)。 バーの高さは、頻度 (指定された間隔に該当する観測値の数)、または相対頻度 (観測値の割合) に対応します。 間隔 渡ってはいけない通常は同じ幅です。

米。 1.16

ヒストグラムとポリゴンは確率密度曲線(微分関数)の近似です f(x)確率論の過程で考慮される理論的な分布。 したがって、それらの構築は定量的連続データの一次統計処理において非常に重要であり、その形式によって仮説的な分布法則を判断することができます。

累積 - 間隔変動系列の累積周波数 (周波数) の曲線。 積分分布関数のグラフは累積分布関数と比較されます。 F(x)、確率論の過程でも考慮されます。

基本的に、ヒストグラムと累積の概念は、それぞれ確率密度関数と分布関数の経験的推定値であるため、連続データとその間隔変動系列に正確に関連付けられています。

区間変動系列の構築は、区間の数を決定することから始まります。 k.そして、この課題はおそらく、研究中の問題の中で最も難しく、重要であり、物議をかもしている課題です。

ヒストグラムが滑らかになりすぎるため、間隔の数が小さすぎないように注意してください ( 平滑化しすぎた)、図では、初期データの変動性の特徴がすべて失われます。 1.17 では、図のグラフと同じデータがどのように変化するかがわかります。 1.15 は、より少ない数の間隔でヒストグラムを作成するために使用されます (左のグラフ)。

同時に、間隔の数は大きすぎてはなりません。大きすぎると、調査対象のデータの数値軸に沿った分布密度を推定できなくなります。ヒストグラムが平滑化されていないことがわかります。 (滑らかさが足りない)間隔が埋められておらず、不均一です (図 1.17、右のグラフを参照)。

米。 1.17。

最も好ましい間隔数を決定するにはどうすればよいでしょうか?

1926 年に遡ると、ハーバート スタージェスは、調査対象の属性の初期値セットを分割する必要がある間隔の数を計算する式を提案しました。 この公式は非常に人気があります。ほとんどの統計教科書でこの公式が提供されており、多くの統計パッケージがデフォルトでこの公式を使用しています。 これが正当化されるかどうか、そしてすべての場合において、非常に深刻な問題です。

それでは、スタージェスの公式は何に基づいているのでしょうか?

検討 二項分布/O.Yu. エルモラエフ。 - M.: モスクワ心理社会研究所フリント出版社、2012年。 - 335p。

変動の程度に応じて、母集団の均一性、特徴の個々の値の安定性、および平均の典型性を判断できます。 それらに基づいて、兆候間の関係の近さの指標、選択的観察の精度を評価するための指標が開発されます。

空間にも変化があり、時間にも変化があります。

空間の変動は、個別の領域を表す人口単位でのフィーチャの値の変動として理解されます。 時間の変動とは、さまざまな期間における属性の値の変化を意味します。

分布系列の変動を調べるために、属性値のすべての変動が昇順または降順に並べられます。 このプロセスはシリーズ ランキングと呼ばれます。

変動の最も単純な兆候は次のとおりです。 最小値と最大値- 集計内の属性の最小値と最大値。 特徴量の個々のバリエーションの繰り返しの数は、繰り返し頻度 (fi) と呼ばれます。 周波数を周波数 - wi に置き換えると便利です。 頻度 - 頻度の相対指標。単位の分数またはパーセンテージで表すことができ、変動系列を異なる観測値と比較できます。 式で表すと次のようになります。

ここで、Xmax、Xmin - 集計内の属性の最大値と最小値。 n はグループの数です。

形質の変動を測定するには、さまざまな絶対指標および相対指標が使用されます。 変動の絶対指標には、変動範囲、平均線形偏差、分散、標準偏差が含まれます。 変動の相対指標には、振動係数、相対線形偏差、変動係数が含まれます。

バリエーションシリーズの検索例

エクササイズ。このサンプルの場合:

  • a) バリエーションシリーズを検索します。
  • b) 分布関数を構築します。

番号=42。 サンプルアイテム:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

解決。

  • a) ランク付けされた変分系列の構築:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) 離散変分系列の構築。

スタージェスの公式を使用して、バリエーション系列内のグループの数を計算してみましょう。

グループの数が 7 であるとします。

グループの数がわかったら、間隔の値を計算します。

テーブルを作成する便宜上、グループの数を 8 とし、間隔を 1 とします。

米。 1 一定期間における店舗の商品の売上高

バリエーション シリーズ: 定義、タイプ、主な特徴。 計算方法
医学および統計研究における流行、中央値、算術平均
(条件付きの例で表示)。

変分系列とは、研究対象の形質の一連の数値であり、大きさが互いに異なり、特定の順序(昇順または降順)で配置されています。 系列の各数値はバリアント (V) と呼ばれ、この系列の構成内でそのバリアントがどのくらいの頻度で発生するかを示す数値は頻度 (p) と呼ばれます。

変動系列を構成する観測ケースの総数は、文字 n で示されます。 研究された特性の意味の違いを変動と呼びます。 変数の符号に定量的な尺度がない場合、その変動は定性的と呼ばれ、分布系列は属性的と呼ばれます (たとえば、病気の転帰、健康状態などによる分布)。

変数記号が量的な表現を持つ場合、そのような変化を量的といい、分布系列を変分的といいます。

変異系列は、量的形質の性質、単純型と重み付け型に応じて、変異の出現頻度に応じて不連続型と連続型に分けられます。

単純な変分系列では、各変異は 1 回だけ発生します (p=1)。重み付き系列では、同じ変異が複数回発生します (p>1)。 このようなシリーズの例については、本文の後半で説明します。 量的属性が連続的な場合、つまり 整数値の間には中間の分数値があり、変分系列は連続と呼ばれます。

例: 10.0 - 11.9

14.0~15.9など

定量的符号が不連続な場合、つまり その個々の値(オプション)は整数によって互いに異なり、中間の小数値を持たないため、変動系列は不連続または離散と呼ばれます。

心拍数に関する前の例のデータを使用する

21 人の生徒に対して、バリエーション シリーズを作成します (表 1)。

表1

脈拍数(bpm)別の医学生の分布

したがって、変分系列を構築するということは、既存の数値(オプション)を体系化し、合理化することを意味します。 対応する周波数を特定の順序 (昇順または降順) で並べます。 検討中の例では、オプションは昇順に配置され、不連続 (離散) 整数として表現されます。各オプションは複数回出現します。 重み付き、不連続または離散変分系列を扱っています。

原則として、研究している統計母集団の観測値の数が30を超えない場合は、表のように、研究対象の形質のすべての値を変分系列に昇順に配置するだけで十分です。 1、または降順。

大量に観測値 (n>30) では、発生するバリアントの数が非常に多くなる可能性があります。この場合、区間またはグループ化された変分系列がコンパイルされます。その後の処理を簡素化し、分布の性質を明確にするために、バリアントはグループにまとめられます。 。

通常、グループ オプションの数は 8 ~ 15 の範囲です。

少なくとも5人はいるはずだから。 そうしないと、粗くなりすぎて拡大しすぎて、変動の全体像が歪められ、平均値の精度に大きな影響を与えます。 グループの選択肢の数が20〜25を超えると、平均値の計算の精度は向上しますが、属性の変動の特徴が大幅に歪められ、数学的処理がより複雑になります。

グループ化されたシリーズをコンパイルするときは、次の点を考慮する必要があります。

− バリアント グループは特定の順序 (昇順または降順) で配置する必要があります。

- バリアント グループの間隔は同じである必要があります。

− 間隔の境界値は一致してはなりません。 個々のオプションをどのグループに属するかは明確ではありません。

- 間隔の制限を設定するときは、収集された材料の定性的特徴を考慮する必要があります(たとえば、成人の体重を研究する場合、3〜4 kgの間隔が許容されます。生後数か月の子供については許容されます)寿命のうち100gを超えてはなりません。)

試験前に 55 人の医学生の脈拍数 (1 分あたりの心拍数) のデータを特徴付けるグループ化された (間隔) シリーズを作成してみましょう: 64、66、60、62、

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

グループ化されたシリーズを構築するには、次のものが必要です。

1. 間隔の値を決定します。

2. バリエーション シリーズのバリエーションのグループの中間、開始、終了を決定します。

● 間隔 (i) の値は、期待されるグループの数 (r) によって決定され、その数は特別なテーブルに従って観測値 (n) の数に応じて設定されます。

観測値の数に応じたグループの数:

私たちの場合、生徒数 55 人の場合、8 から 10 のグループを構成することが可能です。

間隔 (i) の値は、次の式で決定されます。

i = Vmax-Vmin/r

この例では、間隔の値は 82-58/8= 3 です。

間隔値が小数の場合、結果は整数に切り上げられる必要があります。

平均にはいくつかの種類があります。

● 算術平均、

● 幾何平均、

● 調和平均、

● 二乗平均平方根、

●ミディアムプログレッシブ、

● 中央値

医療統計では、算術平均が最もよく使用されます。

算術平均 (M) は、母集団全体の特徴である典型的な値を決定する一般化された値です。 M を計算する主な方法は、算術平均法とモーメント (条件付き偏差) 法です。

算術平均法は、単純算術平均と加重算術平均を計算するために使用されます。 算術平均値を計算する方法の選択は、変動系列のタイプによって異なります。 各変異が 1 回だけ出現する単純な変分系列の場合、単純な算術平均は次の式で求められます。

ここで、 М – 算術平均値。

V は可変機能 (オプション) の値です。

Σ - アクション - 合計を示します。

n は観測値の総数です。

算術平均を計算する例は簡単です。 35歳の男性9名: 20、22、19、15、16、21、17、23、18の呼吸数(1分間あたりの呼吸数)。

35 歳の男性の呼吸数の平均レベルを決定するには、次のことが必要です。

1. すべてのオプションを昇順または降順に配置して、変分系列を構築します。単純な変分系列が得られました。 バリアント値は 1 回だけ発生します。

M = ∑V/n = 171/9 = 1 分あたり 19 呼吸

結論。 35 歳の男性の呼吸数は平均して 1 分間に 19 回です。

バリアントの個々の値が繰り返される場合、各バリアントを 1 行に書き出す必要はありません。発生するバリアントのサイズ (V) をリストし、次にその繰り返しの数 (p) を示すだけで十分です。 )。 いわば、対応する頻度に応じてオプションが重み付けされているこのような変分系列は、加重変分系列と呼ばれ、計算された平均値は算術加重平均です。

算術加重平均は次の式で求められます: M= ∑Vp/n

ここで、n は頻度の合計 - Σr に等しい観測値の数です。

算術加重平均の計算例。

今年の第 1 四半期に地元の医師が治療した急性呼吸器疾患 (ARI) 患者 35 人の障害期間 (日数) は、6、7、5、3、9、8、7、5、6 でした。 、4、9、8、7、6、6、9、6、5、10、8、7、11、13、5、6、7、12、4、3、5、2、5、6、6 、7日間。

急性呼吸器感染症患者の障害の平均期間を決定する方法は次のとおりです。

1. 重み付き変分系列を構築しましょう。 個々のバリアント値が数回繰り返されます。 これを行うには、すべてのオプションを対応する頻度で昇順または降順に並べることができます。

この例では、オプションは昇順になっています。

2. 次の式を使用して算術加重平均を計算します: M = ∑Vp/n = 233/35 = 6.7 日

障害期間別の急性呼吸器感染症患者の分布:

就労不能期間(V) 患者数 (p) 副社長
∑p = n = 35 ∑Vp = 233

結論。 急性呼吸器疾患患者の障害期間は平均 6.7 日でした。

モード (Mo) は、バリエーション シリーズの中で最も一般的なバリエーションです。 表に示されている分布では、モードは 10 に等しいバリアントに対応し、他のものよりも頻繁に発生します (6 回)。

入院期間別の患者の分布 病院用ベッド(日単位)

V
p

研究対象のデータには「最も頻繁に」発生する観測値がいくつか存在する可能性があるため、モードの正確な値を決定することが難しい場合があります。

中央値 (Me) は、変動系列を 2 つの等しい半分に分割するノンパラメトリック指標です。同じ数のオプションが中央値の両側に配置されます。

たとえば、表に示されている分布の場合、中央値は 10 です。 この値の両側の は 14 番目のオプションにあります。 数字の 10 はこのシリーズの中心的な位置を占めており、その中央値です。

この例の観測値の数が偶数 (n=34) であるとすると、中央値は次のように決定できます。

私 = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

これは、系列の中央が 17 番目のオプションに該当することを意味し、これは中央値 10 に相当します。表に示されている分布の算術平均は次のとおりです。

M = ∑Vp/n = 334/34 = 10.1

したがって、表からの 34 個の観測値については次のようになります。 8 では、Mo=10、Me=10、算術平均 (M) は 10.1 となりました。 この例では、3 つの指標はすべて完全に異なりますが、互いに等しいか近いことが判明しました。

算術平均は、すべての影響の結果として得られる合計であり、例外なく、特定の現象またはセットにとって典型的ではない極端なものを含め、すべての変異がその形成に参加します。

最頻値と中央値は、算術平均とは対照的に、変数属性のすべての個別の値 (極値の値と系列の散乱度) に依存しません。 算術平均は観測値全体を特徴づけ、最頻値と中央値は観測値全体を特徴づけます。

状態:

従業員の年齢構成(歳)に関するデータがあります: 18、38、28、29、26、38、34、22、28、30、22、23、35、33、27、24、30、32、28 、25、29、26、31、24、29、27、32、25、29、29。

    1. 間隔分布シリーズを構築します。
    2. シリーズのグラフィック表現を構築します。
    3. 最頻値と中央値をグラフィカルに決定します。

解決:

1) スタージェスの公式によれば、母集団は 1 + 3.322 lg 30 = 6 つのグループに分割されなければなりません。

最高年齢は 38 歳、最低年齢は 18 歳です。

区間の幅 区間の終端は整数でなければならないため、母集団を 5 つのグループに分割します。 間隔幅 - 4。

計算を容易にするために、データを昇順に並べてみましょう: 18、22、22、23、24、24、25、25、26、26、27、27、28、28、28、29、29、29、29 、29、30、30、31、32、32、33、34、35、38、38。

従業員の年齢分布

グラフ的には、系列をヒストグラムまたは多角形として表示できます。 ヒストグラム - 棒グラフ。 列の底辺は間隔の幅です。 バーの高さは周波数と同じです。

ポリゴン (または分布ポリゴン) は度数のグラフです。 ヒストグラムに従ってそれを構築するには、長方形の上辺の中点を接続します。 極値の x 値から間隔の半分に等しい距離で x 軸上のポリゴンを閉じます。

最頻値 (Mo) は、研究対象の形質の値であり、特定の集団で最も頻繁に発生します。

ヒストグラムからモードを決定するには、最も高い四角形を選択し、この四角形の右頂点から前の四角形の右上隅まで線を描き、モーダル四角形の左頂点から最上位の四角形まで線を引く必要があります。次の長方形の左の頂点。 これらの線の交点から、x 軸に垂線を引きます。 横軸はファッションになります。 Mo ≈ 27.5。 これは、この人口で最も一般的な年齢が 27 ~ 28 歳であることを意味します。

中央値 (Me) は研究対象の形質の値であり、順序付けられた変動系列の中央にあります。

累積値によって中央値を求めます。 累積 - 累積された周波数のグラフ。 横座標は系列の変形です。 縦軸は累積周波数である。

累積の中央値を決定するには、累積頻度の 50% (この場合は 15) に対応する点を縦軸に沿って見つけ、それを通る直線を Ox 軸に平行に引き、それに垂直な線を引きます。累積値との交点からの x 軸。 横軸は中央値です。 私は約25.9です。 これは、この人口の労働者の半数が 26 歳未満であることを意味します。