確率質量関数(PMF)と期待値の関係|サイコロとコイントスで直感的に理解
確率質量関数(PMF)は離散確率変数が各値をとる確率を与える関数です。本稿ではPMFを使って期待値をどのように計算するかを、サイコロとコイントスの例で整理し、ベルヌーイ/二項分布やエントロピーとの関係まで簡潔に補足します。
補足①:定義の再確認(PMFと期待値)
離散確率変数 \(X\) のPMFを \(p(x)=P(X=x)\) とすると、期待値は
\[ E[X]=\sum_{x} x\,p(x) \]
となります。サイコロでは \(p(1)=\cdots=p(6)=1/6\) なので
\[ E[X]=\frac{1+2+3+4+5+6}{6}=3.5 \]
—「平均的に得られる値」を表します(実際に出る値とは限りません)。
補足②:ベルヌーイ分布の期待値と分散(式の最短導出)
コイントスのように \(X\in\{0,1\}\)、成功確率 \(p\) のとき
\[ E[X]=p, \quad \mathrm{Var}(X)=p(1-p) \]
はPMFから1行で導けます(\(E[X]=0\cdot(1-p)+1\cdot p\))。検索意図に合う公式明示で到達性を高めます。
補足③:二項分布への一般化(頻出QA対策)
独立なベルヌーイ試行を \(n\) 回:
\[ E[X]=np, \quad \mathrm{Var}(X)=np(1-p) \]
「コイントスを何回も」は実用的な問い合わせが多く、最短で応答できるよう公式を記載しておきます。
補足④:PMF・PDF・CDFの違い(1分要約)
- PMF:離散。棒グラフの高さ=確率。
- PDF:連続。曲線の面積=確率(高さそのものは確率ではない)。
- CDF:閾値以下である確率の累積。
検索で混同されやすい用語の「即答」を本文内に用意しておくと流入の取りこぼしを減らせます。
補足⑤:エントロピーとの関係(2値のとき)
二値の不確実性は
\[ H(p)=-p\log_2 p-(1-p)\log_2(1-p) \]
で最大は \(p=0.5\)。本文の話題(シャノン)を式で補強して内部一貫性を高めます。
補足⑥:Python最小コード(張り替え可)
# PMFから期待値を出す最小例(サイコロ)
xs = [1,2,3,4,5,6]
pmf = [1/6]*6
E = sum(x*p for x,p in zip(xs, pmf))
print("期待値:", E) # 3.5
# ベルヌーイと二項(導出確認)
p, n = 0.3, 10
E_ber, Var_ber = p, p*(1-p)
E_bin, Var_bin = n*p, n*p*(1-p)
print(E_ber, Var_ber, E_bin, Var_bin)
補足⑦:よくある質問(FAQ)
- Q. 期待値は実際に出る値ですか?
- A. 平均的傾向を表す量で、必ず観測される値ではありません(サイコロの3.5など)。
- Q. 偏りコインの期待値は?
- A. 成功確率 \(p\) です(成功=1, 失敗=0 と定義した場合)。
- Q. PMFとPDFの違いは?
- A. 離散か連続かで解釈が異なります。PMFは高さが確率、PDFは面積が確率です。
メタ情報とタグ
ディスクリプション:確率質量関数(PMF)から期待値をどう計算するかを、サイコロとコイントスで直感的に解説。ベルヌーイ/二項、PMF・PDF・CDFの違い、エントロピーも簡潔に補足。
推奨タグ:#確率 #統計 #期待値 #確率質量関数 #ベルヌーイ #二項分布 #エントロピー