一般の確率空間\((\omega,{\cal F},P)\)で、[W:条件付確率]を定義したらどうなるか。Wikipediaでも、英語版、日本語版ともに高校でやったような特殊ケースしか掲載されていない。拙書「ベイジアンネットワーク入門」では、以下のような定義をしている。Radon-Nikodymの定理から、\(A\in {\cal F}, {\cal G}\subseteq {\cal F}\)として、任意の\(G\in {\cal G}\)について、\( P(A\cap G)=\int_G f_A(\omega)dP(\omega)\)となる\({\cal G}\)上可測な\(f_A:\Omega\rightarrow [0,\infty)\)が存在する。これを、\({\cal G}\)のもとでの、\(A\)の条件付確率という。ここで、 \(f_A,g_A\)がともにその条件を満足すれば、\(f_A-g_A\)は\({\cal G}\)上可測であり、\(G=\{\omega\in \Omega|f_A(\omega)\not=g_A(\omega)\}\in {\cal G}\)の確率\(P(G)\)は0である。
\({\cal G}=\{B,\bar{B},\Omega,\{\}\}\)であれば、高校で勉強したような条件付確率\(P(A|B),P(A|\bar{B})\)が定義できる。条件付確率とは、\(B,\bar{B}\)などの事象のもとで決まるものではない。\(\cal F\)の部分\(\sigma\)集合体(事象の集合)\(\cal G\)に対して定まる写像である。
データマイニングでも、情報理論でも、条件付確率を一般的に正しく理解すれば、見通しのよい議論ができる。高校卒業時から進歩せず、条件付確率として、\(P(A|B),P(A|\bar{B})\)のようなものだけを扱っていると、新しいアイデアが出てこないだけではなく、確率の少し難しい論文はお手上げになる。
本日の講義では、第2章グラフィカルモデルの最後2.4, 2.5以外に、2.1の条件付分布関数の説明を行った。\(Z\)のもとでの\(X\)の条件付分布関数といった場合、一般に一意ではないが、\(Z\)の生成する事象について確率1で一致すれば、等価な関数とみなす。条件付独立性についても同様である。
ベイジアンネットワーク 第6回: 第2章グラフィカルモデル 2.4 有向グラフ(2010年5月27日)
ベイジアンネットワーク 第6回: 第2章グラフィカルモデル 2.5 Bayesianネットワーク: 依存モデルの有向非巡回グラフによる表現(2010年5月27日)