文章目录

在这里插入图片描述

  概率模型(Probabilistic Graphical Model,PGM)是一种用图结构表示推断多元随机变量之间条件独立性概率模型。图模型提供了一种直观且有效方式描述高维空间中的概率分布,通过结构表示随机变量之间关系,使得模型参数量得以减少。

  【深度学习】概率图模型(一)概率图模型理论简介

一、有向图模型

  有向图模型(Directed Graphical Models)是概率图模型的一类,其中最为知名的代表贝叶斯网络。这种模型在处理变量概率关系方面表现出色,提供了一种直观、清晰的方法描述随机变量之间因果关系。

  下面将对贝叶斯网络的定义条件独立性局部马尔可夫性质等方面进行深入探讨。

1. 贝叶斯网络的定义

在这里插入图片描述

  1. 有向非循环

    G

    G

    G

    G

    G

    G一个图,其中每个边都有一个方向,而且没有形成循环每个节点表示一个随机变量。这种有向图表示变量之间因果关系,其中箭头方向指示了因果关系的方向

  2. X

    X

    X一个

    K

    K

    K随机向量表示随机变量集合,其中

    K

    K

    K变量的数量。每个节点对应

    X

    X

    X 中的一个随机变量

  3. X

    π

    k

    X_{pi_k}

    Xπk表示变量

    X

    k

    X_k

    Xk 的所有父节点变量集合,这是一个关键概念,它表示了图中节点

    X

    k

    X_k

    Xk 直接影响变量

  4. P

    (

    X

    k

    X

    π

    k

    )

    P(X_k | X_{pi_k})

    P(XkXπk)表示每个随机变量的局部条件概率分布,即给定其父节点的条件下,该变量的概率分布,表达了节点之间因果关系。

  5. 联合概率分布的分解:如果随机向量

    X

    X

    X 的联合概率分布可以分解每个随机变量

    X

    k

    X_k

    Xk局部条件概率的连乘形式(即式子

    p

    (

    x

    )

    =

    k

    =

    1

    K

    p

    (

    x

    k

    x

    π

    k

    )

    p(mathbf{x}) = prod_{k=1}^{K} p(x_k | mathbf{x}_{pi_k})

    p(x)=k=1Kp(xkxπk),那么图 (G) 和随机向量 (X) 构成了一个贝叶斯网络。

2. 条件独立性及其证明

  贝叶斯网络中的条件独立性关系直接反映了有向边的因果关系。

  下面将详细讨论不同连接关系下的条件独立性关系。

在这里插入图片描述

perp

符号说明markdown找到与教材相同符号这里使用

perp

替代

  1. 间接因果关系

    X

    3

    X

    2

    X

    1

    X_3 rightarrow X_2 rightarrow X_1

    X3X2X1

    • X

      2

      X_2

      X2 已知时,

      X

      1

      X_1

      X1

      X

      3

      X_3

      X3 是条件独立的,即

      X

      1

      X

      3

      X

      2

      X_1 perp X_3 | X_2

      X1X3X2

    • 表示给定中间节点

      X

      2

      X_2

      X2信息

      X

      1

      X_1

      X1

      X

      3

      X_3

      X3 不再有直接的因果关系。

  2. 间接果因关系

    X

    1

    X

    2

    X

    3

    X_1 rightarrow X_2 rightarrow X_3

    X1X2X3

    • X

      2

      X_2

      X2 已知时,

      X

      1

      X_1

      X1

      X

      3

      X_3

      X3 是条件独立的,即

      X

      1

      X

      3

      X

      2

      X_1 perp X_3 | X_2

      X1X3X2

    • 类似于上述情况,给定中间节点

      X

      2

      X_2

      X2信息

      X

      1

      X_1

      X1

      X

      3

      X_3

      X3 不再有直接的因果关系。

  3. 共因关系

    X

    1

    X

    2

    X

    3

    X_1 leftarrow X_2 rightarrow X_3

    X1X2X3

    • X

      2

      X_2

      X2 未知时,

      X

      1

      X_1

      X1

      X

      3

      X_3

      X3 是不独立的。

    • X

      2

      X_2

      X2 已知时,

      X

      1

      X_1

      X1

      X

      3

      X_3

      X3 是条件独立的,即

      X

      1

      X

      3

      X

      2

      X_1 perp X_3 | X_2

      X1X3X2

    • 表示给定中间节点

      X

      2

      X_2

      X2信息

      X

      1

      X_1

      X1

      X

      3

      X_3

      X3 之间的关系变得更加独立。

  4. 共果关系

    X

    1

    X

    2

    X

    3

    X_1 rightarrow X_2 leftarrow X_3

    X1X2X3

    • X

      2

      X_2

      X2未知时,

      X

      1

      X_1

      X1

      X

      3

      X_3

      X3 是独立的。

    • X

      2

      X_2

      X2 已知时,

      X

      1

      X_1

      X1

      X

      3

      X_3

      X3不再 是独立的,即

      X

      1

      ⊥̸

      X

      3

      X

      2

      X_1 notperp X_3 | X_2

      X1X3X2

    • 表示给定中间节点

      X

      2

      X_2

      X2信息

      X

      1

      X_1

      X1

      X

      3

      X_3

      X3 之间的关系不再是独立的。

声明:下述证明过程个人所见,不具备权威性……

a. 间接因果关系

X

3

X

2

X

1

X_3 rightarrow X_2 rightarrow X_1

X3X2X1

在间接因果关系中,考虑

X

1

X_1

X1

X

3

X_3

X3给定

X

2

X_2

X2 的条件下是否独立,根据概率链规则

P

(

X

1

,

X

3

X

2

)

=

P

(

X

1

,

X

2

,

X

3

)

P

(

X

2

)

P(X_1, X_3 | X_2) = frac{P(X_1, X_2, X_3)}{P(X_2)}

P(X1,X3X2)=P(X2)P(X1,X2,X3)

由图中的有向边表示因果关系,我们可以写出联合概率的分解

P

(

X

1

,

X

2

,

X

3

)

=

P

(

X

3

)

P

(

X

2

X

3

)

P

(

X

1

X

2

)

P(X_1, X_2, X_3) = P(X_3) cdot P(X_2 | X_3) cdot P(X_1 | X_2)

P(X1,X2,X3)=P(X3)P(X2X3)P(X1X2)

将其代入条件概率的计算式中:

P

(

X

1

,

X

3

X

2

)

=

P

(

X

3

)

P

(

X

2

X

3

)

P

(

X

2

)

P

(

X

1

X

2

)

P(X_1, X_3 | X_2) = frac{P(X_3) cdot P(X_2 | X_3) }{P(X_2)}cdot P(X_1 | X_2)

P(X1,X3X2)=P(X2)P(X3)P(X2X3)P(X1X2)
因为(条件概率~贝叶斯公式

P

(

X

2

,

X

3

)

=

P

(

X

3

)

P

(

X

2

X

3

)

=

P

(

X

2

)

P

(

X

3

X

2

)

P(X_2,X_3)=P(X_3) cdot P(X_2 | X_3) =P(X_2) cdot P(X_3 | X_2)

P(X2,X3)=P(X3)P(X2X3)=P(X2)P(X3X2)

所以

P

(

X

1

,

X

3

X

2

)

=

P

(

X

3

X

2

)

P

(

X

1

X

2

)

P(X_1, X_3 | X_2) = P(X_3 | X_2) cdot P(X_1 | X_2)

P(X1,X3X2)=P(X3X2)P(X1X2)

得证,在

X

3

X

2

X

1

X_3 rightarrow X_2 rightarrow X_1

X3X2X1的关系下,

X

1

X_1

X1

X

3

X_3

X3 在给定

X

2

X_2

X2的条件下是独立的。

b. 间接果因关系

X

1

X

2

X

3

X_1 rightarrow X_2 rightarrow X_3

X1X2X3

P

(

X

1

,

X

3

X

2

)

=

P

(

X

1

,

X

2

,

X

3

)

P

(

X

2

)

P(X_1, X_3 | X_2) = frac{P(X_1, X_2, X_3)}{P(X_2)}

P(X1,X3X2)=P(X2)P(X1,X2,X3)

P

(

X

1

,

X

2

,

X

3

)

=

P

(

X

1

)

P

(

X

2

X

1

)

P

(

X

3

X

2

)

P(X_1, X_2, X_3) = P(X_1) cdot P(X_2 | X_1) cdot P(X_3 | X_2)

P(X1,X2,X3)=P(X1)P(X2X1)P(X3X2)

  • 代入条件概率的计算式,得到:

    P

    (

    X

    1

    ,

    X

    3

    X

    2

    )

    =

    P

    (

    X

    1

    )

    P

    (

    X

    2

    X

    1

    )

    P

    (

    X

    2

    )

    P

    (

    X

    3

    X

    2

    )

    P(X_1, X_3 | X_2) = frac{P(X_1) cdot P(X_2 | X_1) }{P(X_2)}cdot P(X_3 | X_2)

    P(X1,X3X2)=P(X2)P(X1)P(X2X1)P(X3X2)

P

(

X

1

,

X

3

X

2

)

=

P

(

X

1

X

2

)

P

(

X

3

X

2

)

P(X_1, X_3 | X_2) = P(X_1 | X_2) cdot P(X_3 | X_2)

P(X1,X3X2)=P(X1X2)P(X3X2)

  • 得证,在

    X

    1

    X

    2

    X

    3

    X_1 rightarrow X_2 rightarrow X_3

    X1X2X3 的关系下,

    X

    1

    X_1

    X1

    X

    3

    X_3

    X3 在给定

    X

    2

    X_2

    X2 的条件下是独立的。

c. 共因关系

X

1

X

2

X

3

X_1 leftarrow X_2 rightarrow X_3

X1X2X3

P

(

X

1

,

X

2

,

X

3

)

=

P

(

X

2

)

P

(

X

1

X

2

)

P

(

X

3

X

2

)

P(X_1, X_2, X_3) = P(X_2) cdot P(X_1 | X_2)cdot P(X_3 | X_2)

P(X1,X2,X3)=P(X2)P(X1X2)P(X3X2)

  • 将其代入条件概率的计算式中:

P

(

X

1

,

X

3

X

2

)

=

P

(

X

1

X

2

)

P

(

X

2

)

P

(

X

3

X

2

)

P

(

X

2

)

P(X_1, X_3 | X_2) = frac{P(X_1 | X_2) cdot P(X_2) cdot P(X_3 | X_2)}{P(X_2)}

P(X1,X3X2)=P(X2)P(X1X2)P(X2)P(X3X2)

P

(

X

1

,

X

3

X

2

)

=

P

(

X

1

X

2

)

P

(

X

3

X

2

)

P(X_1, X_3 | X_2) = P(X_1 | X_2) cdot P(X_3 | X_2)

P(X1,X3X2)=P(X1X2)P(X3X2)

  • 这表明在

    X

    1

    X

    2

    X

    3

    X_1 leftarrow X_2 rightarrow X_3

    X1X2X3 的关系下,

    X

    1

    X_1

    X1

    X

    3

    X_3

    X3 在给定

    X

    2

    X_2

    X2 的条件下是独立的。

d. 共果关系

X

1

X

2

X

3

X_1 rightarrow X_2 leftarrow X_3

X1X2X3

  • 联合概率的分解:

P

(

X

1

,

X

2

,

X

3

)

=

P

(

X

1

)

P

(

X

3

)

P

(

X

2

X

1

,

X

3

)

P(X_1, X_2, X_3) = P(X_1) cdot P(X_3) cdot P(X_2 | X_1, X_3)

P(X1,X2,X3)=P(X1)P(X3)P(X2X1,X3)

  • 将其代入条件概率的计算式中:

P

(

X

1

,

X

3

X

2

)

=

P

(

X

1

)

P

(

X

3

)

P

(

X

2

X

1

,

X

3

)

P

(

X

2

)

P(X_1, X_3 | X_2) = frac{P(X_1) cdot P(X_3) cdot P(X_2 | X_1, X_3)} {P(X_2)}

P(X1,X3X2)=P(X2)P(X1)P(X3)P(X2X1,X3)

  • 这里的联合概率不能简化

    P

    (

    X

    1

    X

    2

    )

    P

    (

    X

    3

    X

    2

    )

    P(X_1 | X_2) cdot P(X_3 | X_2)

    P(X1X2)P(X3X2),这表明在

    X

    1

    X

    2

    X

    3

    X_1 rightarrow X_2 leftarrow X_3

    X1X2X3 的关系下,

    X

    1

    X_1

    X1

    X

    3

    X_3

    X3 在给定

    X

    2

    X_2

    X2的条件下不是独立的。

3. 局部马尔可夫性质

a. 理论

  局部马尔可夫性质是贝叶斯网络中的重要性质,它描述在给定父节点的条件下,每个随机变量都与其非后代节点条件独立
在这里插入图片描述

局部马尔可夫性质: 对于贝叶斯网络中的每个节点

X

k

X_k

Xk,它在给定其父节点

X

π

k

X_{pi_k}

Xπk 的条件下,条件独立于与

X

k

X_k

Xk相关的其他节点

Z

Z

Z,即

P

(

X

k

X

π

k

,

Z

)

=

P

(

X

k

X

π

k

)

.

P(X_k | X_{pi_k}, Z) = P(X_k | X_{pi_k}).

P(XkXπk,Z)=P(XkXπk).

这表示,给定节点

X

k

X_k

Xk 的父节点的信息,节点

X

k

X_k

Xk 与其非后代节点

Z

Z

Z 之间没有直接的概率依赖关系,这个性质使得贝叶斯网络中的条件独立性关系更加清晰和易于推断

b. 证明

P

(

X

k

,

Z

X

π

k

)

=

P

(

X

k

,

Z

,

X

π

k

)

P

(

X

π

k

)

P(X_k, Z | X_{pi_k}) = frac{P(X_k, Z , X_{pi_k})}{P( X_{pi_k})}

P(Xk,ZXπk)=P(Xπk)P(Xk,Z,Xπk)

P

(

X

k

,

Z

X

π

k

)

=

P

(

X

π

k

)

P

(

X

k

X

π

k

)

P

(

Z

X

π

k

,

X

k

)

P

(

X

π

k

)

P(X_k, Z | X_{pi_k}) = frac{P(X_{pi_k})cdot P(X_k|X_{pi_k}) cdot P(Z|X_{pi_k},X_k) }{P( X_{pi_k})}

P(Xk,ZXπk)=P(Xπk)P(Xπk)P(XkXπk)P(ZXπk,Xk)

P

(

X

k

,

Z

X

π

k

)

=

P

(

X

k

X

π

k

)

P

(

Z

X

π

k

,

X

k

)

P(X_k, Z | X_{pi_k}) = P(X_k|X_{pi_k}) cdot P(Z|X_{pi_k},X_k)

P(Xk,ZXπk)=P(XkXπk)P(ZXπk,Xk)

P

(

X

k

,

Z

X

π

k

)

=

P

(

X

k

X

π

k

)

P

(

Z

X

π

k

)

P(X_k, Z | X_{pi_k}) = P(X_k|X_{pi_k}) cdot P(Z|X_{pi_k})

P(Xk,ZXπk)=P(XkXπk)P(ZXπk)

二、常见有向图模型

持续更新ing~

1. Sigmoid信念网

2. 朴素贝叶斯分类器

3. 隐马尔可夫模型

原文地址:https://blog.csdn.net/m0_63834988/article/details/134633334

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任

如若转载,请注明出处:http://www.7code.cn/show_39678.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱suwngjj01@126.com进行投诉反馈,一经查实,立即删除

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注