在概率論 中,全變差距離 (英語:total variation distance )是概率測度的一種距離。它也是一種統計距離 度量,有時也稱為統計距離 (英語:statistical distance )或變差距離 (英語:variational distance )。
設
F
{\displaystyle {\mathcal {F}}}
是樣本空間
Ω
{\displaystyle \Omega }
的一個子集上的σ代數 ,兩個概率測度
P
{\displaystyle P}
與
Q
{\displaystyle Q}
在
F
{\displaystyle {\mathcal {F}}}
上的全變差距離定義為[ 1]
δ
(
P
,
Q
)
=
sup
A
∈
F
|
P
(
A
)
−
Q
(
A
)
|
.
{\displaystyle \delta (P,Q)=\sup _{A\in {\mathcal {F}}}\left|P(A)-Q(A)\right|.}
粗略地說,這是兩個概率分佈 在同一事件上取值的最大差值。
全變差距離通過Pinsker不等式與Kullback-Leibler散度 相聯繫:
δ
(
P
,
Q
)
≤
1
2
D
K
L
(
P
∥
Q
)
.
{\displaystyle \delta (P,Q)\leq {\sqrt {{\frac {1}{2}}D_{\mathrm {KL} }(P\parallel Q)}}.}
當樣本空間
Ω
{\displaystyle \Omega }
是可數集的時候,全變差距離與
L
1
{\displaystyle L^{1}}
範數有等式關係[ 2] :
δ
(
P
,
Q
)
=
1
2
‖
P
−
Q
‖
1
=
1
2
∑
ω
∈
Ω
|
P
(
ω
)
−
Q
(
ω
)
|
.
{\displaystyle \delta (P,Q)={\frac {1}{2}}\|P-Q\|_{1}={\frac {1}{2}}\sum _{\omega \in \Omega }|P(\omega )-Q(\omega )|.}
^ Chatterjee, Sourav. "Distances between probability measures" (PDF). UC Berkeley. Archived from the original (PDF) on July 8, 2008. Retrieved 21 June 2013.
^ David A. Levin, Yuval Peres, Elizabeth L. Wilmer, 'Markov Chains and Mixing Times', 2nd. rev. ed. (AMS, 2017), Proposition 4.2, p. 48.