馬爾可夫毯
外觀
統計學和機器學習中,想用一組變量推斷一個隨機變量時,通常子集就夠了,其他變量都是無用的。這種包含所有有效信息的子集就稱作馬爾可夫毯(Markov blanket)。若馬爾可夫毯是最小的,即放棄任何變量都會損失信息,就稱之為馬爾可夫邊界(Markov boundary)。識別馬爾可夫毯和馬爾可夫邊界有助於提取有用特徵。這兩個術語是朱迪亞·珀爾 (1988)創造的。[1]馬爾可夫毯可視作是多個馬爾科夫鏈組成的。
馬爾可夫毯
[編輯]隨機變量集中隨機變量Y的馬爾可夫毯是的任意子集,條件是其他變量與Y相互獨立:
即,至少包含推斷Y所需的全部信息,其中中的變量是冗餘的。
一般來說,給定的馬爾可夫毯不唯一。中任何包含馬爾可夫毯的集合本身也是馬爾可夫毯。 具體說,是中Y的馬爾可夫毯。
馬爾可夫邊界
[編輯]中Y的馬爾可夫邊界是的子集,使得本身是Y的馬爾可夫毯,但的真子集都不是Y的馬爾可夫毯。也就是說,馬爾可夫邊界是最小馬爾可夫毯。
貝葉斯網絡中節點A的馬爾可夫邊界是由A的父節點、子節點與子節點的其他父節點構成的節點集。馬爾可夫網絡中,節點的馬爾可夫邊界是其鄰節點集合。依賴網絡中,節點的馬爾可夫邊界是其父節點的集合。
馬爾可夫邊界的唯一性
[編輯]馬爾可夫邊界總存在。某些較溫和的條件下,馬爾可夫邊界是唯一的。但對大多數情形,多個馬爾可夫邊界可能會提供不同的解。[2]存在多個馬爾可夫邊界時,測量因果效應的數量可能失效。[3]
另見
[編輯]註釋
[編輯]- ^ Pearl, Judea. Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference. Representation and Reasoning Series. San Mateo CA: Morgan Kaufmann. 1988. ISBN 0-934613-73-7.
- ^ Statnikov, Alexander; Lytkin, Nikita I.; Lemeire, Jan; Aliferis, Constantin F. Algorithms for discovery of multiple Markov boundaries (PDF). Journal of Machine Learning Research. 2013, 14: 499–566.
- ^ Wang, Yue; Wang, Linbo. Causal inference in degenerate systems: An impossibility result. Proceedings of the 23rd International Conference on Artificial Intelligence and Statistics. 2020: 3383–3392.