貝葉斯污染

維基百科,自由的百科全書

貝葉斯污染(英語:Bayesian poisoning)是垃圾郵件製造者對抗貝葉斯垃圾郵件過濾器的一種技術。貝葉斯過濾器通過貝葉斯概率,確定一封新收到的郵件是否屬於垃圾郵件。垃圾郵件製造者嘗試通過隨機(或專門)添加一些不太可能出現在垃圾郵件中的詞語,讓垃圾郵件過濾器誤以為這封郵件是正常的——這是一個典型的第II型錯誤

垃圾郵件製造者希望降低郵件過濾器的效率,通過在垃圾信息中夾雜一些貝葉斯數據庫中的正常詞彙(典型的第I型錯誤),因為經過訓練的垃圾郵件過濾器中會有很多黑名單詞彙,如果郵件中的這些黑名單詞彙太多、那基本上就能判斷出這是一封垃圾郵件。