髒數據

維基百科,自由的百科全書

從廣義上看,髒數據是指沒有進行過數據預處理而直接接收到的、處於原始狀態的數據;從狹義上看,是不符合研究要求,以及不能夠對其直接進行相應的數據分析。

髒數據依據不同的分析目的有不同的定義,如在常見的數據挖掘工作中,髒數據是指不完整、含噪聲、不一致的數據;而在問卷分析中,髒數據則是指不符合問卷要求的數據。