众数 (数学)

维基百科,自由的百科全书
跳转至: 导航搜索

众数(mode)指一组数据中出现次数最多的数据值。例如{1,2,3,3,3}中,出現最多的是3,因此眾數是3,众数可能是一個數,但也可能是多個數。

離散概率分布中,众数是指概率质量函数有最大值的數據,也就是最容易取様到的數據。在連續概率分布中,众数是指機率密度函數有最大值的數據,也就是機率密度函數的峰值。

在統計學上,众数和平均數中位數類似,都是总体随机变量有關集中趨勢的重要資訊。在在高斯分佈正態分佈)中,眾數位於峰值,和平均數中位數相同。但若分佈是高度偏斜分佈,眾數可能會和平均數、中位數有很大的差異。

分佈中的众数不一定只有一個,若概率质量函数或機率密度函數在x1, x2……等多個點都有最大值,就會有多個众数,最極端的情形是離散型均勻分佈,所有的點概率都相同,所有的點都是眾數。若機率密度函數有數個局部最大值,一般會將這幾個極值都稱為众数,此連續機率分佈會稱為多峰分布英语Multimodal distribution(和單峰性英语Unimodality相反)。

若是對稱的單峰分布(例如正態分佈),眾數和平均數中位數會重合[1]。若一随机变量是由對稱的总体中產生,可以用取樣的平均值來估計總體的眾數。

特征[编辑]

用众数代表一组数据,适合于数据量较多时使用,且众数不受极端数据的影响[2],并且求法简便。在一组数据中,如果个别数据有很大的变动,选择中位数表示这组数据的“集中趋势”就比较适合。

當數值或被觀察者沒有明顯次序(常發生於非數值性資料)時特別有用,由於可能無法良好定義算術平均數中位數。例子:{蘋果,蘋果,香蕉,橙,橙,橙,桃}的眾數是橙。

使用[编辑]

主要用于分类数据,也可用于顺序数据数值型数据

歷史[编辑]

众数的英文mode最早是由卡尔·皮尔逊在1895年開始使用[3]

参考文献[编辑]

  1. ^ 現代統計學的發展
  2. ^ 魏和清; 罗良清. 实用统计学. 中国财政经济出版社. 1 July 2011: 107–. ISBN 978-7-5095-2899-0. 
  3. ^ Pearson, Karl (1895). "Contributions to the Mathematical Theory of Evolution. II. Skew Variation in Homogeneous Material", Philosophical Transactions of the Royal Society of London, Ser. A, 186, 343-414

参见[编辑]