多维标度
维基百科,自由的百科全书
多维标度(Multidimensional scaling,缩写MDS,又译“多维尺度”)也称作“相似度结构分析”(Similarity structure analysis),属于多重变量分析的方法之一,是社会学、数量心理学、市场营销等统计实证分析的常用方法。
目录 |
[编辑] 假設
[编辑] 目的
多维标度是一个探索性的过程方法
- 减少(观察)项目
- 如果可能,在数据中揭示现有结构
- 揭示相关特征
- 寻找尽可能低维度的空间(“最小化条件”)
- 空间必须满足“单调条件”
- 解释空间的轴,依照假设提供关于感知和评判过程的信息
[编辑] 应用领域
用于评判和感知:
[编辑] 与其他多变量分析方法的比较
[编辑] 因子分析
[编辑] 聚类分析
- 相同:把对象分组
- 不同:聚类分析把观测到的特征当作分组标准,而多维标度仅仅取用感知到的差异
- 为划分类别提供实际的支持
[编辑] 所使用的标量类型
- 序数标量
- 区隔标量
- 比率标量
[编辑] 相似(度)矩阵
| 红色 | 橙色 | 黄色 | 绿色 | 蓝色 | 紫色 | |
| 红色 | - | |||||
| 橙色 | 6 | - | ||||
| 黄色 | 8 | 0 | - | |||
| 绿色 | 10 | 8 | 9 | - | ||
| 蓝色 | 10 | 10 | 10 | 6 | - | |
| 紫色 | 0 | 7 | 10 | 9 | 7 | - |
相似度矩阵举例(数字越小表示越相似)
例如,10个对象,2维空间,坐标个数则为10×2=20,“相似度”的个数为C102=45,数据压缩系数=相似度的个数÷坐标个数=45÷20=2.25(数据压缩系数要大于等于2才可接受,否则不能做多维标度分析)
[编辑] 数据采集的困难和问题
[编辑] 间接(数据)采集方法
[编辑] 完全排序法
Cn2对“相似度”进行排序,最相似的一对得到序数1,最不相似的一对得到序数Cn2
[编辑] 锚点法
[编辑] 评级法(Rating)
与“完全排序法”不同的是,虽然最相似的一对得到序数1,但是可以有多于一对得到相同的序数,最不相似的一对也不一定会依序得到Cn2
[编辑] 各种多维标度
[编辑] 简单多维标度
[编辑] 迭代多维标度
[编辑] 加权多维标度
对各维度进行不同的加权
[编辑] 多维展开(Multidimensional unfolding)
[编辑] 多维标度方法
[编辑] (古典)公制(多维)标度
- 处理区隔标量和比率标量
- 一定是采用欧氏距离
[编辑] 非公制多维标度
- 处理序数标量
- 不一定采用欧氏距离