(来学网)把一组数据按照差异性和相似性分为几个类别,使得同类的数据相似性尽量大,不同类的数据相似性尽可能小,跨类的数据关联性尽可能低的数据挖掘方法是()
  • A.
    (来学网)分类
  • B.
    (来学网)聚类
  • C.
    (来学网)降维
  • D.
    (来学网)回归
正确答案:
B
答案解析:
无监督学习中有两大类典型任务:聚类和降维。①聚类是指把一组数据按照差异性和相似性分为几个类别,使得同类的数据相似性尽可能大,不同类的数据相似性尽可能小,跨类的数据关联性尽可能低。聚类分析常用于客户细分、文本归类、结构分组、行为跟踪等。与分类不同,聚类要划分的类是未知的,聚类是根据观察学习来确定数据之间的关系,因此是一种无监督学习。常用的聚类方法包括基于划分的方法(例如h均值聚类算法)、基于分层的方法、基于密度的方法、基于网格的方法和基于模型的方法。