简答题

以下是一个商场所销售商品的价格清单(按递增顺序排列,括号中的数表示前面数字出现次数) 1(2)、5(5)、8(2)、10(4)、12、14(3)、15(5)、18(8)、20(7)、21(4)、25(5)、28、30(3)。 请分别用等宽的方法和等高的方法对上面的数据集进行划分。

正确答案

(1)等宽方法:划分为3个数据集,每个数据集的宽度为价格10。价格在1—10之间出现次数为13;价格在11—20之间出现的次数为24;价格在21—30之间出现的次数为13。
(2)等高方法:划分为2个数据集,每个数据集的高度为出现的次数4。出现次数1—4之间的价格为1、8、10、12、14、21、28、30,共8个数据;出现次数5—8之间的价格为5、15、18、20、25,共5个数据。

答案解析

相似试题
  • 以下哪个范围是数据仓库的数据库规模的一个合理范围?()

    单选题查看答案

  • 假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?()

    单选题查看答案

  • 求和函数sum()是一个()的函数。

    填空题查看答案

  • 以下哪些是数据仓库的主要应用?()

    多选题查看答案

  • 下列几种数据挖掘功能中,()被广泛的应用于股票价格走势分析。

    单选题查看答案

  • 以下是哪一个聚类算法的算法流程()。 ①构造k-最近邻图。 ②使用多层图划分算法划分图。 ③repeat:合并关于相对互连性和相对接近性而言,最好地保持簇的自相似性的簇。 ④until:不再有可以合并的簇。

    单选题查看答案

  • 以下哪些算法是分类算法,()。

    单选题查看答案

  • 以下哪项关于决策树的说法是错误的?()

    单选题查看答案

  • 一个对象的离群点得分是该对象周围密度的逆。这是基于()的离群点定义。

    单选题查看答案