简答题

假定用于分析的数据包含属性age,数据元组中age的值如下(按递增序): 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70。 (a)使用按箱平均值平滑对以上数据进行平滑,箱的深度为3。解释你的步骤。评论对于给定的数据,该技术的效果。 (b)对于数据平滑,还有哪些其它方法?

正确答案

(a)已知数据元组中age的值如下(按递增序):
13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70,且箱的深度为3,划分为(等频)箱:

(b)对于数据平滑,其它方法有:
(1)回归:可以用一个函数(如回归函数)拟合数据来光滑数据;
(2)聚类:可以通过聚类检测离群点,将类似的值组织成群或簇。直观地,落在簇集合之外的值视为离群点。

答案解析

相似试题
  • 假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:()。

    单选题查看答案

  • 业务元数据主要包含的内容是什么?

    简答题查看答案

  • 什么是技术元数据?主要包含的内容是什么?

    简答题查看答案

  • 下列哪种可视化方法可用于发现多维数据中属性之间的两两相关性?()

    单选题查看答案

  • 已知数据元组中age的值如下(按递增序): 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70。 (a)使用min-max规范化,将age值35转换到[0.0,1.0]区间。 (b)使用z-score规范化转换age值35,其中,age的标准偏差为12.94年。 (c)使用小数定标规范化转换age值35。

    简答题查看答案

  • 下列几种数据挖掘功能中,()被广泛的用于购物篮分析。

    单选题查看答案

  • 考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()。

    单选题查看答案

  • 下面哪个不属于数据的属性类型:()。

    单选题查看答案

  • 关于基本数据的元数据是指()

    单选题查看答案