A概念分层
B离散化
C分箱
D直方图
考虑下表所示二元分类问题的数据集。 (1)计算按照属性A和B划分时的信息增益。决策树归纳算法将会选择哪个属性? (2)计算按照属性A和B划分时Gini系数。决策树归纳算法将会选择哪个属性?
简答题查看答案
假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:()。
单选题查看答案
假定用于分析的数据包含属性age,数据元组中age的值如下(按递增序): 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70。 (a)使用按箱平均值平滑对以上数据进行平滑,箱的深度为3。解释你的步骤。评论对于给定的数据,该技术的效果。 (b)对于数据平滑,还有哪些其它方法?
简答题查看答案
Web数据挖掘是通过数据库仲的一些属性来预测另一个属性,它在验证用户提出的假设过程中提取信息。
判断题查看答案
给定基本方体,方体的物化有三种选择:()、()和()
填空题查看答案
简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()。
单选题查看答案
假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?()
单选题查看答案
如果对属性值的任一组合,R中都存在一条规则加以覆盖,则称规则集R中的规则为()。
单选题查看答案
为数据的总体分布建模;把多维空间划分成组等问题属于数据挖掘的哪一类任务?()
单选题查看答案