两个文档向量d1和d2的值为:d1=(1, 0, 3, 0, 2),d2=(3, 2, 0, 0, 1),则它们的余弦相似度为:()
填空题查看答案
给定由两次运行K均值产生的两个不同的簇集,误差的平方和最大的那个应该被视为较优。
判断题查看答案
假定用于分析的数据包含属性age,数据元组中age的值如下(按递增序): 13,15,16,16,19,20,20,21,22,22,25,25,25,25,30,33,33,33,35,35,35,35,36,40,45,46,52,70。 (a)使用按箱平均值平滑对以上数据进行平滑,箱的深度为3。解释你的步骤。评论对于给定的数据,该技术的效果。 (b)对于数据平滑,还有哪些其它方法?
简答题查看答案
()通过将属性域划分为区间,从而减少给定连续值的个数。
单选题查看答案
以下哪个指标不是表示对象间的相似度和相异度?()
单选题查看答案
考虑这么一种情况:一个对象碰巧与另一个对象相对接近,但属于不同的类,因为这两个对象一般不会共享许多近邻,所以应该选择()的相似度计算方法。
单选题查看答案
支持向量机中常用的核函数有多项式核函数、径向基核函数和()
填空题查看答案
给定基本方体,方体的物化有三种选择:()、()和()
填空题查看答案
对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。
判断题查看答案