考虑这么一种情况:一个对象碰巧与另一个对象相对接近,但属于不同的类,因为这两个对象一般不会共享许多近邻,所以应该选择()的相似度计算方法。
单选题查看答案
以下是哪一个聚类算法的算法流程()。 ①构造k-最近邻图。 ②使用多层图划分算法划分图。 ③repeat:合并关于相对互连性和相对接近性而言,最好地保持簇的自相似性的簇。 ④until:不再有可以合并的簇。
单选题查看答案
按照事实表中度量的可加性情况,可以把事实表对应的事实分为4种类型:()、快照事实、线性项目事实和事件事实。
填空题查看答案
考虑下表数据集,请完成以下问题: (1)估计条件概率。 (2)根据(1)中的条件概率,使用朴素贝叶斯方法预测测试样本(A=0,B=1,C=0)的类标号; (3)使用Laplace估计方法,其中p=1/2,l=4,估计条件概率。 (4)同(2),使用(3)中的条件概率。 (5)比较估计概率的两种方法,哪一种更好,为什么?
简答题查看答案
使用星型模式可以从一定程度上()查询效率。因为星型模式中数据的组织已经经过预处理,主要数据都在庞大的事实表中。
填空题查看答案
请列出3种数据仓库产品,并说明其优缺点。
简答题查看答案
从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。
判断题查看答案
一种常用的确定离群点的简单方法是()
填空题查看答案
计算一个单位的平均工资,使用哪个中心趋势度量将得到最合理的结果?()
单选题查看答案