简答题

下表中列出了4个点的两个最近邻。使用SNN相似度定义,计算每对点之间的SNN相似度。

正确答案

SNN即共享最近邻个数为其相似度。
点1和点2的SNN相似度:0(没有共享最近邻)
点1和点3的SNN相似度:1(共享点4这个最近邻)
点1和点4的SNN相似度:1(共享点3这个最近邻)
点2和点3的SNN相似度:1(共享点4这个最近邻)
点2和点4的SNN相似度:1(共享点3这个最近邻)
点3和点4的SNN相似度:0(没有共享最近邻)

答案解析

相似试题
  • 考虑这么一种情况:一个对象碰巧与另一个对象相对接近,但属于不同的类,因为这两个对象一般不会共享许多近邻,所以应该选择()的相似度计算方法。

    单选题查看答案

  • 以下是哪一个聚类算法的算法流程()。 ①构造k-最近邻图。 ②使用多层图划分算法划分图。 ③repeat:合并关于相对互连性和相对接近性而言,最好地保持簇的自相似性的簇。 ④until:不再有可以合并的簇。

    单选题查看答案

  • 按照事实表中度量的可加性情况,可以把事实表对应的事实分为4种类型:()、快照事实、线性项目事实和事件事实。

    填空题查看答案

  • 考虑下表数据集,请完成以下问题: (1)估计条件概率。 (2)根据(1)中的条件概率,使用朴素贝叶斯方法预测测试样本(A=0,B=1,C=0)的类标号; (3)使用Laplace估计方法,其中p=1/2,l=4,估计条件概率。 (4)同(2),使用(3)中的条件概率。 (5)比较估计概率的两种方法,哪一种更好,为什么?

    简答题查看答案

  • 使用星型模式可以从一定程度上()查询效率。因为星型模式中数据的组织已经经过预处理,主要数据都在庞大的事实表中。

    填空题查看答案

  • 请列出3种数据仓库产品,并说明其优缺点。

    简答题查看答案

  • 从点作为个体簇开始,每一步合并两个最接近的簇,这是一种分裂的层次聚类方法。

    判断题查看答案

  • 一种常用的确定离群点的简单方法是()

    填空题查看答案

  • 计算一个单位的平均工资,使用哪个中心趋势度量将得到最合理的结果?()

    单选题查看答案