简答题

考虑如下的频繁3-项集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}。 (a)根据Apriori算法的候选项集生成方法,写出利用频繁3-项集生成的所有候选4-项集。 (b)写出经过剪枝后的所有候选4-项集。

正确答案

(a)利用频繁3-项集生成的所有候选4-项集:
{1,2,3,4},{1,2,3,5},{1,2,4,5},{1,3,4,5},{2,3,4,5}
(b)经过剪枝后的所有候选4-项集:
{1,2,3,4},{1,2,3,5}

答案解析

相似试题
  • 考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,采用合并策略,由候选产生过程得到4-项集不包含()。

    单选题查看答案

  • 设X={1,2,3}是频繁项集,则可由X产生()个关联规则。

    单选题查看答案

  • 什么是频繁项集?

    简答题查看答案

  • 频繁项集

    名词解析查看答案

  • 先验原理可以表述为:如果一个项集是频繁的,那包含它的所有项集也是频繁的。

    判断题查看答案

  • 在多维关联规则挖掘中,我们搜索的不是频繁项集,而是()

    填空题查看答案

  • 考虑值集{1、2、3、4、5、90},其截断均值(p=20%)是()。

    单选题查看答案

  • 一个数据库有5个事务,如表所示。设min_sup=60%,min_conf=80%。 (a)分别用Apriori算法和FP-growth算法找出所有频繁项集。比较两种挖掘方法的效率。 (b)比较穷举法和Apriori算法生成的候选项集的数量。 (c)利用(1)所找出的频繁项集,生成所有的强关联规则和对应的支持度和置信度。

    简答题查看答案

  • 考虑下表数据集,请完成以下问题: (1)估计条件概率。 (2)根据(1)中的条件概率,使用朴素贝叶斯方法预测测试样本(A=0,B=1,C=0)的类标号; (3)使用Laplace估计方法,其中p=1/2,l=4,估计条件概率。 (4)同(2),使用(3)中的条件概率。 (5)比较估计概率的两种方法,哪一种更好,为什么?

    简答题查看答案