简答题

考虑如下的频繁3-项集：{1，2，3}，{1，2，4}，{1，2，5}，{1，3，4}，{1，3，5}，{2，3，4}，{2，3，5}，{3，4，5}。（a）根据Apriori算法的候选项集生成方法，写出利用频繁3-项集生成的所有候选4-项集。（b）写出经过剪枝后的所有候选4-项集。

正确答案

（a）利用频繁3-项集生成的所有候选4-项集：
{1，2，3，4}，{1，2，3，5}，{1，2，4，5}，{1，3，4，5}，{2，3，4，5}
（b）经过剪枝后的所有候选4-项集：
{1，2，3，4}，{1，2，3，5}

答案解析

略

相似试题

考虑下面的频繁3-项集的集合：{1，2，3}，{1，2，4}，{1，2，5}，{1，3，4}，{1，3，5}，{2，3，4}，{2，3，5}，{3，4，5}假定数据集中只有5个项，采用合并策略，由候选产生过程得到4-项集不包含（）。
单选题查看答案
设X={1，2，3}是频繁项集，则可由X产生（）个关联规则。
单选题查看答案
什么是频繁项集？
简答题查看答案
频繁项集
名词解析查看答案
先验原理可以表述为：如果一个项集是频繁的，那包含它的所有项集也是频繁的。
判断题查看答案
在多维关联规则挖掘中，我们搜索的不是频繁项集，而是（）
填空题查看答案
考虑值集{1、2、3、4、5、90}，其截断均值（p=20%）是（）。
单选题查看答案
一个数据库有5个事务，如表所示。设min_sup=60%，min_conf=80%。（a）分别用Apriori算法和FP-growth算法找出所有频繁项集。比较两种挖掘方法的效率。（b）比较穷举法和Apriori算法生成的候选项集的数量。（c）利用（1）所找出的频繁项集，生成所有的强关联规则和对应的支持度和置信度。
简答题查看答案
考虑下表数据集，请完成以下问题：（1）估计条件概率。（2）根据（1）中的条件概率，使用朴素贝叶斯方法预测测试样本（A=0，B=1，C=0）的类标号；（3）使用Laplace估计方法，其中p=1/2，l=4，估计条件概率。（4）同（2），使用（3）中的条件概率。（5）比较估计概率的两种方法，哪一种更好，为什么？
简答题查看答案

语音搜题

拍照搜题

打赏

数据挖掘工程师

正确答案

答案解析