A会消耗大量的内存
B会产生大量的候选项集
C对候选项集的支持度计算非常繁琐
D要对数据进行多次扫描
简述Apriori算法的思想,谈谈该算法的应用领域。
简答题查看答案
Apriori算法的计算复杂度受()影响。
多选题查看答案
如何提高Apriori算法的有效性?有哪些常见方法?
简答题查看答案
一个数据库有5个事务,如表所示。设min_sup=60%,min_conf=80%。 (a)分别用Apriori算法和FP-growth算法找出所有频繁项集。比较两种挖掘方法的效率。 (b)比较穷举法和Apriori算法生成的候选项集的数量。 (c)利用(1)所找出的频繁项集,生成所有的强关联规则和对应的支持度和置信度。
简答题查看答案
考虑如下的频繁3-项集:{1,2,3},{1,2,4},{1,2,5},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}。 (a)根据Apriori算法的候选项集生成方法,写出利用频繁3-项集生成的所有候选4-项集。 (b)写出经过剪枝后的所有候选4-项集。
简答题查看答案
许多基于内存的聚类算法所常用的两种数据结构是()和()
填空题查看答案
方体计算的主要挑战是()和()之间的矛盾。
填空题查看答案
ID3算法主要存在的缺点是什么?
简答题查看答案
简述K-means算法的基本操作步骤(包括算法的输入和输出)。
简答题查看答案