简答题

数据集如下表所示：（a）把每一个事务作为一个购物篮，计算项集{e}，{b，d}和{b，d，e}的支持度。（b）利用（a）中结果计算关联规则{b，d}→{e}和{e}→{b，d}的置信度。置信度是一个对称的度量吗？（c）把每一个用户购买的所有商品作为一个购物篮，计算项集{e}，{b，d}和{b，d，e}的支持度。（d）利用（b）中结果计算关联规则{b，d}→{e}和 {e}→{b，d}的置信度。置信度是一个对称的度量吗？

正确答案

（c）如果把每一个用户购买所有的所有商品作为一个购物篮，则

（d）利用c中结果计算关联规则{b，d}→{e}和{e}→{b，d}的置信度，则

置信度不是一个对称的度量

答案解析

略

相似试题

考虑下表所示二元分类问题的数据集。（1）计算按照属性A和B划分时的信息增益。决策树归纳算法将会选择哪个属性？（2）计算按照属性A和B划分时Gini系数。决策树归纳算法将会选择哪个属性？
简答题查看答案
一个数据库有5个事务，如表所示。设min_sup=60%，min_conf=80%。（a）分别用Apriori算法和FP-growth算法找出所有频繁项集。比较两种挖掘方法的效率。（b）比较穷举法和Apriori算法生成的候选项集的数量。（c）利用（1）所找出的频繁项集，生成所有的强关联规则和对应的支持度和置信度。
简答题查看答案
下表所示的相依表汇总了超级市场的事务数据。其中hot dogs指包含热狗的事务，指不包含热狗的事务。hamburgers指包含汉堡的事务，指不包含汉堡的事务。假设挖掘出的关联规则是“hot dogs=>hamburgers”。给定最小支持度阈值25%和最小置信度阈值50%，这个关联规则是强规则吗？计算关联规则“hot dogs=>hamburgers”的提升度，能够说明什么问题？购买热狗和购买汉堡是独立的吗？如果不是，两者间存在哪种相关关系？
简答题查看答案
简单地将数据对象集划分成不重叠的子集，使得每个数据对象恰在一个子集中，这种聚类类型称作（）。
单选题查看答案
模式为对数据集的全局性总结，它对整个测量空间的每一点做出描述；模型则对变量变化空间的一个有限区域做出描述。
判断题查看答案
考虑如下的频繁3-项集：{1，2，3}，{1，2，4}，{1，2，5}，{1，3，4}，{1，3，5}，{2，3，4}，{2，3，5}，{3，4，5}。（a）根据Apriori算法的候选项集生成方法，写出利用频繁3-项集生成的所有候选4-项集。（b）写出经过剪枝后的所有候选4-项集。
简答题查看答案
下面属于数据集的一般特性的有：（）。
多选题查看答案
数据集分为三类：（）。
填空题查看答案
数据处理通常分成两大类：联机事务处理和（）
填空题查看答案

语音搜题

拍照搜题

打赏

数据挖掘工程师

正确答案

答案解析