简答题

数据聚合需要考虑的问题有哪些?

正确答案

(1)模式识别:这主要是实体识别问题;
(2)冗余:一个属性是冗余的,即它能由另一个表导出,如果属性或维的命名不一致,也可能导致冗余,可以用相关分析来检测;
(3)数据值冲突的检测与处理:有些属性因表示比例或编码不同,会导致属性不同。

答案解析

相似试题
  • 一个数据仓库系统的建立通畅需要经过哪些步骤?

    简答题查看答案

  • 数据聚合的目的是什么?

    简答题查看答案

  • 下面哪些问题是我们进行数据预处理的原因?()

    多选题查看答案

  • 对于数据挖掘中的原始数据,存在的问题有:()。

    多选题查看答案

  • 何谓数据挖掘?它有哪些方面的功能?

    简答题查看答案

  • 数据的预处理方法有哪些?

    简答题查看答案

  • 聚类分析中常见的数据类型有哪些?

    简答题查看答案

  • 常见的分箱方法有哪些?数据平滑处理的方法有哪些?

    简答题查看答案

  • 何谓粒度?它对数据仓库有什么影响?按粒度组织数据的方式有哪些?

    简答题查看答案