简答题

简述数据预处理方法和内容。

正确答案

①数据清洗:包括填充空缺值,识别孤立点,去掉噪声和无关数据。
②数据集成:将多个数据源中的数据结合起来存放在一个一致的数据存储中。需要注意不同数据源的数据匹配问题、数值冲突问题和冗余问题等。
③数据变换:将原始数据转换成为适合数据挖掘的形式。包括对数据的汇总、聚集、概化、规范化,还可能需要进行属性的重构。
④数据归约:缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果。

答案解析

相似试题
  • 进行数据预处理时所使用的主要方法包括:()、()、()和()

    填空题查看答案

  • 数据的预处理方法有哪些?

    简答题查看答案

  • 简述数据清理的基本内容。

    简答题查看答案

  • 简述数据仓库设计的三级模型的基本内容。

    简答题查看答案

  • 下面哪种不属于数据预处理的方法?()

    单选题查看答案

  • 常见的分箱方法有哪些?数据平滑处理的方法有哪些?

    简答题查看答案

  • 简述处理空缺值的方法。

    简答题查看答案

  • 简述缺失值的处理方法。

    简答题查看答案

  • 基于邻近度的离群点检测方法不能处理具有不同密度区域的数据集。

    判断题查看答案