数据清洗用什么技术
@琴丹3495:数据挖掘中常用的数据清洗方法有哪些 -
长谦15745975829…… 数据清洗包含很多方面,比如数据格式校验以及转换、空缺值填充、异常值检验以及截断处理等等.语言有很多,常用的是SQL、SAS.把这两个用好了,包你无敌.
@琴丹3495:结构化数据和非结构化数据分别是什么?数据清洗是什么? -
长谦15745975829…… (1)结构化数据,简单来说就是数据库.结合到典型场景中更容易理解,比如企业ERP、财务系统;医疗HIS数据库;教育一卡通;政府行政审批;其他核心数据库等.这些应用需要哪些存储方案呢?基本包括高速存储应用需求、数据备份需求、...
@琴丹3495:在将数据源中的数据加载到数据仓库之前要完成哪些工作 -
长谦15745975829…… 抽取数据和清洗数据.抽取数据就是把关系型数据库中的数据复制出来;清洗数据就是对残缺数据、错误数据、重复数据等不符合条件数据的检查,主要技术有python、perl等; 其实就是ETL过程,抽取,清洗,加载.加载是最后一步,主要工具是kettle等.
@琴丹3495:如何清洗数据库 -
长谦15745975829…… 使用Sql语句查询出重复的数据,删除就可以了.
@琴丹3495:请教数据挖掘有关知识 -
长谦15745975829…… 这个需要看实际情况,仅作参考,对非结构化数据的数据挖掘适合使用聚类算法,在逐步聚类的过程中可以通过去除孤立点和低密度集合的方式去除噪声数据.实际情况下甚至有可能某一个集合就全是噪声数据
长谦15745975829…… 数据清洗包含很多方面,比如数据格式校验以及转换、空缺值填充、异常值检验以及截断处理等等.语言有很多,常用的是SQL、SAS.把这两个用好了,包你无敌.
@琴丹3495:结构化数据和非结构化数据分别是什么?数据清洗是什么? -
长谦15745975829…… (1)结构化数据,简单来说就是数据库.结合到典型场景中更容易理解,比如企业ERP、财务系统;医疗HIS数据库;教育一卡通;政府行政审批;其他核心数据库等.这些应用需要哪些存储方案呢?基本包括高速存储应用需求、数据备份需求、...
@琴丹3495:在将数据源中的数据加载到数据仓库之前要完成哪些工作 -
长谦15745975829…… 抽取数据和清洗数据.抽取数据就是把关系型数据库中的数据复制出来;清洗数据就是对残缺数据、错误数据、重复数据等不符合条件数据的检查,主要技术有python、perl等; 其实就是ETL过程,抽取,清洗,加载.加载是最后一步,主要工具是kettle等.
@琴丹3495:如何清洗数据库 -
长谦15745975829…… 使用Sql语句查询出重复的数据,删除就可以了.
@琴丹3495:请教数据挖掘有关知识 -
长谦15745975829…… 这个需要看实际情况,仅作参考,对非结构化数据的数据挖掘适合使用聚类算法,在逐步聚类的过程中可以通过去除孤立点和低密度集合的方式去除噪声数据.实际情况下甚至有可能某一个集合就全是噪声数据