脏数据

脏数据从广义上看。脏数据是指没有进行过数据预处理而直接接收到的、处于原始状态的数据。从狭义上看,是不符合研究要求,以及不可以对其直接进行对应的数据分析。脏数据根据不同的分析目的有不同的定义。如在常见的数据挖掘工作中。脏数据是指不完整、含噪声、不一致的数据;而在title=%E9%97%AE%E5%8D%B

大家好,欢迎来到IT知识分享网。

从广义上看。
脏数据
是指没有进行过
数据
预处理而直接接收到的、处于原始状态的数据。
从狭义上看,是不符合研究要求,以及不可以对其直接进行对应的数据分析。
脏数据根据不同的分析目的有不同的定义。如在常见的
数据挖掘
工作中。脏数据是指不完整、含噪声、不一致的数据;而在
问卷
分析中,脏数据则是指不符合问卷要求的数据。


开发中:
脏数据是指源系统中的数据不在给定的范围内或对于实际业务毫无意义,或是数据格式非法,以及在源系统中存在不规范的编码和含糊的业务逻辑。

在数据库技术中,脏数据在暂时更新(
脏读)中产生。

事务A更新了某个数据项X,可是因为某种原因。事务A出现了问题。于是要把A回滚。

可是在回滚之前。还有一个事务B读取了数据项X的值(A更新后),A回滚了事务,数据项恢复了原值。事务B读取的就是数据项X的就是一个“暂时”的值,就是脏数据。

通俗的讲,当一个事务正在訪问数据,而且对数据进行了改动。而这样的改动还没有提交到数据库中,这时。另外一个事务也訪问这个数据。然后使用了这个数据。由于这个数据是还没有提交的数据,那么另外一个事务读到的这个数据是脏数据,根据脏数据所做的操作可能是不对的。

此文加深理解,仅为记录所用。

參考:
http://zh.wikipedia.org/wiki/%E8%84%8F%E6%95%B0%E6%8D%AE
http://baike.baidu.com/view/1445322.htm?

fr=aladdin

版权声明:本文博主原创文章,博客,未经同意不得转载。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/30225.html

(0)

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信