[再议]如何去除数据表中的重复数据

叶金荣在基础知识中写如何去除数据表中的重复数据利用数据导入导出的方式.这种方式是能实现的,数据建立唯一索引的.但有一个更为简单的方法,能达到这个目的.那就是 IGNORG,比如:

ALTER IGNORE TABLE `tbl_name` ADD UNIQUE (`un_name`);
tal_name 为表名,un_name唯一索引名.
IGNORE 是当出现错误时,也就是当前处理的记录,与前面处理过的数据的有冲突(重复),忽略之.使SQL继续进行,这样便把可以达到去重的目的.

引申:这个选项在insert中也存在.我们如果在一个执行过程中,有多个insert 时,不免会在唯一索引字段上会有重复的.那么,使用ignore 会使得insert继续进行.而不是中断.

Taxonomy upgrade extras:

mysql的insert语句有一个比较少见的可选子句: ON DUPLICATE KEY UPDATE col_name=expr, ...

那么如果这个表有KEY的话,就很幸运了

例如:

INSERT INTO table (a,b,c) VALUES (1,2,3) ON DUPLICATE KEY UPDATE c=c;
例如,如果列a被定义为UNIQUE,并且包含值1,则执行以上语句时就不会产生重复数据

即插入时若唯一键冲突,则会执行update语句

这时我的理解,哪位给接着补充,我也时菜鸟一只。。

嗯,看来这样也可以啊,呵呵

MySQL中文网: http://imysql.cn
Google MySQL中文用户群:http://groups.google.com/group/imysql

给你的祝福,要让你招架不住!

谢谢分享。