提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
翻译|使用教程|编辑:黄竹雯|2019-01-30 10:51:17.000|阅读 648 次
概述:本篇文章介绍了如何用非唯一键识别重复项。
#慧都22周年庆大促·界面/图表报表/文档/IDE/IOT/测试等千款热门软控件火热促销中>>
相关链接:
Navicat Premium是一个可连接多种数据库的管理工具,它可以让你以单一程序同时连接到MySQL、Oracle及PostgreSQL数据库,让管理不同类型的数据库更加的方便。
大多数重复记录分为两类:重复意义和非唯一键。在MySQL文章中,如何识别和删除具有重复意义的值涉及到重复意义;在这篇文章中,我们将讨论如何识别非唯一键。这意味着同一表中的两个记录具有相同的键,但可能具有或不具有不同的值和含义。

即使是设计良好的数据库也可以累积非唯一的键重复。它通常是从外部源(如文本、csv或excel文件)以及数据源导入数据的结果。即使合并来自两个不同数据库的数据,如果您以某种方式组合每个数据库以生成一个新的键,也可能会创建重复的键——当然,假设新的键列支持非唯一值。例如,连接两个数字以生成一个新密钥可能会有问题:
Key 1 Key 2 New Key -------------------------- 10 25 1025 102 5 1025 !!!
在支持复杂系统的数据库中,防止出现重复键并不总是可行的。重要的是能够在它们污染您的数据之前快速有效地处理它们。
让我们首先从重叠键中分离出真正的重复值。
这是合并两个参与者数据源的结果。你会注意到有几个重复的名字,特别是“JENNIFER DAVIS”和“NICK WAHLBERG”:
id first_name last_name -------------------------------------- 10 PENELOPE GUINESS 12 NICK WAHLBERG 14 ED CHASE 22 JENNIFER DAVIS 23 JOHNNY LOLLOBRIGIDA 27 BETTE NICHOLSON 34 GRACE MOSTEL 41 NICK WAHLBERG 39 JOE SWANK 23 CHRISTIAN GABLE 22 JENNIFER DAVIS
Nick Walberg是我们在上篇文章中探讨过的意义重复的例子。另一方面, JENNIFER DAVIS也出现在两张唱片中,同一个键是22。还有一个与两个无关的演员相关联的复制键:“JOHNNY LOLLOBRIGIDA”和“CHRISTIAN GABLE”的复制键#23。对于22和23的重复键,第一个键是真正的重复键,而第二个键只需要为其中一个记录生成一个新键。
下面的查询将标识上表中共享公共ID的所有记录。建议使用MySQL group_concat()函数在一行中将重复的行格式化在一起:
SELECT
COUNT(*) as repetitions,
group_concat(id, ' (', last_name, ', ', first_name, ') ' SEPARATOR ' | ')
as row_data
FROM amalgamated_actors
GROUP BY id
HAVING repetitions > 1;
Repetitions row_data
-------------------------------------------------------------
2 22 (DAVIS, JENNIFER) | 22 (DAVIS, JENNIFER)
2 23 (LOLLOBRIGIDA, JOHNNY) | 23 (GABLE, CHRISTIAN)如果希望同时查找所有重复项(即重复含义和非唯一键重复项),可以将上述查询与使用UNION运算符检查重复名称的查询结合起来:
SELECT
COUNT(*) as repetitions,
group_concat(id, ' (', last_name, ', ', first_name, ') ' SEPARATOR ' | ')
as row_data
FROM amalgamated_actors
GROUP BY id
HAVING repetitions > 1
UNION
SELECT
COUNT(*) as repetitions,
group_concat(id, ' (', last_name, ', ', first_name, ') ' SEPARATOR ' | ')
as row_data
FROM amalgamated_actors
GROUP BY last_name, first_name
HAVING repetitions > 1;突出显示一个结果集中的所有重复项:
Repetitions row_data ------------------------------------------------------------- 2 22 (DAVIS, JENNIFER) | 22 (DAVIS, JENNIFER) 2 23 (LOLLOBRIGIDA, JOHNNY) | 23 (GABLE, CHRISTIAN) 2 41 (WAHLBERG, NICK) | 12 (WAHLBERG, NICK)
结论
在MySQL中创建一个查询来标识重复的键相对简单,因为您只需要在键字段上分组,并包含“Having COUNT(*) > 1”子句。以后的文章将回顾一些删除重复行和更新键的不同方法。
购买Navicat Premium正版授权,请点击“”哟!
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@hmdbvip.cn




在现代软件开发过程中,自动化单元测试是确保代码质量与可靠性的关键环节。尤其对于特定框架(如MFC)的代码,测试复杂度显著增加,常因依赖外部资源或交互操作而难以在静默环境中顺利执行。Parasoft C/C++test作为专业的软件测试工具,致力于帮助开发团队高效实施自动化测试,通过其强大的桩函数功能,能够有效模拟依赖组件的行为,从而实现对复杂逻辑的隔离测试。
本文将为大家介绍如何在MyEclipse中使用XDoclet开发EJB 2 Session Bean,欢迎下载最新版体验!
如果能将 CSV 自动转换为 PDF ,就能快速生成清晰、美观的报表,既节省手动排版时间,又能保持数据的专业呈现。本文将介绍如何使用 Spire.XLS for Java 实现这一过程——从加载 CSV 到输出高质量 PDF,仅需数行代码即可完成。
Parasoft C/C++test是一款专为C/C++代码设计的自动化测试工具,通过静态代码分析、单元测试和运行时错误检测等功能,帮助开发团队在早期发现并修复缺陷,提升代码质量和开发效率 。在实际使用中,尤其是在VC6此类旧版开发环境中执行单元测试时,可能会因环境兼容性问题触发链接错误。
相关产品
Navicat Premium 是一套数据库管理工具,让你使用一个程序即可同時连接到 MySQL、MariaDB、SQL Server、SQLite、Oracle 和 PostgreSQL 数据库。
最新文章 MORE
永利最大(官方)网站相关的文章 MORE
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@hmdbvip.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢
永利最大(官方)网站 