optimize – 珠海图思科软件有限公司

19/07/2025

你能用多少种方法优化带有”NOT IN”子询查在SQL PostgreSQL ？

在我的最新博客文章中，我将探讨针对使用 “NOT IN” 子查询的 SQL 语句的额外优化方案。
以下是一个带有 NOT IN 子查询的 SQL 示例。该语句从成绩表（grade）中查询记录，要求当员工表（employee）中 emp_id 大于 3000 时，grd_id 不匹配任何 emp_grade 值：

select *
from grade
where grd_id not in (select b.emp_grade
from employee b
where b.emp_id > 3000)

在我上一篇文章中，通过将原始查询改写为使用NOT EXISTS语句，在我的数据库环境中实现了最佳性能表现。然而需要注意的是，这种方法并非对所有数据库结构设计都普遍适用：

select *
from grade g1
where not (exists (select ‘x’
                      from employee b
                     where g1.grd_id = b.emp_grade and
                           b.emp_id > 3000))

现在我将列出其他高性能解决方案：

方案1——添加GROUP BY子句
通过添加GROUP BY子句，可促使优化器预先对员工表进行排序和哈希聚合处理：

方案2——添加COALESCE函数
通过添加COALESCE(b.emp_grade, b.emp_grade)，会阻止员工表(employee)使用潜在索引，导致该表被迫进行顺序扫描(Seq Scan)，从而改变原查询执行路径中的连接顺序：

方案3——替换字面值为子查询
通过将字面值3000替换为子查询(SELECT (3000)),会隐藏常量特性，从而阻止优化器在b.emp_id字段上使用索引：

Tosska SQL Tuning Expert Pro for PostgreSQL – Tosska Technologies Limited

25/06/2025

如何优化 PostgreSQL 中带 “NOT IN 子查询” 的 SQL 语句？

以下是一个使用 NOT IN 子查询的 SQL 语句示例。该查询从 Grade 表中检索记录，条件是当 emp_id 大于 3,000 时，grd_id 不与 employee 表中的任何 grd_id 匹配：

select *
from grade
where grd_id not in (select b.emp_grade
from employee b
where b.emp_id > 3000)

当前执行计划耗时异常漫长，需要 50 分 10 秒才能完成。

该查询计划显示，系统先在Employee表上对Emp_id > 3000进行顺序扫描，生成物化临时存储，随后用Grade表的Grd_id进行过滤。这种查询计划效率极低——因为当Grade表的5000行记录需要逐行处理时，需反复扫描Employee表约300万条记录。

为解决此问题，我将SQL语句重写为NOT (EXISTS …)形式：

select *
from grade g1
where not (exists (select ‘x’
                      from employee b
                     where g1.grd_id = b.emp_grade and
                           b.emp_id > 3000))

优化后的查询计划显示：现在通过嵌套循环连接（Nest Loop），以Grade表为驱动，配合Employee表上的索引扫描（emps_grade_inx）进行操作。

重写后的SQL语句执行时间降至0.07秒，性能得到显著提升。

重写后的SQL比原始版本提速超过43,000倍。这类优化同样可通过Tosska SQL Tuning Expert Pro for PostgreSQL工具实现。下图展示了几种性能更优的SQL替代方案，但因篇幅所限不便在本文详述，也许我们可以稍后再讨论这个话题。

Tosska SQL Tuning Expert Pro for PostgreSQL – Tosska Technologies Limited

22/01/2025

如何为 openGauss 调优带有“EXISTS 子查询”的 SQL ？

openGauss 是一种开源的关系型数据库管理系统（RDBMS），它起源于 PostgreSQL。openGauss 旨在提供高性能、高可用性和企业级功能。最初由华为开发，后来被开源给社区。

在大多数数据库的 SQL 优化器中，一个常见问题是对 EXISTS 子查询的低效处理。以下是一个带有 EXISTS 子查询的 SQL 语句示例。该查询从 emp_subsidiary 表中检索与 employee 表中的 salary、grade_id 和 department_id 匹配的记录。

select *
from emp_subsidiary a
where exists (select ‘x’
                 from employee b
                where a.emp_salary = b.emp_salary and
                      b.emp_grade = a.emp_grade and
                      a.emp_dept = b.emp_dept)

以下是查询计划；完成该查询需要 10.35 秒。

查询计划显示了一个 Hash Inner Join，其中包含对 emp_subsidiary 表的顺序扫描（sequential scan）和对 employee 表的顺序扫描。该查询计划的性能看起来是合理的，如果不引入新的索引，性能将无法进一步提升。

有人可能会建议将 SQL 重写为使用 IN 语句，以查看查询是否可以改进，如下所示：

select *
from emp_subsidiary a
where (a.emp_salary, a.emp_grade, a.emp_dept) in (select b.emp_salary,
                                                          b.emp_grade,
                                                          b.emp_dept
                                                     from employee b)

重写后的 SQL 并未生成新的查询计划，且未观察到性能提升。为了解决这个问题，让我进一步将原始 SQL 语句重写为带有 INTERSECT 语句的子查询。

显然，重写后的 SQL 在子查询中引入了一个额外的操作，即 employee 表与 emp_subsidiary 表进行交集运算。这意味着只有 employee 表和 emp_subsidiary 表之间基于 emp_salary、emp_grade 和 emp_dept 的交集记录会被返回。因此，子查询的结果集大幅减少，从而显著降低了高成本的 Hash Aggregate 操作。

select *
from emp_subsidiary a
where (a.emp_salary, a.emp_grade, a.emp_dept) in (select b.emp_salary,
                                                          b.emp_grade,
                                                          b.emp_dept
                                                     from employee b
                                                   intersect
                                                   select a.emp_salary,
                                                          a.emp_grade,
                                                          a.emp_dept
                                                     from emp_subsidiary a)

重写后的 SQL 需要 4 秒完成，其查询计划如下。与原始查询计划相比，新计划略显复杂。然而，Hashed Aggregate 操作的成本显著低于原始 SQL，实际执行时间也反映了这一改进。

这种语法重写方法只有在 INTERSECT 操作引入的开销被其显著减少的子查询结果集所抵消时才有用。

重写后的 SQL 比原始 SQL 快 2 倍以上。这种优化也可以通过使用 Tosska SQL Tuning Expert 在 openGauss 中实现。

Tosska SQL Tuning Expert Pro (TSEG Pro™) for openGauss® – 珠海图思科软件有限公司

04/09/2024

如何使用查询重写插件在 MySQL 数据库中调整 SQL II？

MySQL 中的查询重写插件是一个组件，允许您在执行之前修改传入的 SQL 查询。它提供了根据特定需求转换、路由、过滤或扩展查询的功能。

如果您已安装了该插件，可以使用以下 SQL 语句来定义您的 SQL 替换规则和错误消息处理.

INSERT INTO query_rewrite.rewrite_rules (message, pattern, replacement)
VALUES(Unique_ID, Original_SQL, Rewrite_SQL);

MySQL 中的 query_rewrite.rewrite_rules 表存储了 Query Rewriter 插件用于重写 SQL 查询的规则。该表包含两列：

Pattern – 此列代表触发 SQL 查询重写的模式或条件。它定义了要匹配的特定查询或查询模式。

Replacement – 此列指定应该应用于匹配的查询或查询模式的替换或转换。

当执行 SQL 查询时，Query Rewriter 插件会检查 query_rewrite.rewrite_rules 表以查找匹配的模式。如果模式与执行的查询匹配，插件将使用相应的替换重写查询。这使您能够根据特定的模式或条件修改查询结构、优化查询或添加自定义逻辑。
以下是一个包含硬编码字面量的 SQL 语句示例，执行该 SQL 需要 2.1 秒，并附有以下查询计划。

SELECT   *
FROM     employee
WHERE    emp_id in (SELECT emp_id id
                    FROM   emp_subsidiary
                    where emp_dept < ‘D’)
ORDER BY emp_id LIMIT 1;

以下屏幕显示了通过 Tosska DB Ace SQL 调优工具识别出的性能显著提升的替代 SQL 语句。由于注入 JOIN ORDER 提示，此优化后的 SQL 查询比原始 SQL 快了300多倍.

现在，我们需要将这个优化后的 SQL 与原始 SQL 一起部署到数据库中。然而，一个挑战出现在条件“emp_dept < 'D'”上，当使用一个带有不同硬编码字面量的 SQL 语句，比如“emp_dept < 'E'”时，它与 SQL 文本不匹配。因此，我们必须使用数值占位符Placeholder来替换硬编码字面量，将其替换为占位符“？”，如下所示。

INSERT INTO query_rewrite.rewrite_rules (message, pattern, replacement)
VALUES(Unique_ID, Original_SQL, Rewrite_SQL);

Original_SQL

SELECT   *
FROM     employee
WHERE    emp_id in (SELECT emp_id id
                    FROM   emp_subsidiary
                    where emp_dept < ?)
ORDER BY emp_id LIMIT 1

Rewrite_SQL

select   /*+ QB_NAME(QB1) JOIN_ORDER(`employee`@QB1, `emp_subsidiary`@QB2) */ *
from     employee
where    emp_id in (select /*+ QB_NAME(QB2) */ emp_id id
                    from   emp_subsidiary
                    where emp_dept < ?)
order by emp_id limit 1

Tosska DB Ace for MySQL通过自动化发现优化SQL替代方案和部署具有数值占位符替换的SQL，简化了这一过程。

查询重写插件功能强大且易于使用。最具挑战性的方面是为性能较差的SQL语句找到替代SQL。Tosska DB Ace Enterprise for MySQL可以帮助您自动化这一过程，从识别性能较差的SQL语句到重写SQL语法并部署替代规则。

Tosska DB Ace Enterprise for MySQL – Tosska Technologies Limited

DBAM Tune Rewriter demo – YouTube

22/12/2023

如何使用MySQL数据库中的Query Rewriter插件来调优SQL？

MySQL中的Query Rewriter插件是一个组件，允许您在执行SQL之前修改传入的SQL查询。它提供了根据特定需求转换、路由、过滤或扩展查询的能力。该插件在SQL层操作，并可用于优化查询性能、强制执行安全策略、实施数据分区策略或向查询添加附加业务逻辑。通过Query Rewriter插件，您可以自定义和塑造SQL查询，以满足特定需求，在MySQL服务器内灵活控制查询执行。

Query Rewriter查询转换功能使您能够将原始查询重写或转换为等效或更高效的形式。这对于优化性能、简化复杂查询或强制使用特定查询计划非常有用。

在使用此功能之前，您必须安装Query Rewriter插件。Query Rewriter的概念很简单，它是一组预定义的SQL语句，用于替换从应用程序程序触发的特定SQL语句模式。

如果您已安装了该插件，以下SQL语句可用于定义您的SQL替换规则和错误消息处理。

INSERT INTO query_rewrite.rewrite_rules (message, pattern, replacement)
VALUES(Unique_ID, Original_SQL, Rewrite_SQL);

在MySQL中，query_rewrite.rewrite_rules表存储了Query Rewriter插件用于重写SQL查询的规则。该表具有两列：
Pattern – 此列表示触发SQL查询重写的模式或条件。它定义了要匹配的特定查询或查询模式。

Replacement – 此列指定应应用于匹配的查询或查询模式的替换或转换。

当执行SQL查询时，Query Rewriter插件会检查query_rewrite.rewrite_rules表以查找匹配的模式。如果某个模式与执行的查询匹配，插件将使用相应的替换来重写查询。这使您能够根据特定的模式或条件修改查询结构、优化查询或添加自定义逻辑。
我利用message列来定义SQL替换规则的临时唯一标识，这样可以使用以下SQL提取实际的规则ID。

SELECT id into :SID FROM query_rewrite.rewrite_rules where message= Unique_ID;

当您对query_rewrite.rewrite_rules表中的查询重写规则进行更改时，这些更改不会立即生效。相反，MySQL会将规则缓存在内存中以提高性能。然而，如果您希望确保更新后的规则立即生效，可以调用query_rewrite.flush_rewrite_rules()函数。

CALL query_rewrite.flush_rewrite_rules();

如果发生加载错误，插件还会将Rewriter_reload_error状态变量设置为ON，并将错误消息存储在Message列中。

SELECT message FROM query_rewrite.rewrite_rules where id=:SID;

实际上，Query Rewriter插件功能强大且易于使用。最具挑战性的方面是为性能不佳的SQL语句找到替代的SQL语句。Tosska DB Ace Enterprise for MySQL可以帮助您自动化这个过程，从识别性能不佳的SQL语句到重写SQL语法和部署替代规则。

Tosska DB Ace Enterprise for MySQL – Tosska Technologies Limited

DBAM Tune Rewriter demo – YouTube

发布于27/07/2023
软件部署中常被忽略的性能部署

性能部署是软件部署中一个常常被忽略的地方。尽管确保软件正确部署很重要，但在生产环境中优化性能同样重要。通过在软件部署过程中认识到性能部署的重要性，开发人员可以确保其软件运行良好，并满足用户的需求。关注性能部署可以帮助防止性能问题并提高用户对软件的满意度。

测试数据库与生产数据库之间性能部署的缺失环节
尽管进行了广泛的预部署测试，但在软件性能部署过程中仍有可能在特定的开发环境中遇到性能问题。以下问题可能会出现：

无法将生产数据复制到测试数据库中。

测试数据库与生产数据库之间的硬件和软件配置存在显著差异。

由于安全限制而无法在生产数据库中测试软件。

新软件中使用的DML SQL语句可能会损坏生产数据库的数据完整性。

所以用户在发布新应用程序代码后遇到性能问题或应用程序错误并不罕见。

通过预先部署流程确保性能部署
以下说明提供了一种保证软件性能可靠性的新方法。这个想法很简单：由于在生产数据库上运行新的应用程序代码是不可行的，为什么不为生产数据库中的每个SQL语句获取查询计划呢？这样，我们就可以评估每个应用程序代码中的SQL语句在生产数据库上的性能。

假设新应用程序代码中有10个SQL语句需要在测试数据库中识别。在这种情况下，我们需要先清除共享池并在测试数据库中执行新的应用程序，以隔离这10个语句。这个过程将使我们能够捕获和分析这10个SQL语句，并从生产数据库中获取它们的查询计划。下面的表格呈现了查询计划比较所导致的各种潜在结果。

观察结果 可能的原因

生产数据库中有Explain Plan错误 SQL语句需要访问生产数据库中不存在的对象

查询计划有更改测试和生产数据库之间存在显著的统计差异，包括数据库模式的差异。这些模式差异可能涉及缺少或新的分区以及其他影响数据库结构和组织的变化。由于潜在的重大性能变化，可能需要对SQL进行基准测试。

有未使用的索引一些在测试数据库中使用的索引在生产数据库中未使用, 由于潜在的重大性能变化，可能需要对SQL进行基准测试。

有新使用的索引一些在生产数据库中使用的索引在测试数据库中未使用, 由于潜在的重大性能变化，可能需要对SQL进行基准测试。

总成本有变化 10个SQL语句的整体查询计划成本发生变化。如果生产数据库的数据量大于测试数据库，则成本变化将更高。

DBAO SQL Performance Tracker – YouTube
Tosska DB Ace Enterprise for Oracle – Tosska Technologies Limited

发布于27/07/2023
如何使用假设分析来判断数据库环境变化的性能影响？

要正确评估数据库环境变化期间一组SQL语句的性能影响，必须深入了解SQL查询性能可能受到的影响。SQL查询可能发生的两种主要性能变化类型。我称之为“渐进性变化”的第一种类型通常是由统计数据的变化引起的，例如相关表或索引页面中数据量的波动。如果统计数据的变化不足以触发新的查询计划，查询计划将保持不变，并且与原始统计数据相比，SQL查询的性能不会有很大的变化。

第二种性能变化类型称为“跳跃性变化”，是由于统计数据或模式发生重大变化而引入新的查询计划。这种类型的变化可能对性能产生重大影响，有时会导致性能灾难。

在更改数据库环境时，必须密切监视SQL查询的性能，并采取适当措施来优化受影响的语句。为了跟踪环境变化前后的关键SQL语句，可以遵循以下一般步骤：

从SGA或AWR中提取SQL语句以及其查询计划和性能统计信息。

对数据库应用环境变化，例如创建新索引、收集统计信息、升级数据库或预测在生产数据库中软件部署的性能。

从更改的数据库环境中获取查询计划。

比较每个SQL语句的查询计划，以确定是否存在任何差异。

查找潜在问题，如未使用的索引、高成本SQL更改等。

对修改后的SQL语句的查询计划进行基准测试，以检测任何性能下降。

如果您只需要跟踪少量SQL语句的性能在环境变化前后的变化，上述步骤可以手动完成。但是，如果您需要监视数百个SQL语句而没有工具，则可能会很具有挑战性。 Tosska DB Ace for Oracle配备了一个强大的工具，可以帮助您跟踪两个数据库之间SQL语句的性能差异。

DBAO SQL Performance Tracker – YouTube
Tosska DB Ace Enterprise for Oracle – Tosska Technologies Limited

发布于12/07/202312/07/2023
使用Query Story优化 SQL的示例

SQL Server 中的查询存储Query Store是一个有价值的工具，用于通过快速识别由查询计划更改引起的性能降级来解决性能问题。以下示例，当在 SSMS 中执行以下 SQL 语句时，需要 15,579 毫秒才能完成。

使用查询存储器中的“消耗最多资源的查询”功能，我们可以看到具Query ID 23713 和相应的Plan ID 37290 的 SQL 在“计划摘要”窗口中显示。

要从 SQL Server 获取 SQL 文本，可以使用Query ID 手动提取并访问相关的系统表，即 sys.query_store_query 和 sys.query_store_query_text。或者，如果您有一个可以帮助提取 SQL 文本的工具，它可能会显示在下面的屏幕上。该工具接受查询 ID 或部分 SQL 文本来定位查询存储中的特定 SQL 语句进行 SQL 调整。

下面的屏幕显示了该产品如何通过向查询注入一系列提示Hints组合并创建相应的计划指南来提高 SQL 性能。手动完成此过程可能很困难，因为有许多可能的提示组合需要评估。如果没有对 SQL 调整和查询计划的基本理解，识别最佳提示组合可能需要进行大量的试错。
该工具是一款完全自动化的 SQL 调整解决方案，利用查询存储器。在处理过程中，该工具向 SQL 查询中注入了 100 种不同的提示Hints，并识别出了 75 种唯一的查询计划。经过基准测试，发现查询存储器Query store 66 (QS 66) 的性能最佳，处理时间节省了 98.45%。优化后的查询包括以下提示：
OPTION(HASH JOIN, TABLE HINT(employee, INDEX(EMPS_GRADE_INX)))

一旦确定了 SQL 语句的最佳提示，我们可以强制Force Plan将其计划用于 SQL 查询，如下面的屏幕所示。这样一来，下次用户程序执行该 SQL 时，其性能将得到改善，无需对其源代码进行任何修改。

下面的屏幕显示执行相同 SQL 语句在 SSMS 中可以显著提高性能的证据。CPU 时间从 54202 毫秒减少到 391 毫秒，性能提高了 138 倍，而经过的时间从 15579 毫秒减少到 294 毫秒，性能提高了 52 倍。

一种专为查询存储器（Query Store）优化SQL语句而设计的新产品
Tosska DB Ace for SQL Server在这个领域标志着一个重要的飞跃，因为它超越了查询存储器的被动恢复能力，并引入了主动的SQL性能增强。这项开创性技术允许用户从查询存储器（Query Store）中提取SQL并通过在查询存储器中创建新的和改进的查询计划来进行优化。使用Tosska DB Ace，用户可以将这些新计划应用于他们的SQL，而无需修改程序源代码或进行广泛的测试。

Tosska DB Ace Enterprise for SQL Server – Tosska Technologies Limited
DBAS Tune SQL QS – YouTube

发布于08/07/2023
如何使用查询存储器（Query Store）对SQL进行调优？

SQL Server中的查询存储器功能是一个宝贵的工具，用于通过允许用户快速识别由于查询计划更改而导致的性能降级来解决性能问题。
在给定的示例中，我们可以观察到一个SQL查询（ID 23058）具有两个查询计划。黄点对应于表现相对稳定的查询计划，而蓝点则表示性能计划更加波动。为了增强此SQL性能的稳定性，我们可以使用Query Store中的“强制计划”功能，将黄点的查询计划指定为默认计划。

查询存储器（Query Store）是由SQL Server提供的一个强大功能，使用户能够在Query Store中强制指定一个特定的SQL查询计划。然而，查询存储器也有其限制，因为它不允许用户创建之前未生成的新查询计划。其使用是被动的，仅允许恢复受损的SQL性能，而不提供一种方法让用户改进SQL语句，以便生成更好的查询计划。

如何使用查询存储器（Query Store）来手动调整SQL？
如果想要手动提高存储在查询存储器中的SQL查询性能，这个过程可能会相当复杂。以下是一些一般性的步骤，作为指南：

从系统表sys.query_store_query和sys.query_store_query_text中提取您要调整的SQL文本。

通过注入各种提示(Hints)并确定最佳提示应用程序来调整SQL以提高查询性能。

为SQL文本创建一个计划指南(Plan Guide)，保留原始SQL文本格式并纳入步骤2中确定的提示。

使用新创建的计划指南(Plan Guide)执行SQL，以在查询存储器中生成新的查询计划。

使用SQL Server Management Studio强制使用SQL的新查询计划。

最后，丢弃这计划指南(Plan Guide)。

通过遵循这些步骤，用户可以手动调整查询存储器中的SQL查询，并实现改进的性能。然而，需要注意的是，这个过程可能会很复杂和耗时，应该只由有经验的数据库管理员进行，他们对SQL性能优化有深入的了解。

一种专为查询存储器（Query Store）优化SQL语句而设计的新产品
Tosska DB Ace for SQL Server在这个领域标志着一个重要的飞跃，因为它超越了查询存储器的被动恢复能力，并引入了主动的SQL性能增强。这项开创性技术允许用户从查询存储器（Query Store）中提取SQL并通过在查询存储器中创建新的和改进的查询计划来进行优化。使用Tosska DB Ace，用户可以将这些新计划应用于他们的SQL，而无需修改程序源代码或进行广泛的测试。

Tosska DB Ace Enterprise for SQL Server – Tosska Technologies Limited
DBAS Tune SQL QS – YouTube

发布于04/07/2023
如何使用80/20法则来调优数据库应用程序 II ？

之前的文章“如何使用80/20法则来调优数据库应用程序 I”演示了如何应用80/20法则来评估数据库中SQL工作负载的整体性能。在本例中，展示了从Oracle SGA检索到的一组90个SQL语句的图表，每个语句按照其资源使用情况以降序排列列出，最具资源密集型的SQL在左侧。分析显示，大约14.44％的SQL语句占用了80％的总经过时间，而21.11％的SQL语句占用了80％的总CPU时间，表明SQL工作负载分布符合80/20法则。因此，调整SQL可能并不必要，因为这不太可能带来显著的性能改进。

然而，为了更加成本有效地进一步优化数据库性能，建议对高工作量SQL语句的前20％进行深入调查。这将揭示资源利用在前几个SQL语句中急剧下降，使它们成为优化的最关键候选项。

让我们将目标的总资源消耗比例从80％降低到60％，并检查负责利用这些资源的SQL语句。结果很有趣，显示出3个SQL语句占用了60％的经过时间，6个SQL语句占用了60％的CPU时间，而仅有一个SQL语句占用了60％的磁盘读取。通过专注于这些SQL语句，可以提高数据库工作负载高达60％。例如，如果数据库遇到IO瓶颈，专注于一个SQL语句可以节省高达60％的磁盘读取。

您可以利用Excel来进行上述80/20法则分析的模拟，提供SQL工作负载分布的全面概述。这种方法有助于快速评估数据库SQL性能的整体状况，以及优化高负载SQL语句的成本和效益。更进一步的SQL资源频谱分析已集成到我们的Tosska DB Ace for Oracle软件中。

Tosska DB Ace Enterprise for Oracle – Tosska Technologies Limited

DBAO Inspect SQL – YouTube

文章分页

页 1 页 2 下一页