回答

收藏

加快大表和小表之间的内部联接

技术问答 技术问答 530 人阅读 | 0 人回复 | 2023-09-14

这可能是一个愚蠢的问题,但可能会为联接在内部的工作方式提供一些启示。& l% z$ z: ~0 p2 ?5 {0 w& ?
假设我有一个大表L和一个小表S(100K行vs. 100行)。
) ?# ]& u4 a  g, c2 l3 A/ ]以下两个选项在速度方面是否会有任何差异?
0 J5 P: o3 @' g; b, w/ h7 K$ }+ L" aOPTION 1:                 OPTION 2:  s5 M& K& a3 F$ U/ F+ _
---------                 ---------
: V' T7 T/ M7 XSELECT *                  SELECT *; Y: m: L! ?- C5 G6 c
FROM L INNER JOIN S       FROM S INNER JOIN L
& p  i  C# `. E" w2 F, ]$ EON L.id = S.id;           ON L.id = S.id;' q% a2 p+ d- ~2 C
注意,唯一的区别是表的连接顺序。
0 T& J$ J+ V& r4 I; `2 g$ j我意识到不同的SQL语言之间的性能可能会有所不同。如果是这样,MySQL与Access相比如何?
) m% F/ G8 ?1 y0 j, z               
  D. C& H7 }% A0 k/ K% f3 b; s9 l解决方案:
- p8 U% F$ U" p, {$ m9 q, R                8 e! U% V/ f1 ]! f/ c  T/ U9 C
- ~7 \/ E2 l2 ]; o0 ?8 h
3 \+ _2 K' o, x9 l
                不,顺序无关紧要。! V2 X9 j; I. \. ~
几乎所有的RDBMS(例如MS Access,MySQL,SQL, t& V, G+ y$ A4 m; O
Server,ORACLE等)都基于列统计信息使用基于成本的优化器。在大多数情况下,优化师将选择正确的计划。在您提供的示例中,顺序无关紧要(提供的统计信息是最新的)。; z; D, D+ o5 x4 \- G
5 D, Y6 L; k/ k% v% ~" J
为了决定使用哪种查询策略,Jet Engine优化器使用统计信息。以下因素是这些统计数据所基于的一些因素:1 E. W7 A( a6 P. L
表中的记录数& L4 i7 s3 o  X* @: J, b$ H% ^
表中的数据页数
7 n6 K0 j3 c! M6 E桌子的位置( K8 v1 H9 W  S6 r4 V
是否存在索引( ]" M7 {/ v: v/ m4 D/ K/ T4 ]
索引的独特性
5 F8 d7 d! [. s5 e. n- y3 g! i  }
0 D' E5 g/ N' O6 B& O6 ?5 G7 ]* O' l
注意 :您不能查看Jet数据库引擎优化方案,也不能指定如何优化查询。但是,您可以使用数据库文档管理器来确定是否存在索引以及索引的唯一性。  r) V4 m3 n0 P. W8 e- s( I
然后,基于这些统计信息,优化器将选择最佳内部查询策略来处理特定查询。
  u9 ~( v  I- |% M" s" z每当编译查询时,统计信息就会更新。当您保存对查询(或其基础表)的任何更改以及压缩数据库时,该查询都会标记为编译。如果查询被标记为要编译,则下次运行查询时将进行统计信息的编译和更新。编译通常需要一秒钟到四秒钟。
) F+ M/ a" S* K5 ~9 s0 x3 m& w) @2 r如果您在数据库中添加了大量记录,则必须打开然后保存查询以重新编译查询。例如,如果您使用一小组样本数据设计然后测试查询,则必须在将其他记录添加到数据库之后重新编译查询。执行此操作时,您要确保在使用应用程序时实现最佳查询性能。0 V8 ~6 U! |% ]' N! f

) Q( y% h  f/ p+ m参考。
, Z6 l- ]& U9 T$ e9 p可能感兴趣:ACC:如何在Microsoft Access 2.0,Microsoft Access 95和Microsoft Access
4 j0 W- O/ A+ u8 K97中优化查询
. l: P9 N5 s5 [Tony Toews的Microsoft Access Performance- j, j" s0 K1 a. r# }/ Z: I- K
FAQ值得一读。
* B# W! \( Z: U需要注意的是“加入顺序无关紧要”。
, x( d8 \9 A3 n2 f( a! U如果您的RDBMS基于成本的查询优化器在创建查询计划时超时,则连接顺序可能很重要。基于成本的优化器在构造查询计划时具有有限的资源(CPU时间和内存)。如果他们在编译阶段超时,那么您将获得迄今为止找到的最佳计划。
( u2 i" R5 w; y5 [" J; GTLDR;如果您的复杂查询收到计划编译超时(而不是查询执行超时),则应将限制性最强的联接放在首位。这样,在查询计划优化器超时的那一点上,它将增加找到“更好”计划的机会。
! \! ^' i+ Q4 `1 X' A+ m当然,如果遇到查询计划编译超时,则可能应该简化查询。
分享到:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则