回答

收藏

关系代数中“ heta联接”的清晰解释?

技术问答 技术问答 304 人阅读 | 0 人回复 | 2023-09-14

我正在寻找有关关系代数中theta join概念的清晰,基本的解释,并且可能需要一个示例(也许使用SQL)来说明其用法。
0 F4 g: C, p* G, V7 Z% g3 b* a如果我正确理解,则theta联接是添加了条件的自然联接。因此,尽管自然联接在相同名称的属性之间强制相等(并删除重复的属性?),但是theta联接执行相同的操作,但是增加了在某种情况下。我有这个权利吗?以简单的术语(对于非数学家)的任何清楚的解释将不胜感激。9 m. o5 u4 j7 S7 u+ t3 y; c
另外(很抱歉,最后才提出来,但与之相关),有人可以解释笛卡尔积的重要性或想法吗?我认为我在基本概念方面缺少一些东西,因为在我看来,这似乎是对一个基本事实的重申,即一组13
3 m) h6 X5 U5 p, j3 ?X一组4 = 52 …+ E6 h+ [- g) I1 ^! n
                . f! @8 O7 Y4 J) {$ p7 e
解决方案:
! X/ i3 Z% T9 f# \                . y7 F9 f# M: k2 S/ L

2 R9 O# d0 b; @+ \' j: i* X( Q6 D+ V: |
                将SQL搁置一会儿…$ l. F  v  H* [! r1 l5 D- J" l
关系运算符将一个或多个关系作为参数并生成一个关系。因为根据定义,关系中没有具有重复名称的属性,所以关系操作theta联接和自然联接都将“除去重复的属性”。[按照您的要求在SQL中发布示例以解释关系操作的一个大问题是,SQL查询的结果不是关系,因为除其他缺点外,它可能具有重复的行和/或列。]
( P+ S* P- j. e* g* w  u' D# {关系笛卡尔积运算(一个关系的结果)与设置的笛卡尔积(一对结果的结果)不同。“笛卡尔”一词在这里并不是特别有用。实际上,科德称他的原始运算符为“产品”。
1 h; L- d1 b9 U5 `; E: Q% y  G真正的关系语言Tutorial" U/ b0 s) i1 q5 F# R9 d1 u& C* m
D在Tutorial
  t0 `3 v" k1 W! a% SD的合著者Hugh Darwen
0 C# h3 n2 i$ [2 F7 C  v**提出的关系代数中缺少乘积运算符,而product不是原始运算符。这是因为没有属性名称的两个关系的自然连接在相同的关系中产生的结果与相同的两个关系的乘积相同,即自然连接更普遍,因此更有用。
8 x" E/ r+ h* i! t. {* R/ N考虑以下示例(教程D):6 P( Y6 k+ B  m/ O/ X8 W6 I) b8 Q
WITH RELATION { TUPLE { Y 1 } , TUPLE { Y 2 } , TUPLE { Y 3 } } AS R1 ,/ l8 D1 w' f, L, s1 K, |$ I
     RELATION { TUPLE { X 1 } , TUPLE { X 2 } } AS R2 :0 ~6 }, I( e. m0 s  _: R
R1 JOIN R24 F3 p% Z! O: }7 y( r& ?- @6 G8 x
返回关系的乘积,即两个关系的度数(即两个属性X和Y)和基数为6(2 x 3 = 6个元组)。, s9 m9 c4 n/ i
然而,
: n" ^2 L( I  r5 wWITH RELATION { TUPLE { Y 1 } , TUPLE { Y 2 } , TUPLE { Y 3 } } AS R1 ,  F) T3 H2 }& J
     RELATION { TUPLE { Y 1 } , TUPLE { Y 2 } } AS R2 :9 r. N+ y" l( w" k9 x: G! p
R1 JOIN R2" N" B  o4 U7 Y2 \
返回关系的自然连接,即关系的度数(即属性的集合并集产生一个属性Y)和基数为2(即,删除了重复的元组)。
2 ?+ `) d" M) ?& w0 ?* E我希望上面的例子能解释为什么您的陈述“一组13 X一组4 = 52”不是严格正确的。
6 ~6 H% H+ ]  E' D& x$ L( Z0 j同样,教程D不包含theta联接运算符。这本质上是因为其他运算符(例如自然连接和限制)使它既不必要又不是非常有用。相比之下,Codd的原始运算符包括可用于执行theta联接的乘积和限制。' Z% n' k  j3 b1 \

3 \; m5 l3 Y* e2 F0 f* dSQL有一个显式的乘积运算符CROSS
, X( R4 A0 `7 x) I+ P0 F: HJOIN,即使通过创建重复的列(属性)违反了1NF的条件,也可以将结果强制为乘积。考虑与上面的后者Tutormap D示例等效的SQL:; Y9 k3 }- A) z/ u' z; f  [
WITH R1 AS (SELECT * FROM (VALUES (1), (2), (3)) AS T (Y)),
7 O& b: ^$ @) b+ v     R2 AS (SELECT * FROM (VALUES (1), (2)) AS T (Y))
5 W) o, k$ z5 BSELECT * : N2 P1 F7 z0 d  n$ |8 K
  FROM R1 CROSS JOIN R2;" ?9 n7 P, Y( O* r, p4 k+ z
这将返回一个表表达式,该表表达式包含两列(而不是一个属性),分别称为Y(!!)和6行,即
/ X" U7 j! s& j* USELECT c1 AS Y, c2 AS Y
4 t7 }- x2 m  ?  FROM (VALUES (1, 1), 5 P6 l' X7 B! L. q  l  V, {
               (2, 1), 4 n( \4 D* c+ g4 R
               (3, 1), # z$ ?, t& Z' d8 [6 ~7 T1 }$ v
               (1, 2), , N4 @7 [* b) r: M; A8 K
               (2, 2),
/ Q: i. J0 {  I+ @               (3, 2)
3 {+ R- y* X* _$ ]- j       ) AS T (c1, c2);* B3 }1 ]2 ]- R0 S

! f4 H! A/ k4 v% L( p" R**也就是说,尽管只有一种关系模型(即Codd的),但是可以有多个关系代数(即Codd只是一个)。
分享到:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则