構造記述#

千里之行,始于足下.

—老子

学習目標#

  • リレーションの概念を理解する.

  • 直積,濃度,次数の概念を理解し,計算できる.

  • リレーションスキーマとインスタンスの違いを理解する.

  • 第1正規形の概念を理解し,非第1正規形リレーションを正規化できる.

データモデルの要素#

  • 構造記述:データベースの構成要素の記述

  • 意味記述:データベースの一貫性制約の記述

  • 操作記述:データベース操作言語

A data model is a combination of at least three components:

  1. A collection of data structure types (the database building, blocks);

  2. A collection of operators or rules of inference, which can be applied to any valid instances of the data types listed in (1), to retrieve, derive, or modify data from any parts of those structures in any combinations desired;

  3. A collection of general integrity rules, which implicitly or explicitly define the set of consistent database states or changes of state or both–these rules are general in the sense that they apply to any database using this model (incidentally, they may sometimes be expressed as insert-update-delete rules).

E. F. Codd. 1982. Relational database: a practical foundation for productivity. Commun. ACM 25, 2 (Feb 1982), 109–117. https://doi.org/10.1145/358396.358400

リレーションとは#

ドメイン#

Definition

ドメイン(domain,定義域)は属性の取り得る値の集合である.一般に\(D\)で表す.

Example

  • 年齢:\(D_1 = \{0, 1, 2, \ldots, 120\}\)

  • 性別:\(D_2 = \{\text{"M"}, \text{"F"}, \text{"NULL"}\}\)

  • 人名:\(D_3 = \{x \mid x \text{ は人名}\}\)

直積#

Definition

直積(Cartesian product)は集合\(A\)\(B\)の直積であり,\(A \times B = \{(a, b) \mid a \in A, b \in B\}\)である.直積の要素はタプル(tuple,組)と呼ばれる.

Example

\(A = \{1, 2, 3\}\), \(B = \{3, 4\}\)のとき,\(A\)\(B\)の直積は次のようになる.

\[A \times B = \{(1, 3), (1, 4), (2, 3), (2, 4), (3, 3), (3, 4)\}\]

リレーション#

Definition

リレーション(relation)は\(D_1, D_2, \ldots, D_n\)をドメインとするとき,\(D_1, D_2, \ldots, D_n\)上のリレーション\(R\)とは\(D_1 \times D_2 \times \ldots \times D_n\)の任意の有限部分集合として定義する.

Example

\(D_1 = \{1, 2, 3\}\), \(D_2 = \{a, b\}\)のとき,リレーション\(R\)の例は次のようになる.

\[R = \{(1, a), (2, b), (3, a)\}\]

Example

\(D_1 = \{\text{"Tom"}, \text{"Mary"}\}\), \(D_2 = \{1, 2, \ldots, 120\}\)のとき,リレーション\(R\)の例は次のようになる.

\[R = \{(\text{"Tom"}, 20), (\text{"Mary"}, 30), (\text{"Tom"}, 40)\}\]

濃度と次数#

Definition

濃度(cardinality)はリレーションのタプルの数をリレーションの濃度という.次数(degree)はリレーションが定義されるドメインの数をリレーションの次数という.

Example

\(R = \{(1, a), (2, b), (3, a)\}\)の濃度は3,次数は2である.

テーブルとリレーション#

リレーションをテーブル(table)として表すことができる.テーブルの行はリレーションのタプルであり,テーブルの列はリレーションのドメインに対応する.

Example

ドメイン\(D_1 = \{\text{"Tom"}, \text{"Mary"}\}\), \(D_2 = \{0, 1, 2, \ldots\}\)のリレーション\(R\{(\text{"Tom"}, 25), (\text{"Mary"}, 30)\}\)をテーブルで表すと次のようになる.

Tom

25

Mary

30

  • \(D_2\)を年齢のドメインとするとき,TomとMaryの年齢はそれぞれ25歳と30歳である.

リレーションスキーマとインスタンス#

属性名(attribute name)はテーブルの列の名前であり,リレーション名(relation name)はテーブルの名前である.

Definition

\(A_i\)を属性名,\(D_i\)をドメイン,\(i=1, 2, \ldots, n\)とするとき,\(\text{dom}: A_i \to D_i\)ドメイン関数(domain function)という.

Example

\(D_1=\{x \mid x \text{は人名}\}\), \(D_2=\{0, 1, 2, \ldots\}\)のリレーション\(R\{(\text{"Tom"}, 25), (\text{"Mary"}, 30)\}\)を考える.

リレーション名は社員であり,属性名は名前と年齢である.テーブルで表すと次のようになる.

名前

年齢

Tom

25

Mary

30

年齢と名前のドメイン関数はそれぞれ次のようになる.

\[\text{dom}(\text{名前}) = D_1 = \{x \mid x \text{は人名}\}\]
\[\text{dom}(\text{年齢}) = D_2 = \{0, 1, 2, \ldots\}\]

ドメイン関数を用いたリレーションの定義#

Definition

リレーション\(R\)\(\text{dom}(A_1) \times \text{dom}(A_2) \times \ldots \times \text{dom}(A_n)\)の有限部分集合である.

リレーションスキーマとインスタンス#

Definition

\(\boldsymbol{R}\)をリレーション名,\(A_1, A_2, \ldots, A_n\)を属性名,\(\text{dom}\)をドメイン関数とするとき,リレーションスキーマ(relation schema)は\(\boldsymbol{R}(A_1, A_2, \ldots, A_n)\)で表す.このとき,\(R \subseteq \text{dom}(A_1) \times \text{dom}(A_2) \times \ldots \times \text{dom}(A_n)\)\(\boldsymbol{R}\)インスタンス(instance)という.

Note

  • リレーションスキーマはリレーションの構造を記述する.時間的に変化しない.

  • インスタンスはリレーションの具体的な値を記述する.時間的に変化する.

第1正規形#

Definition

リレーションスキーマ\(\boldsymbol{R}(A_1, A_2, \ldots, A_n)\)第1正規形(1NF, first normal form)であるとは,任意のドメインがシンプルであることをいう.

シンプルはドメインの元が原子的(atomic),即ち分解不可能(nondecomposable)な値であることを指す.

非第1正規形#

ドメインを複数のドメインの直積として定義する入れ子型リレーションは非第1正規形である.

Example

\(\text{dom}(\text{学生名}) = \text{dom}(\text{姓}) \times \text{dom}(\text{名})\)のとき,次のリレーションは非第1正規形である.

学生番号

学生名

9375

(田中, 太郎)

9376

(山田, 花子)

この非第1正規形リレーションを正規化すると次のようになる.

学生番号

9375

田中

太郎

9376

山田

花子

べき集合(power set)として定義されるドメインも非第1正規形である.

Example

\(\text{dom}(\text{科目}) = \mathcal{P}(\text{dom}(\text{科目名}))\)のとき,次のリレーションは非第1正規形である.

学生番号

科目

9375

\(\{数学, 物理, 化学\}\)

9376

\(\{英語, 数学\}\)

この非第1正規形リレーションを正規化すると次のようになる.

学生番号

科目

9375

数学

9375

物理

9375

化学

9376

英語

9376

数学