1. 정규화(Normalization)
-우선 정규형을 하는 이유는
'최소한의 정보'들로 자료의 중복성 여부,
단위 정보의 크기가 작을수록 입력, 수정, 검색 및 추출 등에 있어 효율적이며 관리가 수월하여
정규형을 하게된다. 즉 필드 수가 늘어난다.
(= 중복데이터를 제거해 이상적으로 잘 돌아가게 하기위함)
2. 비정규 릴레이션
반복집합을 가질수 있다
즉 한개의 기본키 값에 대해서 두 개 이상의 값을 가질수 있는 속성
3. 제 1 정규형(1NF : First Normal Form)
어떤 릴레이션에 속한 모든 도메인이 원자 값으로만 되어 있는 것
거의 모든 릴레이션이 여기에 속함
※ 릴레이션
- 투플 내의 각 속성값으로 원자 값을 가짐
- 각 속성은 유일한 이름을 가지며 속성의 순서는 큰 의미가 없다.
- 테이블에서 모든 투플은 서로 다른값을 가지며, 투플의 순서는 없고 릴레이션은 투플들의 집합으로 정의
※ 투플
- 데이터의 행을 투플이라 한다
- 파일의 레코드와 유사한 개념으로 행이 투플에 해당
- 서로 다른 속성으로 구성
※ 속성
- 데이터의 가장 작은 논리적 단위
- 속성은 각 개체의 특성을 나타내는 값을 표현한 것으로 단독으로 존재하기 어려움
- item, field, column
4. 제 2 정규형(2NF : Second Normal Form)
제 1 정규형 릴레이션에서 부분 함수의 종속성을 제거한
모든 속성이 키에 완전 함수 종속된 것이 제 2 정규형 릴레이션이다
김사랑 2번 오지호 2번 중복이 된것을 2정규화로 과정으로 분해해준다.
5. 제 3 정규형(3NF : Second Normal Form)
어떤 릴레이션 R이 2NF이고, 모든 속성들이 기본키에 이행적 함수 종속이 아닐때
제 3정규형에 속한다.
※ 이행적 함수 종속의 형태
여기도 종속되고 저기도 종속되는 그런 형태
6. 보이스/코드 정규형(BCNF : Boyce/Codd Normal Form)
- 복잡한 식별자 관계에 의해 발생하는 문제를 해결하기 위해 제3정규형을 보완한 것
- 릴레이션 R이 제 3정규형을 만족하고, 모든 결정자가 후보키
(후보키가 아닌 결정자를 제거함)
보이스/코드 정규화 과정의 함수 종속 다이어그램
간단하게 요약된 정규형 과정
7. 제 5정규형(5NF : Fifth Normal Form) 또는 PJ/NF(Projection-Join Normal Form)
릴레이션 R에 존재하는 모든 조인 종속(JD)이 릴레이션 R의 후보키를 통해서만 만족되는 릴레이션이다
'DB' 카테고리의 다른 글
그림자 페이징 기법 (0) | 2014.10.18 |
---|---|
ACID (0) | 2014.10.17 |
MOLAP vs ROLAP (0) | 2014.10.17 |
스타스키마(Star Schema) (0) | 2014.10.17 |
빅데이터(BIG DATA) (0) | 2014.10.17 |