데이터 표준화 관련 용어, 단어, 도메인, 코드에 대해 정리해보자
1. 용어
종류 : 업무/비표준전문/표준 용어
- 업무용어 : 화면등 label 용. 길이 x
- 비표준전문 : 전문처리용. 길이포함.
- 표준용어 : 테이블 컬럼용.
2. 단어
1) 단일어
한음절 단어는 되도록 표준에서 제외하는 것이 좋다. ex) 회식 + 비(x) , 회식 + 비용(O)
예외적으로 허용해야하는 경우는 복합어로 만드는 것이 낫다. ex) 회식 + 비(x) , 회식비(O)
2) 복합어
- 합성어
- 파생어
단어 + 단어 로 구성된 단어가 각각의 단어에서 의미가 유추되지 않으면 복합어로 구성이 낫다
3) 기타
관용어, 외래어
금칙어/유사어
동음이의/ 이음동의
3. 도메인, 인포타입 ( 코드/번호/그룹)
- 도메인
도메인은 속성이 가질 수 있는 값의 범위
특정 데이터 필드에 허용되는 값의 집합을 정의
- 인포타입
인포타입은 도메인에 대한 구체적인 데이터 타입과 길이를 지정한 것
ex) 일자 도메인 : Varchar(8) 또는 Date 인포타입을 선택
계좌 번호 속성: 'VC12' (12자리 가변 문자열) 인포타입을 지정
4. 코드
- 코드란 무엇인가 : 속성의 값을 기호로 변환한 것
- 필요성 : 프로그램 소스코드 수준에서 로직분기, 데이터를 유형화하여 조회,
짧게 압축 => 가독성, 저장공간 효율성.
본질은 분류, 범주화의 도구
- 코드인 것과 아닌 것 (상품코드 vs 상품번호)
- 코드 종류 :
공통코드 : 시스템 전반에 걸쳐 공통적으로 사용되는 코드
일반적으로 공통코드 테이블에서 통합 관리
코드와 코드값만으로 서비스가 가능한 경우에 사용
개별코드 : 특정 업무 영역이나 테이블에서 개별적으로 정의되고 관리되는 코드
코드와 코드값 외에 추가적인 정보가 필요한 경우 사용
외부코드 : 외부코드는 외부 기관이나 표준에 의해 정의되어 사용되는 코드
시스템 간 호환성을 위해 외부에서 정의된 코드를 그대로 사용
* 식별자와 코드를 구분하기.
PD001, PD002 => 상품번호,
저축성, 연금성.. => 상품코드(범주로 분류)
[부서코드] => [부서]
#부서코드 => #부서번호 (* 식별자)
부서장id => 부서장id
부서구분 => 부서유형코드 (*코드)
데이터표준화는 업무적으로 협의하기에 따른 부분이 많기에 그냥 이렇게 정리해볼수 있다는 걸로만 알아두자.
'생계 > DA' 카테고리의 다른 글
RDBMS 에서의 관계 라는 것 (0) | 2023.12.12 |
---|---|
이력 모델 (0) | 2023.12.09 |
엔터티 통합과 분리 (0) | 2023.12.09 |
엔터티 유형 분류 (0) | 2023.11.29 |
논리 데이터 모델링 절차 (0) | 2021.10.16 |