반응형
자격증 준비하면서 내가 이해하기 편하게, 다시 보기 좋게 정리하는 정보처리기사의 내용 (자격증 상세 내용은 아래)
http://www.q-net.or.kr/crf005.do?id=crf00505&gSite=Q&gId=
정규화 및 데이터베이스 보안 부분을 정리한 내용
이상
- 데이터 중복이 발생하고, 이로 인해 문제가 발생하는 현상
- 삽입 이상 : 테이블에 데이터를 삽입할 때 의도와는 상관없이 원하지 않은 값들로 인해 삽입할 수 없게 되는 현상
- 삭제 이상 : 테이블에서 한 튜플을 삭제할 때 의도와는 상관없는 값들도 함께 삭제되는, 연쇄 삭제가 발생하는 현상
- 갱신 이상 : 테이블에서 튜플에 있는 속성 값을 갱신할 때 일부 튜플의 정보만 갱신되어 정보에 불일치성이 생기는 현상
함수적 종속
- 속성 X의 값 각각에 대해 시간에 관계 없이 항상 속성 Y의 값이 오직 하나만 연관되어 있는 경우
- X → Y로 표시
정규화
- 테이블의 속성들이 상호 종속적인 관계를 갖는 특성을 이용하여 테이블을 무손실 분해하는 과정
- 제1 정규형
- 테이블 R에 속한 모든 속성의 도메인이 원자 값만으로 되어 있는 정규형
- 제2 정규형
- 테이블 R이 제1 정규형이고, 기본키가 아닌 모든 속성에 대하여 완전 함수적 종속을 만족하는 정규형
- 제3 정규형
- 테이블 R이 제2 정규형이고 기본키가 아닌 모든 속성이 기본키에 대해 이행적 함수적 종속을 만족하지 않는 정규형
- BCNF
- BCNF는 테이블 R에 모든 결정자가 후보키인 정규형
- 일반적으로 제 3정규형에 후보키가 여러 개 존재하고, 이러한 후보키들이 서로 중첩되어 나타나는 경우에 적용 가능
- 제4 정규형
- 테이블 R에 다중 값 종속 A →→B가 존재할 경우 R의 모든 속성이 A에 함수적 종속 관계를 만족하는 정규형
- 제5 정규형
- 테이블 ㄲ의 모든 조인 속성이 R의 후보키를 통해서만 성립되는 정규형
반정규화
- 정규화된 데이터 모델을 의도적으로 통합, 중복, 분리하여 정규화 원칙을 위배하는 행위
- 반정규화를 수행하면 시스템의 성능이 향상되고 관리 효율성은 증가하지만 데이터의 일관성 및 정합성이 저하될 수 있음
- 과도한 반정규화는 오히려 성능을 저하시킬 수 있음
테이블 통합
- 두 개의 테이블에서 발생하는 프로세스가 동일하게 자주 처리되는 경우 고려
- 항상 두 개의 테이블을 이용하여 조회를 수행하는 경우 고려
테이블 분할
- 수평 분할
- 레코드를 기준으로 테이블을 분할하는 것
- 레코드별로 사용 빈도의 차이가 큰 경우 사용 빈도에 따라 테이블을 분할
- 수직 분할
- 하나의 테이블에 속성이 너무 많을 경우 속성을 기준으로 테이블을 분할
- 갱신 위주의 속성 분할, 자주 조회되는 속성 분할, 크기가 큰 속성 분할, 보안을 적용해야 하는 속성 분할 등
중복 테이블 추가
- 여러 테이블에서 데이터를 추출해서 사용하거나 다른 서버에 저장된 테이블을 이용해야 하는 경우 추가
- 집계 테이블의 추가 : 집계 데이터를 위한 테이블을 생성하고, 각 원본 테이블에 트리거를 설정하여 사용하는 것
- 진행 테이블의 추가 : 이력 관리 등의 목적으로 추가하는 테이블
- 특정 부분만을 포함하는 테이블의 추가 : 데이터가 많은 테이블의 특정 부분만을 사용하는 경우 해당 부분만으로 새로운 테이블 생성
중복 속성 추가
- 조인해서 데이터를 처리할 때 데이터를 조회하는 경로를 단축하기 위해 자주 사용하는 속성을 하나 더 추가하는 것
- 조인이 자주 발생하는 속성이거나 접근 경로가 복잡한 속성인 경우 추가
- 액세스의 조건으로 자주 사용되는 속성이거나 기본키의 형태가 적절하지 않거나 여러 개의 속성으로 구성된 경우 추가
시스템 카탈로그
- 다양한 객체에 관한 정보를 포함하는 시스템 데이터베이스
- 사용자와 시스템 모두 접근 가능
- 좁은 의미로는 카탈로그를 데이터 사전이라고도 함
메타 데이터
- 시스템 카탈로그에 저장된 정보
- 메타 데이터 유형
- 데이터베이스 객체 정보 : 테이블, 인덱스, 뷰 등의 구조 및 통계 정보
- 사용자 정보 : 아이디, 패스워드, 접근 권한 등
- 테이블의 무결성 제약 조건 정보 : 기본키, 외래키, NULL 값 허용 여부 등
- 함수, 프로시저, 트리거 등에 대한 정보
데이터 디렉토리
- 데이터 사전에 수록된 데이터에 접근하는 데 필요한 정보를 관리 유지하는 시스템
- 시스템만 접근할 수 있음
데이터베이스 저장 공간
- 테이블 : 데이터베이스의 가장 기본적인 객체로 로우(행)와 칼럼(열)으로 구성
- 칼럼 : 테이블의 열을 구성하는 요소, 데이터 타입, 길이 등으로 정의
- 테이블 스페이스 : 테이블이 저장되는 논리적인 영역
테이블 종류
- 일반 테이블 : 대부분의 DBMS에서 표준 테이블로 사용되는 테이블 형태
- 클러스터드 인덱스 테이블 : 기본키나 인덱스키의 순서에 따라 데이터가 저장되는 테이블
- 파티셔닝 테이블 : 대용량의 테이블을 작은 논리적 단위인 파티션으로 나눈 테이블
- 외부 테이블 : 데이터베이스에서 일반 테이블처럼 이용할 수 있는 외부 파일
- 임시 테이블 : 트랜잭션이나 세션별로 데이터를 젖아하고 처리할 수 있는 테이블
트랜잭션
- 논리적 기능을 수행하기 위한 작업의 단위 또는 한꺼번에 모두 수행되어야 할 일련의 연산
- 원자성 (Atomicity) : 트랜잭션의 연산은 데이터베이스에 모두 반영되도록 완료(commit)되던지 아니면 전혀 반영되지 않도록 복구(rollback)되어야 함
- 일관성 (Consistency) : 트랜잭션이 그 실행을 성공적으로 완료하면 언제나 일관성 있는 데이터베이스 상태로 변환
- 독립성 (Isolation) : 둘 이상의 트랜잭션이 동시에 병행 실행되는 경우 어느 하나의 트랜잭션 실행 중에 다른 트랜잭션의 연산이 끼어들 수 없음
- 영속성 (Durability) : 성공적으로 완료된 트랜잭션의 결과는 시스템이 고장 나더라도 영구적으로 반영되어야 함
CRUD 분석
- 프로세스와 테이블 간에 CRUD 매트릭스를 만들어 트랜잭션을 분석하는 것
- 복수의 변화를 줄 때는 기본적으로 C → D → U → R의 우선순위를 적용하여 한 가지만 적음
트랜잭션 분석
- CRUD 매트릭스를 기반으로 테이블에 발생하는 트랜잭션 양을 분석하여 테이블에 저장되는 데이터의 양을 유추
- DB의 용량 산정 및 구조의 최적화 목적
- 트랜잭션 분석서
- 단위 프로세스와 CRUD 매트릭스를 이용하여 작성
- 단위 프로세스, CRUD 연산, 테이블명, 칼럼명, 테이블 참조 횟수, 트랜잭션 수, 발생 주기 등으로 구성
인덱스
- 데이터 레코드를 빠르게 접근하기 위해 <키값, 포인터> 쌍으로 구성되는 데이터 구조
- 레코드가 저장된 물리적 구조에 접근하는 방법 제공
- 파일의 레코드에 빠르게 액세스 가능
인덱스 종류
- 트리 기반 인덱스 : 인덱스를 저장하는 블록들이 트리 구조를 이루고 있는 것
- 비트맵 인덱스 : 인덱스 칼럼의 데이터를 Bit 값인 0 또는 1로 변환하여 인덱스 키로 사용하는 방법
- 함수기반 인덱스 : 칼럼의 값 대신 칼럼에 특정 함수나 수식을 적용하여 산출된 값을 사용하는 것
- 비트맵 조인 인덱스 : 다수의 조인된 객체로 구성된 인덱스
- 도메인 인덱스 : 개발자 필요한 인덱스를 직접 만들어 사용하는 것
클러스터드 인덱스
- 인덱스 키의 순서에 따라 데이터가 정렬되어 저장되는 방식
- 실제 데이터가 순서대로 저장되어 있어 인덱스를 검색하지 않아도 원하는 데이터를 빠르게 찾을 수 있음
넌클러스터드 인덱스
- 인덱스의 키 값만 정렬되어 있고 실제 데이터는 정렬되지 않는 방식
- 데이터 삽입, 삭제 발생 시 순서를 유지하기 위해 데이터를 재정렬해야 함
뷰(View)
- 하나 이상의 기본 테이블로부터 유도된 가상 테이블
- 저장 장치 내에 물리적으로 존재하지 않지만, 사용자에게는 있는 것처럼 간주
- 뷰가 정의된 기본 테이블이나 뷰를 삭제하면 그 테이블이나 뷰를 기초로 정의된 다른 뷰도 자동으로 삭제
- 장점
- 논리적 데이터 독립성을 제공
- 동일 데이터에 대해 동시에 여러 사용자의 상이한 응용이나 요구를 지원
- 사용자의 데이터 관리를 간단하게 해 주며 접근 제어를 통한 자동 보안 제공
- 단점
- 독립적인 인덱스를 가질 수 없음
- 뷰의 정의를 변경할 수 없음
- 뷰로 구성된 내용에 대한 삽입, 삭제, 갱신 연산에 제약이 따름
클러스터
- 동일한 성격의 데이터를 동일한 데이터 블록에 저장하는 물리적 저장 방법
- 클러스터링 된 테이블은 데이터 조회 속도를 향상하지만 입력, 수정, 삭제에 대한 작업 성능을 저하
- 클러스터는 데이터의 분포도가 넓을수록 유리
- 처리 범위가 넓은 경우 단일 테이블 클러스터링, 조인이 많이 발생하는 경우에는 다중 클러스터링 사용
파티션
- 대용량의 테이블이나 인덱스를 작은 논리적 단위인 파티션으로 나누는 것
- 장점
- 데이터 접근 시 액세스 범위를 줄여 쿼리 성능이 향상
- 파티션별로 데이터가 분산되어 저장되므로 디스크의 성능 향상
- 파티션별로 백업 및 복구를 수행하므로 속도가 빠름
- 시스템 장애 시 데이터 손상 정도 최소화 가능
- 데이터 가용성 향상
- 단점
- 하나의 테이블을 세분화하여 관리하므로 세심한 관리가 요구
- 테이블 간 조인에 대한 비용 증가
- 용량이 적은 테이블에 파티셔닝을 수행하면 오히려 성능이 저하
파티션의 종류
- 범위 분할
- 지정한 열의 값을 기준으로 분할
- 해시 분할
- 해시 함수를 적용한 결과 값에 따라 데이터를 분할
- 특정 파티션에 데이터가 집중되는 범위 분할의 단점을 보완한 것으로, 데이터를 고르게 분산할 때 유용
- 특정 데이터가 어디에 있는지 판단할 수 없음
- 조합 분할
- 범위 분할로 분할한 다음 해시 함수를 적용하여 다시 분할하는 방식
- 범위 분할한 파티션이 너무 커서 관리가 어려울 때 유용
데이터베이스 용량 설계
- 데이터가 저장될 공간을 정의하는 것
- 데이터베이스의 용량을 정확히 산정하여 디스크의 저장 공간을 효과적으로 사용하고 확장성 및 가용성 높임
- 디스크의 특성을 고려하여 설계함으로써 디스크의 입출력 부하를 분산시키고 채널의 병목 현상 최소화
분산 데이터베이스 설계
- 논리적으로는 하나의 시스템에 속하지만 물리적으로는 네트워크를 통해 연결된 여러 개의 사이트에 분산된 데이터베이스
- 애플리케이션이나 사용자가 분산되어 저장된 데이터에 접근하게 하는 것을 목적
분산 데이터베이스의 목표
- 위치 투명성 : 액세스 하려는 데이터베이스의 실제 위치를 알 필요 없이 단지 데이터베이스의 논리적인 명칭만으로 액세스 할 수 있음
- 중복 투명성 : 동일 데이터가 여러 곳에 중복되어 있더라도 사용자는 마치 하나의 데이터만 존재하는 것처럼 사용하고, 시스템은 자동으로 여러 자료에 대한 작업을 수행
- 병행 투명성 : 분산 데이터베이스와 관련된 다수의 트랜잭션들이 동시에 실현되더라도 그 트랜잭션의 결과는 영향을 받지 않음
- 장애 투명성 : 트랜잭션, DBMS, 네트워크, 컴퓨터 장애에도 불구하고 트랜잭션을 정확하게 처리
분산 설계 방법
- 테이블 위치 분산
- 데이터베이스의 테이블을 각기 다른 서버에 분산시켜 배치하는 방법
- 분할
- 테이블의 데이터를 분할하여 분산시키는 것
- 분할 규칙 : 완전성, 재구성, 상호 중첩 배제
- 수평 분할 : 특정 속성의 값을 기준으로 행 단위로 분할
- 수직 분할 : 데이터 칼럼 단위로 분할
- 할당
- 동일한 분할을 여러 개의 서버에 생성하는 분산 방법
- 중복이 없는 할당과 중복이 있는 할당
데이터베이스 이중화
- 시스템 오류로 인한 서비스 중단이나 물리적 손상 발생 시 이를 복구하기 위해 동일한 데이터베이스를 복제하여 관리하는 것
- 사용자가 수행하는 작업은 데이터베이스 이중화 시스템에 연결된 다른 데이터베이스에도 동일하게 적용
데이터베이스 이중화 분류
- Eager 기법 : 트랜잭션 수행 중 데이터 변경이 발생하면 이중화된 모든 데이터베이스에 즉시 전달하여 변경 내용이 즉시 적용되도록 하는 기법
- Lazy 기법 : 트랜잭션의 수행이 종료되면 변경 사실을 새로운 트랜잭션에 작성하여 각 데이터베이스에 전달되는 기법
데이터베이스 이중화 구성 방법
- 활동 - 대기 방법 : 한 DB가 활성 상태로 서비스하고 있으면 다른 DB는 대기하고 있다가 활성 DB에 장애가 발생하면 대기 상태에 있던 DB가 자동으로 모든 서비스를 대신 수행
- 활동 - 활동 방법 : 두 개의 DB가 서로 다른 서비스를 제공하다가 둘 중 한쪽 DB에 문제가 발생하면 나머지 다른 DB가 서비스를 제공
클러스터링
- 두 대 이상의 서버를 하나의 서버처럼 운영하는 기술
- 고가용성 클러스터링 : 하나의 서버에 장애가 발생하면 다른 노드(서버)가 받아 처리하여 서비스 중단을 방지하는 방식
- 병렬처리 클러스터링 : 전체 처리율을 높이기 위해 하나의 작업을 여러 개의 서버에서 분산하여 처리하는 방식
목표 복구
- RTO(목표 복구 시간) : 비상사태 또는 업무 중단 시점으로부터 복구되어 가동될 때 가지의 소요 시간
- RPO(목표 복구 시점) : 비상사태 또는 업무 중단 시점으로부터 데이터를 복구할 수 있는 기준점을 의
암호화
- 송신자가 지정한 수신자 이외에는 그 내용을 알 수 없도록 평문을 암호문으로 변환하는 것
- 암호화 : 암호화되지 않은 평문을 암호문으로 바꾸는 과정(개인키 암호 방식, 공개키 암호 방식)
- 복호화 : 암호문을 원래 평문으로 바꾸는 과정
접근통제 기술
- 임의 접근 통제(DAC)
- 데이터에 접근하는 사용자의 신원에 따라 접근 권한을 부여하는 방식
- 데이터 소유자가 접근통제 권한을 지정하고 제어
- 객체를 생성한 사용자가 생성된 객체에 대한 모든 권한을 부여받고, 부여된 권한을 다른 사용자에게 허가할 수 있음
- 강제 접근 통제(MAC)
- 주체와 객체의 등급을 비교하여 접근 권한을 부여하는 방식
- 시스템이 접근통제 권한을 지정
- 데이터베이스 객체별로 보안 등급 부여 가능
- 사용자별로 인가 등급 부여 가능
- 역할기반 접근 통제(RBAC)
- 사용자의 역할에 따라 접근 권한을 부여하는 방식
- 중앙관리자가 접근통제 권한 지정
- 임의 접근통제와 강제 접근 통제의 단점 보완
- 다중 프로그래밍 환경에 최적화
접근 통제 정책
- 신분 기반 정책
- 주체나 그룹의 신분에 근거하여 객체의 접근을 제한하는 방법
- IBP : 최소 권한정책으로, 단일 주체에게 하나의 객체에 대한 허가를 부여
- GBP : 복수 주체에 하나의 객체에 대한 허가를 부여
- 규칙 기반 정책
- 주체가 갖는 권한에 근거하여 객체의 접근을 제한하는 방법
- MLP : 사용자나 객체별로 지정된 기밀 분류에 따른 정책
- CBP : 집단별로 지정된 기밀 허가에 따른 정책
- 역할 기반정책
- GBP의 변형된 정책으로, 주체의 신분이 아니라 주체가 맡은 역할에 근거하여 객체의 접근을 제한하는 방법
접근 통제 메커니즘
- 정의된 접근통제 정책을 구현하는 기술적인 방법
- 접근통제 목록, 능력 리스트, 보안 등급, 패스워드, 암호화 등
접근통제 보안 모델
- 기밀성 모델
- 군사적 목적으로 개발된 최초의 수학적 모델로 기밀성 보장이 최우선
- 군대 시스템 등 특수 환경에서 사용
- 무결성 모델
- 기밀성 모델에서 발생하는 불법적인 정보 변경을 방지하기 위해 무결성을 기반으로 개발된 모델
- 접근통제 모델
- 접근통제 메커니즘을 보안 모델로 발전시킨 것
- 접근통제 행렬 : 임의적인 접근통제를 관리하기 위한 보안 모델로 행과 열로 주체와 객체의 권한 유형을 나타냄
접근 통제 조건
- 값 종속 통제 : 일반적으로 객체에 저장된 값에 따라 다르게 접근통제를 허용해야 하는 경우 사용
- 다중 사용자 통제 : 지정된 객체에 다수의 사용자가 동시에 접근을 요구하는 경우 사용
- 내용 기반 통제 : 특정 시간, 네트워크 주소, 접근 경로, 인증 수준 등에 근거하여 접근을 제어하는 방법
로그 파일
- 데이터베이스의 상태 변화를 시간의 흐름에 따라 모두 기록한 파일
- 데이터베이스 복구를 위한 가장 기본적인 자료
- 트랜잭션 시작 시점, Rollback 시점, 데이터 입력, 수정 삭제 시점 등에서 기록
데이터베이스 복구 알고리즘
- 버퍼 내용을 비동기적으로 갱신한 경우의 복구 알고리즘
- NO-UNDO : 트랜잭션 완료 전에는 변경 내용이 데이터베이스에 기록되지 않으므로 취소할 필요 없음
- REDO : 트랜잭션 완료 후 데이터베이스 버퍼에는 기록되고 있고, 저장매체에는 기록되지 않았으므로 트랜잭션 내용을 다시 실행
- 버퍼 내용을 동기적으로 갱신한 경우의 복구 알고리즘
- UNDO : 트랜잭션 완료 전에 시스템이 파손되었다면 변경된 내용을 취소
- NO-REDO : 트랜잭션 완료 전에 데이터베이스 버퍼 내용을 이미 저장 매체에 기록했으므로 트랜잭션 내용을 다시 실행할 필요 없음
백업
- 물리 백업
- 데이터베이스 파일을 백업하는 방법
- 백업 속도가 빠르고 작업이 단순하지만 문제 발생 시 원인 파악 및 문제 해결 어려움
- 논리 백업
- DB 내의 논리적 객체들을 백업하는 방법
- 복원 시 데이터 손상을 막고 문제 발생 시 원인 파악 및 해결이 수월하지만, 시간이 많이 소요
스토리지
- 대용량의 데이터를 저장하기 위해 서버와 저장장치를 연결하는 기술
- DAS
- 서버와 저장장치를 전용 케이블로 직접 연결하는 방식
- 저장 장치를 직접 연결하므로 빠르고 설치 및 운영이 쉬우며, 초기 구축 비용과 유지보수 비용이 저렴함
- 확장성 및 유연성 낮음
- NAS
- 서버와 저장장치를 네트워크를 통해 연결하는 방식
- Ethernet 스위치를 통해 다른 서버에서도 스토리지에 접근할 수 있어 파일 공유 가능
- DAS에 비해 확장성 및 유연성 우수
- SAN
- 서버와 저장장치를 연결하는 전용 네트워크를 별도로 구성하는 방식
- 파이널 채널(FC) 스위치를 이용하여 네트워크 구성
- 서버들이 저장장치 및 파일 공유 가능
- 확장성, 유연성, 가용성이 뛰어남
슈퍼타입 기준 테이블 변환
- 서브타입을 슈퍼타입에 통합하여 하나의 테이블로 만드는 것
- 서브타입에 속성이나 관계가 적을 경우 적용
- 통합된 테이블에는 서브타입의 모든 속성이 포함
서브타입 기준 테이블 변환
- 슈퍼타입 속성들을 각각의 서브타입에 추가하여 서브타입들을 개별적인 테이블로 만드는 것
- 서브타입에 속성이나 관계 많이 포함된 경우 적용
개별타입 기준 테이블 변환
- 슈퍼타입과 서브타입들을 각각의 개별적인 테이블로 변환하는 것
- 슈퍼타입과 서브타입 테이블들 사이에 각각 1:1 관계 형성
속성 → 칼럼 변환
- 일반 속성 변환 : 개발자와 사용자 간 의사소통을 위하여 가능한 한 표준화된 약어를 사용하여 일치
- Primary UID → 기본키 변환 : 논리 데이터 모델에서의 Primary UID는 물리 데이터 모델의 기본키를 형성
- Primary UID(관계의 UID Bar) → 기본키로 변환 : 다른 엔티티와의 관계로 인해 생성된 Primary UID는 물리 데이터 모델의 기본키로 형성
- Secondary(Alternate) UID → 유니크키 변환 : 논리 모델링에서 저장된 Secondary UID는 물리 모델에서 유니크키로 형성
물리 데이터 모델 품질 기준
- 정확성 : 데이터 모델이 요구사항이나 업무 규칙, 표기법에 따라 정확하게 표현
- 완전성 : 데이터 모델이 데이터 모델의 구성 요소를 누락 없이 정의하고 요구사항이나 업무 영역을 누락 없이 반영
- 준거성 : 데이터 모델이 데이터 표준, 표준화 규칙, 법적 요건 등을 정확하게 준수
- 최신성 : 데이터 모델이 최근의 이슈나 현행 시스템을 반영
- 일관성 : 데이터 모델이 표현상의 일관성을 유지
- 활용성 : 작성된 모델과 설명을 사용자가 충분히 이해할 수 있고, 업무 변화에 따른 데이터 구조의 변경이 최소화될 수 있도록 설계
뒤로 이어지는 내용
https://edder773.tistory.com/182
반응형
'자격증 > 정보처리기사' 카테고리의 다른 글
[정보처리기사 실기] 통합 구현 정리 (0) | 2023.04.16 |
---|---|
[정보처리기사 실기] 자료구조와 정렬 정리 (0) | 2023.04.16 |
[정보처리기사 실기] 데이터베이스와 관계형 데이터베이스의 개요 (0) | 2023.04.14 |
[정보처리기사 실기] 비용 산정 기법 & 소프트웨어 개발 정리 (0) | 2023.04.12 |
[정보처리기사 실기] 요구사항 및 UML 정리 (0) | 2023.04.11 |
댓글