자격증 준비하면서 내가 이해하기 편하게, 다시 보기 좋게 정리하는 빅데이터 분석기사의 내용 (자격증 상세 내용은 아래)
https://www.dataq.or.kr/www/sub/a_07.do
1과목인 빅데이터 분석 기획을 정리한 내용
데이터 분석 계획
데이터 분석 로드맵 단계
- 데이터 분석체계 도입
- 분석 과제 정의 & 로드맵 수립이 주요 과제
- 데이터 분석 유효성 검증
- 분석 알고리즘 · 아키텍처 설계 및 기술 실현 가능성 검증
- 데이터 분석 확산 및 고도화
- 빅데이터 분석, 활용 시스템 구축 및 고도화
※ 기출문제
→ 데이터 수집 및 확보와 데이터 준비 단계는 순차적으로 진행하여야 한다. (답 : 1)
하향식 접근 방식
- 분석 과제가 정해져 있고, 이에 대한 해를 찾기 위해 분석하는 방법
- 핵심, 파트너, 핵심자원, 채널, 비용구조 등의 비즈니스 모델 캔버스를 사용
하향식 분석 절차
- 문제탐색
- 비즈니스 모델 기반 문제 탐색
- 외부 참조 모델 기반 문제 탐색 및 분석 유스케이스 정의
- 문제 정의
- 사용자 관점에서 비즈니스 문제를 데이터 문제로 변환하여 정의
- 해결 방안 탐색
- 정의된 문제를 해결하기 위해 분석기법 및 역량에 따라 다양한 방안으로 탐색
- 데이터, 시스템, 인력 등에 따라 소요되는 예산 및 활용 가능 도구 다양하게 고려
- 타당성 검토
- 제시된 대안에 대한 타당성 평가 수행
- 경제적, 운영적 , 데이터 및 기술적 타당성 검토
- 선택
- 여러 대안 중 타당성에 입각하여 최적 대안을 선택하여 이를 프로젝트화
※ 기출문제
→ 하향식 접근 방식의 4단계 구성요소로는 문제 탐색, 무제 정의, 해결방안 탐색, 타당성 평가가 있으며, 순차적으로 진행된다. (답 : 3)
상향식 접근 분석
- 문제 정의 자체가 어려운 경우 데이터를 기반으로 문제를 지속적으로 개선하는 방식
- 인간에 대한 관찰과 공감을 바탕으로 최선의 방법을 찾는 디자인 사고 접근법을 사용
- 데이터 자체의 결합, 연관성 등을 중심으로 데이터를 분석하는 비지도 학습법 사용
- 생성, 실험, 테스트, 통찰 등의 시행착오로 문제를 해결하는 프로토타이핑 접근법 사용
상향식 접근 분석 절차
- 프로세스 분류 : 프로세스 단계를 구조화해 업무 프로세스 정의
- 프로세스 흐름 분석 : 프로세스 맵을 통해 프로세스별 업무흐름 표현
- 분석 요건 식별 : 각 프로세스 맵상의 주요 의사 결정 포인트 식별
- 분석 요건 정의 : 각 의사결정 시점에 무엇을 알아야 의사결정 할 수 있는지 정의
※ 기출문제
→ 문제가 먼저 주어지는 것은 하향식 접근 방식이고, 동적인 환경에서 발산과 수렴 단계를 반복하는 것은 혼합 방식이며 신상품 개발이나 전략 수립 등 중요한 의사결정 시 사용한다 (답 : 2)
대상별 분석 기획 유형
- 최적화(Optimization) : 대상이 무엇인지 무엇인지 인지(known)하고, 분석 방법도 인지(known)하고 있을 경우 사용
- 솔루션(Solution) : 분석 대상이 무엇인지 인지(known) 하나, 분석 방법을 모르는 경우(unknown) 사용
- 통찰(Insight) : 분석 대상을 명확하게 인지하지 못하나(unknown), 분석 방법을 인지(known)하고 있을 경우 사용
- 발견(Discovery) : 분석의 대상(unknown)도 모르고 방법(unknown)도 모르는 경우 사용
※ 기출문제
→ Insight는 분석 주제는 정해지지 않았더라도 방법을 알고 있을 때 가능하다. (답 : 2)
분석 마스터 플랜 수립
- 우선순위 설정
- 전략적 중요도, 비즈니스 성과, 실행 용이성 등을 기준으로 설정
- 로드맵 수립
- 업무 내재화, 분석 데이터, 기술 적용 수준으로 설정
분석과제 우선순위 선정 기준
- 1 사분면 : 전략적 중요도가 높아 즉각적 처리가 요구 (난이도 높음)
- 2 사분면 : 전략적 중요도가 높진 않지만 장기적 관점에서 반드시 추진돼야 함 (난이도 높음)
- 3 사분면 : 전략적 중요도가 높아 현재 시점에 전략적 가치를 두고 있음 (난이도 낮음)
- 4 사분면 : 전략적 중요도가 높지 않아 중장기적 관점에서 과제 추진
- 시급성 → 3, 4, 2 영역 순, 난이도 → 3, 1, 2 영역 순
※ 기출문제
→ 난이도를 평가하는 요소로는 데이터 획득 비용, 데이터 가공 비용, 데이터 저장 비용, 분석적용 비용, 분석 수준이 있으며, 전략적 중요도와 목표 가치는 시급성에 해당한다. (답 : 3)
→ 적용 우선순위 기준을 난이도에 둘 경우 순서는 3 사분면, 1 사분면, 2 사분면 순이다.
데이터 분석 방안
데이터 분석 방법론 계층
- 단계 : 프로세스 그룹을 통해 완성된 단계별 산출물을 생성하고 버전관리, 기준선 설정 등으로 통제
- 태스크 : 물리적, 논리적 단위로 품질 검토하는 항목
- 스탭 : 입력, 출력, 처리 및 도구로 구성된 단위 프로세스
※ 기출문제
→ 계층적 프로세스 모델은 단계, 태스크, 스탭 3단계로 구성되어 있다. (답 : 4)
빅데이터 분석 방법론의 절차
- 분석 기획
- 비즈니스 이해 및 범위 설정 : 비즈니스에 대한 충분한 이해와 도메인 문제점 파악
- 프로젝트 정의 및 계획 수립 : 모델의 운영 이미지 설계 및 모델 평가 기준 설정
- 프로젝트 위험계획 수립 : 발생 가능한 모든 위험을 발굴, 회피, 전가, 완화, 수용이 있음
- 데이터 준비
- 필요 데이터 정의 : 정형/비정형/반정형 등의 모든 내/외부 데이터와 속성, 담당자 등을 포함하는 데이터 정의서 작성
- 데이터 스토어 설계 : 획득 방안 수립 후 전사 차원의 데이터 스토어설계
- 데이터 수집 및 정합성 검증 : 데이터 스토어에 크롤링, 실시간 처리, 배치 처리 등으로 데이터 수집
- 데이터 분석
- 분석용 데이터 준비 : 비즈니스 이해, 도메인 문제점 인식, 프로젝트 정의 등 프로젝트 목표 인식
- 텍스트 분석 : 오피니언 마이닝, 사회 연결망 분석, 텍스트 마이닝, 웹 마이닝 등
- 탐색적 분석 : 기초 통계량 산출, 데이터 분포와 변수간 관계 파악 등
- 모델링 : 데이터 모델링, 모델에 대한 상세 알고리즘 작성 등
- 모델 평가 및 검증 : 테스트 데이터 세트를 이용한 모델 검증 작업 및 보고서 작성
- 모델 적용 및 운영 방안 수립 : 검증된 모델을 적용하고 최적화하여 운영할 수 있는 방안 수립
- 시스템 구현
- 설계 및 구현 : 알고리즘 설명서 · 데이터 시각화 보고서를 이용하여 시스템 · 데이터아키텍처 설계 및 사용자 인터페이스 설계
- 시스템 테스트 및 운영 : 단위 테스트, 통합 테스트, 시스템 테스트 실시
- 평가 및 전개
- 모델 발전 계획 수립 : 모델의 생명 주기를 설정하고 주기적 평가를 통한 유지보수 및 재구축
- 프로젝트 평가 보고 : 프로젝트의 성과를 정량적, 정성적 평가 및 최종 보고서 작성
※ 기출문제
→ 분석 방법론의 구성 요건은 상세한 절차, 방법, 도구와 기법, 템플릿과 산출물, 그리고 어느 정도의 지식만 있으면 활용 가능한 수준의 난이도(답 : 1)
→ 분석의 가치를 증명하고, 이해 관계자들의 동의를 얻기 위해 과제를 빠르게 해결하여 그 가치를 조기에 체험시키는 방식은 혼합 방식이다. (답 : 3)
→ 분석 기획 단계의 세부 태스크는 비즈니스 이해 및 범위 설정, 프로젝트 정의 및 계획 수립, 프로젝트 위험계획 수립이 있으며, 모델 발전계획 수립 태스크는 평가 및 전개 단계에 속한다. (답 : 3)
→ 분석 프로젝트가 갖는 속성으로는 데이터 크기, 데이터 복잡도, 속도, 분석모형의 복잡도, 정확도와 정밀도가 있다. (답 : 2)
KDD 분석 방법론 개념 및 절차
프로파일링 기술을 기반으로 통계적 패턴이나 지식을 찾기 위해 체계적으로 정리한 방법론
- 데이터 세트 선택 : 데이터 마이닝에 필요한 목표 데이터 구성
- 데이터 전처리 : 데이터에 대한 노이즈, 이상값, 결측값 등을 제거하는 단계
- 데이터 변환 : 데이터의 변수를 찾고, 데이터에 대한 차원축소를 수행하는 단계
- 데이터 마이닝 : 분석 목적에 맞는 데이터 마이닝 기법, 알고리즘 선택, 패턴 찾기, 데이터 분류, 예측 작업을 수행하는 단계
- 데이터 마이닝 결과 평가 : 분석 결과에 대한 해석·평가, 발견된 지식을 활용하는 단계
※ 기출문제
→ 분석 변수의 전처리 방법으로 데이터 정제, 데이터 통합, 데이터 축소, 데이터 변환이 있다. (답 : 4)
CRISP-DM 분석 방법론 개념 및 절차
비즈니스 이해를 바탕으로 데이터 분석 목적의 6단계로 진행되는 데이터 마이닝 방법론으로, 단계 → 일반화 테스트 → 세분화 태스크 → 프로세스 실행으로 구성
- 업무 이해 : 업무 목적 파악, 상황 파악, 데이터 마이닝 목표 설정, 프로젝트 계획 수립
- 데이터 이해 : 초기 데이터 수집, 데이터 기술 분석, 데이터 탐색, 데이터 품질 확인
- 데이터 준비 : 분리용 데이터 세트 선택, 데이터 정제, 데이터 통합, 학습·검증 데이터 분리 수행
- 모델링 : 모델링 기법 선택, 모델 테스트 계획 설계, 모델 작성, 모델 평가 수행
- 평가 : 분석 결과 평가, 모델링 과정 평가, 모델 적용성 평가 수행
- 전개 계획 수립, 모니터링과 유지보수 계획 수립, 프로젝트 종료 보고서 작성, 프로젝트 리뷰
SEMMA 분석 방법론 개념 및 절차
SAS사가 주도한 샘플링 → 탐색 → 수정 → 모델링 → 검증의 5단계로 분석하는 방법론
- 샘플링 : 통계적 추출, 조건 추출을 통한 분석 데이터 생성 단계
- 탐색 : 기초 통계, 그래프 탐색, 요인별 분할표, 클러스터링, 변수 유의성 및 상관 분석을 통한 분석 데이터 탐색 단계
- 수정 : 수량화, 표준화, 각종 변환, 그룹화를 통한 분석 데이터 수정·변환 단계
- 모델링 : 신경망, 의사결정나무, 로지스틱 회귀 분석, 전통적 통계를 이용한 모델을 구축하는 단계
- 검증 : 모델에 대한 평가 및 검증을 수행하는 단계
※ 기출문제
→ SEMMA 분석 방법론의 분석절차는 추출, 탐색, 수정, 모델링, 평가 순으로 수행된다. (답 : 4)
뒤로 이어지는 내용
https://edder773.tistory.com/129
'자격증 > 빅데이터 분석 기사' 카테고리의 다른 글
[빅데이터 분석 기사 필기 1과목] 빅데이터 분석 기획 정리 - 6 (0) | 2023.04.03 |
---|---|
[빅데이터 분석 기사 필기 1과목] 빅데이터 분석 기획 정리 - 5 (0) | 2023.04.03 |
[빅데이터 분석 기사 필기 1과목] 빅데이터 분석 기획 정리 - 4 (0) | 2023.04.03 |
[빅데이터 분석 기사 필기 1과목] 빅데이터 분석 기획 정리 - 2 (0) | 2023.04.03 |
[빅데이터 분석 기사 필기 1과목] 빅데이터 분석 기획 정리 - 1 (0) | 2023.04.02 |
댓글