[빅데이터 분석 기사 필기 3과목] 빅데이터 모델링 정리

자격증 준비하면서 내가 이해하기 편하게, 다시 보기 좋게 정리하는 빅데이터 분석기사의 내용 (자격증 상세 내용은 아래)

https://www.dataq.or.kr/www/sub/a_07.do

데이터자격시험

대용량의 데이터 집합으로부터 유용한 정보를 찾고 결과를 예측하기 위해 목적에 따라 분석기술과 방법론을 기반으로 정형/비정형 대용량 데이터를 구축, 탐색, 분석하고 시각화를 수행하는 업

www.dataq.or.kr

3과목인 빅데이터 모델링을 정리한 내용

딥러닝

여러 비선형 변환 기법의 조합을 통해 높은 수준의 추상화를 시도하는 기계 학습 알고리즘의 집합

오차역전파 사용
시그모이드는 기우기 소실 문제로 인해 ReLU와 같은 활성화 함수를 많이 사용
딥러닝은 은닉층을 사용하여 결과에 대한 해석이 어려움
Dropout은 일정한 비율을 가지고 무작위로 신경망

딥러닝 알고리즘

DNN 알고리즘
- 은닉층을 심층 구성한 신경망으로 학습하는 알고리즘
- 입력층, 다수의 은닉층, 출력층으로 구성
- 입력층에서 가중치가 곱해져 은닉층으로 이동시키고, 은닉층에서도 가중치가 곱해지면서 다음 계층으로 이동
- 역전파 알고리즘은 출력층 → 은닉층 → 입력층으로 반복적으로 수행되며 최적화된 결과를 도출
CNN 알고리즘
- 시각적 이미지를 분석하는 데 사용되는 심층신경망으로 합성곱 신경망이라고 함
- 기존 영상처리의 필터 기능과 신경망을 결합하여 성능을 발휘하도록 만든 구조
- 필터 기능을 이용하여 입력 이미지로부터 특징을 추출한 뒤 신경망에서 분류작업을 수행
CNN 알고리즘 순서
1. 입력층 합성곱 연산 : 사용자가 입력한 이미지에서 필터를 이용하여 특징을 추출
2. 피처 맵에서 서브샘플링 연산 : 피처 맵에서 서브샘플링 연산을 통해 환면의 크기를 줄임
3. 피처 맵에서 합성 곱, 서브샘플링을 반복 연산 : 반복 연산을 통해 최적화된 피처 맵을 구성
4. 완전연결계층에서 다층 신경망을 이용하여 분류 수행 : 2차원의 이미지를 1차원 행렬이 되도록 한 후 신경망의 입력에 하나씩 맵핑을 수행함
RNN 알고리즘
- 입력층, 은닉층, 출력층으로 구성되며 은닉층에서 재귀적인 신경망을 갖는 알고리즘
- 음성신호, 연속적 시계열 데이터 분석에 적합
- 장기 의존성 문제와 기울기 소실문제가 발생하여 학습이 이루어지지 않을 수 있음
- 확률적 경사 하강법, 시간 기반 오차역전파를 사용해서 가중치를 업데이트

[빅데이터 분석 기사 필기 4과목] 빅데이터 결과 해석 정리 - 2 (0)	2023.04.07
[빅데이터 분석 기사 필기 4과목] 빅데이터 결과 해석 정리 - 1 (0)	2023.04.07
[빅데이터 분석 기사 필기 3과목] 빅데이터 모델링 정리 - 4 (0)	2023.04.06
[빅데이터 분석 기사 필기 3과목] 빅데이터 모델링 정리 - 3 (0)	2023.04.05
[빅데이터 분석 기사 필기 3과목] 빅데이터 모델링 정리 - 2 (0)	2023.04.05

[빅데이터 분석 기사 필기 3과목] 빅데이터 모델링 정리 - 5

딥러닝

딥러닝 알고리즘

※ 기출문제

※ 기출문제

비정형 데이터 분석

텍스트 마이닝

텍스트 마이닝 절차

텍스트 마이닝 기능

오피니언 마이닝

오피니언 마이닝 절차

웹 마이닝

웹 마이닝 유형

사회 연결망 분석

사회 연결망 분석 절차

사회 연결망 분석 주요 속성

사회 연결망 분석 측정지표

앙상블 분석

앙상블 학습 절차

※ 기출문제

배깅

배깅 절차

부스팅

부스팅 절차

랜덤 포레스트

랜덤 포레스트 절차

랜덤 포레스트 기법

랜덤 포레스트 초매개 변수

※ 기출문제

K-최근접 이웃(K-NN)

K-최근접 이웃의 장단점

※ 기타 기출문제

'자격증 > 빅데이터 분석 기사' 카테고리의 다른 글

관련글

댓글

티스토리툴바