본문 바로가기
자격증/빅데이터 분석 기사

[빅데이터 분석 기사 필기 2과목] 빅데이터 탐색 정리 - 4

by char_lie 2023. 4. 4.
반응형
반응형

자격증 준비하면서 내가 이해하기 편하게, 다시 보기 좋게 정리하는 빅데이터 분석기사의 내용 (자격증 상세 내용은 아래)

https://www.dataq.or.kr/www/sub/a_07.do

 

데이터자격시험

대용량의 데이터 집합으로부터 유용한 정보를 찾고 결과를 예측하기 위해 목적에 따라 분석기술과 방법론을 기반으로 정형/비정형 대용량 데이터를 구축, 탐색, 분석하고 시각화를 수행하는 업

www.dataq.or.kr

2과목인 빅데이터 분석 기획을 정리한 내용


시공간 데이터

공간적 객체에 시간의 개념이 추가되어 시간에 따라 위치나 형상이 변하는 데이터

  • 이산적 변화 : 데이터 수집의 주기가 일정하지 않은 데이터를 이용하여 표현, 시간의 변화에 따라 데이터가 추가
  • 연속적 변화 : 일정한 주기로 수집되는 데이터를 이용하여 연속적으로 표현, 연속적인 변화를 일종의 함수를 이용하여 표현

시공간 데이터 타입

  • 포인트 타입 : 하나의 노드로 구성되는 공간 데이터 타입
  • 라인 타입 : 서로 다른 두 개의 노드와 두 노드를 잇는 하나의 세그먼트로 구성
  • 폴리곤 타입 : n개(n≥3)의 노드와 n개의 세그먼트로 구성
  • 폴리라인 타입 : n개(n≥3)의 노드와 n-1개의 세그먼트로 구성

시공간 데이터 탐색 절차

  1. 주소를 행정구역으로 변환
  2. 주소를 좌표계로 변환 (지오 코딩 서비스를 이용하여 좌표계로 변환)
  3. 행정구역 및 좌표계를 지도에 표시(코르플레스 지도, 카토그램, 버블 플롯맵 등)

 기출문제

더보기

위상적 공간타입 : 공간 객체 간의 관계를 표현하며, 방위, 공간 객체 간의 중첩, 포함, 교차, 분리 등과 같은 위치적 관계 (답 : 4)

더보기

시공간자료 정의언어에는 공간적 속성과 시간적 속성을 동시에 포함하며 시공간 테이블의 정의 문은 점, 선, 면 등의 공간속성 타입이 추가되어 있다. (답 : 2)

다변량 데이터

조사 대상의 특징, 성질을 숫자 또는 무자로 나타낸 값

  • 일변량 데이터 : 단위에 대해 하나의 속성만 측정하여 얻게 되는 변수에 대한 자료
  • 이변량 데이터 : 각 단위에 대해 두 개의 특성을 측정하여 얻어진 두 개의 변수에 대한 자료
  • 다변량 데이터 : 하나의 단위에 대해 두 가지 이상의 특성을 측정하는 경우얻어지는 변수에 대한 자료

변량 데이터 탐색

  • 일변량 데이터 탐색 : 기술통계량, 그래프 통계량
  • 이변량 데이터 탐색 : 조사 대상의 각 개체로부터 두 개의 특성을 동시에 관측
  • 다변량 데이터 탐색 : 데이터 분석을 시행하기 이전에 산점도 행렬, 별 그림, 등고선 그림 등을 통해 시각적으로 자료 탐색

다변량 데이터 탐색 도구

  • 산점도 행렬 : 여러 변수 간의 산점도를 행렬로 나타내 변수 간의 연관성을 표현한 그래프
    • 그림 행렬 : 최대 20개의 변수를 사용할 수 있으며 가능한 모든 조합의 그래프를 만들 수 있음. 변수가 여러 개 있을 경우 변수쌍 간의 관계를 보려면 그림 행렬을 사용하는 것이 효율적
    • 개별 Y대 개별 X 산점도 행렬 : y축 및 x축 변수를 사용하여 가능한 각 xy조합의 그래프
  • 스타 차트 : 별 모양의 점을 각각의 변수에 대응되도록 한 뒤 각각의 변숫값에 비례하도록 반경을 나타내도록 하여 관찰 값을 그림으로 표시한 그래프

비정형 데이터

일정한 규칙이나 형태를 지닌 숫자 데이터와 달리 이미지나 영상, 텍스트처럼 형태와 구조가 다른 구조화 되지 않은 데이터

  • 텍스트 탐색 방법 : 소셜 데이터의 텍스트와 같은 스크립트 파일 형태일 경우 데이터를 파싱한 후 탐색
  • 동영상, 이미지 탐색 방법 : 이진 파일 형태의 데이터일 때, 데이터의 종류별로 응용소프트웨어를 이용하여 탐색
  • XML, JSON, HTML 탐색 방법 : XML, JSON, HTML 각각의 파서(Parser)를 이용하여 데이터를 파싱 후 탐색

 기출문제

더보기

비정형 데이터의 특징이다. (답 : 4)


뒤로 이어지는 내용

https://edder773.tistory.com/139

 

[빅데이터 분석 기사 필기 2과목] 빅데이터 탐색 정리 - 5

자격증 준비하면서 내가 이해하기 편하게, 다시 보기 좋게 정리하는 빅데이터 분석기사의 내용 (자격증 상세 내용은 아래) https://www.dataq.or.kr/www/sub/a_07.do 데이터자격시험 대용량의 데이터 집합

edder773.tistory.com

 

반응형

댓글