본문 바로가기
ADsP

[ADsP] 3. 데이터 분석 기획의 이해(1)

by Point-Nemo 2026. 1. 30.

1. 분석 기획의 정의와 특징

(1) 분석 기획의 정의

 

(2) 분석 기획의 특징

 

(3) 분석 대상과 그 방법에 따른 4가지 분석 주제

https://m.blog.naver.com/yamyamsis/223104608246

 

(4) 목표 시점별 분석기획

- 과제 중심적인 접근 방식: 빠르게 해결해야하는 경우, 빠른 수행과 문제 해결이 목적

- 장기적인 마스터플랜 방식: 지속적 분석 내재화를 위한 경우, 정확도와 무엇이 문제인가에 대한 문제 정의가 목적 

 

2. 분석 기획 시 고려사항

(1) 가용 데이터 고려

- 데이터가 확보될 수 있는지에 대한 고려

- 데이터가 존재하더라도 유형에 따라 분석 방법이 다르기에 데이터 유형에 대한 분석이 선행되어야 함

 

(2) 적절한 활용 방안과 유스케이스의 탐색

- 기존에 잘 구현되어 활용되고 있는 유사 시나리오 및 솔루션을 최대한 활용

- 과거의 유사한 분석 사례가 있다면 그 시나리오를 활용

 

(3) 장애요소에 대한 사전 계획 수립

- 발생 가능한 장애요소에 대한 사전 계획 수립

 

3. 분석 방법론 개요

(1) 분석 방법론이란?

- 대규모 조직이 분석 프로젝트를 수행할 땐 구성원 간 업무상의 통일을 위한 철저한 조직 관리와 더불어 성공적인 프로젝트 수행을 위한 방법론이 필요

- 방법론이란 주어진 과제를 해결하기 위해 조직이 어떠한 절차로 작업을 수행해 나갈 것인지 일련의 절차를 정의

 

(2) 분석 방법론의 필요성

- 데이터 분석 프로젝트는 일정한 수준의 품질을 갖춘 산출물과 프로젝트의 성공 가능성을 확보하고 제시해야함

- 방법론 구성 요소: 상세한 절차, 방법, 도구와 기법, 템플릿과 산출물

 

(3) 분석 방법론의 생성 과정

https://dltpgh7060.tistory.com/8

 

4. 분석 방법론이 적용되는 업무 특성에 따른 모델

(1) 폭포수 모델

- 단계를 거쳐 순차적으로 진행하는 방법

- 현재 단게가 완료되어야 다음 단계로 진행 가능하지만, 문제가 발견될 경우 이전 단계로 돌아갈 수 있음

 

(2) 프로토타입 모델

- 사용자 중심의 개발 방법

- 일부분을 먼저 개발하고, 사용자의 요구를 분석해 개선 작업을 시행하며 점진적으로 시스템 개발

 

(3) 나선형 모델

- 반복을 통해 점증적으로 개발하지만, '위험요소를 사전에 제거하는 것'에 초점

- 처음 시도하는 프로젝트에는 적용이 용이하지만, 관리 체계를 효과적으로 갖추지 못하면 복잡도가 상승

 

(4) 계층적 프로세스 모델

- 하나의 단계는 여러 개의 태스크로 구성되고, 하나의 태스크는 여러 개의 스텝으로 구성됨

- 스텝은 WBS의 워크패키지에 해당되며, 입력 - 처리 및 도구 - 출력으로 구성됨

https://m.blog.naver.com/yamyamsis/223104608246

 

 

5. KDD 분석 방법론

(1) KDD 분석 방법론

- 데이터로부터 통계적 패턴이나 지식을 찾기 위해 체계적으로 정리한 데이터 마이닝 프로세스

- 데이터마이닝부터 기계학습, 인공지능, 패턴인식, 시각화 등에서 응용 가능한 구조를 갖고 있음

 

(2) KDD 분석 방법론 프로세스

데이터셋 선택 - 비즈니스 도메인에 대한 이해와 프로젝트 목표 설정이 필수
- 분석에 필요한 데이터를 선택 -> 타깃 데이터 생성
데이터 전처리 - 잡음, 이상치, 결측치를 파악하여 제거하거나 의미있는 데이터로 재가공
- 추가로 요구되는 데이터셋이 있다면 데이터 선택 프로세스를 다시 실행
데이터 변환 - 변수를 생성/선택하고 데이터의 차원을 축소
- 학습용 데이터와 검증용 데이터를 분리
데이터 마이닝 - 학습용 데이터를 이용해 적절한 데이터 마이닝 기법을 선택하고 알고리즘 적용
- 필요에 따라 전처리와 변환 프로세스 추가
해석과 평가 - 분석 목적과의 일치성을 확인하고 평가
- 발견한 지식을 업무에 활용하기 위한 방안 마련

 

6. CRISP-DM 분석 방법론

(1) CRISP-DM 분석 방법론

- KDD 방법론에 비해 약간 더 세분화되어 있음

 

(2) CRISP-DM 분석 방법론 프로세스

업무 이해 - 업무 목적 파악, 상황 파악, 데이터 마이닝 목표 설정, 프로젝트 계획 수립
데이터 이해 - 초기 데이터 수집, 데이터 기술 분석, 데이터 탐색 등
데이터 준비 - 분석용 데이터셋 선택, 데이터 정제, 데이터 통합 등
모델링 - 모델링 기법 선택, 모델 테스트 계획 설계, 모델 작성/평가 등
평가 - 분석 결과 평가, 모델링 과정 평가
전개 - 전개 계획 수립, 유지보수 계획 수립, 프로젝트 리뷰

 

7. 빅데이터 분석 방법론 개요

(1) 빅데이터 분석 방법론

- 빅데이터 분석 방법론은 완벽한 계층적 프로세스 모델로서 단계, 태스크, 스텝 3계층 레벨과 5단계로 구성됨

- 5개의 단계들을 프로세스 그룹이라 하며, 각 단계는 여러 개의 태스크로 구성되는데, 각 태스크는 물리적/논리적 품질 검토 항목

- 마지막 계층인 스텝은 입력자료, 출력 및 도구, 출력자료 등으로 구성된 단위 프로세스

 

(2) 빅데이터 분석 방법론의 계층적 프로세스

- 5개의 단계와 각각의 태스크와 스탭이 순차적으로 진행되며, 필요에 따라 데이터 준비 단계와 분석 단계가 피드백을 주고 받음

https://m.blog.naver.com/yamyamsis/223104608246

 

https://m.blog.naver.com/yamyamsis/223104608246

 

8. 빅데이터 분석 방법론 단계별 수행 프로세스

(1) 분석 기획

(2) 데이터 준비

(3) 데이터 분석

(4) 시스템 구현 

(5) 평가 및 전개