think deeply

데이터 탐색 (EDA vs CDA) 본문

KT AIVLE

데이터 탐색 (EDA vs CDA)

윌_ 2023. 2. 22. 23:55

EDA (Exploratory Data Analysis : 탐색적 데이터 분석)

- 쌓여있는 데이터를 기반으로 가설을 세워 데이터를 분석하는 방법

- 데이터의 구조와 특징을 파악하며 여기서 얻은 정보를 바탕으로 통계모형으로 만드는 단계

 

예시) 쌓여있는 데이터를  하나의 목적을 가지고 보지 않고 이리 저리 추출해보고 뜯어보면서,

여러 형태로 통계를 시각화해서 다양한 관점으로 데이터를 바라본다.

 

CDA (Confirmatory Data Analysis : 확증적 데이터 분석)

- 목적을 가지고 데이터를 확보하여 분석하는 방법

- 관측된 형태나 효과의 재현성 평가, 유의성 검정, 신뢰구간 추정 등 통계적 추론을 하는 단계

- 가설검정, 보통은 설문조사, 논문에 대한 내용을 입증하는데 많이 사용

 

예시) 기존에 논문에 주장된 내용이 맞는 지 확인하기 위해 동일한 조건으로 테스트를 진행 및 확인해본다


고정된 데이터를 분석할 일이 많던 과거에는 CDA 방식을 주로 활용하였으나,

데이터의 범람으로 주어진 데이터에 대한 새로운 인사이트를 내야하는 상황이 많이 연출되면서 EDA 방식이 발전했다고 이해하면 되겠다.

Comments