Notice
Recent Posts
Recent Comments
Link
think deeply
데이터 탐색 (EDA vs CDA) 본문
EDA (Exploratory Data Analysis : 탐색적 데이터 분석)
- 쌓여있는 데이터를 기반으로 가설을 세워 데이터를 분석하는 방법
- 데이터의 구조와 특징을 파악하며 여기서 얻은 정보를 바탕으로 통계모형으로 만드는 단계
예시) 쌓여있는 데이터를 하나의 목적을 가지고 보지 않고 이리 저리 추출해보고 뜯어보면서,
여러 형태로 통계를 시각화해서 다양한 관점으로 데이터를 바라본다.
CDA (Confirmatory Data Analysis : 확증적 데이터 분석)
- 목적을 가지고 데이터를 확보하여 분석하는 방법
- 관측된 형태나 효과의 재현성 평가, 유의성 검정, 신뢰구간 추정 등 통계적 추론을 하는 단계
- 가설검정, 보통은 설문조사, 논문에 대한 내용을 입증하는데 많이 사용
예시) 기존에 논문에 주장된 내용이 맞는 지 확인하기 위해 동일한 조건으로 테스트를 진행 및 확인해본다
고정된 데이터를 분석할 일이 많던 과거에는 CDA 방식을 주로 활용하였으나,
데이터의 범람으로 주어진 데이터에 대한 새로운 인사이트를 내야하는 상황이 많이 연출되면서 EDA 방식이 발전했다고 이해하면 되겠다.
'KT AIVLE' 카테고리의 다른 글
[python] 공공데이터 포털 오픈API 형태 데이터 불러오기( feat. 서울 열린데이터 광장, 공공데이터 포털) (0) | 2023.02.28 |
---|---|
EDA 방법 정리(1) :: Data Understanding of CRISP-DM (feat. 단변량 분석, 이변량 분석, 통계량, 시각화, 상관계수의 한계) (0) | 2023.02.23 |
[DAY 15] CRISP-DM (feat. 데이터분석 PART 1일) (0) | 2023.02.20 |
[DAY 12-14] 1차 미니프로젝트 회고 (feat. 서울 열린데이터광장, 캐글) (1) | 2023.02.18 |
[KT AIVLE] DAY 8-11 : 파이썬 데이터 다듬기 회고 (feat. 반장, 기자단, 미니프로젝트 팀원, 코딩 마스터스) (0) | 2023.02.18 |
Comments