think deeply

[Daily Check] DAY 9 : pandas 데이터 프레임 탐색, 조회, 집계 함수 정리( feat.허회경_그렇게 살아가는 것) 본문

KT AIVLE

[Daily Check] DAY 9 : pandas 데이터 프레임 탐색, 조회, 집계 함수 정리( feat.허회경_그렇게 살아가는 것)

윌_ 2023. 2. 17. 18:02

오늘은 코드가 많아 다루었던 내용들을 상기하고 넘어가는 식으로만 작성할려구요!

 

<목차>

1. 오늘의 곡

2. 다루었던 내용

3. 기록할 내용

4. 오늘 뭐했냐면 내가~


1. 오늘의 곡

https://www.youtube.com/watch?v=1Qtr8TznwNI

요즘은 시간에 의도적으로 공백을 만들고 살려고 노력하는 중입니다.

사색하지 않으니 방향이 헷갈리고

방향이 헷갈리면 불안감을 느끼기 마련이니까요.

조용히 혼자 있을 때 노래를 들으면

어느새 가사를 듣고 있게 되기 마련인데요.

멜로디만 익숙하던 노래의 가사가 이렇게 철학적인 줄 몰랐어여.

 

작은 일에 웃음 지어놓고선
또 상처같은 말을 입에 담는 것

...

익숙한 듯이 살아가는 게

가끔은 너무 무서워 나

...

돌아오는 차 안에서 그저

조용히 생각에 잠겨

정답을 찾아 헤매이다가

그렇게 눈을 감는 것

그렇게 잠에 드는 것


 

2. 다루었던 내용

03 pandas 데이터 프레임 탐색

04 pandas 데이터 프레임 조회

05 pandas 데이터 프레임 집계


​3. 기록할 내용

pandas를 활용해 탐색, 조회, 집계를 다루었다.

집계를 하고 matplotlib으로 시각화도 함께 다루었다.

코드 예시 작성하는 건 비효율적이니,

Daily 기록에서는 다루었던 함수을 기억나는대로 정리하고

기억해야할 사항체크해두고 넘어가도록 하겠다.

6일 과정이 끝나고 part check 포스팅

활용도가 높고 중요한 부분들을 추려서 정리하도록 하겠다.


pandas 데이터 프레임 탐색
내용
함수
데이터 불러올 때
.read_csv()
데이터 프레임 사이즈 확인
.shape()
열 확인
.columns
인덱스 확인
.index
값 확인
.values
열 자료형 확인
.dtypes()
열에 대한 상세한 정보
.info()
기초통계정보
.describe()
열 고유값 확인
.unique() # 결과값은 배열 형태
고유값과 그 개수 확인
.value_counts()
값 정렬하기
.sort_values( by='(정렬기준이 될 칼럼명)', ascending=False )
[참고] ascending=False : 내림차순, ascending= True : 오름차순
인덱스 초기화
reset_index( drop = True, inplace = True )
[참고] drop=True : 기존 인덱스열 일반열로 가져오지 X, 인덱스 열 초기화
[참고] drop=False : 초기화 전 인덱스를 일반열로 가져옴, 이게 디폴트값

pandas 데이터 프레임 조회
내용
함수
특정열 조회하기
.loc [ 행, 열 ]
[참고] 이때, 여러 열을 조회하려면 리스트로 묶어서 줘야한다.
ex. .loc [ : , ['열2','열4','열6'] ]
조건 검색 · 조회
.loc [ 조건 ]
ex. .loc[ df['칼럼명'] > 6.0 , : ] : 해당 조건이 맞는 행 모두 추출

pandas 데이터 프레임 집계
내용
함수
집단별 그룹별로 데이터를 집계, 요약
.groupby()

groupby는 그룹별로 데이터를 집계하는 분석은 굉장히 일상적으로 다루어지기 때문에 사용빈도가 굉장히 높다.

SQL에서도 자주 사용되는 개념이라 익힐 때 잘 익혀두면 활용도가 굉장히 높을 것!


조회, 집계 부분은 기록하고 싶은 내용이 많은데, 내가 정리한 글보다 정리된 글을 잘 찾아보는 게 좋을 것 같다!

내가 공부한 교안은 배포가 어렵기 때문에 코드 활용이 어렵다.

공부한 내용을 조만간 개인적으로 많이 적용해볼 것 같은데,

그때 기회가 된다면 내 코드를 가지고 설명하는 포스팅을 해야겠숩니다 :)

Comments