목록파이썬 (17)
think deeply
EDA (Exploratory Data Analysis : 탐색적 데이터 분석) - 쌓여있는 데이터를 기반으로 가설을 세워 데이터를 분석하는 방법 - 데이터의 구조와 특징을 파악하며 여기서 얻은 정보를 바탕으로 통계모형으로 만드는 단계 예시) 쌓여있는 데이터를 하나의 목적을 가지고 보지 않고 이리 저리 추출해보고 뜯어보면서, 여러 형태로 통계를 시각화해서 다양한 관점으로 데이터를 바라본다. CDA (Confirmatory Data Analysis : 확증적 데이터 분석) - 목적을 가지고 데이터를 확보하여 분석하는 방법 - 관측된 형태나 효과의 재현성 평가, 유의성 검정, 신뢰구간 추정 등 통계적 추론을 하는 단계 - 가설검정, 보통은 설문조사, 논문에 대한 내용을 입증하는데 많이 사용 예시) 기존에 논..
import numpy as np 조건에 맞는 값 위치 형태: np.where( 조건 ) 예시: np.where( titanic [ 'Sex' ] == ' female ' ) 조건에 맞는 값 변경 형태 : np.where( 조건 , 참일 때 변경값 , 거짓일 때 변경값 ) 예시 : titanic [ 'Sex' ] = np.where ( titanic [ 'Sex' ] == ' female ' , ' Woman ' , ' Man ' ) * 두, 세번째 파라미터에 문자형이 아닌, 수치형이 와도 상관없음 * 조건에는 ==, >, True, False로 변경되는 값이 정해짐
에이블스쿨에서 처음으로 미니 프로젝트를 진행했습니다. 3일간 진행되었으며, 8명의 팀원이 하나가 되어 주어진 task를 풀어나가는 형태였습니다. 강사님은 KT실무팀 이호준 강사님이셨다. 미니 프로젝트의 취지는 다음과 같습니다. 배운 이론과 실습 내용을 바탕으로 실제 사례에 적용해보며 문제 해결 역량을 상향시키기 위함입니다. 하여 앞서 배운 내용이 데이터 전처리였기에 1차 미니 프로젝트는 데이터 전처리 실습이었습니다. 목차 1. 강의구성 2. 정리할 내용 3. 해당 기간 이슈 4. 개인적 회고 1. 강의구성 매일 다루었던 데이터들은 다음과 같다. 서울시 모기예보제 정보 https://data.seoul.go.kr/dataList/OA-13285/S/1/datasetView.do 열린데이터..
4일동안 파이썬을 활용해 데이터를 다듬는 법을 배웠습니다. 그리고 이번에도 이장래 강사님께서 가르쳐주셨습니다. 목차 1. 강의구성 2. 정리할 내용 3. 해당 기간 이슈 4. 개인적 회고 1. 강의구성 01 넘파이 기초 02 pandas 데이터 프레임 생성 https://blog.naver.com/kgh5654/223010958134 [Daily Check] DAY 8 : Jupyter Lab 주피터랩 설치방법, 배열, 데이터프레임(feat. 사카모토 류이치, 사사키 Part별로 정리하자니 너무 아쉬워. Daily로 정리도 하고자 한다. 아마도 매일 기록하는데는 무리가 있을 ... blog.naver.com 03 pandas 데이터 프레임 탐색 04 pandas 데이터..
오프닝데이 다음, 6일동안은 파이썬의 기초 데이터 다루는 법을 배웠다. 그리고 이 모든 것은 이장래 강사님께서 가르쳐주신다. 1. 강의 구성 2. 정리할 내용 3. 개인적 회고 1. 강의 구성 기본연산자 기본자료형 문자열 자료형 리스트, 튜플, 집합 딕셔너리 자료형 제어문 함수 정규표현식 텍스트 파일 다루는 법 엑셀 파일 다루는 법 이메일 보내기 2. 정리할 내용 문자열 포맷팅 방법 1) .format : 문자열 포맷팅이라고 하며, 해당 위치 { }에 변수를 넣어서 출력하고 싶을 때 자주 사용한다. 아래 간단한 예시같이 print문에 주로 쓴다. name = '김규한' age = '26' num = '010-..
파이썬 역순 정렬 함수3. : reverse, reversed 1. reverse() :: list.reverse() 배열의 항목 순서를 뒤집는다 메모리 내의 배열 원소들을 직접 수정 반환값은 None a = 'string' a_list = list(a) # 문자열을 list로 치환 :: reverse는 list에만 사용 가능하기 때문 a_list.reverse() # reverse 함수를 사용해 문자열 리스트를 거꾸로 뒤집음 print(''.join(a_list)) # 거꾸로 뒤집어진 리스트를 연결해서 출력 #출력: gnirts 2. reversed() :: reversed(list) reversed는 문자열에도 바로 적용이 가능함 (cf. reverse는 list만 사용 가능) 반환값이 배열값: 변수..
EDA(Exploratory Data Analysis, 탐색적 데이터 분석) 분석을 하기 위한 데이터를 살펴보는 과정을 의미하는 단어 도출하고자 하는 결과값을 좀 더 수월하게 낼 수 있도록 해당 데이터를 살펴보는 것입니다. EDA가 필요한 이유 분석 코드를 어렵게 모두 작성해도 원하는 형태의 결과가 나오지 않을 수 있는데, 그럴 경우 그 시간이 모두 헛고생으로 돌아간다. 근원적으로 분석해야하는 데이터를 잘못 이해했기 때문이라고 볼 수 있다. 오늘은 현재 내가 분석하고자 하는 대상인 '국내 e-book에 대한 사용자 경험 분석' EDA 과정을 간략히 정리해두고자 작성한다. 1. 관련 raw data를 모으기 위해, 국내 구글 플레이 스토어 크롤링 진행 분석 대상에 대한 사용자 경험을 다루기 위해 적합한 데..
이 책을 처음 접하게 된 것은 몇 일전 자기 전에 읽을 전자책을 서칭하다가 알게 된 책이다. 우연히 집어 목차를 보았는데, 공부 방향성에 있어 고민이 많던 나에게 필요해보였다. 다음 날, 운동할 때 e-book으로 청취하면 들었고, 오늘 아침에서야 완독한 도서다. e-book중심으로 읽어 메모해둔 도서의 페이지가 종이책에서 몇 페이지인지는 매칭하지 못했다. ' part 1, 2 '는 인공지능에 대한 지식이 거의 전무한 비전공자들이 읽어볼 만한 부분인 것 같다. 비전공자들이 접하기 어려운 수리통계적인 부분이나 초기 공부법에 대한 해법을 알려준다. 우리가 흔히 데이터 공부를 하고자할 때 가장 접하기 쉬운 학원이나 국비 교육에 대한 부정적 시각을 담고 있다. 내가 그런 국비 교육들을 찾아본 보았을 때도 그랬다..