import pandas as pd
import urllib.request # url을 가져오기 위한 파이썬 모듈
import json
2. 가져올 데이터의 주소와 인증키로그인 후 인증키 신청하고 인증키 발급
key = '797a5961526b6768374b6146f' # 본인의 인증키 입력
start = 1 # 페이지 시작
end = 1000 # 페이지 끝
# 미리보기 > OpenAPI > 샘플 URL의 URL을 가져와서 다음과 같이 편집
url = f'http://openapi.seoul.go.kr:8088/{key}/json/CardSubwayStatsNew/{start}/{end}/20230211'
3. 데이터 가져오기
# 라이브러리를 활용해 브라우저에 주소를 쳤다고 가정해줄 수 있는 코드
response = urllib.request.urlopen(url)
# 브라우저에서 주소창에 쳐서 응답받은 걸 받아오겠다
# 여기서 응답받은 것 tpye = str
json_str = response.read().decode('utf-8')
# 응답받은 것을 딕셔너리로 변환
# tpye = dict
json_object = json.loads(json_str)
# 데이터의 실제 로우들을 가져옴 : 파싱
# 위의 JSON 데이터에서 내가 필요한 행들만 df로 선언해주기
subway = pd.json_normalize(json_object['CardSubwayStatsNew']['row'])
#확인
subway.head()
위에서 'CardSubwayStatsNew' , 'row'을 지정해주는 것은 json 데이터 형식보고 가져올 수 있다.