Skip to content

lucyya99/Subway_delay

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 

Repository files navigation

Subway_delay

프로젝트 개요

공공데이터를 활용하여 서울 교통공사 지하철 지연 시간 예측하기

  • 사람들의 승하차 인원이 많아지면 지하철 지연이 발생할까?라는 궁금증에서 시작함
  • 승하차 인원 외에 요소들도 크롤링 하여 알아볼 예정.

데이터 출처

진행상황

  • 현재 날씨 데이터와 간편지연증명서는 날짜가 맞지만, 이동량데이터는 과거데이터인 상태.
  • 날씨, 지연 데이터들을 모아두고, 이동량 데이터가 나오는 대로 상관계수 분석을 진행할 예정.

데이터 프레임 만들기

Subway_moving_dataframe

  • 승하차 인원을 전부 합한 양 = 이동량이라고 정의.
  • pandas, seaborn 등의 패키지를 활용하여 이동량을 시각화 및 분석

Subway_delay_dataframe

  • 간편지연증명서의 내용을 크롤링하여, 지연 시간 파악.
  • 크롤링 내용 중 결측치가 많아 지연되는 내용만 csv 파일에 저장.

Subway_weather_dataframe

  • 날씨 - 기온, 비 혹은 눈이 지하철 운행에 영향을 줄 수 있다고 생각함.
  • 시간별로 파악한 데이터가 필요했는데, 기상청에서 찾을 수 있었음.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published