서론
선행연구
연구방법론
1. Geographically Weighted Regression(GWR)
2. Multiscale Geographically Weighted Regression(MGWR) and Geographically Temporal Weighted Regression(GTWR)
3. Spatio-temporal Weighted Regression(STWR)
데이터 구축 및 기초통계분석
1. 활용 데이터
2. 데이터 전처리
3. 데이터 기초통계 분석
분석 결과
1. 최적의 통계모형 선정을 위한 비교 분석
2. STWR 모형 분석
3. 대중교통 통행량과의 관계 분석
결론
서론
현대 사회는 경제적인 성장과 지역 개발로 인하여 인구 밀도가 지속해서 증가하고 있다(United Nations, 2018; Lee et al., 2023). 교통은 증가하는 도시 인구를 경제, 환경, 사회로 연결하는 중요한 역할을 담당하고 있다(Zarrinpanjeh et al., 2022; Li et al., 2023). 교통의 역할은 굉장히 커졌으나, 교통수단에 의한 온실가스, 폐기물과 같은 외부효과는 해결해야 할 문제로 남아있다(Giuffrida et al., 2023, Koack et al., 2022).
공유 자전거는 교통수단의 외부효과를 줄이는 지속 가능한 교통수단이자, 시민의 이동성을 보완해 주는 훌륭한 교통수단 중 하나이다. 공유 자전거는 자동차 사용을 대체할 수 있고, 시민들의 건강을 증진하며, 대중교통과 연결되어 대중교통을 대체 및 보완할 수 있는 교통수단으로 오랜 시간 연구되어왔다(Fuller et al., 2013; Hsu et al., 2018; Mohiuddin et al., 2021; Caspi, 2023; Henriksson and Scalzotto, 2023; Tsenkova and Mahalek, 2014; Griffin and Sener, 2016; Saberi et al., 2018; Kim 2023). 공유 자전거는 이동성 측면에서 다른 교통수단들을 대체할 수 있으며, 환경과 건강 측면에서 활용성이 높아 전 세계적으로 긍정적인 영향을 미치고 있다.
특히 COVID-19가 전 세계적으로 유행하면서 많은 국가에서 대중교통을 이용하던 사람들이 자전거를 선호하기 시작하였다(Sung, 2023; Zafri et al., 2022; Kwak et al., 2022; Shin and Choo, 2022). 현재는 COVID-19가 종식되었지만, 공유 자전거 편의시설 확산, 지속 가능한 도시를 위한 다양한 노력으로 COVID-19 유행 당시 변화된 사람들의 통행 행태가 이어질 전망이다. 변화된 사람들의 통행 행태와 지속 가능성을 위해서는 공유 자전거의 활용성을 더욱 늘릴 필요가 있다. 그리고 자전거의 활용 증진을 위해 도시의 시공간적 특성과 사회경제적 특성을 활용하여 공유 자전거 수요에 영향을 미치는 요인을 분석할 필요가 있다.
본 연구에서는 공유 자전거 대여소를 중심으로 공유 자전거 수요에 영향을 미치는 요인을 시공간적 관점과 사회경제학적 관점에서 분석하고자 한다. 세부적으로 시공간과 사회경제학 관점의 데이터를 수집하여 수요의 영향 정도를 분석하고, 대중교통과의 연관성을 부가적으로 분석하고자 한다. 세부 목적을 달성하기 위해 여러 통계 모형을 비교 분석하여 적합한 통계모형을 설정하였으며, 연구는 다음과 같이 구성된다. 2장에서는 공유 자전거 수요 영향 요인에 대한 문헌 고찰을 정리하였다. 3장에서는 수요의 영향을 분석하기 위한 통계 모형에 대하여 설명하고, 4장에서는 활용 데이터와 데이터 전처리 과정을 소개한다. 5장에서는 수요 영향 요인 분석 결과 및 대중교통과의 연관성 분석을 소개하고, 마지막 6장에서는 결론과 향후 연구에 대해 정리하였다.
선행연구
도시 내 공유 자전거는 통행 행태, 탄소배출, 통근 의도, 다른 교통수단 간의 비교, 수요 영향 요인과 같은 주제로 다양한 연구가 진행되고 있다. 한 연구에서는 베이징을 중심으로 다양한 통계 모형을 접목하여 자전거 전용 도로로 인한 통행 행태 변화와 자전거 수요에 영향 요인을 분석하고, 탄소 배출량을 정량화하는 지표를 개발하였다(Zhang and Li, 2023). 다른 연구에서는 중국 여러 도시에서 공유 자전거를 통한 통근 의도와 행동에 영향을 미치는 요인을 구조방정식을 기반으로 분석하였다(Cai et al., 2019). 일부 연구에서는 자전거 통행량에 대하여 공간을 활용하는 통계 모형으로 분석하였다(Lyu et al., 2020; Bao et al., 2018).
자전거 통행량에 영향을 미치는 요인들은 사회학적 데이터, 날씨, 토지 사용, 건축 환경 특성 등을 고려하여 통계 모형을 기반으로 분석하였다(Saneinejad et al., 2012, El-Assi et al., 2017; Kim, 2023; Faghih-Imani, 2014, 2017; Sung, 2023). 한 연구에서는 토론토를 중심으로 나이, 성별과 같은 다양한 사회학적 데이터와 날씨 데이터를 사용하여 기상 조건이 교통수단에 영향을 미치는 정도를 분석하였다(Saneinejad et al., 2012). 다른 연구에서는 토론토를 중심으로 날씨, 토지이용, 사회 인구학적 변수 및 건축 환경 특성을 기반으로 공유 자전거에 영향을 미치는 요인들을 Mixed effects model과 Lag model을 사용하여 분석하였다(El-Assi et al., 2017). 일부 연구는 서울에서 수집된 공유 자전거를 승차권 종류에 따라 시공간 이용 패턴과 공유 자전거 수요에 미치는 영향을 회귀모델과 분류 모델, 군집 분석으로 분석하였다(Kim, 2023). 한 연구자는 여러 지역에서 수집한 자전거 데이터를 활용하여 자전거 수요에 영향을 미치는 요인을 분석하였다(Faghih-Imani et al., 2014, 2017). 2014년 연구는 캐나다 몬트리올 지역을 중심으로 Linear Mixed Model을 사용하였고, 2017년 연구는 세비야와 바르셀로나 지역에서 선형 혼합모델과 Binary Logit Model을 사용하였다. COVID-19에 초점을 맞춰 연구를 수행한 경우도 존재한다. COVID-19가 발생하지 않는다는 가정하에 자전거 탑승 수요를 예측하는 연구를 진행하였다(Sung, 2023). 자전거 통행과 관련한 연구 요약은 Table 1과 같다.
Table 1.
Summary of the literature review
Author (year) | Area | Method | Data | Year of data | Variable |
Zhang and Li(2023) | Beijing | ICLVM, BLM, MLM, etc. | Survey | 2020 |
SPF, SD,TPI, DCEPKCEF, SSV |
Cai et al.(2019) | China | SEM | Survey | 2017 | Attitude, IPBC, Gender |
Lyu et al.(2020) | Nanjing | MGWR | NPBS | 2016 | Time, NT, Population, Commercial, etc. |
Bao et al.(2018) | New york | K-means, GWR | CBW, Google API, etc. | 2015 | Population, Employment, CE, BR, BI, etc. |
Saneinejad et al.(2012) | - | MLM | TTS, EC | 2001, 2008 | Gender, Age, TP, Weather, ADC, etc. |
El-Assi et al.(2017) | Toronto | LMEM, LM, etc. | BRD, HWD, TTS | 2013 | Weather, Land use, SD, BEA, etc. |
Kim(2023) | Seoul | RM, Clustering, CM | BD, Kakao local API, etc. | 2019 | NT, Weather, Temperature, Restaurants, etc. |
Faghih-Imani et al. (2014) | Montreal | LMM | BIXI data, MD, etc. | 2012 | Weather, TC, BI, BEA, etc. |
Faghih-Imani et al. (2017) | Barcelona, Seville | LMM, BLM | BD, EUA, TAPI, etc. | 2006, 2007, 2009 | NS, SCD, PD, PFM, etc. |
Sung(2023) | Seoul | BSTSM | BD, BDS, etc. | 2017~2021 | Weather, Temperature, Weekend, Holiday, etc. |
This study | Seoul | STWR | BRD, SCD, etc. | 2019~2022 | NT, Weather, Fine dust, Population, Slope |
Annotation : ICLVM(Integrated Choice and Latent Variable Models), BLM(Binary Logit Model) , MLM(Multinomial Logit Model), SEM(Structural Equation Modeling), LMEM(Linear Mixed Effects model), LM(Lag Model), RM(Regression Model), CM(Classification Model), LLM(Linear mixed Models), BSTSM(Bayesian Structural Time Series Model), MGWR(Multiscale Geographically Weighted Regression), GWR(Geographically Weighted Regression), TTS(Transportation Tomorrow Survey), EC(Environment Canada), BRD(Bicycle Ridership Data), SPF(Social Psychological Factors), SD(Socio-Demographic), TPI(Travel Pattern Information), DCEPKCEF(Discrete Choice Experiments and Passenger Kilometer Carbon Emission Factors), SSV(Scenario-Setting Variables), IPBC(Intention and Perceived Behavioral Control), TP(Trip Purpose), ADC(Auto Driver Cost), BEA(Built Environment Attributes), TC(Temporal Characteristics), BI(Bicycle Infrastructure), CE(College Enrollment), CBW(City Bike Website), HWD(Hourly Weather Data), BD(Bike Data), MD(Meteorological Data), EUA(Eurostat Urban Audit), TAPI(Tele Atlas Points of Interests), BDS(Bike Station Data), NT(Number of Trip), NS(Number of stations), BR(Bike Racks), BI(Bike Length), SCD(Smart Card Data), PD(Population Density), PFM(Proportion of Females to males)
자전거 통행량에 대한 문헌은 다음과 같은 한계를 가지고 있다. 일반적인 통계 모형을 사용한 경우는 전반적으로 공간성을 고려하지 않았다(Sung, 2023; Zhang and Li, 2023; Faghih-Imani et al., 2014; Faghih-Imani et al., 2017; Saneinejad et al., 2012). 자전거 통행량은 기상 조건 외에 경사도, 정류장 유무, 생활 인구와 같은 주변의 영향을 많이 받을 수 있으므로 공간적인 요소를 반영할 수 있는 통계 모형이 필요하다. 공간성을 고려하는 통계 모형도 전역적인 관점에서의 통계 모형을 활용하는 경우가 많았다(Kim, 2023; Cai et al., 2019; Lyu et al., 2020). 자전거 통행량은 앞서 언급한 복합적인 요인에 따라 통행량이 달라질 수 있어 지역적인 관점에서 세부적인 분석이 필요하다. 그리고 현재 자전거 통행량은 시간이 지날수록 더욱 증가하는 추세이며, 각각의 영향 요인들도 시간적인 변화가 존재한다. 시간적인 변화를 반영하기 위해서는 시간성을 고려하는 통계 모형을 활용할 필요가 있으나, 기존의 연구 대부분은 이를 반영하지 않았다(Zhang and Li, 2023; Faghih-Imani, 2014; Faghih-Imani, 2017; Saneinejad et al., 2012; Kim, 2023; Cai et al., 2019; Lyu et al., 2020). 공유 자전거는 대중교통을 대체 및 보완하며 대중교통과의 연결성이 높은 것으로 알려져 있다(Cho and Shin, 2022). 이러한 이유로 많은 연구자들이 대중교통 편의 시설과의 연관성을 연구한 사례가 많으나, 실제 대중교통 통행량을 기반으로 동일한 시점에서 연구를 한 사례는 많지 않다. 실제 대중교통 통행량을 기반으로 대중교통과 공유 자전거의 상호 보완 관계를 살펴볼 필요가 있다.
기존 연구의 한계를 보완하는 본 연구의 차별점은 다음과 같다. 1) 실제 대중교통과 공유 자전거 데이터를 기반으로 대중교통과 공유 자전거의 연관성을 분석한다. 2) 연도별로 변수의 변화를 반영하기 위해 2019년부터 2022년까지의 데이터를 활용한다. 3) 국지적인 관점에서 공간성과 시간성을 모두 고려하는 통계 모형인 STWR을 사용하여 영향 요인과 영향 정도를 파악한다. 4) 세부적인 관점에서 분석을 진행하기 위해 500 x 500m 격자를 분석단위로 활용한다.
연구방법론
본 연구에서는 2020년에 개발된 Spatio-temporal Weighted Regression(STWR)을 사용한다. STWR은 1996년에 개발된 Geographically Weighted Regression(GWR) 기반의 모형으로, 시공간성을 고려하는 통계 모형이다. GWR의 모형 중 시간성을 고려하는 GTWR 모형이 있으나, STWR은 GTWR의 한계점을 보완하는 통계모형이다.
1. Geographically Weighted Regression(GWR)
GWR은 Fotheringham, Brunson and Martin이 1996년에 개발한 공간 통계분석 기법이다. GWR은 인접 지역과의 공간적 상호작용을 반영하여 변수들의 국지적인 영향력을 파악하고, 결과를 제시한다는 부분에서 일반 통계 모형들과 가장 뚜렷한 차이가 있다(Fotheringham et al., 2017). GWR은 회귀식 내에 지역적 공간 관계를 반영하여 일반적인 통계 모형으로 파악하기 어려운 공간 내 이질적인 패턴을 파악한다(Park, 2010). GWR의 회귀 모형 식은 Equation 1과 같다.
여기서, i는 해당 지역, m은 독립변수 전체, 는 독립변수를 의미한다; 는 공간 좌표, 는 공간에 따라 변화하는 의 회귀 계수이다; 는 에 대한 m개의 독립변수 중 번째 독립변수를 나타내며, 는 공간의 오차를 의미한다. 여기서 를 산출하는 식은 Equation 2와 같다.
여기서 X는 design matrix,는 에 대한 공간 가중치가 적용된 매트릭스, 는 특정 시간에 대한 design matrix를 의미한다.
일반적으로 관측값은 버퍼를 그려 i까지의 거리에 의해 가중치가 부여되며, 버퍼를 벗어날 때는 가중치 0을 부여한다(Zhang et al., 2023). GWR은 독립변수의 국지적인 영향력을 파악할 수 있으나, 하나의 고정된 대역폭을 사용하여 다양한 변수에 적절하게 활용하기 어렵다는 한계점이 있다(Mansour et al., 2021).
2. Multiscale Geographically Weighted Regression(MGWR) and Geographically Temporal Weighted Regression(GTWR)
MGWR은 2017년, Fotheringham, Yang and Kang이 개발한 공간통계분석 기법이다. 앞서 언급한 GWR의 한계점을 보완하기 위해 조건부 확률을 기반으로 변수별로 개별 대역폭을 설정한다(Fotheringham et al., 2017). MGWR은 GWR보다 공간 이질성을 정밀하게 분석하고, 공산성과 매개변수 추정치에 대한 편향을 감소시킨다는 특징이 있다(Oshan et al., 2019; Wolf et al., 2018; Mansour et al., 2021). MGWR은 회귀 모형식은 Equation 3과 같다.
여기서 는 j번째 조건부확률의 관계를 보정하는 대역폭을 의미하며, back-fitting algorithm에 의해 설정한다. 나머지 변수는 Equation 1과 같다.
GTWR은 Fotheringham, Crespo and Yao가 2015년에 개발한 시공간통계분석 기법이다. GWR의 공간 통계에서 더 확장된 개념으로, 변수가 공간적인 특성 외에 시간이 지남에 따라 변화하는 영향력을 파악하기 위해 고안되었다(Fotheringham et al., 2015). GWR과 같은 뼈대를 가지고 있지만, 에 대한 가중치 행렬에서 차별점이 있다. 공간 측면의 대역폭을 찾은 후 시간 대역폭을 찾는 매커니즘으로, 각각을 단독으로 측정하여 오해의 여지가 있다는 한계점이 존재한다. 를 산출하는 식은 Equation 4와 같다.
여기서 는 t시점에 고유하게 위치한 시공간 가중함수를 의미하고, 는 공간 커널 함수, 는 시간 커널 함수를 의미한다. 는 i와 사이의 공간적인 거리, 는 시간 t에 특정한 공간 대역폭, 는 i와 사이의 시간 거리이다.
3. Spatio-temporal Weighted Regression(STWR)
STWR은 GTWR의 한계점을 보완하기 위해 2020년에 Que, Ma, Ma and Chen에 의해 개발된 시공간적인 관점의 통계분석 기법이다. STWR은 GTWR의 개별적인 대역폭을 찾는 매커니즘이 시공간의 복합적인 변화를 명확하게 반영하지 못한다는 점을 중심으로 제안되었다(Que et al., 2020). STWR은 시간 간격의 개념으로 시간 거리를 보는 것이 아닌 시간에 따른 가치 변동률로 설정하였으며, 공간 커널과 시간 커널을 함께 결합하는 매커니즘을 가지고 있다. 그리고 GTWR과는 가중평균으로 에 대한 가중치 행렬을 적용한다는 차별점이 있다. 를 산정하는 식은 Bi-Square와 Gaussian Kernel로 구분되며, 본 연구에서 사용한 Gaussian Kernel에서 시공간 가중평균값을 구하는 식은 Equation 5와 같다.
여기서 는 시간 t와 관측 위치 i, 에서의 가중치를 의미한다; 는 공간 커널에 대한 가중평균값, 는 시간 커널에 대한 가중평균값이다; 는 각각 공간 및 시간 커널을 의미하며 0에서 1 사이의 값을 가진다; 𝛽는 대역폭을 최적화하는 매개변수, 는 i와 사이 공간과 시간에 대한 거리를 의미한다; 는 특정 시점 T에서의 공간 대역폭 이고, 는 시간 대역폭을 의미한다; 본 연구에서 사용된 Gaussian Kernel 기반의 공간 커널에 대한 가중평균값과 시간 커널에 대한 가중평균값을 구하는 식은 Equation 6과 같다.
여기서, 𝛽는 대역폭을 최적화하는 매개변수, 는 공간 대역폭을 구하는 과정이며, 는 시간 대역폭을 구하는 과정을 의미한다; 는 특정 시점 T에서의 공간 대역폭 이고, 는 시간 대역폭을 의미한다; 는 시간 간격이며, 는 시간 간격에 대응하는 공간 대역폭의 변화에 대한 기울기를 의미한다; q는 시간의 변화이며, 는 시간 간격의 변화에서 t-q 시점 의 관측값에서 i의 관측값을 뺀 값을 의미한다;
STWR 모형은 다른 통계 모형보다 공간과 시간적인 반영을 보다 명확하게 반영할 수 있고, 지도에 시각화하기 쉽다는 장점이 있다. 본 연구의 공간적 범위인 서울은 도심지와 비도심지 간의 공간적인 차이가 크게 발생하여, 국지적인 영향력에 대한 분석이 필요하다. 그리고 COVID-19 시점의 연도들을 통해 시간적 변화를 함께 가지고 있으므로, 시간성도 함께 고려할 필요가 있어 본 연구에서는 STWR이 가장 적합한 통계 모형으로 판단하였다.
데이터 구축 및 기초통계분석
본 연구의 주된 목적은 공유 자전거 수요에 영향을 미치는 요인을 공유 자전거 대여소를 중심으로 시공간적 관점과 사회경제학적 관점에서 분석하고자 한다. 연구의 목적을 달성하기 위해 서울시 공유 자전거, 대중교통 통행량, 대중교통 편의시설, 인구, 날씨, 경사도를 사용하였다. Figure 1은 연구의 전체 과정을 나타낸다.
1. 활용 데이터
본 연구의 목적을 달성하기 위해 서울시 공유 자전거, 대중교통 통행량, 대중교통 편의시설, 인구, 날씨 그리고 경사도를 사용하였다. 데이터에 대한 정보는 Table 2에서 확인할 수 있다. 서울시 공유 자전거인 따릉이는 서울 전역에서 운영되며 대여 시간 및 이동 거리 정보 등을 제공하고 있다. 따릉이 데이터는 2019년부터 2022년까지, 10월 셋째 주의 데이터를 활용하였으며, 대중교통의 통행량은 스마트카드 데이터를 통해 추출하였다. 스마트카드 데이터는 2004년부터 수집되기 시작하여 탑승 시간 및 하차 시간, 환승 횟수 등에 대한 정보들을 제공하고 있다. 스마트카드 데이터도 동일하게 2019년부터 2022년까지 매년 10월 셋째 주 데이터를 수집하였다.
Table 2.
Data introduction
기존 연구의 전역적인 관점 또는 특정 위치에 초점을 맞추고 있는 부분을 보완하기 위해 500x500m 격자를 공간적 범위로 설정하였다(Kim, 2023; Cai et al., 2019; Lyu et al., 2020; Bao et al., 2018; El-Assi et al., 2017). 500m 격자의 경우 도시 전체나 행정구역보다 세밀한 공간 범위로 교통 서비스가 제한된 취약지역을 파악하기 쉽고, 이를 분리하여 특징을 명확하게 파악할 수 있다. 격자 단위를 500m로 설정한 이유는 성인이 10분 내외로 이동하기에 용이하다고 판단하였다(Zhou et al., 2022).
추가로 시공간 및 사회경제학적 관점의 변수들을 활용하였다. 시공간 및 사회경제학적 데이터는 유동 인구, 거주인구, 대중교통 정류장, 날씨, 경유 버스 수, 미세먼지, 경사도를 포함하고 있다. 유동 인구 데이터는 서울 열린 데이터 광장에서 수집되며, KT에서 2017년부터 구축하여 서울 전역의 유동 인구 35%를 포함하는 데이터이다. 거주인구 데이터는 2014년부터 국토정보플랫폼에서 수집하고 있는 데이터를 활용하였다. 유동 인구와 거주인구는 격자의 모든 인구를 식별하기 위해 재가공하였다. 대중교통 정류장은 각각 서울에서 제공하는 서울 버스 정류장 정보와 서울시 지하철역 데이터를 사용하였고, 날씨 데이터는 기상청에서 제공하는 방재 기상관측 데이터를 활용하였으며, 미세먼지 데이터는 AirKorea에서 제공하는 시도별 대기 정보 데이터를 활용하였다.
시간적 특성을 가진 데이터는 모두 2019~2022년 매년 10월 셋째 주의 데이터로 수집하였다. 다만 유동 인구와 스마트카드 데이터는 미수집된 일부 날짜를 다른 날짜로 대체하였다. 유동 인구 데이터는 2019년 10월 15일부터 27일까지 데이터가 오류로 수집되지 않아 10월 두 번째 주의 데이터로 대체하였고, 스마트카드 데이터는 2022년 10월 10일 데이터 대신 10월 17일 데이터를 사용하였다.
2. 데이터 전처리
교통 수단 데이터에 대한 전처리는 정류장 위치를 공간 정보와 결합하여 위·경도 값을 추출하고, 서울에서 발생한 통행을 추출하였다. 서울 내부 통행 중 이용 시간이 0분인 경우와 이용 시간이 과도하게 높은 경우가 존재하였다. 이러한 데이터는 실제 데이터로 판단하기 어렵고 전체 값에 정확성과 신뢰성을 낮출 수 있으므로, 이용 시간을 기준으로 상하위 1%를 절삭하였다. 그 후 위·경도 값을 기준으로 격자를 결합하고, 격자를 그룹화하여 대중교통 승하차 값을 집계하였다.
거주인구는 격자를 포함하고 있는 데이터로 4개년 데이터를 합쳐서 활용하였으며, 거주인구 데이터는 총 9,421개이다. 유동 인구 데이터는 집계 구를 기준으로 수집하고 있으므로, 집계 구를 격자와 결합했고, 각 집계 구가 격자에서 포함되는 비율을 측정하여 연도와 날짜별 격자 유동 인구를 추출하였다.
미세먼지와 날씨 데이터는 측정소를 기준으로 데이터를 수집하여 측정소가 행정구역별로 한 개인 경우, 행정구역으로 이름을 수정하였고, 측정소가 2개 이상인 경우 구간 내 측정소들의 평균값을 활용하였다. 측정된 날씨와 미세먼지 데이터를 연도와 날짜별로 구분하여 격자 날씨 및 미세먼지 데이터를 집계하였다. 대중교통 편의시설은 격자 별로 버스와 지하철 정류장의 개수를 집계하는 방식으로 수집하였다. 경사도의 경우, 격자 내 최대와 최소 표고 값의 차이를 높이로, 둘 사이의 거리를 측정하여 경사도를 계산하였다. 모델링에 활용된 변수는 전처리를 이후 변수의 규모를 비슷하게 맞추기 위해 Robust Scaler를 적용하였습니다.
3. 데이터 기초통계 분석
데이터에 대한 기초 통계는 Table 3에 정리되어 있으며, 공유 자전거의 통행량은 COVID-19 이전인 2019년 10월 셋째 주는 약 56만 건이었으나, COVID-19가 본격적으로 유행한 동일 시점의 2020년은 약 64만 건으로 약 15% 통행량이 증가하였다. COVID-19가 지속된 2021년 통행량이 약 72만 건, 2022년 약 107만 건으로 꾸준히 증가하는 경향을 보이며, 2019년과 2022년을 비교하면 약 92%가 증가하였다. 4개년 데이터에 대한 평일 일평균 이용 건수는 약 11만 건, 주말은 약 9만 건이다. 공유 자전거는 대중교통의 특성과 비슷하게첨두 시간과 비첨두 시간 간의 명확한 차이가 발생한다. 이를 세부적으로 확인하기 위해 첨두 시간을 오전 7~9시, 오후 5~7시로 설정하였다. 첨두 시간 평균 이용 건수는 약 4만 3천 건, 비첨두 시간 평균 이용 건수는 약 1만 9천 건이다. 공유 자전거의 통행량은 첨두 시간에 약 40%의 비중을 차지하고 있다.
Table 3.
Descriptive statistics
스마트카드 데이터의 통행량을 살펴보면 2019년 10월 셋째 주 약 9,370만 건에서 2020년 약 7,240만 건으로 약 23% 감소하였다. 2021년 약 6,690만 건, 2022년은 약 8,270만 건이다. 대중교통 통행량은 공유 자전거의 통행량과 상반되는 결과를 확인할 수 있다. 4개년 데이터에 대한 평일 일일 평균 이용 건수는 약 1,244만 건, 주말은 약 835만 건이다. 첨두 1시간 평균 이용 건수는 561만 건, 비첨두 1시간 평균 이용 건수는 약 198만이다. 대중교통의 통행량은 첨두 시간에 약 45%의 비중을 차지하고 있다.
인구의 변화를 살펴보면, 거주인구의 경우 2019년 약 972만 명에서 2022년 약 927만 명이고, 꾸준히 감소하는 추세이다. 날씨의 변화는 2019년, 2021년 분석 기간의 평균 기온은 15.5 ℃, 2020년도는 가장 낮은 13.2 ℃, 2022년은 2021년보다 조금 낮은 14.3 ℃ 이다. 미세먼지(PM2.5)와 초미세먼지(PM10)은 2021년까지 감소하는 추세였으나, 2022년 다시 증가하였다.
분석 결과
1. 최적의 통계모형 선정을 위한 비교 분석
본 연구에서는 공유 자전거의 통행이 시공간적 특성이 존재하기 때문에 공유 자전거의 정류장 위치와 시간에 따른 차이가 발생한다고 가정하였다. 이러한 가정을 확인하기 위해 일반적인 통계 모형과 시공간성을 인식하는 통계 모형 간의 차이가 발생할 것이라 가정했고, 일반 통계 모형과 국지적 통계 모형, 시공간을 인식하는 통계 모형을 비교하였다. 일반 통계 모형은 활용성이 높은 통계 모형 중 하나인 다중회귀분석(MLR)을 사용하였다. 국지적 관점에서 공간성을 인식하는 통계 모형은 GWR, MGWR을 선정하였고, 시공간성을 인식하는 통계 모형으로 STWR을 사용하였다. 비교에 활용된 종속변수는 공유 자전거의 통행량, 독립변수는 대중교통, 경사도, 인구, 날씨 총 4가지 측면으로 구분하여, 변수간 높은 상관 관계로 인해 발생하는 다중 공선성을 피하고 고유한 특성을 분석하기 위해 19가지 변수 중 9가지의 변수를 사용하였다. 대중교통에서 활용된 변수는 대중교통 통행량, 대중교통 정류장 개수와 경유 버스 수를 활용하였다. 인구 측면에서 거주인구와 유동 인구, 날씨 측면에서 기온, 미세먼지, 초미세먼지, 그리고 경사도를 변수로 사용하였다.
통계 모형별 분석에 대한 Goodness-of-fit(GOF) 값은 Table 4와 같다. 다중 회귀분석의 R-squared 값은 0.36, Akaike Information Criterion(AIC) 값은 3,153으로 산출되었다. 국지적 관점의 공간 회귀분석인 GWR과 MGWR은 각각 0.67, 0.71의 R-squared 값과 2,738, 2,613의 AIC 값을 산출하였다. 마지막으로 시공간을 모두 고려하는 시공간 회귀분석인 STWR은 0.87의 R-squared 값과 1,404의 AIC 값을 산출하였다. STWR의 결괏값은 다른 통계 모형들보다 R-squared 값이 크고, AIC값은 낮은 수치를 나타내며, 도출된 통계 모형 중 가장 데이터셋에 적합한 모형으로 판단하였다.
Table 4.
Analysis result of statistical model
2. STWR 모형 분석
STWR 모형에서 를 산정하는 방정식은 앞서 언급한 대로 Bi-Square와 Gaussian Kernel이 존재하며, 본 연구에서는 Gaussian Kernel을 사용하였다. 구축된 데이터 셋은 2019년부터 2022년까지 10월 셋째 주에 존재하는 일일 데이터를 연도별로 집계한 형태를 띄고 있다. STWR의 공간적 범위는 서울 전역의 격자 개수인 2,160이며, 시간적 범위는 2019년부터 2022년까지 총 4개의 연도로 설정하였다. 공간 커널과 시간 커널에 대한 매개 변숫값은 0.320이고, 최적화된 공간 대역폭()은 9이다. 공간 대역폭 9는 하나의 격자가 인근 격자 9개에 영향을 미침을 의미한다. 시간 간격은 3으로 구분하였으며, 최적화된 시간 대역폭()은 2이다. 해당 값은 4개 연도에 대해서 2개의 시간 구간을 설정하여 구분하였으며, 구분된 시간 구간을 3개의 시간 간격으로 세분화하여 분석을 수행했음을 의미한다. 3개의 상수항을 포함한 STWR 파라미터값의 추정치는 Table 5와 같다. STWR은 공간과 시간에 대한 가중치를 각 데이터에 대한 가중치가 개별적으로 존재하여 일반적인 통계 추론 값을 계산하기엔 어려움이 있지만 각 데이터에 해당하는 영향을 미치는 정도를 효과적으로 파악할 수 있다.
Table 5.
Summary statistics for STWR parameter estimates
평균과 중앙값을 기준으로 대중교통과 관련한 변수는 양의 영향을 미친다. 하지만 경유 버스 수와 대중교통 정류장은 양의 영향이 크지 않으며, 편차가 커서 유의미한 영향을 미친다고 보기 어렵다. 인구와 관련한 변수 중 유동 인구는 양의 영향, 거주인구는 음의 영향을 미친다. 유동 인구는 영향을 미치는 정도가 크지 않으며, 거주인구는 음의 영향을 많이 미치는 것으로 나타났다. 거주인구와 공유자전거 간에 음의 영향이 발생하는 이유는 주로 대중교통 인프라가 잘 갖춰진 지역에 거주인구가 밀집되는 경향이 있기 때문인 것으로 추정된다. 거주 인구가 많은 지역은 버스 정류장을 더 좁은 간격으로 지으므로 주거 밀집 지역에서의 보다 쉬운 대중교통 이용이 공유 자전거 수요에도 영향을 미치는 것으로 판단된다. 날씨와 관련한 변수는 미세먼지(PM 10)를 제외한 두 변수 모두 음의 영향력을 가지고 있으며, 영향을 미치는 정도가 크다. 경사도는 음의 영향을 미치는 것으로 나타났다.
정리하면, 양의 영향을 미치는 변수는 대중교통 통행량, 경유 버스 수, 대중교통 정류장, 유동 인구, 미세먼지이고, 음의 영향을 미치는 변수는 거주인구, 초미세먼지, 기온, 경사도이다. 이 중 경유 버스 수, 대중교통 정류장 개수, 유동 인구는 전반적으로 0에 가까워 Table 5의 결과로는 유의미한 변수로 보기 어렵다. 유의미한 변수들을 시각적으로 살펴볼 필요가 있다.
유의미한 변수들에 대한 시각화 자료는 Figure 2와 같다. Figure 2는 각 변수가 격자별로 영향을 미치는 정도를 시각화한 것으로, 푸른 계열은 음의 영향, 붉은 계열은 양의 영향을 의미하고, 영향의 정도가 높을수록 진한 색으로 표시하였다. 또한 서울에 존재하는 중심업무지구 세 곳을 도심 권역(CBD, Central Business District), 여의도 권역(YBD, Yeouido Business District), 강남 권역(GBD, Gangnam Business District)으로 구분하여 표현하였다. 변수 간 결과 비교를 위해 모든 결과에 동일한 범례 값을 설정하였다. 초미세먼지 (a)와 기온 (b)은 일반적으로 공유 자전거 수요에 음의 영향을 미친다. 기온과 초미세먼지가 영향을 미치는 정도가 격자별로 다른 이유는 서울이 자체적으로 가지고 있는 도시 구조와 지리적 특성에 의한 것으로 추정된다. 서울은 상업, 녹지, 공업 지역이 모두 존재하는 지역으로 각각의 특성에 따라 인근 지역과 비교했을 때 상대적으로 기온이 높거나, 초미세먼지 농도가 짙음 등의 특성이 존재하므로 격자별로 영향을 미치는 정도가 다른 것으로 판단된다. 초미세먼지와 기온 모두 영향을 미치는 정도가 강하며, 전 지역을 대상으로 초미세먼지 농도가 높을수록 자전거 수요량이 줄어든다고 해석할 수 있다. 전국에서 초미세먼지에 대한 경보와 주의에 대한 경보를 지속적으로 시행하여 이런 결과가 나온 것으로 판단된다. 기온의 경우 더운 낮보다, 기온이 내려가는 아침과 저녁 시간, 혹은 기온이 대체로 낮은 날의 자전거 수요량이 증가한다고 볼 수 있다.
경유 버스 수(c)는 양의 영향과 음의 영향을 모두 미치고 있다. 양의 영향은 대체로 3대 권역이 위치한 중앙 지역과 공항 인근 지역, 음의 영향은 주로 외곽 지역에서 영향을 미치고 있다. 3대 권역과 공항 인근 지역에서는 경유하는 버스 수가 많을수록 공유 자전거의 통행량도 증가하며, 외곽 지역은 경유하는 버스가 줄어들수록 공유 자전거의 통행량이 증가한다. 외곽 지역의 경우 대중교통의 인프라가 잘 갖춰지지 않은 지역이 많으므로, 대중교통 대신 공유 자전거를 선택하는 것으로 추정할 수 있다.
대중교통 통행량(d)은 대부분의 지역에서 양의 영향을 미친다. 특히, 외곽 지역에선 중심 지역보다 양의 영향이 높게 나타나는 지역이 많게 나타났다. 외곽 지역의 경우 대중교통 인프라가 잘 구축되어 있지 않아, 대중교통을 이용한 인원들이 공유 자전거와 연계하는 경우가 많기 때문으로 추정된다. 대중교통 인프라가 밀집된 중심 지역의 경우, 상대적으로 외곽지역보다 자전거를 이용하기가 어려워 이런 결과가 나온 것으로 판단된다. 특히 지하철 노선이 많지 않은 격자에 양의 영향이 대부분 높게 측정되었다. 해당 결과는 공유 자전거가 대중교통 중 지하철과 더 연관이 있음을 시사한다.
STWR 결과를 바탕으로, 공유 자전거의 통행량은 대중교통과 연관이 있음을 확인할 수 있다. COVID-19로 인하여 통행 행태에 변화가 생겼으므로, 대중교통 통행과 공유 자전거 통행도 변화가 생겼을 것으로 가정하였다. 이를 확인하기 위해 대중교통 통행량과 공유 자전거 통행량과의 관계를 연도별로, 세부적으로 분석하였다.
3. 대중교통 통행량과의 관계 분석
대중교통 통행량에 대한 영향 계수의 변화를 파악하기 위하여 연도별로 STWR 모델을 구축하여 시각화하였다. 2019년부터 2022년까지 연도별 대중교통 통행량이 공유 자전거 통행량에 영향을 주는 정도를 추정한 결과는 Table 6과 같고, 시각화한 자료는 Figure 3과 같다. 연도별 비교를 위해 기존과 동일한 범례 값으로 설정하였다. 4개년도에 대한 추정값을 살펴보면, 평균과 중앙값에서는 큰 차이가 발생하지 않지만, 분산에서 큰 차이가 발생하고 있다. 이는 연도별로 편차가 크게 나타나고 있음을 보여주며, 특히 2021년 편차가 매우 크다. 2021년도의 경우 최솟값은 -1.281, 최댓값은 2.519로 다른 연도에 비해 훨씬 편차가 큰 분포를 두고 있다.
Figure 3을 통해 영향 요인을 시각적으로 살펴보면 전반적으로 4개년도 모두 중심 지역보다 외곽 지역에서 양의 영향력이 큼을 알 수 있다. 2019년도 (a)의 경우 외곽 지역에서 양의 영향력이 나타나기 시작했으며, 3대 권역 중에선 YBD 지역이 다른 지역보다 대중교통과 공유 자전거 통행량의 관계가 유의미하게 나타나고 있다. COVID-19로 인하여 공유 자전거 통행량이 증가한 2020년 (b)은 일부 외곽 지역에서 2019년보다 더 강한 영향력을 미치는 지역들이 존재한다. YBD 지역에서의 대중교통과 공유 자전거 통행량 간의 관계가 더 크게 나타나고 있으며, CBD 지역에서는 음의 영향을 미치는 곳이 존재한다. 2021년 (c)은 위치별로 대중교통 통행량이 양의 영향을 미치는 곳과 음의 영향을 미치는 곳들이 모두 존재한다. 2021년은 음의 영향을 미치는 정도는 크지 않으나, 다른 연도에 비해서 다른 특성을 보이고 있다. 2021년은 COVID-19이 계속 유지되면서 공유 자전거를 선호하는 변화된 통행 행태가 나타나는 시기이다. 그리고 공유 자전거의 통행량 급증과 감소했던 대중교통 통행량이 반등하기 시작하는 시기이다. 이러한 시기가 맞물려 다른 연도에 비해 편차가 크게 발생한 것으로 판단된다. 대부분 중심업무지구에서 대중교통의 통행량이 줄어들수록 공유 자전거의 통행량이 증가하는데 이러한 이유는 유동 인구가 밀집된 중심업무지구에서 사람들과 밀집된 공간을 피하고, 비대면 교통 수단인 공유 자전거를 선호하는 통행 행태와 대중교통의 통행량 증가로 인해 이러한 결과가 나온 것으로 추정할 수 있다.
Table 6.
STWR results for Public Transit volume by year
Year | Mean | STD | Min | Median | Max |
2019 | 0.246 | 0.090 | 0.051 | 0.262 | 0.433 |
2020 | 0.217 | 0.126 | -0.081 | 0.218 | 0.682 |
2021 | 0.208 | 0.362 | -1.281 | 0.172 | 2.519 |
2022 | 0.238 | 0.223 | -0.514 | 0.205 | 1.581 |
2022년 (d)에는 COVID-19로 인한 경계가 완화되면서 2021년보다 편차가 줄었으며, 외곽 지역에서의 양의 영향을 미치는 지역이 더 많아졌다. 계속해서 증가하는 자전거 통행량과 2021년 이후 다시 대중교통 통행량이 증가하기 시작하면서 원래의 통행 행태가 비슷한 패턴을 보인다. 정리해 보면, 4개년도 모두 외곽 지역에서의 공유 자전거와 대중교통 통행량이 서로 양의 영향을 미치는 관계임을 확인할 수 있다. 이러한 결과를 통해 대중교통의 First-mile과 Last-mile을 공유 자전거가 연계하는 형태가 외곽 지역에서 많이 발생하고 있다고 추정할 수 있다. 그리고 외곽 지역에서 주요 대중교통 통행지로 이동하기 위한 노선이 부족하여 대중교통의 통행량이 많이 발생하는 주요 하차 지역에서 공유 자전거의 통행이 많아진다고 유추할 수 있다.
결론
현대 사회에서 공유 자전거는 교통수단의 온실가스 배출을 감소시키는 지속 가능한 교통수단이다. 본 연구는 공유 자전거 통행에 영향을 주는 사회경제학적 요인들을 시공간적인 관점에서 분석하여 활용성을 증진하기 위한 목적으로 시작되었다. 영향 요인을 파악하기 위해 대중교통, 날씨, 인구, 경사도 측면에서 9가지의 변수를 사용하였으며, 여러 통계 모형을 비교 분석하여 시공간적 변화에 따른 영향을 해석할 수 있는 STWR 통계 모형을 사용하였다. 모든 변수 중 대중교통 통행량과 초미세먼지, 기온, 경유 버스 수가 영향을 많이 미치는 것으로 나타났다. 세부적인 분석을 위해 대중교통 통행량과의 연관성을 분석하였다. 공유 자전거의 영향 요인 분석 결과는 외곽 지역에서 대중교통과의 연관성이 높음을 파악하였습니다. 본 연구의 결과는 공유 자전거와 대중교통 간의 연관성을 파악하는데 기여하며, 대중교통의 단거리 노선이 부족한 지역을 공유 자전거로 대체하기 위해 MaaS를 통한 대중교통과 공유 자전거의 연결성을 확장하여 공유 자전거의 활용성이 더욱 증진될 것으로 기대된다.
본 연구의 한계점은 데이터 구득의 한계로 동일한 날짜가 아닌 일부 변수의 날짜가 다르다는 부분이다. 그리고 데이터 기간이 10월로 설정하였으나, 연구의 일반화를 위해서 기간을 더욱 늘릴 필요가 있다. 또한 STWR의 결과로 영향 요인에 대하여 세부적인 분석이 필요하다. 추가로 공유 자전거와 대중교통의 통행량 관계를 분석하기 위해서는 시간을 세부적으로 나눠서 분석할 필요가 있다.
해당 연구는 연도를 중점적으로 시간적 범위를 설정하였다. 향후 연구로 세부적인 시간적 범위를 기반으로 평일과 주말과의 비교 분석과 첨두와 비첨두 시간을 분리하여 분석하고자 한다. 그리고 본 연구에서는 대중교통 교통수단인 버스와 지하철을 하나로 묶어서 연관성을 살펴봤다. 대중교통과의 연관성을 세부적으로 파악하기 위해 버스와 지하철을 구분하여 대중교통 내에서 어떤 교통수단과 더욱 연관성이 더 높은지 살펴볼 필요가 있다. 마지막으로 두 교통 수단의 연계를 확정지을 수 있는 연구를 수행하면 두 수단 간의 환승 및 연계 수단에 대한 새로운 근거 및 특성을 도출할 수 있을 것으로 보인다.