Article

Journal of Korean Society of Transportation. 31 December 2023. 861-877
https://doi.org/10.7470/jkst.2023.41.7.861

ABSTRACT


MAIN

  • 서론

  • 연구개념

  • 문헌고찰

  •   1. 코로나 확산 분석 사례

  •   2. 동적 타임워프 분석 기법

  • 분석방법

  •   1. 동적 타임워프

  •   2. CHAID

  • 연구영역과 자료

  • 분석 결과

  •   1. 전역적 DTW와 CHAID 분석

  •   2. 국지적 DTW와 CHAID 분석

  • 결론

서론

지난 2020년 시작에서 2023년 초까지의 장기간 동안 지속되었던 코로나19는 다양한 형태로 전 세계에 확산되었다(Gossling et al., 2021). 세계 경제는 이로 인해 심각한 피해를 입었다. 이 질병은 소멸과 부활을 반복하여, 정상으로 돌아오던 일상에 더욱 치명적인 영향을 미치는 일들이 많았다(Brinkman and Mangum, 2020).

팬더믹으로 인한 일상생활의 근본적인 변화는 다른 사람과의 불필요한 접촉을 최소화하고 감염에 대한 두려움으로 인해 특히 인구 밀집 지역에서 신체적 접촉과 이동을 줄이는 것으로 나타났다. 이는 질병이 오래 지속되고 반복적으로 발생할 경우 향후 토지 이용 및 통행행태에 중요한 영향을 미칠 수 있음을 시사한다. 현대 사회의 생산과 소비는 중심 도시와 주변 주거 지역 간의 장거리 통근통행 및 쇼핑통행을 기반으로 운영된다. 특히 중심 도시로 들어가거나 나오는 통행들은 중심지의 위계적 체계의 특성으로 인해 통행시간이 길어진다. 코로나19 감염에 대한 두려움으로 인해 사람들은 다른 사람과의 접촉을 최소화하기 위하여 인구 밀집지역으로 오가는 장거리 이동을 피하고, 필수적인 이동을 제외한 일상적인 이동은 주거지 인근을 중심으로 전환하는 경향을 보였다(Kim, 2020; Bhin and Son, 2021).

이같은 현상으로 인해, 최근 코로나19로 인한 통행행태 변화의 다양한 측면에 초점을 맞춘 연구들이 많이 보고되었다(De Vos, 2020; Anwari et al., 2021; Irawan et al., 2021; Politis et al., 2021; Zhang and Lee, 2021). 특히 코로나19 발생에 따른 지역별 통행행태 변화의 이해는 매우 중요하다. 또한 팬더믹이 장기화되고 반복되는 현 상황에서, 코로나19의 각 단계별 통행행태 변화의 패턴을 분석하는 것 역시 중요하다. 이를 통해 이동패턴의 변화로 인한 토지이용 변화뿐만 아니라 앞으로 다시 찾아올 수 있는 팬더믹 상황에서의 이동서비스 대응에 활용할 수 있을 것이다.

코로나 19의 통행행태 변화와 이에 대한 정책적 대응을 탐구한 중요 연구 중 Cho et al.(2021)Kim et al.(2021a), Kim et al.(2021b) 등은 특히 우리나라에서의 코로나19의 단계별 영향을 분석에 고려하여 연구 결과의 정책적 활용도가 높다. 코로나19는 그 자체 진행 단계별 상이한 강도와 속도로 전파가 진행되었으며, 질병으로 인한 사회적 활동의 통제 상황이 지속되면서 사람들의 대응 민감도가 달라지는 등, 질병이 사회에 미치는 영향은 단계별로 달랐다. 그런데 통행행동에 대한 전염병의 단계별 영향을 분석한 이러한 연구들에서 전염병 진행 상황과 통행행동 변화의 추이가 양적으로 어느 정도 일치하는지, 그리고 그 일치의 정도가 지역별로 어떻게 달리 나타나는지를 체계적으로 살핀 예는 찾기 어렵다. 질병의 전개와 통행의 그에 따른 반응의 양상은 질병 전개의 단계마다 상이할 수 있으며, 그 상이한 정도는 다시 지역별 특성에 따라서도 다를 수 있다. 이는 팬더믹 변화 추이에 따라 각 지역별로 차별화되는 대응 지침에 중요한 정보를 제공할 수 있다.

본 연구는 통행행태와 코로나19 확진자 발생 변화 추이의 일치 정도를 측정하고 지역적 특성과 일치 정도 사이의 연관성을 파악하는 방법을 제시하고자 한다. 이를 위해 본 연구는 먼저 2020년 1월부터 2021년 4월까지 코로나19 팬더믹 기간 동안 경기도의 버스카드 데이터를 수집하였다. 이 데이터에는 경기도내 각 버스 정류장에 기록된 버스 이용 빈도 정보가 포함되어 있다. 그런 다음 코로나19 발생과 버스 이용 빈도 변화 추이의 일치 정도를 계산하여 코로나19 발생이 이동 행태에 미치는 영향의 정도를 측정하였다. 팬더믹 기간 전체의 일치 정도와 팬더믹 전개 각 단계별 일치 정도를 각 행정구역별로 계산하였다. 마지막으로, 본 연구는 통계적 방법을 활용하여 일치 정도에 미치는 지역별 특성의 영향을 제시할 것이다.

연구개념

‘코로나19 전개’에 따른 ‘통행행태 변화’는 여러 가지 방법으로 파악할 수 있다. 본 연구는 버스 정류장에 기록된 주간 버스 이용 빈도 변화 데이터와 정부에서 발표하는 주간 코로나19 신규 확진자 수 데이터를 활용하여, 팬더믹 하에서의 통행행태 변화를 다음 두 항목들의 옳고 그름을 확인함으로써 검토하고자 한다.

1) 코로나19 상황과 버스 이용 간의 전반적인 변화 추이의 일치 정도는 지역마다 다르다.

2) 코로나19 각 단계에 따른 변화 추이의 국지적 일치 정도 역시 지역마다 다르다.

버스 이용 빈도 변화에 영향을 미치는 요인은 다양하기 때문에 코로나19 국면에 따른 정확한 버스 이용 빈도 변화는 유추할 수 없다. 따라서 본 연구에서는 두 변수 변화 추이의 일치 정도를 측정하고, 그것에 유의미한 영향을 미치는 요인을 파악하고자 한다. 여기서 강조할 것은, 이 분석은 버스 이용 빈도 변화에 대한 코로나19의 한계 기여도를 추론하는 것이 아니라 변화 추이의 일치 정도에 영향을 미치는 요인으로서 지역 특성을 파악하는 데 중점을 두는 분석이라는 것이다.

이 연구는 코로나19의 단계별 확진자 수 변화와 버스 이용 승객 수의 변화 각각을 하나의 시계열 자료로 정의하고, 이 두 시계열의 시간에 따른 변화 추이의 일치 정도를 측정하는 방법을 개발한다. 변화 추이의 일치 정도는 전반적인 것과 국지적인 것 두 가지 범위로 측정한다. 전반적인 일치 정도는 전체 분석 기간 동안 코로나19 발생과 버스 이용 빈도가 일치하는 정도를 나타낸다. 국지적인 일치 정도는 코로나19의 각 단계별 일치의 정도를 측정한다. 그런 다음 이러한 전반적 일치 정도와 국지적 일치 정도 각각이 지역의 어떠한 특성에 의해 영향을 받는지에 대해 알아본다. 분석 결과는 코로나19와 버스 이용 빈도 간의 전반적인 일치 정도에 영향을 미치는 지역적 특성과, 코로나19의 특정 단계와 버스 이용 빈도 변화 추이의 일치 정도에 미치는 지역적 특성을 각각 확인시켜 줄 것이다.

문헌고찰

1. 코로나 확산 분석 사례

질병의 확산에 관한 대표적인 연구로는 Barabasi(2005), Brockmann et al.(2006), Gonzalez et al.(2008) 등이 자주 인용된다. 이들의 연구는 질병 확산의 비선형적 특성과 감염이 허브와 스포크의 네트워크를 통해 진행되는 현상을 분석하였다. 이들 연구는 개별 이동 경로, 네트워크 확산, 시뮬레이션 등을 분석의 주된 구성 요소로 활용하였다. 이러한 선구적 실험적 연구와 달리, 경험에 기반을 둔 기술적 연구로서, 정부 통제의 영향을 강조한 연구들도 많다. Abdullah et al.(2020)은 통제 수준이 다른 여러 국가에서 코로나19가 통행행태와 교통수단 선택에 미치는 영향을 분석했다. Aloi et al.(2020)은 팬더믹 통제로 인해 통행빈도, 이산화질소 배출량, 교통사고가 급격히 감소했음을 확인했다. Chinazzi et al.(2020)은 통행 제한이 전염병의 국내 및 국제적 확산에 미친 영향을 분석하였다. De Vos(2020)는 코로나19와 그에 따른 사회적 거리두기가 통행에 미치는 영향을 분석한 연구에서 걷기와 자전거 타기가 만족스러운 수준의 건강과 웰빙을 유지하는 데 중요한 방법이 될 수 있음을 제안하였다. Beck et al.(2021)은 코로나19 팬더믹 통제 기간 동안 대중교통 이용의 변화와 관련된 통행행태에서의 생물학적 안전성을 분석하였다. Borkowski et al.(2021)도 봉쇄가 일상적인 이동성에 미치는 영향을 분석하였다. Franzen and Wöhner(2021)은 사회적 거리두기 조치의 준수 여부를 결정하는 데 있어 인식의 중요성을 강조하였다. Kim and Kwan(2021)은 팬더믹 기간 동안 미국에서 장기간의 자료에 대한 연구를 수행하여, 팬더믹을 통제하기 위해 사람들의 이동을 제한하는 것은 단기간 동안만 효과적이라고 주장했다. Downey et al.(2022)은 팬더믹 통제 기간 동안의 대중교통 이용 현황을 조사하여 대중교통에 대한 잠재적 수요 감소를 예상하고 향후 공평하고 지속 가능한 이동수단의 필요성을 강조하였다. Loa et al.(2022)은 코로나19 팬더믹이 차량 공유 서비스 이용에 미치는 영향을 조사한 결과, 위험에 대한 우려로 인해 팬더믹이 종식되기 전에 오히려 이용이 줄어든다는 것을 확인하였다. de Palma et al.(2022)은 팬더믹이 이동성과 일상생활에 급격한 변화를 일으켜 도시 및 교통 계획에도 지대한 영향을 미쳤음을 알렸다. Tshuo et al.(2022)은 다양한 코로나19 정책에 대한 백신 접종의 효과를 평가했다. Yao et al.(2022)도 코로나19에 따른 통행행태 변화에 근거하여 중앙정부의 강력한 통제의 효과를 평가했다. Semple et al.(2023)은 스코틀랜드 거주자들의 제한 조치 준수에 영향을 미치는 요인을 정리하였다. 본 연구는 이러한 대표적인 선행연구들이 밝힌 질병 확산의 일반 원리를 수용하여, 이러한 질병 확산 현상이 대중교통 이용 변화와 갖는 관계를 계량적으로 분석하는 방법을 관련 선행연구를 참조하여 새롭게 제안하고자 한다.

2. 동적 타임워프 분석 기법

본 연구는 코로나19의 확진자 수와 버스 이용 빈도 변화 추이의 일치 정도를 측정하기 위해 동적 타임워프(Dynamic Time Warping: DTW) 알고리즘을 사용하였다. 워핑은 한 시계열의 움직임의 양상을 다른 시계열에 일치시키는 것을 의미한다. 이 알고리즘의 기원은 여러 갈래인데, 그 중 하나는 음성 인식 분야에서 두 시계열 사이의 최적의 워핑 경로를 계산하는 기원을 포함한다(Sakoe and Chiba, 1978; Furtuna, 2008). 음성으로 표현되는 두 문장은 화자의 발음 방식, 단어 수, 언어모델, 단어 혼잡도, 잡음비 등에 따라 동일하거나 유사한 내용이라도 매우 다른 정보로 인식될 수 있다. 그럼에도 불구하고 완전히 상이한 두 문장에 비해 유사한 두 문장은 공통의 음소 혹은 핵심어(schema)들을 공유한다. 음성 인식 분야의 선행연구들은 이러한 공통의 음소 집합이 발음 방식, 언어모델, 잡음 등에 의해 선형으로 동일한 간격으로 놓이지 않더라도 워핑 방법을 이용한다면 두 문장 간의 유사성을 용이하게 감지해 낼 수 있다는 것을 확인하였다.

패턴 인식 분야에서도 비슷한 연구들이 있다(Needleman and Bunsch, 1970; Kruskal and Sankof, 1983; Murata et al., 1985; Carrillo and Lipman, 1988; Schuler et al., 1991; States and Boguski, 1991; McClure et al., 1994; Gusfield, 1997). 패턴 인식은 타임워프 방법으로부터 가장 큰 영향을 받았다. 특히 유전자 배열의 유사성과 차이점을 확인해 주는 게놈프로젝트는 타임워프 기법 혹은 정보배열비교 기법을 적용하는 대표적인 연구 분야이다. 위 음성인식이 중요 음소나 핵심어 간 무의미한 시간 지연이나 잡음 부분을 제거하고 의미 있는 내용만을 상호 비교하는 방식인 것과 유사한 원리로, 패턴 인식 역시 핵심적인(skeletal) 정보의 배열만을 강조하여 비교함으로써 두 패턴 간의 의미 있는 비교가 가능하게 한다. 유전자 배열에서 의미 있는 염기 정보 즉 엑손(exon)은 전체 염기 정보의 1-2%에 불과하며, 그것이 종들 간의 구분을 가능케 한다. 나머지 98-99%의 의미 없는 정보의 염기는 인트론(intron)이라 하며, 정보 배열 비교에서 배제된다. 두 염기 배열이 인간과 침팬지처럼 유사하다거나 인간과 악어와 같이 비교적 상이하다는 결론은 바로 이 1-2%의 염기 배열의 유사성과 차이점을 패턴인식의 방법으로 확인한 결과이다. 얼굴인식도 핵심 이미지 정보 간의 2차원 배열 비교에 의해 실행된다.

DTW 알고리즘의 실무에서의 적용은 Aach and Church(2001), Keogh and Ratanamahatana(2005), Ranacher and Tzavella(2014), Lee et al.(2017)에서와 같이 매우 다양하다. Aach and Church는 유전자 염기배열 간의 비교를 실험실에서 생성하여 수행하는 연구에서, 공통된 과정에서도 실험마다 또는 개인마다 서로 다른 속도로 생성된 유전 배열간 차이를 맵핑하는 데에 동적 타임워프가 단순 클러스터링 방법에 비해 효율적임을 보고하였다. Keogh and Ratanamahatana는 과학, 의학, 산업 및 금융 분야 등에서 시계열 패턴을 구분하는 인덱스를 생성하는 데에 Euclidean 거리측정 방법보다 DTW가 훨씬 더 효율적임을 확인하였다. Ranacher and Tzavella는 속도, 공간적 경로 또는 시간적 지속과 같이 이동의 물리적 양에 의해 측정되는 객체들의 공간적, 시간적, 시공간적 움직임들이 유사하거나 상이할 때 그 정도를 측정하는 데에 DTW를 사용할 수 있음을 보여주었다. Lee et al.(2017)은 KOSPI200선물을 대상으로 거래량 패턴과 하루 중의 price momentum을 분석하였는데, 9시부터 9시 10분까지 수익률이 점점 증가되는 J자형 가격 패턴 경우는 그렇지 않은 U 자형 패턴의 경우보다 price momentum 현상이 더 강한 것을 확인하여, DTW 분석 방식을 사용하면 특정일 특정 시간대의 가격 패턴이 J자형 가격 패턴을 형성하는지 여부를 판단할 수 있음을 보였다. 본 연구는 이와 같이 음성인식, 패턴인식, 다양한 용도의 실무 작업에서 의미 있는 핵심 정보 스키마들의 정보배열을 효과적으로 비교하는 용도로 사용되어 온 DTW 기법을 코로나 확진자 수와 통행행태의 핵심적 정보들이 시간에 따라 변화하는 양상에 일치성이 있는지를 확인하는 데 적용하고자 한다.

분석방법

1. 동적 타임워프

1) 전역적 동적 타임워프 측정

일주일간의 코로나19 확진자 수 변화와 대중교통 이용 빈도 변화의 일치 정도는 전체 분석 기간에 걸쳐 계산된다. 시간 축을 따라 코로나19 확진자 수와 대중교통 이용 빈도가 표시되고 이들을 각각 이으면 시간별 확진자 수의 곡선과 시간별 대중교통 이용 빈도의 곡선이 각각 생성된다. 두 개의 곡선은 시간의 경과에 따라 서로 달리 나타나는 곡률에 의해 각각의 모양을 갖게 된다. 이 때 DTW는 두 선 사이의 최소 거리, 즉 시간 축 위의 확진자 수와 대중교통 이용 빈도 간의 차이를 측정하여, 두 선의 시작점에서 끝점까지 누적된 거리를 계산한다. 특히 DTW는 각 선에서의 시간 지연 효과를 제거하여, 두 선 사이의 서로 다른 기간 동안의 유사한 곡률 구간을 성공적으로 감지한다. 비교한 두 선이 약간의 시차를 두고 유사한 곡률의 곡선을 명확하게 나타내더라도, 유클리드 측정 방식은 시차를 고려하지 않고 해당되는 데이터 포인트를 비교한다. 유사 곡률 구간을 감지하지 않고 동일 시점마다의 두 선 사이의 거리를 기계적으로 비교하면 두 선 사이의 차이의 정도가 비현실적으로 크게 측정될 수 있다. 이와 달리, DTW는 시점이 서로 다르더라도 곡률이 유사한 구간이라면 매칭하여 두 선 사이의 차이를 실제 의미에 부합하게 측정하는 특성이 있다.

이 특성이 두 개의 시계열 자료 간 비교에서 유클리드 거리 측정 방식이 아닌 DTW를 이용하는 가장 중요한 이유인데, 코로나 확진자 수의 변화는 대중교통 이용 빈도에 영향을 미치되 동시적인 것이 아닌 시차를 둔 영향을 미치기 때문이다. DTW를 이용하는 또 하나의 이유는, 영향이 시차를 두고 미칠 때, 그 시차가 항상 일정하지는 않다는 것이다. 변화의 전후에 따라, 혹은 변화가 발생하는 지역이나 해당되는 인구집단에 따라 시차의 크기는 달라질 수 있다. 분명히 두 현상 간의 영향 관계가 있음에도 이렇듯 현상의 발생 시점이 동일하지 않기에, 유클리드 측정 방법에 비해 훨씬 더 효율적으로 그 유사성과 차이점을 잘 감지해 내는 DTW를 사용하는 것이다. Lee et al.(2017)의 예로부터 학습한다면, 주식시장에서 런던과 뉴욕 등 서로 다른 시장에서의 주가 변동 그래프 간의 비교, 혹은 어제와 오늘 사이의 코스피 주가 변동 추이 간의 비교 등에서 의미 없는 중간의 변화들을 자동으로 거르고 중요 변곡점의 추이만을 비교하는 데 DTW를 사용할 수 있으며, 본 연구에서의 DTW 이용은 이와 유사한 응용이라고도 볼 수 있다.

실제로, 코로나19 기간 동안 확진자 수 변화에 따른 버스 이용 빈도 변화는 어느 정도 시차를 두고 관찰되었으며, 그 시차의 크기는 다소 무작위적이었기 때문에, 이러한 시간 왜곡 특성은 현재 분석에 매우 타당한 것으로 판단하였다. 사람들은 매일 매일의 신규 확진자 수 발표뿐만 아니라, 그 시기까지의 코로나19의 전반적인 기복에 대한 정보에 따라 앞으로의 확진자 수 변화 및 팬더믹 심각성의 변화 추이를 예상하여 이동 행태를 변화시키는 경향을 보였다.

또한 통행행태는 다양한 방식으로 질병과 함께 변화할 수 있다. 코로나19의 확진자 수가 증가함에 따라 버스 이용 빈도가 감소할 것을 예상할 수 있다. 그러나 그 반대의 움직임을 관찰할 가능성도 전혀 없지는 않다. 이러한 팬더믹과 통행행태 변화 추이의 일치 정도를 분석하는 것이 제공할 시사점은 명백하다. 분석된 변화 추이 일치 정도의 예상 경향은 앞으로 팬더믹 위기가 다시 발생할 때에 이에 대한 이해와 대비를 용이하게 해 줄 것이다. 팬더믹 상황이 완화하는 상황에서 일치 정도가 지속적으로 감소한다면, 즉 신규 확진자 수가 감소함에도 이동이 계속 위축되고 경제활동이 지속적으로 위축한다면, 개인들이 지속적으로 매우 조심하는 생활이 몸에 배어 질병의 재확산 가능성을 크게 낮추므로 질병 관리 당국은 만족할 수 있다. 그러나 이러한 경향이 너무 강해 일상으로의 '회복'이 늦어진다면 경제에는 해가 될 수 있다. 반대로 팬더믹 상황의 변화마다 너무 민감한 반응을 나타내 일치 정도가 지속적으로 증가한다면, 팬더믹의 전반적 소멸을 거꾸로 되돌리는 질병 재확산을 촉진하는 부작용을 가져올 수 있다. 혹은 질병 재확산에 의해 팬더믹 통제에 빨간 불이 들어왔는데 거꾸로 이동 빈도가 증가하는 불일치 현상이 발생한다면 팬더믹 상황 통제를 더욱 어렵게 만들 것이다. 이는 사람들이 장기간 지속되는 팬더믹에 지쳐서 질병 재확산이라는 좋지 않은 상황이 닥쳐도 거기에 둔감해져 더 이상의 조심스런 행동을 거부하는 것을 의미하는데, 이는 팬더믹 상황을 통제해야 하는 질병 관리 당국에게는 최악의 시나리오가 될 수 있다. 이 마지막 경우에는 팬더믹 방지 정책이 효과를 발휘하지 못할 수 있으므로, 당국은 예상에서 벗어난 행동 경향을 정상적인 일치 패턴으로 전환시키기 위한 적극적 정책을 지향할 수 있다.

DTW는 다음과 같이 표현할 수 있다. 각각 길이 mn의 두 시계열 선 sg가 주어지고, s = (s1,s2,…,si, …, sm)과 g = (g1,g2,…,gj, …, gn) 을 비교 대상으로 할 경우, DTW는 Equations 1, 2, 3에 표현된 대로 각 시계열 선에서의 i번째 및 j 번째 요소 sigj까지의 두 시계열 선 간 워핑 비용 D(i,j)의 최소 누적 거리의 최종 측정값 D(m,n)인 DTW(s,g)로 간주된다.

(1)
d(si,gj)=(si-gj)2
(2)
D(i,j)=d(si,gj)+minD(i-1,j-1),D(i-1,j),D(i,j-1)
(3)
DTW(s,g)=min{k=1Kwk

여기서, wk는 워핑 경로 Wk번째 요소로서, max(m,n) < K < m+n−1 이다.

Equation 1의 d(si,gj)는 거리행렬 m× ni번 째 요소와 j번째 요소 간 거리 제곱이며, Equation 2의 D(i,j)는 si번째 요소 sigj 번째 요소 gj까지의 두 시계열 선 간 거리 제곱의 최소 누적값, Equation 3D(i,j)가 최종 요소인 smgn까지의 거리 제곱의 최소 누적값의 제곱근을 계산한 결과이다. 여기서, Equation 1sigj 간 의 거리는 좌표계에 의한 2차원 평면상의 거리가 아닌 이벤트를 나타내는 1차원 점 간의 절대 거리이되, 절대값 대신 제곱의 값을 취하며(Lee et al., 2017), Equation 2를 거쳐 Equation 3에 이르러 제곱근의 값을 취해 원래 이벤트 간 거리의 스케일로 환원시킨다. 즉 국지적 DTW는 D(1,1)에서 D(m,n)까지의 경로 wk 중 요소 sigj 간 거리 제곱의 누적합이 최소인 경로가 제시하는 누적값의 제곱근을 뜻한다. 위의 Equations 1, 2, 3의 계산을 그림으로 다시 설명하면 Figure 1과 같다. 왼쪽 그림의 두 선의 시간 왜곡은 오른쪽의 누적 시간 왜곡 비용의 배열 행렬을 사용하여 계산된다. 왼쪽 그림 아래의 점선은 코로나 신규 확진자 수의 변화, 위의 실선은 통행 빈도의 변화를 나타낸다. 오른쪽 그림의 각 행렬의 눈금은 시간 단위를 나타내며, 좌하향하는 화살표점선은 거리 제곱의 최소 누적합이 얻어지는 경로를 나타낸다. 모든 행렬 셀은 먼저 Equation 12를 사용하여 계산된 수치로 채워진다. 그런 다음 계산된 수치를 Equation 3을 사용하여 오른쪽 상단 셀에서 왼쪽 하단 셀까지 합산하여 전체 행렬의 DTW를 구한다.

https://cdn.apub.kr/journalsite/sites/kst/2023-041-07/N0210410707/images/kst_2023_417_861_F1.jpg
Figure 1.

Overall time warping computation: Adjusted from Lee et al.(2017), Aach and Church(2001), and Keogh and Ratanamahatana(2005) for the current analysis data at hand

2) 국지적 동적 타임워프 측정

개념 2에서 언급했듯이, 국지적 DTW는 코로나19와 통행행동 변화 추이의 일치 정도를 단계별로 측정한 것으로서, 다음과 같이 표현된다.

(4)
DTWp=min{kp=1Kpwkp
(5)
DTWL=pPDTWp

여기서, P는 COVID-19 진행 단계의 총 수, Kpp번째 단계의 요소 개수, K = K1+...+Kp + ... + KP 이다.

다음으로, 코로나19의 단계별 일치 정도를 확인하기 위해 국지적 DTW 측정값을 계산한다. 국지적 DTW는 각 코로나19 단계의 최소 거리 제곱근의 합으로, 전체 단계 최소 거리 제곱합의 제곱근인 전역적 DTW의 측정값과 차이가 있다. 예를 들어, 전체 3개 단계의 최소 거리 제곱합의 제곱근인 전역적 DTW 측정치가 √(20+30+50)=10이라면, 국지적 DTW는 4.47 + 5.47 + 7.07=17.01인데, 동일한 전역적 DTW 측정치 √(15+30+55)=10의 국지적 DTW 인 3.87+5.47+7.41=16.75로서, 앞서 전역적 DTW과 차이를 나타낸다.

Equation 45Figure 2에 표현되어 있다. 그림에서 두 선의 전체 타임워프는 왼쪽에서 여러 단계의 로컬 타임워프들로 나뉜다. 이들은 각각 방정식을 사용하여 오른쪽에서 계산된다. 누적 타임워프 비용은 각 로컬 행렬의 가장 오른쪽 위 셀에서 가장 왼쪽 아래 셀까지 계산된다.

https://cdn.apub.kr/journalsite/sites/kst/2023-041-07/N0210410707/images/kst_2023_417_861_F2.jpg
Figure 2.

Local time warping computation

2. CHAID

본 연구는 COVID-19의 변화와 통행 변화 추이의 일치 정도를 DTW에 의해 측정한 후, 그 일치 정도가 연구 지역 내 세부 지역 간 상이하다면 그 차이가 어떤 지역적 특성에 의해 나타나는가를 확인하기 위해, CHAID 방법을 적용하였다. 보통 하나의 세부 지역은 매우 많은 변수들에 의해 그 특성을 기술할 수 있다. 일치의 정도는 서로 다른 특성을 가진 세부 지역별로 상이할 수 있다. 일치 정도에 영향을 미치는 특성은 세부 지역과 무관하게 일치 정도의 크기순으로 일률적일 수 있으나, 세부 지역별로 상이한 특성들이 존재할 수도 있다. 이렇듯 일치 정도에 영향을 미치는 일률적 특성과 세부 지역별 상이한 특성들의 복잡한 체계를 통계적 방법에 의해 도출해 내는 데 적합한 방법이 바로 CHAID이다.

CHAID는 Chi-squared Automatic Interaction Detection의 약어로 주로 이산형 종속변수 범주 구분에 영향을 주는 영향변수의 집합을 여러 방향의 가지치기에 의해 구분해 준다(Kass, 1980). 데이터마이닝의 한 방법으로서, 구분의 기준은 피어슨 혹은 우도비 카이제곱 검정 통계량이 주로 사용된다. CHAID의 결과로서 얻어지는 범주 구분의 영향변수 가지치기 그림은 의사결정나무(decision tree)라고 부른다(IBM, 2023). 종속변수의 범주 구분에 의해 가장 분명하게 구분되는 영향변수의 둘 이상의 범주 구분을 찾아 child node로 규정한다. 해당 변수에서 구분되지 않는 인접 범주들은 통합된다. 각 child node에서는 그 외 영향변수 중 가장 분명하게 구분되는 범주 구분을 갖는 것이 선택되어 그 다음 단계의 child node를 구성한다. 이러한 각 단계별 범주 구분은 계속되며, 더 이상의 명확한 영향변수 범주 구분이 불가능할 때 가지치기는 중단된다. 이 연구에서는 DTW 수준이 유사한 세부 지역들이 묶여 DTW 그룹이 확인된 후 구분된 그룹들이 CHAID에 의해 배타적으로 갖는 특성들을 밝히고자 한다.

연구영역과 자료

연구 지역은 경기도로서, 경기도 내의 가장 작은 행정 단위인 547개 동을 세부 지역으로 모두 포함한다. 경기도는 28개의 시와 3개의 군으로 구성되어 있으며, 10,171 km2의 면적에 약 1,300만 명의 주민이 거주하고 있고 인구 밀도는 1,247명/ km2이다. 2020년 현재, 이 지역의 교통 시스템은 24개의 지하철 및 철도 노선과 204개의 역, 1,846개의 버스 노선, 37,237개의 정류장으로 구성되어 있다(Gyeonggi Transportation DB Center, 2020). 평일 기준 약 3 백만 명의 버스 사용자가 440 만 회의 버스통행을 한다.

분석에 쓰인 자료는 2020년 1월 20일(월)부터 2021년 4월 18일(일)까지의 코로나19 기간 중 수집하였다. 보다 구체적으로, 분석을 위해 다음의 세 가지 데이터를 수집했다: (1) 질병관리본부에서 제공하는 국내 주간 코로나19 신규 확진자 수, (2) 도내 547개 동 버스 정류장마다 기록되어 도내 버스 카드사에서 수집하는 주간 버스 탑승객 수, (3) 코로나19 발생 전 경기연구원(GRI)에서 수집한 547개 동에 대한 인구 및 사회경제적 특성, 이동 행태 등의 자료가 그것이다. Table 1에 자료의 동별 통계적 특성을 요약했다.

Table 1.

Statistical summary of the regional characteristics

N Mean Standard dev. Min Max
population 542 24527.58 18418.858 157 132495
elderly ratio 542 .2370 .09705 .05 .55
sex ratio 542 .5094 .02449 .46 .64
area (km2) 542 18.4326 27.3682 2.73 229.90
population density 547 9072.7825 10161.43830 0 49192.46
# persons per household 542 2.3156 .35292 1.36 3.34
# kindergarten kids 542 317.5664 367.0310 0 2655
# students before university 542 2718.2619 2589.4722 0 16878
residential ratio (%) 542 33.0443 26.24177 0 97.39
commercial ratio (%) 542 4.5415 8.43316 0 54.03
industrial ratio (%) 542 5.8090 17.37374 0 100.00
greenery ratio (%) 542 55.3137 31.02475 0 100.00
# workers 530 8917.12 10540.363 0 122384
# employed 530 5714.01 8518.866 0 107667
# part-time workers 530 1226.75 1161.767 0 10564
# self-runners 530 1316.90 1082.201 0 8203
# retail shops 530 44.34 31.571 0 202
# street stalls 530 17.65 25.663 0 340
# pubs 530 202.67 160.536 0 1030
# restaurants 530 76.46 79.115 0 581
# cinema companies 530 1.36 4.150 0 75
# private educational institutes 530 44.06 39.572 0 267
# creative/art services 530 1.88 3.311 0 32
# library/history services 530 5.37 5.716 0 46
# sports services 530 18.31 16.216 0 108
# recreation/leis services 530 29.04 29.341 0 214
# cosmetic/bath services 530 71.69 65.056 0 516
# wedding/funeral services 530 21.60 17.420 0 122
bus boarding freq. 509 8483.70 8200.014 8 54611
outbound bus board freq. 509 976.35 1530.986 0 10877
bus trip av. duration(min) 509 813.47 554.998 20.86 3933.67
outbound bus av. duration 509 61.59 51.621 0 322.50

(1)과 (2)의 데이터 포인트 수는 분석 기간의 전체 주 수인 65개이다. (1)과 (2)의 데이터는 주간 신규 코로나19 확진자 수와 주간 버스 탑승객 수 변화 추이의 일치 정도를 측정하기 위해 수집한 데이터이다. (3)의 데이터는 일치 정도와 동별 지역 특성 간의 연관성을 분석하기 위해 수집했다. 보다 구체적으로, 도내 547개 행정동별 평균치를 기술한 표 1은 인구특성, 토지이용특성, 일상 활동 시설특성, 이동 행태 등을 나타낸다. 이같은 변수들을 팬더믹 상황과 연계하여 검토함으로써, 팬더믹 상황에서 개인의 자발적인 이동 자제 경향으로부터 가장 큰 영향을 받은 것이 어떤 인구집단인지, 어떤 토지이용특성인지, 어떤 일상 활동인지 그리고 어떤 이동 행태인지에 대한 정보를 얻을 수 있을 것이다. 특히 일상 활동 시설특성에는 감염병이 다중 이용 시설에서 전파되는 경우가 빈번하기 때문에 그에 대한 대중의 인식이 행동을 바꾸는 데 영향을 줄 수 있다는 점을 고려하여 포함하였다. 분석 결과에 따라, 직접적으로 영향을 받는 행태 및 그와 연관된 도시 시설과 산업이 확인될 것이며, 이에 대한 정책적 대응을 준비하는 데 중요한 정보를 얻을 수 있을 것으로 기대한다.

주간 COVID-19 확진자 수와 주간 버스 승객 수는 대부분 규모가 다르기 때문에 정규화했다. 후자가 전자보다 훨씬 큰 수치인 경우가 많다. 정규화하지 않으면 결과는 버스 이용 빈도와 코로나19 확진자의 동시 이동 정도 간의 차이가 아닌 547개 동별 주간 버스 승객 수의 전체 규모 차이만 반영하게 된다. Figure 3의 선은 주간 코로나19 신규 확진자 수(굵은 선)와 임의의 6개 동의 주간 버스 승객 수 변화 추이를 나타낸다. 가로축은 분석 기간 2020년 1월 20일(월)부터 2021년 4월 18일(일)의 65개 주를 포함한다. 각각의 선은 정규화되어 있어 동별로 크게 차이가 나는 버스 승객 규모 수준에 구애받지 않고 동별 버스 승객과 코로나19 신규 확진자 수의 동선 이동 정도를 비교할 수 있다는 점에 주의해야 한다. 또한 코로나19 신규 확진자 수와 버스 승객의 이동이 반비례하기 때문에, 정규화된 코로나19 신규 확진자 선은 해석의 편의를 위해 시간 축을 중심으로 반전했음을 강조한다.

https://cdn.apub.kr/journalsite/sites/kst/2023-041-07/N0210410707/images/kst_2023_417_861_F3.jpg
Figure 3.

Weekly number of newly confirmed COVID-19 cases in Korea and bus use frequency in dongs

Figure 3은 DTW의 다양한 상황을 보여준다. (1)과 같이 모든 동선이 COVID-19 선과 비슷하게 움직이는 경우도 있다. (2)에서와 같이 일부 선이 다른 선보다 훨씬 더 많이 반응하는 경우도 있다. 때로는 (3)과 같이 선들이 서로 반대 방향으로 움직이기도 한다. (4)에서와 같이 질병의 큰 충격에서 회복하는 데 시간이 걸릴 수 있다. (5)와 같이 코로나19 사태가 오래 지속되면서 사람들은 지쳐가고, 코로나19 확진자 수가 증가함에도 불구하고 버스 승객 수는 증가한다.

분석 결과

1. 전역적 DTW와 CHAID 분석

547개 동별로 두 선의 65개 데이터 포인트에서 계산된 전체 DTW 값을 얻었다. 0.009에서 34.306까지의 범위이며 평균은 5.409, 표준편차는 5.1302 이다. 이러한 547개 동에 대한 전체 DTW 점수를 토지 이용 및 사회 인구학적 특성과 연관시기 위하여 탄뎀 방식의 분석을 수행하였다. 먼저 동질적인 동 그룹의 개수를 찾은 후, 각 그룹을 프로파일링하고, 클러스터를 결정하는 외부 요인을 식별하였다. 그룹의 수는 각 동의 DTW 값을 기준으로 하여 워드 클러스터링 알고리즘에 의한 덴드로그램이 확인한 3개로 결정하였다(Figure 4). 71개, 160개, 316개 동으로 구성된 세 그룹은 평균 DTW 값이 각각 15.96, 7.13, 2.16으로 유의미하게 구분되었다. 그룹 1은 매우 높은 DTW로 매우 낮은 수준의 일치 수준을 나타낸 반면, 그룹 3은 매우 낮은 DTW로 매우 높은 수준의 일치 정도를 나타냈다. 즉 그룹 1에 비해 그룹3은 코로나19 확진자 수 변화에 대해 더 민감한 통행행태 변화를 보인 집단이다.

https://cdn.apub.kr/journalsite/sites/kst/2023-041-07/N0210410707/images/kst_2023_417_861_F4.jpg
Figure 4.

Dendrogram of groups of similar DTW dongs

다음으로, 동질적인 소수의 동 그룹들 간 차이를 초래하는 외부 요인을 파악하였다. DTW 값에 대한 행정동 특성의 영향은 비선형적일 수도 있으며, 범주별 수준에 따라 상이한 특성들이 영향을 미칠 수도 있다. 본 연구는 CHAID 모델을 활용하여 각 DTW 수준별 행정동 그룹별로 코로나19에 따른 통행행태의 변화를 유도하는 변수를 파악하였다. CHAID 결과는 Figure 5에 제시했다. 인구 밀도가 높은 동에 거주하는 주민들은 코로나19 확진자 수 변화에 민감하게 반응하고, 이에 따라 버스 이용 빈도도 변화하기 때문에 전체 DTW 점수가 작다. 인구 밀도가 낮을수록 전체 DTW 점수가 높아지는 것은 분명하다. 인구 규모보다는 인구 밀도가 팬더믹에서의 행태변화에 더 중요한 의미를 갖는데, 인구 밀도가 높은 지역의 사람들이 감염 위험에 대해 더 우려한다는 문제의 특성이 우선적으로 반영되고 있다. 인구 밀도가 높은 동 중 유치원생 수가 많은 동은 코로나19 확진자 수 변화에 더욱 더 민감하게 반응할 수밖에 없으므로 전체 DTW 점수가 작아 그룹 3의 비중이 가장 높음을 알 수 있다. 마지막으로, 인구 밀도가 가장 높지는 않더라도 사람들이 많이 모이는 예식장이나 장례식장이 많은 동에서는 DTW 점수가 작은 그룹 3의 비중이 두 번째로 높다. 코로나19 발생 이후 결혼식과 장례식에 모이는 것이 극도로 회피되어 온 뚜렷한 사실이 있으며, 분석 결과는 이를 반영하는 것으로 볼 수 있다. 이러한 분석 결과는 팬더믹 시기의 개인의 통행 변화는 전염 확산에 대한 공포나 우려에서 일차적으로 기인하는 것이기 때문에, 개인의 반응은 접촉 가능성에 대해 가장 민감하게 나타날 것이며, 따라서 사람들이 많이 모이는 활동의 장이 우선적으로 기피된 것이 매우 잘 확인된 결과라 볼 수 있다. 따라서 팬더믹 전개 시기에는 통행에 대한 제한은 대규모 집회, 다수가 모이는 토지이용 관련 활동의 장 등이 있는 지역이나 권역을 선별적으로 실행하는 것이 필요하다. 이동은 일상생활이 가능하게 하는 기본적인 권리에 해당하는 활동이다. 이의 제한은 가급적 최소화하여야 하며, 팬더믹으로 인한 무차별의 전면적 제한보다는 개인의 행태적 특성과 토지이용의 특성을 반영한 이동 제한이 바람직함을 시사한다.

https://cdn.apub.kr/journalsite/sites/kst/2023-041-07/N0210410707/images/kst_2023_417_861_F5.jpg
Figure 5.

CHAID result of the overall DTW groups (Hit ratio = 60.3%)

2. 국지적 DTW와 CHAID 분석

여기서는 코로나19 국면에 따라 국지적 DTW가 달라지는지, 달라진다면 그 차이가 지역별 특성을 반영하는지 살펴본다. 전역적 DTW 분석에서와 마찬가지로, 코로나19와 버스 승객의 이동이 반비례하기 때문에 정규화된 코로나19 선은 시간 축에서 반전되었다는 점을 다시 한 번 강조한다. 전역적 DTW 점수가 높을수록 코로나19 상황에 대한 민감도가 낮은 것은, 코로나19 확진자가 급격히 증가하는 상황에서 버스 이용 빈도가 제한적으로 감소하거나, 코로나19 확진자가 안정화 또는 감소하는 상황에서 버스 이용 빈도가 큰 폭으로 증가하기 때문일 수 있다. 동별 전역적 DTW 점수는 코로나19 단계에 따른 여러 개의 국지적 DTW를 합산한 값이다. 전역적 DTW 점수가 비슷한 두 동이라도 국지적 DTW 값은 다를 수 있다. 코로나19 확진자가 급격히 증가하는 단계에서 국지적 DTW 값이 크면 버스 이용 빈도를 더 줄이는 정책이 필요하다. 코로나19 확진자가 감소하는 국면에서 국지적 DTW 점수가 크면 버스 이용 빈도가 너무 큰 폭으로 증가하는 것을 억제하는 정책이 필요할 수 있다.

위에서 논의한 분석을 수행하기 위해 주간 코로나19 신규 확진자 수를 기준으로 팬더믹 기간을 6단계로 나누었다(Figure 6). 1, 3, 5단계는 코로나19 확진자가 급격히 증가한 첨두가 있는 시기인 반면, 2, 4, 6단계는 코로나19 신규 확진자가 상대적으로 안정화되는 시기이다. 다만 6단계에서는 질병이 점진적으로 부활하는 양상을 보인다.

https://cdn.apub.kr/journalsite/sites/kst/2023-041-07/N0210410707/images/kst_2023_417_861_F6.jpg
Figure 6.

The number of confirmed cases over six phases of COVID-19 in Korea from January 2020 to April 2021

이제 국지적 DTW가 특히 증가하거나 감소하는 단계를 식별할 수 있다. 전반적으로, 사람들이 장기간 지속되는 질병에 지쳐 코로나19 사례의 변화에 덜 민감해지기 때문에 전체 연구 기간 동안 국지적 DTW가 증가하였다. 일반적으로 코로나19 확진자가 급격히 증가하면 DTW가 약간 감소하고, 그 반대의 경우도 마찬가지이다. 대부분의 동은 코로나19 단계에 따라 놀라울 정도로 유사한 DTW 추세를 보인다. 그러나 일부 동은 5단계 또는 6단계에서 DTW가 예외적으로 증가한다. Figure 3과 마찬가지로, Figure 7은 임의의 6개 행정동의 주간 버스 승차인원 변화를 예시로 보여주고 있는데, 예를 들어 동 1과 동 500의 선들과 같이 그 차이를 쉽게 볼 수 있는 경우들도 있다.

https://cdn.apub.kr/journalsite/sites/kst/2023-041-07/N0210410707/images/kst_2023_417_861_F7.jpg
Figure 7.

An exemplar of local DTWs of several dongs ramdonly selected from 547 Dongs

전역적 DTW 분석과 마찬가지로 547개 동은 국지적 DTW인 6개의 DTWi (i = 1, ..., 6)를 기준으로 하여 워드 클러스터링 알고리즘을 적용한 클러스터링의 결과, 뚜렷이 구분되는 두 그룹의 존재를 확인되었다. 총 523개 동으로 구성된 대부분의 동은 비슷한 DTWi추세를 보였다. 소수의 예외적인 동, 총 24개 동만이 두 번째 그룹으로 분류되었다.

두 그룹 간의 평균 DTW를 비교한 결과(Figure 8), 그룹 2(예외 동)가 그룹 1(대부분의 동)보다 팬더믹 기간 전체에 걸쳐 더 높은 DTW 점수를 나타냈다. 특히 전체 유행 기간에 걸쳐 점진적으로 DTWi 점수가 증가하는 그룹 1과 달리 그룹 2의 경우 급격히 증가한 DTW5와 DTW6을 확인할 수 있다. 당시 질병관리본부가 1년 넘게 다양한 사회적 거리두기 규제를 시행하면서 사람들은 점점 지쳐가고 있었다. 코로나19 확진자가 급격히 증가하더라도 버스 이용객은 줄지 않고 오히려 늘어났다. 또한, 코로나19 확진자 증가가 6단계에서 다소 완화되면서 버스 이용 빈도가 그보다 훨씬 급격히 증가하였다. 예외동은 이러한 경향이 극적으로 강하게 나타난 지역이다.

https://cdn.apub.kr/journalsite/sites/kst/2023-041-07/N0210410707/images/kst_2023_417_861_F8.jpg
Figure 8.

Means of DTWs of Groups 1 and 2

전체 기간 동안의 DTW 변화 추이 영향 변수와는 달리, 마지막으로, CHAID 분석을 실시한 결과는 Figure 9와 같다. 버스운행총시간이 긴 경우 그룹 2의 동들은 거의 해당되지 않았다. 또한, 버스운행총시간이 짧더라도 학원 수가 많은 경우 역시 그룹2의 동들은 거의 해당되지 않았다. 기본적으로 코로나19 확산에 따른 통행행태의 변화는 감염 가능성을 줄이거나 타인에게 감염될 가능성을 줄이려는 노력에서 비롯된다. 총통행시간이 길수록 사람들은 코로나19 발병에 더욱 민감해졌다. 마찬가지로 과밀학급이 빈번한 학원에서는 학생들 간의 감염을 걱정하는 경우가 많았다. 이상의 분석 결과로부터, 감염병 상황의 변화와 통행행태 변화 추이의 일치 정도는 각 동이 갖는 지역적 특성 중 장시간의 버스운행시간으로 인해 밀접접촉이 잦거나, 학원이 많아 학생들 간의 밀접접촉 개연성이 매우 높은 행정동에서 특히 낮음을 알 수 있다. 이는 각 행정동에 밀접접촉 관련 특성이 어느 정도 강한지에 따라 두 현상의 불일치 수준이 결정되며, 따라서 팬더믹 하의 통행수요 관리에도 행정동의 밀접접촉 관련 특성을 주의 깊게 확인할 필요가 있다.

https://cdn.apub.kr/journalsite/sites/kst/2023-041-07/N0210410707/images/kst_2023_417_861_F9.jpg
Figure 9.

CHAID results on the groups of dongs of similar local DTWs (Hit ratio = 95.6%)

여기서 전역적인 DTW의 행정동간 차이와 구분되게, 국지적인 DTW의 행정동 그룹별 차이를 좀 더 구체적으로 볼 수 있다. 즉 팬더믹의 기간이 길어질수록 피로감에 의해 개인의 팬더믹에 대한 반응이 무뎌지고 따라서 팬더믹 양상의 변화에 대한 민감도가 떨어지는 정도가 그룹별로 달라져, 민감도의 감소 정도가 점진적으로 미세하게 나타나는 경우와 그렇지 않고 급속도로 떨어지는 경우가 있는 것이다. CHAID 분석 결과에 따르면, 민감도가 특히 떨어지는 그룹 2의 행정동에서 보여지는 피로감에 의해 반응이 무뎌지는 정도가 빨라지는 것은 특히 장시간의 버스운행, 많은 학원에 의한 학원 수업 등은 장기간의 통제로 인해 감염병의 전파 위험에도 더 이상 피할 수 없는 일상의 필수 요소를 담당하고 있기 때문으로 보이며, 이러한 기능을 많이 갖고 있는 행정동일수록 DTW 값이 팬더믹의 지속에 따라 빠른 속도로 증가한다고 판단된다.

결론

전 세계적인 코로나19 위기는 인류의 일상을 변화시켰다. 사람들은 먼저 통행빈도를 조정하여 전염병에 대응했다. 특히 집단감염 우려로 인해 팬더믹의 심각성이 높아지면서 당국이 버스운행 자체를 줄이기도 했지만 이용 수요 자체도 급격하게 감소했다. 팬더믹 상황이 개선되자 사람들은 다시 일상으로 돌아가기 위해 통행빈도를 늘렸다. 코로나19와 통행행태 변화 추이의 일치 정도는 지역에 따라 다르며, 이는 향후 팬더믹 대응 정책에 중요한 시사점을 제시하였다.

본 연구는 코로나19와 통행행태 변화 추이의 일치 정도를 측정하고 지역별로 상이한 일치 정도에 영향을 미치는 영향변수를 확인하는 방법을 제안하였다. 이에 경기도가 제공하는 2020년 1월부터 2021년 4월까지의 버스카드 데이터와 547개 동의 지역 특성 자료 분석하였다. 버스카드 데이터로 경기도의 각 정류장에서 집계된 주간 버스 이용횟수를 확인했다. DTW 알고리즘은 다양한 코로나19 단계의 국지적 DTW를 측정하기 위해 수정 적용했다. DTW의 수준이 유사한 행정동의 집단들을 확인하고, 그들 집단을 구분하는 중요한 요인들을 확인했다.

그 내용은 다음과 같다. 첫째, 데이터의 전체 시간 범위를 포괄하는 전역적 DTW에 대해 세 그룹의 동질적인 동 그룹들이 식별되었다. 둘째, 높은 인구 밀도, 유치원생 수, 결혼식장 및 장례식장 수는 작은 DTW를 나타내는 그룹과 관련이 있어, 코로나19와 통행행태 변화 추이 간 높은 일치성을 나타냈다. 셋째, 국지적 DTW 값들은 대유행 기간이 길어짐에 따라 점차 커졌다. 넷째, 코로나19의 여섯 개의 단계들에 따른 국지적 DTW의 변화 양상은 두 개의 그룹으로 구분되었다. 두 그룹 중 두 번째 그룹은 단계5와 단계6에서 유난히 국지적 DTW가 높은 24개의 동들로 구성되었는데, 특히 동 주민의 총 버스 운행시간이 길거나, 동 내 학원 수가 많은 경우에는 거의 해당되지 않았다.

분석 결과는 다음을 의미한다. 첫째, 변화추이의 일치정도는 감염에 대한 두려움의 영향이 반영되었다고 볼 수 있다. 둘째, 팬더믹이 장기화되면서 사람들은 절제된 일상에 점점 지치고 팬더믹 상황에 덜 민감해진다. 셋째, 총 버스 운행시간과 학원의 수가 매우 적을 경우, 팬더믹 후기 단계(단계 5와 6)에서 일치 정도가 매우 낮아진다. 즉, 일치 정도는 감염에 대한 두려움과 일상생활의 제약으로 인한 피로감에 영향을 받으며, 동이 갖는 지역적 특성이 이들간의 trade-off 정도에 영향을 주는 것으로 해석된다.

결국 이와 같은 분석 결과는 본 연구의 기여점으로 제시한 다음 사항들을 확인해 준 것으로 해석할 수 있다. 첫째, 코로나19와 같은 팬더믹 전개의 양상은 단계별로 상이하고, 이는 통행행태에도 영향을 미친다. 둘째, 이러한 단계별 양상의 분석에는 질병과 행태의 변화 추세의 일치 정도를 통계적으로 측정하는 것이 중요하다. 셋째 일치 정도는 지역별로 차이가 있으며, 그 차이는 지역마다의 특성에 따라 다양한 원인을 갖기 때문에 이를 바탕으로 지역별 대응정책 수립과 시행이 필요하다.

향후 연구과제는 다음과 같다. 첫째, 변화 추세의 일치 정도에 미치는 위치의 영향을 밝히기 위해 공간분석이 더욱 상세히 이루어져야 한다. 행정동 단위의 분석은 더욱 세분화될 필요가 있다. 세부 지역으로서 경기도내 행정동을 단위로 분석하였으나, 더욱 세분화된 지역별 토지이용 내용을 분석에 포함하면 통행행태 변화 분석에 더 큰 설명력을 가질 것이다. 통행은 활동과 토지이용에서 유발되는 현상이므로, 토지이용의 상세 분석은 분석 결과의 정책적 시사점 도출에도 많은 도움이 될 것이다. 둘째, 개인의 통행궤적을 분석하여 개인 특성이 변화 추세의 일치 정도에 미치는 영향을 통합 분석해야 한다. 본 연구는 팬더믹의 영향으로 행정동 단위의 통행빈도 변화만을 분석하였다. 그러나 개인 통행행동의 변화 내용은 매우 다양하며, 그 중 팬더믹과 같은 감염에 대한 우려에 영향을 더 심하게 받는 변화 내용을 감지하여 팬더믹 시의 통행수요 관리 정책에 참고하는 것이 필요하다. 셋째, 코로나19 이후의 통행행태와 토지 이용을 추론하려면 더 다양한 데이터를 분석해야 한다. 이는 온라인과 비대면 시대에 도시 기능의 분산 과정을 평가하는 데 특히 중요하다.

References

1
Aach J., Church G.M. (2001), Aligning Gene Expression Time Series with Time Warping Algorithms, Bioinformatics, 17(6), 495-508. 10.1093/bioinformatics/17.6.49511395426
2
Abdullah M., Dias C., D. Muley M. Shahin (2020), Exploring the Impacts of COVID-19 on Travel Behavior and Mode Preferences, Transportation Research Interdisciplinary Perspectives, 8, 100255. 10.1016/j.trip.2020.10025534173481PMC7640923
3
Aloi A., Alonso B., Benavente J. (2020), Effects of the COVID-19 Lockdown on Urban Mobility: Empirical Evidence from the City of Santander (Spain), Sustainability, 12(9), 3870. 10.3390/su12093870
4
Anwari N., Ahmed M.T., Islam M.R., Hadiuzzaman M., Amin S. (2021), Exploring the Travel Behavior Changes Caused by the COVID-19 Crisis: A Case Study for a Developing Country, Transportation Research Interdisciplinary Perspectives, 9, 100334. 10.1016/j.trip.2021.100334
5
Barabasi A.L. (2005), The Origin of Bursts and Heavy Tails in Human Dynamics, Nature, 435, 207-211. 10.1038/nature0345915889093
6
Beck M.J., Hensher D.A., Nelson J.D. (2021), Public Transport Trends in Australia during the COVID-19 Pandemic: An Investigation of the Influence of Bio-security Concerns on Trip Behaviour, Journal of Transport Geography, 96, 103167. 10.1016/j.jtrangeo.2021.10316734776656PMC8575658
7
Bhin, M., Son, S. (2021), Reduction and Reallocation of Bus Use under COVID-19: An Analysis of Bus Card Data of Gyeonggi Province, South Korea, International Journal of Urban Sciences, 25(3), 416-436. 10.1080/12265934.2021.1936137
8
Borkowski P., Jazdzewska-Gutta M., Szmelter-Jarosz A. (2021), Lockdowned: Everyday Mobility Changes in Iesponse to COVID-19, Journal of Transport Geography, 90, 102906. 10.1016/j.jtrangeo.2020.10290635721765PMC9188832
9
Brinkman J., Mangum K. (2020), Travel Behavior and the Coronavirus Outbreak, Federal Reserve Bank of Philadelphia, Q3, 23-26.
10
Brockmann D.D., Hufnagel L., Geisel T. (2006), TheSscaling Laws of Human Travel, Nature, 439, 462-465. 10.1038/nature0429216437114
11
Carrillo, H., Lipman, D. (1988), The Multiple Sequence Alignment Problem in Biology, SIAM Journal of Applied Mathematics 48(5), 1073-1082. 10.1137/0148063
12
Chinazzi M., Davis J.T., Ajelli M., Gioannini C., Litvinova M., Merler S., Piontti A.P., Mu K., Rossi L., Sun K., Viboud C., Xiong X., Yu H., Halloran M.E., Longini Jr., I.M., Vespignani A. (2020), The Effect of Travel Restrictions on the Spread of the 2019 Novel Coronavirus (COVID-19) Outbreak, Science, 368, 395-400. 10.1126/science.aba975732144116PMC7164386
13
Cho J.S., Jang D.I., Choi J.M., Won M.S. (2021), Study on POST-COVID-19 Response Strategy by Transportation Sector (3):Analysis of Traffic Behavior Change and Policy Response, Korea Transportation Institute(KOTI).
14
de Palma A., Vosough S., Liao F. (2022), An overview of effects of COVID-19 on mobility and lifestyle: 18 months since the outbreak, Transportation Research Part A: Policy and Practice, 159, 372-397. 10.1016/j.tra.2022.03.02435350704PMC8947947
15
De Vos J. (2020), The Effect of COVID-19 and Subsequent Social Distancing on Travel Behavior, Transportation Research Interdisciplinary Perspectives, 5, 100121. 10.1016/j.trip.2020.10012134171016PMC7180344
16
Downey L., Fonzone A., Fountas G., Semple T.E. (2022), The Impact of COVID-19 on Future Public Transport Use in Scotland, Transportation Research Part A: Policy and Practice, 163, 338-352. 10.1016/j.tra.2022.06.00535784830PMC9236918
17
Franzen A., Wöhner F. (2021), Coronavirus Risk Perception and Compliance with Social Distancing Measures in a Sample of Young Adults: Evidence from Switzerland, PLoS One, 16(2), e0247447. 10.1371/journal.pone.024744733606826PMC7894933
18
Furtuna T.F. (2008), Dynamic Programming Algorithms in Speech Recognition, Informatica Economica, 2(46), 94-98.
19
Gonzalez M.C., Hidalgo C.A., Barabasi A.L. (2008), Understanding Individual Human Mobility Patterns, Nature, 453, 779-782. 10.1038/nature0695818528393
20
Gossling S., Scott D., Hall C.M. (2021), Pandemics, Tourism and Global Change: A Rapid Assessment of COVID-19, Journal of Sustainable Tourism, 29(1), 1-20. 10.1080/09669582.2020.1758708
21
Gusfield, D. (1997), Multiple String Comparison: The Holy Grail, In Algorithms on Strings, Trees, and Sequences: Computer Sciences and Computational Biology, D. Gusfield, 332-367, Cambridge: Cambridge University Press. 10.1017/CBO9780511574931.017
22
Gyeonggi Transportation DB Center (2020), Transportation Technical Report, Geyonggi Province, https://gits.gg.go.kr/web/board/2578.do?mode=view&schBcode=&schCon=&schStr=&pageIndex=1&pageUnit=10&idx=153389911.
23
IBM (2023), IBM SPSS Decision Trees 22, https://www.sussex.ac.uk/its/pdfs/SPSS_Decision_Trees_22.pdf.
24
Irawan M.Z., Belgiawan P.F., Joewono T.B., Bastarianto F.F., Rizki M., Ilahi A. (2021), Exploring Activity-travel Behavior Changes during the Beginning of COVID-19 Pandemic in Indonesia, Transportation, 49, 529-553. 10.1007/s11116-021-10185-533723465PMC7948168
25
Kaas G. (1980), An Explanatory Technique for Investigating Large Quantities of Categorical Data, Applied Statistics, 29(2), 119-129. 10.2307/2986296
26
Keogh E., Ratanamahatana C.A. (2005), Exact indexing of Dynamic Time Warping, Knowledge and Information Systems, 7, 358-386. 10.1007/s10115-004-0154-9
27
Kim J., Kwan M.P. (2021), The Impact of the COVID-19 Pandemic on People's Mobility: A Longitudinal Study of the U.S. from March to September of 2020, Journal of Transport Geography, 93, 103039. 10.1016/j.jtrangeo.2021.10303936569218PMC9759208
28
Kim J.H., Lim H.S., Yoon S.Y., Jang Y.H., Kim G.S., Oh S.C., Kim H.C. (2021a), Big Data-based Urban Mobility Pattern Analysis, KRIHS Report, 21-31.
29
Kim J.M., Ki D.H., Lee S.G. (2021b), Analysis of Travel Choice Change by the Spread of COVID-19: The Case of Seoul, Korea, Journal of Korea Planning Association, 56(3), 113-123. 10.17208/jkpa.2021.06.56.3.113
30
Kim Y. (2020), Changes in Travel Behavior during COVID-19 and the Implications, GRI Report, 2020-16.
31
Kruskal J.B., Sankof D. (1983), An Anthology of Algorithms and Concepts for Sequence Comparison, in Time Warps, String Edits, and Macromolecules: The Theory and Practice of Sequence Comparison, D. Sankoff, J. B. Kruskal (eds.), 265-310, London: Addison-Wesley. 10.1137/1025045
32
Lee C., Ahn W., Oh K. (2017), Analysis of Intraday Price Momentum Effect Based on Patterns using Dynamic Time Warping, Journal of the Korean Data & Information Science Society, 28(4), 819-829.
33
Loa P., Hossain S., Liu Y., Nurul Habib K. (2022), How Has the COVID-19 Pandemic Affected the Use of Ride-sourcing Services? An Empirical Evidence-based Investigation for the Greater Toronto Area, Transportation Research Part A: Policy and Practice, 155, 46-62. 10.1016/j.tra.2021.11.01334815625PMC8602061
34
McClure M.A., Vasi T.K., Fitch W.M. (1994), Comparative Analysis of Multiple Protein-sequence Alignment Methods, Molecular Biology and Evolution 11(4), 571-592.
35
Murata M., Richardson J.S., Sussman J.L. (1985), Simultaneous Comparison of Three Orotein Sequences, Proceedings of the National Academy of Sciences of the U.S.A. 82, 3073-3077. 10.1073/pnas.82.10.30733858804PMC397716
36
Needleman S.B., Bunsch C.D. (1970), A general method applicable to the search for similarities in the amino acid sequence of two proteins, Journal of Molecular Biology 48, 443-453. 10.1016/0022-2836(70)90057-45420325
37
Politis I., Geeorgiadis G., Nikolaidou A., Kopsacheilis A., Fyrogenis I., Sdoukopoulous A., Verani E., Papadopoulos E. (2021), Mapping Travel Behavior Changes during the COVID-19 Lock-down: A Socioeconomic Analysis in Greece, European Transport Research Review, 13, 21. 10.1186/s12544-021-00481-7PMC7968570
38
Ranacher P., Tzavella K. (2014), How to Compare Movement? A Review of Physical Movement Similarity Measures in Geographic Information Science and Beyond, Cartography and Geographic Information Science, 41(3), 286-307. 10.1080/15230406.2014.89007127019646PMC4786848
39
Sakoe H., Chiba S. (1978), Dynamic Programming Algorithm Optimization for Spoken Word Recognition, IEEE Transactions on Acoustics, Speech, and Signal Processing, ASSP-26(1), 43-49. 10.1109/TASSP.1978.1163055
40
Schuler G.D., Altschul S.F., Lipman D.J. (1991), A Workbench for Multiple Alignment Construction and Analysis, Proteins: Structure, Function, and Genetics, 9(3), 180-190. 10.1002/prot.3400903042006136
41
Semple T., Fonzone A., Fountas G., Downey L. (2023), An Empirical Analysis of the Factors Influencing Scottish Residents' Compliance with COVID-19 Travel Restrictions, Transportation Research Part A, 178, 103842. 10.1016/j.tra.2023.103842
42
States D.J. Boguski M.S. (1991), Similarity and Homology, in Sequence Analysis Primer, M. Gribskov, J. Devereux (eds.), 89-157, New York: Stockton Press. 10.1007/978-1-349-21355-9_3
43
Tshuo H.H., Kuo S.C., Lin Y.H., Hsiung C.A., Chiou H.Y., Chen W.J., Wu S.I., Sytwu H.K., Chen P.C., Wu M.H., Hsu Y.T., Wu H.Y., Lee F.J., Shih S.M., Liu D.P., Chang S.C. (2022), A Comprehensive Evaluation of COVID?19 Policies and Outcomes in 50 Countries and Territories, Scientific Reports, Nature, 12, 8802. 10.1038/s41598-022-12853-735614332PMC9130690
44
Yao W., Yu J., Yang Y., Chen N., Jin S., Hu Y., Bai C. (2022), Understanding Travel Behavior Adjustment under COVID-19, Communications in Transportation Research, 2, 100068. 10.1016/j.commtr.2022.100068PMC9127189
45
Zhang J., Lee J. (2021), Interactive Effects between Travel Behaviour and COVID-19: A Questionnaire Study, Transportation Safety and Environment, 3(2), 166-177. 10.1093/tse/tdab003PMC8083298
페이지 상단으로 이동하기