Estimation of the Effect of Commercial Vehicle Driving Safety Training Using the Propensity Score Matching Method

Joonbeom Lim; Dongwoo Lee

doi:10.7470/jkst.2023.41.2.254

Preview

Article

Journal of Korean Society of Transportation. 30 April 2023. 254-265
https://doi.org/10.7470/jkst.2023.41.2.254

Estimation of the Effect of Commercial Vehicle Driving Safety Training Using the Propensity Score Matching Method

성향점수매칭(PSM)방법을 이용한 교통안전체험교육 효과추정

Joonbeom LIM¹

Dongwoo LEE²^*

임 준범¹

이 동우²^*

¹Chief Researcher, Mobility Policy Research Department, Korea Transportation Safety Authority, Gyeongsangbukdo 39660, Korea

²Assistant Professor, Department of Urban Policy and Administration, Incheon National University, Incheon 22012, Korea

¹한국교통안전공단 모빌리티정책연구처 책임연구원

²인천대학교 도시행정학과 조교수

^{*Corresponding Author}

ABSTRACT

Increasing traffic safety concerns have become critical issues in the realm of transport. Since a well-known roadside safety policy, Vision Zero, was originally established in Sweden in 1997, various policies and related technical treatments have been adopted to address road traffic safety issues in several countries. To enhance the effectiveness of the safety policy, the potential impacts of these policies and treatments on traffic accident prevention are required to be evaluated. Nonetheless, there are some limitations in quantifying the effects of the safety policy due to the limitation of data availability and methodological issues. Although existing studies have adopted statistical methodologies such as statistical validation tests and empirical Bayesian comparison, these methodologies have limitations in measuring the net effect of traffic safety policy by eliminating confounding factors. To investigate the net effect of traffic safety policy, this study proposed propensity score matching approaches to estimate causal treatment effects of empirical safe driving education by controlling confounding factors. The results revealed that drivers who received empirical safe driving education policy are less likely to cause traffic accidents than drivers who didn’t get such training by 16.4%. In particular, the treatment effect of education policy is more effective for older people than younger people, those in their seventies rated 36.7%, and those in their sixties are 28.5%. In addition, taxi drivers showed the highest treatment effect of education policy on reducing road traffic accidents by 39.2%.

Keywords

commercial vehicles

effect of traffic safety

probit regression

propensity score matching

traffic safety experience education

교통분야에서 교통안전에 대한 문제는 매우 중요한 이슈가 되었다. 1997년 스웨덴에서 시작한 비전제로 교통안전 정책이 알려진 이후로, 여러 국가에서 도로 교통안전 문제를 해결하기 위해 다양한 정책과 관련 기술이 채택되어지고 있다. 교통안전 정책의 실효성을 높이기 위해서는 이러한 정책과 처치가 교통사고 예방에 미치는 잠재적 영향에 대한 평가가 필요하다. 그러나 자료의 한계와 방법론적 문제로 인해 안전정책의 효과를 정량화 하는데 한계가 있다. 기존 연구들은 통계적 타당성 검증, 경험적 베이지안 방법 등을 주로 채택하였지만 이러한 방법론은 교란요인을 제거하여 교통안전정책의 순수 효과를 측정하는데 한계가 있다. 교통안전정책의 순수효과를 알아보기 위해 본 논문은 교란요인을 통제하는 성향점수매칭방법을 사용하여 교통안전체험교육 정책의 순수효과를 제시하였다. 분석결과 교통안전 체험교육을 이수한 운전자는 이수하지 않은 운전자에 비해서 교통사고 재발율이 16.4% 감소하는 것으로 나타났다. 연령별로 세분화하여 비교한 결과 70대가 36.7%, 60대가 28.5%로 고연령대가 저연령대에 비해 효과가 큰 것으로 나타났으며, 업종별로는 택시 업종이 39.2% 가장 효과가 높은 것으로 나타났다.

키워드

사업용자동차

교통안전체험교육

성향점수매칭

교통사고 감소효과

프로빗 회귀모형

MAIN

서론
선행연구 고찰
1. 교통안전 관련 정책효과 연구
2. 성향점수매칭(PSM) 방법 적용 연구
3. 시사점
성향점수매칭(PSM) 방법론
데이터 수집
1. 데이터 전처리
2. 변수 정의 Commercial Vehicle Driving Safety Training
3. 분석용 데이터 기술통계량
분석결과
1. 성향점수 추정 결과
2. 성향점수 매칭 결과
3. 정책효과 추정 결과
결론

서론

정부는 안전사고를 사전에 예방하기 위한 목적으로 각 분야별로 안전제도를 강화하고 있는 추세이다. ‘19-’21년 상반기 규제영향분석서 검증이 수행된 안전규제 안건 63건 중 건설 분야 및 교통 분야 안전규제는 각각 23건으로 총 77%를 차지하였다. 특히, 도로안전에 대한 중요성이 지속적으로 이슈화됨에 따라 정부는 다양한 조치를 시행해왔다. 여기서 조치는 정책을 포함한 입법시행과 같이 넓은 범위에 적용되는 것과 단속, 도로 네트워크의 물리적 개선, 운전자 행동과 교통상황에 직간접적 영향을 미치는 시설물 설치 등 좁은 범위에 적용되는 것을 모두 포함한다고 할 수 있다. 정부는 처치에 대한 지속여부와 신규 조치 도입 여부 등을 결정하기 위해서 도로안전의 성능과 효과를 평가를 객관적, 과학적 방법으로 시행할 필요가 있다.

교통안전에 대한 평가에서 조치에 대한 효과는 처치를 시행한 후 예상되는 대상 사고의 감소로 정의된다(Elvik, 1997). 대부분의 경우 조치는 특정도로에 한정한 안전문제를 대상으로 하므로, 위치 또는 도로구간에 무작위로 시행될 수 없다. 따라서 관찰된 교통안전 조치와 교통사고의 관계는 객관적이지 않아 교란을 야기할 수 있다. 예를들어, 평균으로의 회귀현상은 선택편향이 있을 때 발생하는 교란의 잘 알려진 징후이다(Graham et al., 2019). 도로안전 조치에 대한 효과평가 연구는 다양한 통계적 방법으로 시도되었으며, 경험적 베이지안 방법은 가장 널리 사용되는 방법 중 하나이다. 경험적 베이지안 방법은 추정 정확도를 높이고, 회귀분석을 통해 발생하는 교란요인에 대한 설명이 통계적으로 방어 가능한 수단으로 간주된다(Hauer, 2002; Persaud and Lyon, 2007). 그러나 경험적 베이지안 방법은 기준이 되는 특성을 고려하여 처치된 그룹(실험군)과 유사한 대조군 그룹이 필요하다(Hauer, 1992). 이러한 가정이 위반되면 경험적 베이지안 방법의 성능에 부정적인 영향을 미칠 수 있다(Lord and Kuo, 2012; Wood and Donnell, 2017). 이와 같이 경험적 베이지안 방법이 가진 한계에 대한 대안으로 성향점수방법(Propensity Score Method)이 제안되었으며(Rosenbaum and Rubin, 1983), 이 방법은 실험군과 대조군 사이의 유사성 문제를 해결할 수 있다. 특히, PSM 방법을 통해서 관찰된 모든 교란 요인으로 인한 편향을 제거할 수 있으며, 경험적 베이지안 방법의 결과와 비교하였을 때 교통안전 처치 효과평가에 더욱 실행가능 하였다(Wood et al., 2015)

따라서 본 연구에서는 교통안전 관련 정책 도입(교통안전체험교육 이수)에 대한 효과분석을 성향점수매칭(PSM)방법을 이용하여 분석하고자 한다. 교통안전 체험교육을 이수한 그룹과 이수하지 않은 그룹의 교통사고 재발여부(효과)에 대한 차이를 분석하였으며, 대상군 선정에서의 편향을 최소화 하기 위해서 프로빗 모형을 이용하여 성향점수를 추정하고 대조군과 비교군을 설정하였다. 처치효과는 대조군과 비교군의 교통사고 재발 가능성의 평균 차이로 정의하였으며, 전체 그룹에 대한 처치효과 뿐만 아니라 업종별, 연령별, 지역별 운전자 그룹으로 구분하여 처치효과를 비교하였다.

선행연구 고찰

교통안전 분야에서는 대부분 교통사고건수나 교통사고 사상자수를 측정지표로 설정하고 이에 대한 변화를 정책 도입의 효과로 추정해왔다. 그러나 교통사고 감소는 여러 가지 요인이 복합적으로 작용하여 발생할 수 있기 때문에 다른 조건들을 배제하고 해당 정책 도입으로 인한 순수한 효과를 파악하는 것은 현실적으로 한계가 있다. 이는 비실험디자인(non-experimental design)요소로써 주요 변수를 조작할 수 없는 경우임을 의미한다. 기존 국내연구에서 정책 도입(본 연구 목적에 맞게 도로지점에 시설개선 사업 효과측정은 제외)으로 인한 효과측정을 어떠한 방법으로 했는지와 국외에서 성향점수매칭방법을 사용한 효과측정 연구를 고찰하였다.

1. 교통안전 관련 정책효과 연구

Jung et al.(2013)은 차로이탈경고장치, 비상자동제동장치 장착으로 인한 교통안전 효과평가 방법으로사고회피시간(TAC: Time to Avoid Crash)의 변화에 따른 사고발생확률 감소를 추정하는 방법론을 제시하였다. 본 연구에서는 각 장치 장착 여부에 따라 운전자가 추가로 확보할 수 있는 사고회피시간을 독립변수로 하고, 종속변수로 사고발생확률을 설정하여 EDF(Exponential Decay Function)를 통해 사고발생확률을 추정하였다. 장치 장착했을 경우 사고발생확률과 장착하지 않았을 경우 사고발생확률 차이를 교통안전 효과로 정의하였다. 분석결과 차로이탈경고장치는 장치와 관련성이 높은 사고유형(정면충돌, 도로외이탈, 공작물추돌, 전도 및 전복)을 약 10-14%, 비상자동제동장치는 추돌사고에 대하여 약 47%-56%의 사고감소 효과가 있다고 하였다.

Koo et al. (2017)은 이륜차의 안전검사제도가 도입될 경우 교통사고 절감 효과에 관한 분석을 수행하였다. 독일의 차령별 결함율 자료를 이용하여 국내 차령별 이륜차 결함대수를 추정하고, 우리나라의 차량결함에 따른 교통사고건수 자료를 통해 차량결함 사고발생 확률을 추정하였다. 이륜차 검사제도 도입으로 인한 차량결함 제거비율을 적용하여 감소된 교통사고 발생건수를 추정하였다. 추정결과 642건/연, 교통사고 비용 325억/연(2014년 기준 전체 교통사고비용의 0.1%) 감소할 것으로 분석하였다.

Son et al.(2019)은 제한속도 하향으로 인한 교통사고 감소 효과를 대표적인 효과평가 방법인 단순 전후비교 방법, 비교그룹 방법, 경험적 베이지안 방법을 적용하여 비교분석 하였다. 5030 속도 하향정책을 시행한지 1년이 경과하고, 분석가능한 변수수집이 가능한 대구광역시 5030 제한속도 하향을 적용한 20개 구간을 대상으로 분석하였다. 단순 전후비교 방법은 선정된 20개 구간에 제한속도 하향을 적용하기 전과 후의 교통사고 발생건수 감소율을 분석하였으며, 비교그룹 방법은 속도하향을 적용한 20개 구간과 유사한 구간 20개를 선정하여 자연감소율을 반영한 속도하향으로 인한 교통사고 감소 효과를 분석하였다. 경험적 베이지안 방법은 교통량 등 사고발생에 영향을 미치는 요인 기반의 안전성능함수(SPF)를 개발하여 사고건수를 예측한 값과 실제 발생한 사고건수와의 가중치를 적용하여 기대사고건수를 도출하고, 제한속도 하향을 통해 기대사고건수가 변화하는 효과를 추정하였다. 3가지 분석방법론을 적용한 결과, 단순 전후비교 방법과 비교그룹방법은 약 16% 교통사고 건수 감소 효과를 나타냈으며, 경험적 베이즈 방법은 약11%의 교통사고 건수 감소를 기대할 수 있는 것으로 나타났다.

2. 성향점수매칭(PSM) 방법 적용 연구

본 논문에서 정책 및 규제에 대한 효과를 추정하기 위해 사용한 성향점수매칭(PSM, Propensity Score Matching)방법을 적용한 연구에 대한 고찰을 수행하였다.

Talebian et al.(2018)은 캘리포니아 주의 철도 서비스 지원이 지역 인구와 고용에 미치는 영향을 분석하였다. 1950-2010년까지 캘리포니아 주 및 도시의 지리적, 교통 및 사회경제적 특성 데이터를 이용하여 성향점수매칭 방법을 이용하여 분석하였다. 철도 서비스가 지원되는 도시와 아닌 도시 두 그룹으로 분류하여 다변량정규분포(multivariate normal imputation method) 및 최소 제곱 회귀를 통해 지역 인구와 고용에 미치는 영향을 추정하였다. 철도 서비스는 장기적으로 지역 인구에 상당한 영향을 미치고 시간이 지남에 따라 그 효과가 증가하는 것으로 나타났다. 그러나 민간 고용에 미치는 영향은 거의 없는 것으로 나타났다. 이러한 결과는 캘리포니아 주에서 지원하는 철도서비스가 이동성과 접근성의 품질을 높여 제공하기 때문에 철도 접근 가능 지역에 살도록 유도한 효과라고 주장하였다. 그러나 철도서비스로 인한 경제적 영향력은 한계가 있다고 언급하였다.

Ding et al.(2021)은 2003년 런던에 처음도입된 혼잡통행료(LCC)가 안전상 편익의 영향을 받는 면적과 잔존 효과 기간에 대해서 분석하였다. 분서을 위하여 런던의 352개 MSOA(Middle Super Ouput Areas)의 교통사고 데이터를 이용하였는데, 27개의 MSOA에서는 혼잡통행료가 부가 되었으며, 301개의 MOSA에서는 혼잡통행료가 부과되지 않았다. 교통흐름, 토지이용, 건설환경, 인구통계를 포함한 요인들을 고려하여 혼잡통행료를 부과한 처치군과 부과하지 않은 대조군의 편향을 없애기 위해 성향점수매칭 방법을 사용하였다. 분석결과 LCC 적용지역의 1.5km 반경 지역에서 교통안전에 긍정적인 영향이 있음을 밝혔다. 또한 잔존효과는 혼잡통행료를 폐지한 후 1년차 까지는 교통사고 감소 효과가 있었으나, 폐지 후 2년 및 3년 후에는 교통사고 감소에 대한 효과가 통계적으로 유의하지 않았다.

Sasidharan et al.(2013)은 미네소타의 교차로 교통사고 데이터와 조명설치로 인한 교통사고 감소효과를 분석하였다. 비무작위 관찰 데이터를 통해서 성향점수매칭 방법을 기반으로한 통계모형을 구축하여, 야간 교통사고를 약 11% 감소시킨다고 밝혀냈으며, 기존에 EB방법에 비해 더욱 우수한 모형이라고 주장하였다.

Wood et al.(2015)는 교통안전 대책의 효과를 평가하는 방법론 중 Cross-sectional, 경험적 베이지안 방법, 성향점수매칭 방법을 적용하여 비교하였다. 성향점수매칭 방법은 효과분석을 위한 데이터 그룹의 선택적 편향과 관련되 문제를 해결하기 위한 대안으로 제시하였다. 본 연구에서는 도로이탈 사고를 감소하는 효과가 있는 Safety Edge 포장기술에 대한 대책을 앞서 언급한 3가지 방법론으로 비교하여, 경험적 베이지안 방법이 표준오차가 가장 작은 것으로 나타났다.

Wood and Donnell(2016)는 연속적인 녹색 T교차로의 교통안전 효과에 대해서 분석하였다. 플로리다와 사우스 캐롤라이나의 녹색 T 교차로를 설치한 곳과 설치하지 않은 곳의 데이터를 이용하였다. 기존의 신호화된 교차로와 T교차로의 객관적 비교를 위해 성향점수매칭 방법을 사용하였으며, 분석결과 기존 신호교차로는 사고수정계수(Crash Modification Factors, CMF)가 0.958로 나타났으며, 녹색 T교차로는 사망 및 부상사고에 대한 CMF가 0.846, 후면/측면 충돌사고에 대한 CMF는 0.920으로 나타났다. 기존 신호교차로에 비해서 연속적인 녹색 T 교차로가 교통사고 감소 효과가 더욱 크다고 주장하였다.

Bonifaz and Fasanando(2022)은 페루 사례에 대해 민자운영 도로와 민자운영이 아닌 도로 구간의 평균 충돌률, 비용 초과 및 시간 초과를 비교하였다. 민자운영 도로와 민자운영이 아닌 도로의 정확한 비교를 위해 성향점수매칭(PSM) 방법을 사용하였다. 이 방법을 통해서 대조군과 실험군을 구별하는 고유한 특성을 일치시켜 더 유사하게 만드는 작업을 수행하였다. 대상 도로 구간에 대해서 충돌률, 부상자 수, 사망자 수, 비용 초과 및 시간 초과를 비교하였다. 시간 및 비용 초과는 민자운영이 아닌 도로구간보다 민자운영 도로구간에서 더 낮게 나타났다. 또한 페루의 2015-2019년 기간 동안 개통한 고속도로의 충돌사고당 평균 연간 비용은 USD 65.72였으며, 민자운영이 아닌 도로구간에서 2억 5,400만 달러가 되는 것으로 나타났다. 즉, 모든 고속도로가 민자운영 도로가 되면 페루는 교통사고로 인한 연간 평균비용을 미화 1억 8,900만 달러를 절약할 수 있을 것으로 분석하였다.

3. 시사점

선형연구를 고찰한 결과 교통사고 감소를 위해 교통안전 시설측면의 대책을 적용한 곳과 적용하지 않은 곳에 대한 비교를 통해서 효과를 분석한 사례들이 많았다. 교통안전시설 설치 지점과 설치하지 않은 지점은 기본적으로 교통량 등 교통사고에 영향을 미치는 변수의 특성이 차이가 있기 떄문에 이러한 차이로 인한 효과에 편향(bias)를 줄이기 위해 비교그룹방법, 베이지안 방법, 성향점수매칭방법(PSM) 등을 이용하였다. 비교그룹방법, 베이지안 방법 등은 국내 연구에서도 많이 사용하고 있었으나, 성향점수매칭방법 적용사례는 거의 없었다. 성향점수매칭방법은 비교그룹 방법과 유사하나, 비교그룹방법이 정성적으로 비교군을 정하여 분석하는 것에 비해, 성향점수매칭방법은 정량적으로 유사그룹을 구분하고, 판단하는 유사그룹 정도를 판단하는 기준값도 존재하는 것이 장점인 것으로 보인다. 특히, 교통안전 시설물 설치 지점과 같은 공간적인 특성이 적용될 수 없는 정책효과 분석은 정책을 적용받은 대상자에 대해 정성적으로 유사그룹으로 분류하기엔 어려울 것으로 보인다. 따라서 본 연구에서는 성향점수매칭방법을 이용하여 정량적으로 대조군과 비교군을 설정하여 교통안전 체험효과를 분석하는 것이 적절할 것으로 판단된다.

성향점수매칭(PSM) 방법론

과학적 통계적으로 어떤 처치(treatment)에 대한 효과를 측정하고자 하는 고전적인 연구방법으로 전향적인 연구(prospective study)와 관측연구(observational study)가 있다. 전향적인 연구방법은 특정 처치가 나타내는 결과를 추정하기 위해 연구대상을 무작위로 배정하여 결과에 영향을 주는 특성의 차이가 없도록 하는 방법이다. 그러나 이 방법은 일반적으로 결과변수에 영향을 미치는 요인을 인위적으로 통제하는 과정은 시간적, 비용적, 윤리적 문제가 발생할 수 있다. 반면, 관측연구방법은 무작위배정 없이 특정집단을 대상으로 연구를 진행하는 방법이며, 적용이 쉽고, 특정 교란변수에 대한 영향을 통계적으로 배제 시킬 수 있다. 그러나 이 방법은 실험군과 대조군의 대상 선정시 선택편향으로 과대추정 또는 과소추정될 수 있다. 이러한 방법들이 가지는 단점을 극복하고 선택편향을 최소화하기 위하여 매칭(matching)방법을 사용하는데 일반적인 매칭방법은 통계적 검정력을 가질 만큼 충분한 표본수를 확보하기가 어렵고, 확보하더라도 결과가 왜곡될 수 있다.

따라서, 일반적인 매칭 방법보다는 정확하고 손쉬운 성향점수매칭(PSM)방법이 사용되고 있으며, PSM 방법은 실험군과 대조군의 공변량의 영향력을 반영하는 성향점수를 계산하여, 실험군과 대조군을 매칭함으로써 연구결과의 신뢰도와 정확도를 향상시킬 수 있다. 이 방법은 무작위 배정이 어려운 연구 등에서 선택편향을 줄이기 위해 사용되고 있으며, 성향점수매칭방법을 위한 가정은 다음과 같다. 첫째, 공변량 X가 주어졌을 때, 잠재적 결과여부(Y)와 처치변수(T)는 서로 조건부 독립으로 가정하였다. 둘째, 관측치에 대한 처치 여부는 일관적이다. 즉, 실험군만이 교육을 이수한 것으로 가정하였다. 셋째, 실험군과 대조군 사이 동일한 공변량을 갖는 개체들이 존재한다. 즉, 유사한 성향점수의 개체들끼리 중첩하여 매칭이 이루어진다.

성향점수는 공변량이 주어졌을 때, 실험군 또는 대조군에 들어갈 확률 예측값으로 로지스틱 모형, 프로빗 회귀모형 등을 이용하여 추정할 수 있다. 성향점수는 확률이기 때문에 0에서 1사이의 값을 가지며, 만약 연구대상이 실험군과 대조군이 무작위 배정되었다고 가정하면 성향점수는 0.5가 된다. 그러나 무작위 배정이 불가능하므로 각 공변량에 대한 성향점수를 추정하여 이 점수를 이용한 조정을 시행하게 된다. 이렇게 추정된 확률이 성향점수이고 실험군과 대조군에서 성향점수가 같은 대상끼리 매칭하면 랜덤하게 배정된 것과 같은 효과를 가질 수 있다. 성향점수는 공변량과 특정 처치를 받아 실험군에 포함되는 것과의 연관성에 따라 결정된다. 다른 공변량의 효과가 없다고 가정하면, 특정 공변량에 대해 같은 성향점수를 가지는 연구대상들이 실험군과 대조군에 같은 수로 포함된다면 이 두 집단을 대상으로 한 통계쩍 추론의 결과는 같은 성향점수를 가지는 공변량에 의한 효과보다는 특정 처치를 받아 실험군에 포함되었기 때문에 발생한 차이로 인한 것이라 할 수 있다.

성향점수를 계산하는 방법은 의사결정나무 방법(Classification and Regression Tree)과 회귀분석(로지스틱 또는 프로빗 모형) 방법이 있다. 의사결정나무 방법은 너무 복잡하고 특정 통계적 상황에만 적용이 가능하기 때문에 잘 사용되지 않는다. 회귀분석 방법은 실험군에 포함되는 경우를 1, 대조군에 포함되는 경우를 0으로 하는 이항반응 형태로 종속변수를 설정하고, 보정하려는 공변량을 독립변수로 지정하여 회귀분석을 시행한다. 이 경우 회귀분석은 성향점수모형을 추정하며, 이 모형에 의해 각 대상들의 추정된 확률이 성향점수에 해당된다. 본 연구에서는 프로빗 모형을 사용하였으며, 다음의 Equation 1은 성향점수 추정식이다.

(1)

r = E [Y_{i}^{1} - Y_{i}^{0} | Z_{i} = 0] = E [Y_{i}^{1} | Z_{i} = 1] - E [Y_{i}^{0} | Z_{i} = 1]

$Z_{i} : 관 측 치 의 교육이수여부 Y_{i}^{j} : j 의상 태 에서 발생 하 는 잠재적인결과 (= 0, 1)$

대조군 및 실험군의 모든 관측치에 대해 성향점수가 유사한 대상끼리 매칭하여 최종적으로 분석 자료를 선정하고, 매칭되지 못한 관측치는 분석 대상에서 제외하였다. 매칭방법은 최근접이웃 매칭(Nearest neighbor matching), 반경 매칭(Radius matching), 범위 매칭(Caliper matching) 등이 사용되어오고 있으며, 본 연구에서는 최근접이웃 매칭(Nearest neighbor matching)을 활용하였다. 최근접이웃 매칭(Nearest neighbor matching)은 추정된 성향점수의 차이가 가장 적은 순서대로 매칭하는 방법이다.

성향점수 매칭은 랜덤 배정 상황과 유사하게 조성하여 최적의 결과값을 도출하기 위해 성향점수가 유사한 변수끼리 일대일 매칭으로 실시한다. 이를 위해 실험군과 대조군의 분포가 균형 있게 이루어졌는지 확인하여야 하며, 매칭 전과 후의 표준화된 평균 차이(SMD, Standardized Mean Difference)를 확인한다. 다음의 Equation 2는 SMD 추정식이다.

(2)

S M D = \frac{{\bar{X}}_{z = 1} - X_{z = 0}}{σ_{x_{z = 1}}}

$X_{z = 0} : 미이수자그룹의공변량 평 균 X_{z = 1} : 이수자그룹의공변량 평 균 σ_{x_{z = 1}} : 이수자그룹공변량의 표 준 편 차$

처치변수(교통안전체험교육 이수여부)에 대한 효과는 성향점수매칭을 실시한 후 실험군과 대조군의 평균 사고 재발 가능성을 비교하는 단순 평균처치효과로 추정한다. 처치(교통안전체험교육 이수)를 받지 않았을 때의 잠재적 결과와 처치를 받았을때의 잠재적 결과에서의 평균차이, 즉 평균처치효과(Average Treatment Effect)를 산출한다.

데이터 수집

본 연구의 처치변수인 교통안전체험교육을 받은 경우와 받지 않은 경우와 결과변수인 해당 운전자들의 교통사고 재발여부를 분석하고자 한국교통안전공단의 운수종사자관리시스템 및 교통안전체험교육 자료를 수집하였다. 분석 대상은 2015년부터 2020년까지의 교통사고 데이터 중 퇴사일이 2019년 이후 또는 재직 중인 인원으로 하였다. 교통안전 체험교육 이수자 데이터는 입교일자가 2017년부터 존재하므로 퇴사일자가 그 이전인 경우 교육 이수 여부를 파악할 수 없다고 판단하였으며, 교육 효과가 나타날 수 있는 기간을 충분히 고려하여 한정하였다. 교육 미이수자 중 퇴사일이 2019년 이후인 교통사고 데이터 93,404건과 이수자 교통사고 데이터 10,453건을 확보하였다.

1. 데이터 전처리

한국교통안전공단의 관리 시스템 특성상 미이수자 그룹과 이수자 그룹의 데이터가 분리되어 있어 두 그룹간 변수를 일치시킨 후 하나의 데이터로 통합이 필요하다. 따라서 두 그룹이 공통으로 가진 변수와 공통으로 가지고 있지 않은 변수는 Table 1과 같다. 두 그룹 모두 공통으로 수집된 변수들로 분석을 수행하였다.

Table 1.

List of data for group of drivers who received driving safety training and who did not receive the training

	group of received driving safety training	group of not received driving safety training
Common variables	area, ages, amount of damage, accident type, demerit, type of commercial vehicle, whether an accient accurred, accident severity (fatal, serius injury, moderate injury, minor injury)
Non-common variables	affiliated company, name, gender, type of training, training date, date of accident before training, date of accident after training,	joining date, resignation date, accident site

2. 변수 정의 Commercial Vehicle Driving Safety Training

본 분석에 활용한 변수의 정의는 Table 2와 같다. 교통안전체험교육 이수자를 실험군, 미이수자를 대조군으로 선정하였다. 체험교육 이수 여부를 처치변수(treatment variable; T)로, 사고 재발 가능성을 결과변수(outcome variable; y)로 선정하였다. 처치변수(T)인 교통안전체험교육 이수여부는 미이수 0, 이수 1로 설정하였다. 결과변수(Y)는 미이수자 데이터의 ‘차년도 사고발생여부’ 변수와 이수자 데이터 중 사고가 교육 이전에 발생했는지, 이후에 발생했는지의 여부를 나타내는 ‘교육전후구분’ 변수를 ‘사고 재발 여부’로 정의하였다. 교통안전공단 운수종사자관리시스템에서 수집한 체험교육 미이수자 정보와 교통안전공단 교육정보 시스템의 체험교육 이수자 정보를 연계하여 준실험설계를 수행하였다. 사고재발여부를 동일한 기간으로 고려하게 되면 통계적으로 유의한 샘플 숫자 확보가 어렵고, 일부 공변량에 편향된 샘플이 선정될 우려가 있었다. 따라서 사고재발여부와 교육전후 구분의 연도가 동일하지 않고 2015-2020년의 데이터 중에서 퇴사일이 2019년 이후 또는 재직 중인 인원으로 설정하고 분석을 수행하였다. 체험교육 이수자와 미이수자의 샘플수의 비율을 다양하게 검토하였으나 샘플수의 비대칭일 경우는 낮은 성향점수를 가진 미이수자도 포함되는 것을 확인하여, 50대 50으로 매칭하였다.

Table 2.

Variables configuration

Variables		Definition
Outcome variable (Y)	Accident recurrence	no recurrence(0), recurrence(1)
Treatment variable (T)	Driving safety training	not received (0), received(1)
Control variable (X)	Ages	10years, 20years, 30years,  , 80years
	Type of commercial vehicle	etc.(0), taxi(1), bus(2), truck(3)
	Region	seoul(11), busan(21), daegu(22), incheon(23), gwangju(24), daejun(25), ulsan(26), sejong(29), gyeonggi(31), gangwon(32), chungcheongbuk(33), chungcheongnam(34), jeollabuk(35), jeollanam(36), gyeongsangbuk(37), gyeongsangnam(38), jeju(39)
	Type of accident	etc.(0), car to car(1), car to pedestrian(2), car to fixed object(3), car to etc.(4), car fall accident(5)
	Accident severity	minor injury(0), moderate injury(1), serious injuruy(2), fatal(3)
	Amount of damage	unit : 1,000 won
	Number of accident victim (fatal, serious injuty, moderate injury, minor injury)	number of deaths, number of serious injuries, and number of injured in one traffic accident, unit : person
	Penalty	total number of penalty points received by drivers for violating traffic laws in one year, unit : point

3. 분석용 데이터 기술통계량

분석 데이터의 기초통계량은 Table 3과 같다. 전체 운전자의 연령은 평균 52, 표준편차 10세로 나타났으며, 벌점은 최대 580점, 평균 27.7점으로 나타났다. 교통사고를 발생한 운전자는 1건당 사망자수 평균 0.05명, 최대3명이며, 중상자수는 최대 35명, 평균 0.62명으로 나타났다.

Table 3.

Data description

Variable		Mean	Max	Median	Min	Variance	Standard deviation
Outcome (accident recurrence)		0.33	1	-	0	0.22	0.47
Treatment (driving safety training)		0.50	1	-	0	0.25	0.50
Control variable	Region	25.70	39	31	11	84.94	9.22
	Type of commercial vehicle	1.64	3	2	0	0.48	0.69
	Ages	52.58	80	50	20	103.24	10.16
	Penalty	27.70	580	25	0	440.58	20.99
	Number of fatal	0.05	3	0	0	0.05	0.22
	Number of serious injuty	0.62	35	1	0	0.61	0.78
	Number of moderate injuty	0.95	41	1	0	2.27	1.51
	Number of minor injuty	0.05	40	0	0	0.32	0.57

분석결과

1. 성향점수 추정 결과

체험교육 미이수자 그룹과 이수자 그룹의 차이를 고려한 순수 교육효과를 분석하기 위해 ‘연령대’, ‘업종별’, ‘지역별’ 변수를 공변량으로 하여 성향점수를 추정하여 매칭하였다.

교통안전체험교육의 정책효과를 일률적으로 도출하는 것을 방지하기 위해서는 데이터 요인의 영향을 파악하는 것이 중요하다. 따라서 공변량마다 주어진 특성이 상이하여 교육효과에 차이가 발생할 수 있어 부문별로 구분하여 교육효과를 산출하였다. 성향점수의 경우 –0.2-1.0 사이에 실험군과 대조군의 공통영역(common support)이 존재하였으며, 연령, 지역, 업종 변수의 분포에서도 공통영역이 존재하는 것으로 확인되었다. 즉, 실험군과 대조군 사이에 동일한 공변량을 갖는 개체들이 존재하며, 유사한 성향점수 개체들끼리 중첩하여 매칭이 이루어질 수 있음을 의미한다. 매칭 전의 체험교육 이수자 집단과 미이수자 집단의 성향점수 밀도 및 주요 변수 분포를 확인한 결과는 Figure 1과 같다. Figure 1에서 보여지듯이 실험군과 대조군의 개체수가 불균형하여, 각 변수들의 밀도에서도 불균형이 발생하였다.

https://cdn.apub.kr/journalsite/sites/kst/2023-041-02/N0210410208/images/kst_2023_412_254_F1.jpg

Figure 1.

Distribution of variables depending on the completion of driving safety training (before matching)

2. 성향점수 매칭 결과

실험군과 대조군의 분포가 균형 있게 이루어졌는지 확인할 수 있는 지표는 표준화된 평균 차이(Standardized Mean Difference, SMD)값이며, SMD 절대값이 0.25 이상의 값을 가질 경우 불균형하다고 판단한다(Rubin, 2001). 다음의 Figure 2와 Figure 3에서 나타난 바와 같이 매칭 전에는 SMD의 절대값이 0.25 이상으로 불균형하게 나타났으나, 매칭 후 모든 변수에서 SMD의 절대값이 0.25로 나타나 균형적으로 매칭이 이루어졌음을 확인하였다.(주황색 막대 그래프가 매칭 후 SMD 값으로 0.1을 넘지 않는다.)

https://cdn.apub.kr/journalsite/sites/kst/2023-041-02/N0210410208/images/kst_2023_412_254_F2.jpg

Figure 2.

Standardized mean difference before and after propensity score matching

https://cdn.apub.kr/journalsite/sites/kst/2023-041-02/N0210410208/images/kst_2023_412_254_F3.jpg

Figure 3.

Distribution of variables depending on the completion of driving safety training (after matching)

3. 정책효과 추정 결과

정책효과 추정을 위해 서로 비슷한 성향을 가진 개체들 간 매칭한 후 실험군과 대조군의 재발 가능성(y)의 평균 차이를 산출한 결과는 Table 4와 같다. 전체 교통안전체험교육 평균처치효과 분석결과, 교통안전체험교육을 이수한 그룹(T=1)과 미이수한 그룹(T=0) 사이에 약 –0.164의 평균 차이가 나타났다. 따라서 모든 조건이 동일하다고 가정했을 때, 교통안전체험교육을 이수한 그룹이 교통사고를 다시 일으킬 가능성이 이수하지 않은 그룹에 비해 약 16.4% 낮다고 분석되었다.

Table 4.

Result of estimating effects of driving safety training

Treatment (T)		Outcomes
		Mean		Variance			S.D.		Samples
group of did not received driving safety training (0)		0.414		0.243			0.493		10,453
group of received driving safety training (1)		0.250		0.188			0.433		10,453
	Coef.		Std Err		t	P>\|t\|		.025		.975
(Intercept)	0.414		0.0005		91.23	0.000		0.405		0.423
Treatment	-0.164		0.0006		-25.55	0.000		-0.176		-0.151

추가적으로 지역별, 연령별, 사고심각도별로 세분화하여 교통안전 체험교육 효과도를 비교하였다. 첫 번째로 지역별 비교결과, 서울에서 45.8%로 가장 높게 나타났으며, 광주(29.0%) > 대구(24.6%) > 부산(23.3%) > 대전(20.2%) > 전북(13.9%) > 충북(12.4%) > 경북(10.8%) > 경기(3.7%) > 인천(2.4%) > 경남(1.8%)순으로 나타났으며, 전남, 충남, 강원, 울산, 제주는 교통안전체험교육에 따른 교통사고 재발 감소 효과가 상대적으로 작은 것으로 나타났다. 특히, 강원, 울산, 제주는 지자체 산하 교육기관인 교통문화연수원이 없는 지역으로써, 적극적인 교통안전체험교육 이수 독려 등이 미흡한 원인으로 추정된다. 두 번째로 연령별 비교결과 70대에서 36.7%로 교육 효과가 가장 높게 나타났으며, 60대(28.5%) > 80대(19.3%) > 50대(15.0%) 순으로 나타났다. 50대 이상 고령층이 되면서 신체적 기능 저하를 인지하고, 다양한 사고를 직·간접적으로 경험한 것이 교통안전 체험교육의 효과를 높이는 것으로 판단된다. 20-40대의 경우 운전에 대한 자신감 등으로 고령층에 비해서 체험교육에 대한 효과가 적은 것으로 판단된다. 체험교육의 효과의 지속성을 판단할 수는 없으나, 고령운전자 사고가 지속 증가하고 있는 사업용자동차 영역에서 체험교육 효과가 높다는 것은 정책점 시사점으로 판단된다. 다만 본 연구의 20-40대 운전자의 경우 신규자 체험교육을 이수하였을 가능성이 높은데, 신규자와 재직자의 교육 프로그램 구분이 없이 분석한 것은 한계점이라고 할 수 있다. 마지막으로 사고심각도별 비교결과 중상사고 발생자의 경우 16.7%, 경상사고 발생자의 경우 7.6%의 교통사고 감소 효과가 있는 것으로 나타났다. 사망사고 운전자들의 경우 대부분 퇴사를 하거나 운송업을 유지하지 않는 경우가 많아 표본에서 많이 제외된 결과로 추정된다(경상, 중상 사고발생자의 10%미만의 샘플수를 나타내었다).

결론

본 연구은 한국교통안전공단에서 수행하는 사업용자동차 운전자 대상 교통안전체험교육의 순수한 교통사고 감소 효과에 대해서 분석하였다. 일반적으로 정책도입의 효과를 추정하는 경우 수집한 샘플이 특정 집단으로 편향되는 경우 그 편향집단에 의해서 효과가 과소 또는 과대 추정될 수가 있다. 특히, 정책 도입 전 대조군과 정책 도입 후 비교군이 다른 집단이라고 한다면 정책 효과추정의 오류가 커질 수 있다. 따라서 도입한 정책 이외에 변수가 효과에 영향을 미칠 것으로 생각되는 변수는 통제하는 것이 좋다. 본 연구에서는 교통사고 발생에 영향을 미칠 수 있는 사업용자동차 운전자의 업종, 지역, 연령, 사고유형 4개 변수를 성향점수매칭 방법으로 통제하여 유사 그룹으로 정의(SMD 0.25미만)할 수 있는 샘플(20,906명)을 이용하여 분석하였다. 분석결과 교통안전체험교육을 이수한 그룹이 이수하지 않은 그룹에 비해서 교통사고 재발 가능성을 16.4%를 감소시키는 것으로 나타났다. 추가적으로 지역별, 연령별, 사고심각도별 체험교육 효과도를 분석하였다. 표본수가 충분하지 않은 유형이 일부 있었으나, 지자체 산하 교통문화연수원이 없는 지역에서 효과가 적은 것으로 나타났으며, 고연령일수록 효과가 높은 것으로 나타났다. 본 연구의 결과는 성향점수매칭방법 적용시 사업용자동차 교통사고에 영향을 미칠 수 있는 업종, 연령, 지역, 사고유형 4가지 변수를 기준으로 성향이 유사한 그룹을 매칭하였는데, 4가지 외의 영향요인(ex. 위험운전행동, 운수업체 안전관리 정도 등)은 자료구득의 한계로 반영하지 못하였다. 또한 운수업 재직자와 신규자의 체험교육 프로그램이 다르기 운영되나 이 두 그룹을 구분하여 반영하지 못하였다. 향후 연구에서 사업용자동차 교통사고에 영향을 주는 변수를 추가로 반영하여 성향점수 매칭방법을 이용하고, 신규자와 재직자를 구분하여 체험교육 이수에 대한 순수 효과도를 분석할 필요가 있다.

References

Bonifaz J.L., Fasanando A. (2022), The Use of Propensity Score Matching Methodology for Analysis of Vonsession: The Case of Road Networks in Peru, Case Studies on Transport Policy, 10, 2350-2357. 10.1016/j.cstp.2022.10.017

Ding Hongliang, Sze N.N., Li Haojie, Guo Yanyong (2021), Affected Area and Residual Period of London Congestion Charging Scheme on Road Safety, Transport Policy, 100, 120-128. 10.1016/j.tranpol.2020.10.012

Elvik R. (1997), A Framework for Cost-Benefit Analysis of the Dutch Road Safety Plan, Institute of Transport Economics, Oslo, Norway.

Graham D.J., Naik C., Mc Coy E.J., Li H. (2019), Do Speed Cameras Reduce Road Traffic Collisions? PLoS One 14 (9), e0221267. 10.1371/journal.pone.022126731525209PMC6746359

Hauer E. (1992), Empirical Bayes Approach to Estimation of “unsafety”: The Multivariate Regression Method, Accid. Anal. Prev. 24(5), 457-477. 10.1016/0001-4575(92)90056-O

Hauer E., Harwood D.W., Council F.M., Griffith M.S. (2002), Estimating Safety by the Empirical Bayes Method: A Tutorial, Transp. Res. Rec. 1784, 126-131. 10.3141/1784-16

Jung E.B., Oh C. (2013), Methodology for Estimating Safety Benefits of Advanced Driver Assistant System, The Journal of The Korea Institute of Intelligent Transport System, 12(3), 65-77. 10.12815/kits.2013.12.3.65

Koo J.H., Jang J.Y., Choo S.H. (2017), Analysis of Traffic Accident Reduction Effect When Introducing Motorcycle Safety Inspection, J. Korean Soc. Transp., 35(1), Korean Society of Transportation, 25-36. 10.7470/jkst.2017.35.1.025

Lord D., Kuo P. (2012), Examining the Effects of Site Selection Criteria for Evaluating the Effectiveness of Traffic Safety Countermeasures, Accid. Anal. Prev. 47, 52-63. 10.1016/j.aap.2011.12.00822405239

Persaud B., Lyon C. (2007), Empirical Bayes before-after Safety Studies: Lessons Learned from Two Decades of Experience and Future Directions, Accid. Anal. Prev. 39, 546-555. 10.1016/j.aap.2006.09.00917081487

Rosenbaum P.R., Rubin D.B. (1983), The Central Role of the Propensity Score in Observational Studies for Causal Effects, Biometrika 70, 41-55. 10.1093/biomet/70.1.41

Rubin D.B. (2001), Using Propensity Scores to help Design Observational Studies: Application to the Tobacco Litigation, Health Services and Outcomes Research Methodology, 2(3), 169-188.

Sasidharan Lekshmi, Donnell Eric T. (2013), Application of Propensity Scores and Potential Outcomes to Estimate Effectiveness of Traffic Safety Countermeasures: Exploratory Analysis Using Intersection Lighting Data, Accident Analysis and Prevention, 50, 539-553. 10.1016/j.aap.2012.05.03622749318

Son S.O., Park J.Y., Kim M.W., Choe B.H. (2019), Assessing the Safety Effects of Reduction of Speed Limit on Urban Raods, J. Korean Soc. Transp., 37(6), Korean Society of Transportation, 514-524. 10.7470/jkst.2019.37.6.514

Talebian A., Zou B., Hansen M. (2018), Assessing the Impacts of State-supported Rail Services on Local Population and Employment: A California Case Study, Transport Policy, 63, 108-121. 10.1016/j.tranpol.2017.12.013

Wood Jonathan S., Donnel Eric T. (2016), Safety Evaluation of Continuous Green T Intersections: A Propensity Scores-Genetic Matching-Potential Outcomes Approach, Accident Analysis and Prevention, 93, 1-13. 10.1016/j.aap.2016.04.01527129112

Wood Jonathan S., Donnel Eric T., Porter Richard J. (2015), Comparison of Safety Effect Estimates Obtained from Emporocal Bayes Before-After Study, Propensity Scores-Potential Outcomes Framework, and Regression Model with Cross-Sectional Data, Accident Analysis and Prevention, 75,144-154. 10.1016/j.aap.2014.11.01925481539

Wood Jonathan S., Donnell Eric T. (2017), Causal Inference Framework for Generalizable Safety Effect Estimates, Accid. Anal. Prev. 104, 74-87. 10.1016/j.aap.2017.05.00128486151

Journal of Korean Society of Transportation ISSN:1229-1366(Print) 2234-4217(Online) 대한교통학회지

Preview

Estimation of the Effect of Commercial Vehicle Driving Safety Training Using the Propensity Score Matching Method

ABSTRACT

MAIN

(1)

(2)

Table 1.

List of data for group of drivers who received driving safety training and who did not receive the training

Table 2.

Variables configuration

Table 3.

Data description

Figure 1.

Distribution of variables depending on the completion of driving safety training (before matching)

Figure 2.

Standardized mean difference before and after propensity score matching

Figure 3.

Distribution of variables depending on the completion of driving safety training (after matching)

Table 4.

Result of estimating effects of driving safety training

References