Article

Journal of Korean Society of Transportation. 31 December 2024. 627-648
https://doi.org/10.7470/jkst.2024.42.6.627

ABSTRACT


MAIN

  • 서론

  • 기존문헌고찰

  •   1. DTG 기반 차량운행기록 관련 연구

  •   2. 데이터 큐브 모델 활용 관련 연구

  •   3. 기존 연구와의 차별성

  • 분석자료 및 분석방법론

  •   1. 데이터 수집 및 전처리

  •   2. 다차원 데이터 분석 기법

  • 실험 및 연구결과

  •   1. 실험 설계

  •   2. 시나리오Ⅰ: 운수업체 규모 및 개별 운전자의 특성에 따른 위험운전행동 분석

  •   3. 시나리오Ⅱ : 시간대별 및 공간별 운수업체의 위험운전행동 분석

  • 결론

서론

과학기술의 발전에도 불구하고 도로 교통사고는 여전히 전 세계적으로 부상, 장애, 인명 손실 등 심각한 사회적 문제로 남아있는 상황이다(WHO, 2015; Eun, 2020; Noh, 2022). 교통사고분석시스템(TAAS; Traffic Accident Analysis System)에 나타난 통계에 의하면 2019년 국내 교통사고 발생 건수는 약 23만 건, 사망자 수는 약 3,300명으로 자동차 1만 대당 교통사고 사망자는 약 1.2명으로 추산된다. 이는 OECD(Organization for Economic Co-operation and Development) 평균인 약 0.9명을 상회하는 수치로, OECD 36개 회원국 중 5번째로 높은 국가에 해당한다. 특히, 상업용 차량의 사고는 일반 승용차 대비 다양한 측면에서 심각한 사회적, 경제적 문제를 야기할 수 있으며, 특히 인명 손실 측면에서 그 심각성이 더 크다(Mir et al., 2013; Yan et al., 2021). 상업용 차량은 화물 운송, 승객 이동, 특수 임무 수행 등의 다양한 목적을 가지며, 크게 여객차량(버스, 택시 등)과 화물차량 등으로 구분될 수 있다. 이러한 차량의 특성 및 운행의 특성상 일반 승용차보다 더 높은 위험성을 내포한다(Moridpour et al., 2012; Chen et al., 2020). 지난 10년간 상업용 차량의 사고는 도로 교통사고의 상당 부분을 차지해 왔으며, 사망자 수에서 지속적으로 심각한 수준임을 나타낸다(Kar et al., 2024).

상업용 차량의 사고 예방과 관련된 노력의 일환으로 한국교통안전공단은 위험운전행동 정보에 기초하여 고위험 운전자 및 운수업체를 대상으로 안전교육을 실시하고 있다. 위험운전행동 정보는 국내 상업용 차량에 부착이 의무화된 운행기록장치(DTG; Digital TachoGraph)를 통해 추출된다. 한국교통안전공단은 이로부터 상업용 차량의 유형별 11대 위험운전(과속, 장기과속, 급가속, 급출발, 급감속, 급정거, 급좌회전, 급우회전, 급U턴, 급끼어들기, 급차선변경 등)의 기준을 정의하였으며, 상업용 차량을 대상으로 위험운전에 관한 관리를 수행하고 있다. 그러나, 현재 운영 중인 방식은 단순히 위험운전의 빈도에 따른 운수업체별 안전 교육에 그치고 있으며, 상업용 차량의 위험운전행동을 다각적으로 조망하여 사고 예방을 위한 운수업체별 안전 교육 및 평가 기준 설정 등 상업용 차량의 안전운행을 지원할 수 있는 시스템은 여전히 부족한 실정이다. 예를 들어, 운수업체별로 택시와 버스는 급가속, 급감속과 같은 위험운전행동 빈도가 높을 수 있으며, 화물차량은 고속도로 통행의 경우 사고 방지를 위해 급감속을 빈번하게 할 수 있다. 이러한 운수업체별 차이로 인해, 운수업체의 위험운전행동 패턴을 다각적으로 분석할 필요성을 강조한다. 따라서, 상업용 차량의 위험운전행동을 구체적으로 식별하고 각 운수업체별 맞춤형 안전 교육 시스템 강화를 통한 실효성 있는 상업용 차량 사고 예방을 위한 전략 수립이 반드시 필요하다.

본 연구에서는 운수업체 소속 상업용 차량의 11대 위험운전 정보를 활용한 다차원 분석 시스템을 제안한다. 제안하는 다차원 분석 시스템은 기존의 관계형 데이터베이스(RDB; Relational Database)의 분석 방법과 달리 다차원 분석 수행이 가능한 데이터 큐브 및 OLAP(On-Line Analytical Processing) 기법을 활용하여 운수업체별 11대 위험운전행동의 패턴을 다차원적으로 분석할 수 있는 가능성을 제시한다. 또한, 교통사고 기록 데이터를 활용하여 분석 결과를 바탕으로 교통 안전 담당자와 안전 관리자 같은 의사 결정자에게 상업용 차량의 위험운전행동과 관련된 유의미한 정보를 제공하여, 효율적이고 실질적인 의사결정을 지원할 수 있도록 한다. 본 논문의 구성은 다음과 같다. 우선 기존 관련 문헌 고찰을 통해 차별성 있는 분석방법론을 설명하고, 분석방법론에 따른 연구 결과를 정리하며, 결론을 제시한다.

기존문헌고찰

본 장에서는 상업용 차량(버스, 택시, 화물차 등) 사고의 예방을 위한 다양한 연구들 중에서도 11대 위험운전행동의 위험성을 식별하고 분석하는 연구에 대해 소개한다. 상업용 차량의 사고는 그 운행의 특성상 발생 시 일반 승용차량의 사고에 비해 그 심각도가 더 높으므로 반드시 해결해야 할 과제 중 하나로 인식되고 있다. 또한, 최근까지 DTG 데이터를 활용한 상업용 차량의 안전운전에 관한 다수의 선행 연구 결과도 보고되었다(Lee and Lee, 2012; Kim and Kang, 2015; Jang et al., 2017; Trirat and Lee, 2021). 본 장에서는 본 연구의 목적을 고려하여, 선행 연구들 중 본 논문의 주제와 그 목적이 유사한 연구들을 중심으로 살펴보고자 한다.

1. DTG 기반 차량운행기록 관련 연구

먼저, DTG 데이터를 활용한 관련 연구들을 살펴보면, Seoul Research Institute(2014)에서는 서울시 내 택시의 DTG 데이터를 활용하여 택시의 이용 및 운행 행태를 분석하였다. 택시 이동거리에 따른 요금 지불 형태, 택시의 승하차 기록을 통해 이용 패턴 및 시간대별 택시 공급과 수요의 관계를 분석하고 도시철도 막차 시간 이후에는 택시 수요가 급증하는 결과를 보였다. Ahn and Shin(2018)은 부산시의 택시 DTG 데이터를 활용해 OD 데이터를 구축하고, 택시 사용자의 승하차 지점 및 이동 경로, 통행량 등을 분석하였다. 택시 이용자의 통행 패턴은 시간대와 지역에 따라 상이하며, 특정 지역에서의 승하차가 빈번하다는 결과를 도출하였다. Lee and Kim(2020)은 서울시의 신호 교차로에서 택시의 DTG 데이터를 활용하여 대기행렬 길이를 추정하는 알고리즘을 개발하였으며, 마이크로시뮬레이션 소프트웨어인 Vissim을 사용하여 알고리즘의 정확성과 민감도를 검증하였다(Fellendorf and Vortisch, 2001).

교통 안전의 관점에서 살펴보면, 차량운행기록 정보를 활용하여 위험운전행동의 패턴을 파악하고, 상업용 차량 관리 및 정책 입안 등의 자료로 활용하고자 하는 일부 연구가 존재한다. 그 예로써, Cho et al.(2017)은 고속도로에서 화물차의 위험운전행동을 식별하여 졸음운전으로 인한 위험 구간을 분석하였다. Kim et al.(2018)은 고속버스 DTG 데이터를 활용하여 시간대별, 요일별, 기상 상태별 위험운전 발생 패턴을 분석하여 고속버스 운전자의 안전 교육 및 평가 기준을 마련할 수 있는 근거를 제시하였다. Park et al.(2020)은 세종시에서 운행하는 다양한 유형의 버스(시내버스, 마을버스, 시외버스, 여행버스 등)의 위험운전행동 유형을 분석하고, 특정 구간에서 위험운전행동이 반복적으로 발생하는지 확인하였다. 버스의 유형별로 운행하는 지역 차이로 인해 각 결과는 다르게 나왔으며, 시내버스 위험운전행동 민원과의 비교 분석에서도 일치함을 보였다.

국내뿐만 아니라 해외에서도 주행기록 데이터를 활용한 위험운전행동에 대한 연구들도 존재한다. 먼저, Chen et al.(2021)은 무인항공기(UAV) 영상을 통해 데이터를 추출하여 주행 속도가 불규칙하게 변하는 주행 행동, 차량이 도로를 뱀처럼 곡선으로 주행하는 행동, 앞차량과 너무 가까이 따라가는 위험운전행동 세 가지를 정의하였다. 이를 MOR(Measurement of Risk)기반 평가 모델로 위험도를 정량화하여 세 가지 유형의 위험운전행동을 평가하였다. 박스플롯 기반 방식과 분포 기반 방식으로 데이터를 검증한 결과 각각 91%와 86%의 높은 인식 정확도를 보였다. Singh and Kathuria(2021)은 위치 기반 및 차량 기반 데이터를 수집하여 정상운전행동과 사고 직전의 위험운전행동을 비교 분석하였다. 연구 결과, 운전자의 행동이 교통사고 원인에 중요한 영향을 미친다는 사실을 입증하였으며, 실시간 데이터 수집을 통해 운전자 행동을 모니터링하고 예측할 수 있음을 밝혔다. Pantangi et al.(2020)은 SHRP2(Second Strategic Highway Research Program)에서 수집된 NDS(Naturalistic Driving Study) 데이터를 활용하여 공격적인 운전행동을 분석하였다. 이 연구는 다양한 통계 모델을 사용하여 공격적인 운전행동들이 교통사고 위험에 미치는 영향을 평가하였으며, 고가시성 단속 프로그램(HEV; High-Visibility Enforcement)이 운전자의 공격적인 운전행동을 감소시키는 데 효과적임을 입증하였다.

2. 데이터 큐브 모델 활용 관련 연구

본 연구에서 사용한 데이터 큐브 모델을 구성과 OLAP 연산을 활용한 다양한 연구에 대해 살펴보면, Noh and Yeo(2021)는 취약한 도로 사용자(VRU)를 보호하기 위한 전략 중 하나로, 교통 사고의 원인을 분석하고 사전에 예방하며 사고 발생 전에 예측적으로 대응하기 위한 프레임워크를 제안하였다. 이 프레임워크는 데이터 큐브를 구성하여 시간, 장소, 교통흐름, 보행자 특성 등 다양한 차원에서 데이터를 집계하고 OLAP 기법을 사용하여 보행자 관련 데이터를 다양한 관점에서 분석하였다. 이를 통해 도시 계획자와 교통 안전 전문가에게 보행자 안전을 개선하는 데 유용한 정보를 제공하며, 보행자 보호를 위한 교통 인프라 개선 방안을 모색하는 데 기여하였다. Park et al.(2013)은 매우 복잡하고 다양한 특성을 가지고 있는 네트워크 트래픽을 데이터 큐브와 OLAP 기법을 활용하여 다차원적인 관점에서 살펴볼 수 있는 NetCube 모델을 제안하였다. NetCube 모델은 다차원적인 접근을 통해 네트워크에서 발생하는 트래픽 패턴을 보다 정교하게 분석하고, 이해하기 쉬운 시각적 형태로 표현할 수 있는 방법을 제시하였다. Xu et al.(2017)은 고병원성 조류인플루엔자를 분석하는 다차원 분석 모델을 제안하였다. 이 연구는 다차원 데이터 큐브를 구성하여 시간, 장소, 조류 종류 등 다양한 요소를 포함한 데이터를 집계하고 분석하여 조류인플루엔자의 확산 경로와 위험요인을 식별하고 예측하는 것을 목표로 하였다. 그 결과로 전염병 관리와 예방 전략을 개발하는 데 중요한 기여를 할 수 있었으며, 다차원 분석 모델이 정교한 예측과 의사 결정을 가능하게 한다는 결론을 도출하였다.

3. 기존 연구와의 차별성

DTG 데이터를 활용하여 위험운전행동을 분석한 연구들은 존재하는 반면, 위험운전행동을 다양한 관점에서 조망하고 분석하는 연구는 여전히 부족한 실정이다. 특히, 본 연구에서 중점적으로 다루고자 하는 위험운전행동에 대한 다각적 조망을 통해 고위험 운전자와 운수업체를 세밀히 선별하고 그 특징을 반영한 맞춤형 안전 교육 및 평가 기준 설정 등에 관한 연구는 전무하다. 이를 위한 선행 연구로서, 본 연구에서는 운수업체정보, 교통사고기록, DTG 데이터 등을 종합적으로 활용하여 운수업체별 위험운전행동의 특성을 심도 있게 분석하고자 한다. 이를 위해 데이터의 다차원 분석에 적합한 모델 중 하나인 데이터 큐브 모델을 구축하고, OLAP 기법을 활용하여 위험운전행동을 시간, 공간, 운수업체, 도로 교통사고 등 여러 관점에서 다양한 추상화 정도에 따른 분석을 수행하고자 한다.

분석자료 및 분석방법론

1. 데이터 수집 및 전처리

본 연구에서는 한국교통안전공단에서 제공하는 2019년 대전광역시 내 상업용 차량의 DTG 기반 운행기록 데이터, 교통사고 기록 데이터 및 운수업체 정보 데이터 등을 활용한다. 운행기록 데이터는 날짜, 시간, 차량번호, 운수업체 코드, 경·위도, 11대 위험운전행동 여부 등으로 구성되어 있다. 분석 목적에 맞게 운행기록 데이터의 운수업체 코드를 활용하여 식별이 되지 않은 운수업체는 제거하고 버스, 화물, 택시 업체를 각각 식별한 결과, 버스업체 108개, 화물업체 65개, 택시업체 43개 총 216개의 운수업체를 식별하였다. 식별된 운수업체에 등록된 차량의 DTG 기반 운행기록 데이터에서 11대 위험운전행동을 추출하여 분석에 활용한다. 11대 위험운전행동은 Korea Transportation Safety Authority(2024)에서 제시한 위험운전행동 기준을 적용하여 트럭, 버스, 택시별로 과속, 장기과속, 급가속, 급출발, 급감속, 급정지, 급좌회전, 급우회전, 급U턴, 급앞지르기, 급차선변경을 책정한다. 11대 위험운전행동 기준은 Table 1에서 확인할 수 있다. 교통사고 기록의 경우, 2019년 한 해 동안 전국에서 발생한 데이터 중 대전광역시만을 추출하여, 수집된 데이터를 가공하여 분석에 활용한다.

Table 1.

Classification of top 11 risky driving behaviors

Classification Truck
evaluation standard
Bus
evaluation standard
Taxi
evaluation standard
Speeding
type
Speeding ∙ Driving 20km/h over the road speed limit
Long-term
speeding
∙ Driving 20km/h over the road speed limit for more than 3 minutes
Acceleration
type
Sudden
acceleration
∙ Accelerating 5km/h per
second at higher than
6km/h speed
∙ Accelerating 6km/h per
second at higher than
6km/h speed
∙ Accelerating 8km/h per
second at higher than
6km/h speed
Sudden
start
∙ Starting lower than 5km/h
speed and accelerating
6km/h per second
∙ Starting lower than 5km/h
speed and accelerating
8km/h per second
∙ Starting lower than 5km/h
speed and accelerating
10km/h per second
Deceleration
type
Sudden
deceleration
∙ Decelerating 8km/h per
second at higher than
6km/h speed
∙ Decelerating 9km/h per
second at higher than
6km/h speed
∙ Decelerating 14km/h per
second at higher than
6km/h speed
Sudden
stop
∙ Decelerating at higher
8km/h speed and becoming
lower than 5km/h speed
∙ Decelerating at higher
9km/h speed and becoming
lower than 5km/h speed
∙ Decelerating at higher
14km/h speed and becoming
lower than 5km/h speed
Turn
type
Sudden
left turn
∙ A sharp turn to the left/right
(cumulative turning angle
ranging from 60° to 120°)
in 4 seconds with a speed
of 20km/h or more
∙ A sharp turn to the left/right
(cumulative turning angle
ranging from 60° to 120°)
in 4 seconds with a speed
of 25km/h or more
∙ A sharp turn to the left/right
(cumulative turning angle
ranging from 60° to 120°)
in 3 seconds with a speed
of 30km/h or more
Sudden
right turn
Sudden
U-turn
∙ Driving left or right
(range of 160° to 180°)
in 8 seconds with a speed
of 15km/h or more
∙ Driving left or right (range
of 160° to 180°) in 8
seconds with a speed of
20km/h or more
∙ Driving left or right (range
of 160° to 180°) in 6
seconds with a speed of
25km/h or more
Lane
change
type
Sudden
overtaking
∙ The vehicle change
direction to the left or
right more than 6°/sec at a
higher than 30km/h speed
∙ The vehicle change
direction to the left or
right more than 8°/sec at a
higher than 30km/h speed
∙ The vehicle change
direction to the left or
right more than 10°/sec at a
higher than 30km/h speed
∙ Cumulative angle is less than ±2°/sec during 5 seconds and acceleration or deceleration
is more than 3km/h per second
Sudden
lane change
∙ The vehicle changes
direction to the left or
right more than 6°/sec at a
higher than 30km/h speed
∙ The vehicle changes
direction to the left or
right more than 8°/sec at a
higher than 30km/h speed
∙ The vehicle changes
direction to the left or
right more than 10°/sec at a
higher than 30km/h speed
∙ Cumulative angle is less than ±2°/sec during 5 seconds and acceleration or deceleration
is less than ±2km/h per second

2. 다차원 데이터 분석 기법

본 절에서는 상업용 차량의 위험운전행동에 대한 다차원적 분석을 위한 방법론인 데이터 큐브 모델링 기법과 OLAP 연산들에 관하여 서술한다.

1) 데이터 큐브 모델

데이터 큐브 모델은 주어진 데이터를 여러 차원으로 모델링하고 조망하는 데 유리하다(Han et al., 2006; Boutkhoum and Hanine, 2017). 데이터 큐브는 차원(dimension)과 사실(fact)로 정의된다. 일반적으로 차원은 조직이 기록을 유지하고자 하는 관점이나 실체(entities)를 의미하고, 사실은 차원 간의 관계를 분석하기 위한 측정값을 의미한다. 데이터 큐브의 구성을 위해서는 전통적인 관계형 데이터베이스가 아닌 특수한 형태의 스키마가 필요하며 본 연구에서는 다차원 분석에서 주로 활용되는 스타 스키마(star schema)를 적용하여 데이터 큐브를 모델링한다. 스타 스키마는 크게 차원 테이블과 사실 테이블로 구성되며, 본 연구에서는 상업용 차량의 11대 위험운전행동의 다차원적 분석을 위해 시간, 위치, 운수업체, 운전 행동, 운전 습관, 도로 교통사고의 6개의 차원 테이블을 정의하고, 사실 테이블에서는 앞서 언급한 11대 위험운전행동에 대해 그 발생 횟수를 측정값으로 하는 스타 스키마를 구성한다(Figure 1 참조).

https://cdn.apub.kr/journalsite/sites/kst/2024-042-06/N0210420601/images/kst_2024_426_627_F1.jpg
Figure 1.

Star schema of date cube model

2) 개념 계층도 및 OLAP 연산

데이터 큐브를 활용한 다차원 분석을 수행하기 위해서 주어진 데이터의 추상화 수준을 달리하여 표현할 수 있는 개념 계층도(concept hierarchy)를 구성한다. 개념 계층 구조는 하위 수준 개념 집합으로부터 상위 수준의 보다 일반적인 개념들로 연속되는 사상의 연속(a sequence of mapping)을 의미한다. 이러한 개념 계층도를 활용하여 분석 목적에 따라 추상화 세부 정도를 조절하여 다차원 분석을 수행한다. 본 연구에서 제안하는 개념 계층도는 Figure 2와 같다.

https://cdn.apub.kr/journalsite/sites/kst/2024-042-06/N0210420601/images/kst_2024_426_627_F2.jpg
Figure 2.

Concept hierarchy of data cube model: (a) time; (b) location; (c) driving behavior; (d) transportation company; (e) exposure; (f) road traffic accident

시간 차원의 개념 계층 구조는 일, 주, 월, 분기, 연도로 구성되며, ‘일(day) < {월(month) < 분기(quarter); 주(week)} < 년(year)’의 구조를 가진다(Figure 2(a) 참조). 운수업체의 개념 계층 구조는 운수업체의 최상위 단계인 버스업체, 화물업체, 택시업체(bus company, freight company, taxi company) 등의 ‘company type’과 최하위 단계인 ‘company sub type’으로 구성된다(Figure 2(d) 참조). 예를 들어, ‘버스업체(bus company)’의 규모에 따라 ‘company size A’, ‘company size B’와 같은 하위 단계가 포함되며, 그 하위에는 A-1, A-2와 같은 운수업체가 포함된다. 위치, 운전 행동, 운전 습관, 도로 교통사고 차원 등의 다른 개념 계층 구조도 유사하게 묘사된다. 이러한 다양한 개념 계층은 사용자가 다양한 관점에서 데이터를 볼 수 있는 유연성을 제공한다(Noh and Yeo, 2021). 이를 실현하기 위해 다양한 보기를 구체화할 수 있는 여러 가지의 OLAP(On-Line Analytical Processing) 데이터 큐브 작업이 존재하며, 이를 통해 확장 가능한 분석 시스템을 설계하고, 사용자에게 익숙한 환경을 제공하여 다차원 및 대화형 쿼리를 수행할 수 있다(Zhang et al., 2009; Eavis et al., 2010; Lee et al., 2010; Noh et al., 2017).

OLAP는 대규모 양의 데이터를 관리하며, 요약(summarization)과 집계(aggregation)를 위한 도구를 제공하여 복잡한 데이터를 빠르고 효과적으로 이해할 수 있도록 역할을 수행한다. 이를 위해 OLAP 연산을 수행할 수 있으며, 본 논문에서는 롤업(roll-up), 드릴다운(drill-down), 슬라이스(slice), 다이스(dice), 피봇(pivot) 등과 같은 다양한 OLAP 연산을 이용하여 다차원적인 분석을 수행한다. OLAP 연산에 대해 자세히 살펴보면, 롤업 연산은 차원에 대한 개념 계층을 따라 위로 올라가거나 차원을 축소하여 데이터 큐브에서 집계를 수행하는 연산이다. 반면, 드릴다운 연산은 롤업의 반대 개념으로 개념 계층을 단계적으로 내려가거나 추가 차원을 도입하여 집계를 수행하는 연산으로 비교적 덜 상세한 수준에서 더 상세한 수준으로 이동하여 정보를 더 자세히 제공하는 구체화(specialization) 연산이다. 슬라이스 연산은 주어진 데이터 큐브의 한 차원에 대한 선택을 수행하여 하위 큐브(sub-cube)를 생성하고, 다이스 연산은 2개 이상의 차원에서 여러 조건을 선택하여 더 세밀한 분석이 가능한 하위 큐브를 만드는 데 활용된다. 피봇은 데이터 큐브의 축을 회전하여 다른 각도에서의 다양한 데이터 뷰를 제공하는 시각화 작업 연산이다. 이를 통해 데이터에 대한 여러 뷰를 통해 다양한 인사이트를 도출하는 것이 가능하다. 본 장에서 서술한 OLAP 연산의 과정에 대한 예시는 Figure 3에 나와 있다.

https://cdn.apub.kr/journalsite/sites/kst/2024-042-06/N0210420601/images/kst_2024_426_627_F3.jpg
Figure 3.

The process of OLAP operation

이러한 데이터 큐브는 다차원 데이터 모델링을 통해 직관적으로 데이터를 표현 가능하게 하며, 사용자에게 복잡한 데이터 관계를 이해하기 쉽고 직관적인 시각화를 제공한다는 장점이 존재한다. OLAP 연산을 활용하여 분석의 목적에 따라 차원을 적절하게 조절해 나가며 다차원적인 측면에서 데이터를 탐색하는 것이 가능하다. 이는 미리 계산된 데이터 집계와 인덱스를 사용하여 복잡한 데이터 쿼리를 빠르게 처리할 수 있으며, 대규모 데이터 집합을 효율적으로 집계하고 요약하는 기능을 제공함으로써, 사용자의 관점에서 인사이트를 빠르게 도출할 수 있다. 또한, 기존의 RDB 분석 방법으로는 발견할 수 없었던 의미 있는 정보를 발견하고 의사결정에 활용할 수 있다는 장점이 존재한다. 반면, 이러한 방법론들은 주로 구조화된 데이터 분석에 최적화되어 있으므로, 텍스트나 이미지와 같은 비정형 데이터를 분석하는데 한계가 존재한다.

정리하자면, 본 논문에서는 주어진 데이터 세트를 기반으로 데이터 큐브 모델을 구성하고 OLAP 기법을 활용하여 쿼리, 분석, 시각화 및 결과 보고를 통해 다차원적 시나리오 분석을 수행한다. 이를 위해 연구에 적합한 추상화 수준을 달리할 수 있는 개념 계층도를 구축하여 데이터를 다양한 관점에서 조망하였으며, 시간, 위치, 운전행동, 운수업체, 운전 습관, 도로 교통사고 총 6개의 차원 테이블을 활용한다. 각 차원의 측정값으로는 과속, 장기과속, 급가속, 급출발, 급감속, 급정지, 급좌회전, 급우회전, 급U턴, 급앞지르기, 급차선변경의 11대 위험운전행동 횟수를 책정한다. 그중에서도 본 연구에서 가장 중점적으로 살펴보고 싶은 상업용 차량의 위험운전행동과 교통사고의 관계, 운수업체별 위험운전행동 횟수와의 관계 및 위험운전행동을 많이 하는 운수업체의 특징을 분석한 시나리오를 제시한다.

실험 및 연구결과

1. 실험 설계

본 절에서는 앞서 언급한 OLAP 연산과 데이터 큐브 모델을 활용하여 위험운전행동과 사고의 관계에 대한 유의미한 영향을 파악하고자 한다. Figure 4는 2018년부터 2023년까지 대전광역시의 교통사고 발생 빈도를 나타내고 있다. 다른 년도에 비해 2019년에 교통사고 발생 건수가 약 8,000건을 넘어 가장 높게 집계된 것으로 나타났다. 따라서 본 연구에서는 2019년 DTG 데이터를 중심으로 위험운전행동에 대한 시나리오를 설계하고 분석을 진행하였다.

https://cdn.apub.kr/journalsite/sites/kst/2024-042-06/N0210420601/images/kst_2024_426_627_F4.jpg
Figure 4.

Number of traffic accidents per year(2018-2023)

2019년 대전에서 발생한 교통사고를 자세히 살펴보면 일반 승용차량의 통행량이 상업용 차량의 통행량보다 현저히 많다는 것은 자명한 사실이다. 차량에 따른 교통사고 위험성을 파악하기 위해 차량의 종류별로 차량 1대당 발생하는 사망자 및 부상자 수의 비중을 알아본 결과 Figure 5와 같다. 사망자 및 부상자의 구분은 TAAS에서 정의한 인적피해로 구분하며, Table 2에 명시되어 있다. 택시가 일반 승용차로 분류된 것을 감안하여 살펴본 결과, 상업용 차량이 사고가 발생했을 때 사망자 및 부상자의 비중이 더 높다는 사실을 확인하였다. 이러한 결과들로 인해 상업용 차량의 교통사고 발생 시 인명피해 측면에서 일반차량보다 더 높은 위험성을 내포한다는 사실을 확인하였다.

https://cdn.apub.kr/journalsite/sites/kst/2024-042-06/N0210420601/images/kst_2024_426_627_F5.jpg
Figure 5.

2019 Commercial vs. General vehicle comparison

Table 2.

Categorizing traffic injuries

Injury type Definition
Fatality ∙ Death within 30 days
Serious injury ∙ An injury that requires medical treatment for more than 3 weeks
Minor injury ∙ An injury that requires medical treatment for more than 5 days but less than 3 weeks
Reported injury ∙ An injury that requires medical treatment for less than 5 days

본 연구에서는 위험운전행동과 교통사고 발생 빈도 간의 연관성을 파악하기 위해 위험운전행동과 교통사고가 발생한 시간 및 위치 데이터와 공간 조인(spatial join)을 수행한다. 이러한 연관성을 실질적으로 분석하기 위해 Table 2에서 명시한 사망자 및 부상자로 교통사고 심각도를 구분하였다. Equation 1에 나타난 OLAP 작업을 수행한 결과 Figure 6과 같다. Figure 6(a)는 2019년 대전광역시에서 운행한 상업용 차량의 11대 위험운전행동을 교통사고 심각도별로 나타낸 것이며, Figure 6(b)는 2019년 대전광역시의 교통사고 발생 빈도를 교통사고 심각도별로 보여준다. 두 그래프를 비교한 결과, 비슷한 패턴을 파악할 수 있다. 이는 11대 위험운전행동이 직접적으로 사고를 유발한다는 것을 의미하진 않으나, 시간과 위치 측면에서 위험운전행동 패턴과 사고의 심각도가 유사하다는 시사점을 제공한다. 이로 인해 위험운전행동에 대한 정보는 사고의 심각도를 파악하는 데 활용될 수 있으며, 본 연구에서는 이러한 위험운전행동에 대한 다차원적 분석을 수행하고자 한다.

https://cdn.apub.kr/journalsite/sites/kst/2024-042-06/N0210420601/images/kst_2024_426_627_F6.jpg
Figure 6.

Aggregate by accident severity: (a) 11 risky driving behavior; (b) Road traffic accident

(1)
Drill-downonroadtrafficaccident(fromallroadtrafficaccidenttoaccidentseverity)Dicefor(measure=[Speeding|Long-termspeeding|Suddenacceleration|Suddenstart|Suddendeceleration|Suddenstop|Suddenleftturn|Suddenrightturn|SuddenU-turn|Suddenovertaking|Suddenlanechange])and(time=2019)and

먼저, 2019년 대전광역시에서 자주 발생한 위험운전행동의 유형을 파악하기 위해 11대 위험운전행동을 모두 측정값으로 하여 집계한 결과 Figure 7과 같다. 급가속이 약 4,500만 회로 가장 많이 발생하였으며, 급감속과 과속은 각각 약 1,800만 회와 약 1,700만 회로 높다는 정보를 얻을 수 있다. 과속이 빈번함에도 불구하고 장기과속은 단 한 차례도 발생하지 않는 현상이 나타났다. Table 1에서 제시된 11대 위험운전행동 기준에 따르면, 장기과속은 제한속도를 20km/h 초과하여 3분 이상 지속 운행하여야 한다. 도로의 특성상 신호등과 과속카메라 등의 영향으로 과속이 3분 이상 지속될 가능성이 낮다고 추정할 수 있다.

https://cdn.apub.kr/journalsite/sites/kst/2024-042-06/N0210420601/images/kst_2024_426_627_F7.jpg
Figure 7.

Daejeon commercial vehicle risky driving behaviors aggregate in 2019

이러한 분석 결과를 바탕으로, 운수업체의 특성을 파악하고 효과적인 사고 예방 전략과 정책을 수립하는 데 의미 있는 정보를 제공하고자 본 연구에서는 두 가지 주요 시나리오를 설계하고 다차원적인 분석을 진행한다.

∙ 시나리오 1: 운수업체 규모 및 개별 운전자의 특성에 따른 위험운전행동 분석

∙ 시나리오 2: 시간대별 및 공간별 운수업체의 위험운전행동 분석

2. 시나리오Ⅰ: 운수업체 규모 및 개별 운전자의 특성에 따른 위험운전행동 분석

본 절에서는 운수업체 규모 및 개별 운전자의 특성에 따른 위험운전행동의 분석 결과에 대해 서술한다. 먼저 운수업체의 규모의 관점으로 살펴보면, Figure 8은 2019년 DTG 데이터와 운수업체 정보 데이터를 활용하여 하나의 운수업체에서 집계된 위험운전행동 총 횟수를 해당 운수업체의 등록된 차량 수로 나눈 값을 버블 차트로 나타낸 것이다. 각 버블의 크기 및 색상은 차량 1대당 연간 위험운전행동 횟수의 평균 비중을 나타내고 있다. 분석 결과, 차량의 수가 많은 운수업체일수록 차량 1대당 위험운전행동을 많이 한다는 양의 상관관계를 관찰하였다. 이는 대규모 운수업체가 더 많은 운전자를 고용하면서 행동 패턴 표준화에 어려움이 생기고 안전 규정을 준수하지 않은 운전자가 증가할 가능성이 높으므로 개별 차량에 대한 관리와 감독이 어려워 위험운전행동이 빈번해질 수 있음을 시사한다. 또한, 사내 규정이나 운전자의 운전 습관 등 다양한 요인이 영향을 미칠 수 있다. 따라서 이러한 업체들은 운전자 교육과 훈련을 강화하고, 기술적 도구를 도입해 실시간 모니터링을 강화할 필요가 있다. 이러한 결과는 대규모 운수업체에 대한 엄격한 정책과 규제를 통해 위험운전행동을 줄이는 것이 중요함을 시사하며, Equation 2의 OLAP 연산 과정을 통해 도출하였다.

(2)
Drill-downontransportationcompany(fromalltocompanysize)Dicefor(measure=[Speeding|Long-termspeeding|Suddenacceleration|Suddenstart|Suddendeceleration|Suddenstop|Suddenleftturn|Suddenrightturn|SuddenU-turn|Suddenovertaking|Suddenlanechange])and(time=2019)and(transportationcompanybo

https://cdn.apub.kr/journalsite/sites/kst/2024-042-06/N0210420601/images/kst_2024_426_627_F8.jpg
Figure 8.

Risky driving behavior by size of transportation companies

총 216개의 운수업체 중 보유한 차량의 대수가 가장 많은 상위 10% Group 1; 30% Group 2; 50% Group 3; 70% Group 4; 나머지 Group 5로 5개의 그룹화 작업을 수행하였다. 그 결과, 각각의 Group에 속해있는 운수업체의 개수는 21개, 43개, 44개, 43개, 65개로 나타났다.

Table 3은 각 그룹의 한 개 운수업체별 면허 정지, 취소의 발생 횟수와 각 운수업체별 평균 면허 정지 비중(Rate of license suspension) 및 평균 면허 취소 비중(Rate of license revocation)을 보여준다. Group 1에서 1년간 한 운수업체별 평균 면허 정지 비중은 약 70회로 나타난 반면, Group 5에서 1년간 한 운수업체별 해당 비중은 약 11회로 현저히 낮은 수치로 나타났다. 또한, 한 운수업체별 평균 면허 취소 비중 역시 Group 1에서는 약 18회, Group 5에서는 약 6회로 비교적 낮은 수치로 관찰되었다. 따라서 각 운수업체의 규모별 위험운전행동 빈도는 면허 정지 및 취소와 높은 상관관계가 있는 것으로 보인다. 이는 면허 정지와 취소 결정이 주로 벌점, 누산점수에 기반을 둔다는 점을 고려할 때, 위험운전행동과 면허 정지 및 취소 간에 직접적인 연관이 있음을 시사한다.

Table 3.

License suspension and revocation rates per company in each group

Grouped License suspension Rate of license suspension License revocation Rate of license revocation
Group 1 1,463 69.67 371 17.67
Group 2 1,937 46.12 643 15.31
Group 3 1,765 42.02 531 12.64
Group 4 737 17.14 249 5.79
Group 5 714 11.33 370 5.87

그룹별 11대 위험운전행동 유형을 조사한 결과는 Figure 9에 나와 있으며, 급가속, 급감속, 급차선변경이 가장 빈번하게 발생한다는 사실을 보여준다. 본 시나리오 분석에서는 위험운전행동이 가장 빈번한 Group 1과 가장 적은 Group 5를 비교 분석한다. 분석에 사용된 측정값으로는 위험운전행동 유형 중 가장 많이 발생하는 급가속, 급감속, 급차선변경을 채택하여 분석을 진행한다.

각 업체의 등록 차량 수 대비 위험운전행동의 비율도 중요한 반면, 이 시나리오에서는 위험운전행동의 절대적인 수치가 가장 많은 운수업체를 파악하고자 분석을 진행하였다. 이는 등록 차량 수가 많더라도 위험운전행동의 빈도가 낮다면 상대적으로 안전한 운행을 하고 있다고 해석할 수 있다. 따라서, 절대적인 수치로 위험운전행동이 많은 업체를 파악함으로써, 보다 효과적인 안전 대책을 마련하고자 한다.

https://cdn.apub.kr/journalsite/sites/kst/2024-042-06/N0210420601/images/kst_2024_426_627_F9.jpg
Figure 9.

11 Risky driving behavior by group

1) Group 1과 Group 5의 비교 분석

Group 1과 Group 5의 비교 분석에 앞서, 각 그룹에 속한 운수업체 비율을 조사하였다(Figure 10 참조). 본 연구에서는 운수업체의 용도에 따라 범주를 Bus, Freight, Taxi로 구분한다. 여행사 및 시외버스, 시내버스는 ‘Bus’ 범주로 통합하고, 택배 및 기타 화물 관련 업체는 ‘Freight’로 통합하여 분석을 진행하였다. 그 결과, Group 1의 운수업체 21개 중 버스업체가 17개, 화물업체가 3개, 택시업체가 1개로 나타났으며, Group 5의 운수업체 65개 중 버스업체가 2개, 화물업체가 63개로 나타났다. 이처럼 그룹별 업체 분포의 차이가 존재하는 것은 분석 대상이 도시 지역이므로 화물 관련 업체 차량이 더 안전하게 운전하는 경향이 있다. 이는 본 연구의 한계로 향후 고속도로 등 다양한 도로 유형을 비교하여 더 의미 있는 분석을 수행할 수 있을 것이다.

https://cdn.apub.kr/journalsite/sites/kst/2024-042-06/N0210420601/images/kst_2024_426_627_F10.jpg
Figure 10.

Distribution of transportation companies in Group 1 and Group 5

2) 위험운전 유형별 운수업체의 특징 분석

앞서 언급한 위험운전의 유형 중 자주 발생하는 세 가지 유형을 측정값으로 하여 Group 1과 Group 5에 속한 운수업체들 중 상위 4개를 선정하여, 위험운전행동이 얼마나 자주 발생하는지 분석하였다(Figure 11 참조). Group 1은 상위 업체 4개는 모두 버스업체로 식별되었으며, Group 5의 상위 업체 4개는 모두 화물업체로 식별되었다.

https://cdn.apub.kr/journalsite/sites/kst/2024-042-06/N0210420601/images/kst_2024_426_627_F11.jpg
Figure 11.

Top 4 companies with the highest risky driving behavior in each group: (a) Group 1; (b) Group 2

Group 1의 경우, A 업체는 세 가지 유형 모두 다른 업체에 비해 훨씬 높은 빈도를 보여 위험운전행동이 빈번하게 발생하는 것으로 나타났다. B 업체와 C 업체는 급가속 유형의 빈도는 비슷한 수준으로 보였으나, 급감속 유형은 B 업체가, 급차선변경 유형은 C 업체가 더 높은 것으로 나타났다. D 업체는 Group 1에 속한 업체들 중 전반적으로 낮은 빈도의 위험운전행동을 보였다.

반대로 Group 5에서 A 업체와 B 업체는 급가속과 급감속 유형에서 보통 수준의 빈도를 보였으나, A 업체는 급차선변경에서는 가장 높은 빈도를 보였으며, B 업체는 급차선변경에서 가장 낮은 빈도를 보였다. C 업체는 급가속과 급감속이 가장 높게 나타났고 급차선변경의 유형 또한 높은 수준의 빈도를 보였다. D 업체는 다른 업체들에 비해 상대적으로 모든 위험운전행동 유형에서 낮은 빈도를 보인 것으로 확인하였다.

이러한 분석 결과는 운수업체별로 위험운전행동의 빈도와 유형이 다르게 나타나는 이유와 정당성을 설명하는 데 중요한 근거를 제공한다. Group 1의 버스업체들이 모든 유형의 위험운전행동에서 높은 빈도를 보이는 것은 버스 운전의 특성상 정해진 경로를 따라 운행하며, 반복적인 정차와 출발을 반복하기 때문일 수 있다. 이러한 운행 패턴은 급가속, 급감속, 급차선변경 같은 위험운전행동의 빈도를 높일 수 있다. 반면, Group 5의 화물업체가 전반적으로 낮은 빈도를 보이는 이유는 고속도로 주행이 많고, 일정한 속도로 장시간 운행하기 때문일 수 있다. 또한, 화물차는 화물의 안전을 위해 급작스러운 운전 변동를 최소화하려는 경향이 있다.

전반적으로 위험운전을 빈번하게 하는 업체는 Group 1에서는 A 업체, Group 5에서는 C 업체로 나타났다. 이처럼 각각의 그룹과 업체별로 위험운전행동에 대한 특성이 다양하다. 따라서 그룹별 및 기업별 맞춤형 안전관리 프로그램을 개발하면 운전자들의 위험운전행동을 효과적으로 감소시킬 수 있으며, 전반적인 도로 안전성을 향상시킬 수 있을 것으로 기대된다. 이러한 맞춤형 접근 방식은 각 운수업체의 특성과 필요에 맞추어 설계되어야 하며, 이를 바탕으로 보다 실효성 있는 사고 예방 및 안전 정책을 수립할 수 있다.

다음으로 개별 운전자의 특성을 살펴보기 위해, Group 1의 A 업체와 Group 5의 C 업체의 재직자 경력을 비교 분석한 결과에 대해 서술한다. Figure 12는 Group 1의 A 업체와 Group 5의 C 업체의 재직자 수를 현재 경력과 전체 경력 범주별로 비교하여 나타낸 것이다. ‘현재 경력’은 현재 재직 중인 운수업체에서 일한 기간을 의미하며, ‘전체 경력’은 직원이 여러 운수업체에서 일한 모든 기간을 합한 총 경력을 의미한다. 위험운전이 빈번한 Group 1의 A 업체는 재직자들의 현재 경력이 1-5년 사이를 제외하고 고르게 분포되어 있고, 전체 경력도 1년 미만을 제외하고 분포가 고르게 나타났다. 반면, 위험운전을 적게 하는 Group 5의 C 업체는 현재 경력이 10년을 초과하는 재직자가 존재하지 않으며, 전체 경력 역시 10년을 초과한 이후 급격히 감소하는 것을 확인하였다(Figure 12 참조).

https://cdn.apub.kr/journalsite/sites/kst/2024-042-06/N0210420601/images/kst_2024_426_627_F12.jpg
Figure 12.

Distribution of experience across each company: (a) Group 1 Company A; (b) Gorup 5 Company C

Group 1의 A 업체 재직자 수는 228명, Group 5의 C 업체의 재직자 수는 41명으로 총 재직자 수에 차이가 있음에도 불구하고, 전체적인 분포를 고려하였을 때 현재 경력이 10년 미만일 때와 전체 경력이 오래될수록 위험운전을 하는 경향이 있음을 보여준다. 이는 운전자의 경력과 위험운전행동의 빈도 사이에 상관관계가 있음을 의미하며, 경험이 많은 운전자일수록 위험운전행동의 빈도가 높다는 것을 나타낸다. 반대로 경험이 적은 운전자일수록 더 안전운전을 하는 경향이 있음을 시사한다. 이러한 결과는 경험이 많은 운전자들에게 지속적인 교육과 모니터링이 필요하다는 점과, 신입 운전자에 대한 초기 안전 교육 프로그램의 중요성을 강조한다. 따라서 운수업체는 운전자의 경력 분포에 맞춘 맞춤형 안전 관리 프로그램을 개발하면 전반적인 도로 안전성을 크게 향상시키고 위험운전행동의 발생률을 효과적으로 줄일 수 있을 것으로 기대된다.

이번 시나리오 분석을 요약하자면, 데이터 큐브와 OLAP 연산을 수행하여 운수업체 규모 및 개별 운전자의 특성에 따른 위험운전행동을 다각적으로 분석하였다. 분석 결과, 위험운전행동 중 급가속, 급감속, 급차선변경 유형이 가장 빈번하게 나타나는 것을 확인하였으며, 차량을 많이 보유한 대규모 운수업체일수록 위험운전행동의 빈도가 더 높은 것으로 나타났다. 이러한 대규모 운수업체로 묶여진 Group 1에서의 면허 정지 및 취소 비율이 높았으며, 버스업체의 비율이 상대적으로 높게 나타났다. 또한, 현재 재직 중인 운수업체에서의 경력이 10년 미만이고 전체 운수업 경력이 오래된 운전자일수록 위험운전행동을 더 자주 하는 경향이 관찰되었다. 이는 운전자의 경험과 위험운전행동 사이에 잠재적인 상관관계가 있음을 시사하며, 경험이 많은 운전자가 위험운전행동을 더 자주 한다는 것을 의미한다. 이러한 결과는 운수업체의 안전 관리 및 정책 수립에 있어 운전자 경력 관리의 중요성을 강조하며, 대규모 운수업체에 대한 더 효과적인 관리와 교육 정책이 필요함을 시사한다. 또한, 대규모 운수업체별 맞춤형 안전 교육 프로그램 및 엄격한 정책과 규제를 통해 위험운전행동을 줄이는 것이 중요함을 보여준다.

3. 시나리오Ⅱ : 시간대별 및 공간별 운수업체의 위험운전행동 분석

두 번째 시나리오에서는 시간대별 및 공간별로 운수업체의 위험운전행동에 대해 분석한다. 그중에서도 공간 분석을 진행하기 위해, Equation 3에 나타난 OLAP 연산과 같이 대전광역시의 위치 차원을 각 구별로 드릴다운한다.

(3)
Drill-downonlocation(fromalltodistrict)Dicefor(measure=[Speeding|Long-termspeeding|Suddenacceleration|Suddenstart|Suddendeceleration|Suddenstop|Suddenleftturn|Suddenrightturn|SuddenU-turn|Suddenovertaking|Suddenlanechange])and(time=2019)and(location=district)

그 결과, Figure 13은 대전광역시의 위험운전행동 빈도를 구별로 시각화한 것이다. 색상 그라데이션은 이러한 행동의 빈도를 나타내며, 노란색과 보라색은 각각 높은 빈도와 낮은 빈도를 나타낸다. 서구와 유성구의 위험운전행동 횟수는 각각 약 2,280만 회와 약 2,240만 회로 가장 높은 빈도를 보였다. 반면, 대덕구와 동구는 각각 보통의 빈도를 보였으며, 중구가 가장 낮은 빈도를 보였다. 서구와 유성구의 높은 빈도는 해당 지역의 도로 환경이나 교통 패턴과 관련이 있을 수 있다. 반면, 중구의 낮은 빈도는 비교적 안전한 도로 환경을 반영할 수 있다. 따라서, 서구와 유성구는 집중적인 안전 관리와 교육 프로그램이 필요하며, 대덕구와 동구도 추가적인 관리가 필요하다. 중구는 현재의 안전 관리 프로그램을 유지하면서 다른 지역에서 효과를 본 전략을 도입해 볼 수 있다. 이는 각 지역의 특성에 맞춘 맞춤형 안전 교육 및 관리 프로그램이 필요함을 강조한다.

https://cdn.apub.kr/journalsite/sites/kst/2024-042-06/N0210420601/images/kst_2024_426_627_F13.jpg
Figure 13.

Aggregate of risky driving behavior by district in Daejeon

반면, 지역별로 위험운전행동 빈도의 차이는 도로 구조나 지형적 요인으로 인해 위험운전행동 횟수가 지역별로 다르게 집계될 가능성을 시사한다. 이러한 원인을 보다 명확히 파악하기 위해 위치 차원을 법정동 단위로 OLAP 드릴다운 연산을 수행하여, 지도 위에서 더욱 세부적인 법정동 단위 분석을 진행한다(Equation 4 참조).

(4)
Drill-downonlocation(fromdistricttoneighborhood)Dicefor(measure=[Speeding|Long-termspeeding|Suddenacceleration|Suddenstart|Suddendeceleration|Suddenstop|Suddenleftturn|Suddenrightturn|SuddenU-turn|Suddenovertaking|Suddenlanechange])and(time=2019)and(location=neighborhood)

Equation 4의 OLAP 연산을 통해 얻어진 Figure 14(a)는 대전광역시 내 모든 법정동의 위험운전행동 횟수에 대한 분포를 보여준다. 색상 그라데이션은 위험운전행동의 빈도를 나타내며, 빨간색일수록 빈도가 높고 청록색일수록 빈도가 낮은 것을 나타낸다. 분포를 효과적으로 보기 위해 로그 변환을 적용함으로써 위험운전행동 횟수가 높게 집계되는 법정동과 낮게 집계되는 법정동을 명확히 구분하였다. 가장 높게 집계된 6개의 법정동을 추출해 본 결과, 서구의 둔산동, 월평동, 관저동, 도마동과 유성구의 봉명동, 대덕구의 비래동으로 나타났다. 특히, 둔산동은 위험운전행동의 빈도가 가장 높은 지역으로 나타났다. 이는 서구의 도로들이 도심 내 밀도가 높은 지역에 위치해 있어 서구에서 위험운전행동 발생 빈도가 높은 것으로 추정할 수 있다. 또한, 비래동과 관저동은 도심 외곽에 위치하며, 각각 대전 IC와 경부고속도로, 서대전 IC와 대전남부순환고속도로를 포함한다(Figure 14(b) 참조). 이러한 고속도로 인접성은 두 법정동에서의 위험운전행동 빈도가 다른 네 개의 법정동과 차별화되는 요인으로 작용할 수 있다. 이 결과를 바탕으로, Equation 5와 같이 추가적인 OLAP 연산을 수행하여 6개 법정동에서 위험운전행동을 자주 하는 운수업체들을 식별하였다.

(5)
Drill-downontransportationcompany(fromalltocompanytype)Dicefor(measure=[Speeding|Long-termspeeding|Suddenacceleration|Suddenstart|Suddendeceleration|Suddenstop|Suddenleftturn|Suddenrightturn|SuddenU-turn|Suddenovertaking|Suddenlanechange])and(time=2019)and(location=neighborhood)

https://cdn.apub.kr/journalsite/sites/kst/2024-042-06/N0210420601/images/kst_2024_426_627_F14.jpg
Figure 14.

Aggregate of risky driving behavior by neighborhood in Daejeon (a) Overview; (b) Close-up

그 결과, Figure 15에서 나타나듯이 도심에 위치하고 일반도로가 밀집된 둔산동, 월평동, 도마동, 봉명동에서는 택시와 버스 운수업체의 위험운전행동이 높게 나타났다. 이는 해당 지역들이 상업 지구와 주거 지역이 혼재된 복잡한 교통 환경을 가지고 있어 차량 운행이 빈번하고 교통량이 많기 때문으로 추정된다. 특히, 이러한 지역에서는 출퇴근 시간대에는 교통 체증이 심화되어 운전자들이 급가속, 급감속, 급차선변경과 같은 위험운전행동을 할 가능성이 높아진다고 판단된다. 반면, IC와 고속도로를 포함하는 관저동과 비래동에서는 화물 운수업체의 위험운전행동이 상대적으로 높게 나타났다. 이는 이 지역들이 주요 물류 거점으로 사용되며, 고속도로와 IC를 통해 대규모 화물 운송이 이루어지기 때문으로 볼 수 있다. 관저동과 비래동은 고속도로를 포함하고 있음에도 버스 운수업체의 위험운전행동 횟수가 높게 나타났다. 이러한 이유는 시내버스뿐만 아니라 관광버스 및 여행사 버스들을 ‘Bus’ 범주로 통합하였으므로, 이와 같은 결과를 도출하였다고 추정할 수 있다.

시간대별 분석을 진행하기에 앞서, 위치 차원에 대한 롤업 연산을 수행하여 유의미한 결과를 확보하였다. 특히, 시나리오 1에서 주목할 만한 결과를 보인 급가속, 급감속, 급차선변경 세 가지 위험운전행동을 측정값으로 하여, Equation 6의 OLAP 연산을 통해 위험운전행동이 가장 많이 집계되었던 서구의 위험운전행동 횟수를 도출하였다.

(6)
Roll-uponlocation(fromneighborhoodtodistrict)Dicefor(measure=[Suddenacceleration|Suddendeceleration|Suddenlanechange])and(time=2019)and(location=district)(transportationcompany=all)Sliceonlocation(district=Seo-gu)

https://cdn.apub.kr/journalsite/sites/kst/2024-042-06/N0210420601/images/kst_2024_426_627_F15.jpg
Figure 15.

Type of transportation companies in the Top 6 neighborhood

Equation 6의 OLAP 연산 결과로 얻은 Figure 16에 따르면, 둔산동은 다른 법정동들에 비해 위험운전행동 횟수가 현저히 높다는 것을 다시 한번 확인하였다. 이는 둔산동과 같은 고위험 지역에 교통 카메라 및 모니터링 시스템을 추가 설치하여 표적화된 안전 개입의 필요성을 강조한다. 이를 바탕으로, 분석을 더욱 정교화하고 보다 세부적인 안전 관리 전략을 개발하기 위해 위험운전행동이 가장 많이 발생하는 시간대를 파악하고자 시간 차원에서의 추가적인 OLAP 드릴다운 연산을 수행한다(Equation 7 참조).

(7)
Drill-downontime(fromalltohour)Drill-downonlocation(fromdistricttoneighborhood)Dicefor(measure=[Suddenacceleration|Suddendeceleration|Suddenlanechange])and(time=hour)(location=neighborhood)Sliceonlocation(neighborhod=Dunsan-dong)

https://cdn.apub.kr/journalsite/sites/kst/2024-042-06/N0210420601/images/kst_2024_426_627_F16.jpg
Figure 16.

Aggregate of risky driving behavior in Seo-gu

Figure 17은 둔산동의 시간대별 위험운전행동 횟수의 집계를 보여준다. 분석 결과, 일반적인 출근 시간대인 7-9시와 퇴근 시간대인 18-19시에 위험운전행동 횟수가 증가하는 것을 확인할 수 있다. 또한, 택시 요금 심야 할증이 적용되기 전인 22시에도 위험운전행동 횟수가 증가하는 경향이 관찰되었다. 버스와 택시가 많이 검출된 지역이므로, 버스가 운행하지 않는 새벽 시간대에 위험운전행동 횟수가 현저히 감소하는 것으로 나타났다.

https://cdn.apub.kr/journalsite/sites/kst/2024-042-06/N0210420601/images/kst_2024_426_627_F17.jpg
Figure 17.

Number of risky driving behavior by time in Dunsan-dong

이는 위험운전행동의 빈도가 증가하는 주요 시간대에 교통 모니터링과 단속을 강화하는 등의 표적화된 개입이 둔산동의 교통 안전을 개선하는 데 도움이 될 수 있다는 점을 시사한다. 또한, 이러한 주요 시간대에 초점을 맞춰 운수업체 내 운전자를 대상으로 맞춤형 안전 교육프로그램을 설계 및 시행의 필요성을 강조한다.

결론

본 연구에서는 디지털 운행 기록장치(DTG) 데이터를 활용하여 상업용 차량의 위험운전행동에 대한 다차원 분석을 수행하였다. 데이터 큐브 모델과 OLAP 기법을 통해 운수업체 규모 및 개별 운전자의 특성에 따른 위험운전행동의 패턴을 식별하고, 이를 다양한 차원에서 조망하였다. 분석 결과, 급가속, 급감속, 급차선변경 유형의 위험운전행동이 가장 많이 발생하는 것으로 나타났다. 또한, 운수업체의 규모와 위험운전행동 사이의 상관관계를 확인하였으며, 위험운전행동 횟수가 높게 집계된 운수업체가 상대적으로 면허 정지 및 취소율이 높음을 확인하였다. 개별 운전자의 관점에서 살펴보면 경험이 많은 운전자에게서 위험운전행동이 빈번하게 관찰되었다. 특히 대전광역시 서구 둔산동에서의 급가속 유형이 출근 시간 및 퇴근 시간에 높게 나타나는 등 시간과 지역에 따른 위험운전행동의 차이를 밝혔다.

이러한 분석결과는 상업용 차량 운전자에 대한 추가적인 안전 교육, 평가 기준 설정 및 감시 체계를 구축하는 데 활용될 수 있다. 이를 통해 면허 정지 및 취소율 감소에 기여하고, 급가속 및 급감속과 같은 위험운전행동 유형에 대한 교육 프로그램을 개발하여 사고 예방을 위한 정책 수립에 중요한 기초 자료를 제공할 수 있다. 또한, 특정 지역에서의 위험운전행동 패턴을 반영한 도로 환경 개선 방안을 검토하는 것도 중요하다. 특정 시간대에 높게 나타나는 급가속 유형의 위험운전행동을 줄이기 위해 모니터링 단속을 강화하거나 특정 도로구간의 신호 체계 개선 및 추가적인 표지판 설치 등의 조치를 고려할 수 있다. 이러한 노력을 통해 상업용 차량의 위험운전행동에 대한 이해를 높임으로써, 더 안전한 도로 환경을 조성하는 데 기여할 수 있을 것으로 기대된다.

향후 연구에서는 다양한 지역 및 시간대에 대한 분석을 확대하여, 위험운전행동과 교통사고 사이의 인과관계를 더욱 상세히 밝히는 데 집중할 필요가 있다. 예를 들어, 서울이나 부산과 같은 대도시 지역에서의 위험운전행동 패턴을 비교하여 지역 간 차이점을 분석하고, 버스, 택시, 화물차 등의 업종별로 데이터를 세밀하게 구분하여 각 업종별로 위험운전행동의 특성을 비교 분석 및 특정 유형의 상업용 차량에 대한 개별적인 연구도 고려할 수 있다. 또한, 실시간 데이터를 통한 예측 모델을 개발하여 실시간 교통 관리와 사고 예방에 활용할 수 있는 시스템을 설계하는 방향으로 연구를 확장하는 것이 유망하다. 이러한 연구는 상업용 차량 관련 교통안전 정책 수립에 있어 실질적인 영향력을 미칠 것이며, 더 나아가 상업용 차량의 운전자들뿐만 아니라 일반 운전자들의 안전운전 습관 형성에도 기여할 것으로 기대된다.

본 연구에서 제시한 분석 방법론과 결과들은 데이터 기반 의사결정 프로세스에 있어 중요한 롤모델이 될 수 있다는 점에 의의를 두며, 향후 스마트 교통 시스템의 발전에 시사점을 제공할 것이다. DTG 데이터와 같은 대규모 교통 데이터를 활용한 연구의 중요성은 계속해서 증가하고 있으며, 이는 교통안전 연구뿐만 아니라 교통 시스템의 효율성 향상을 위한 연구에도 중요한 토대가 될 것이다. 상업용 차량 운전자의 안전과 추가 피해에 대한 안전을 보장하고, 교통사고 발생률을 낮추는 것은 우리 사회가 직면한 중요한 도전 과제 중 하나이다. 본 연구는 이러한 도전에 대응하기 위한 연구의 필요성을 강조하며, 다차원 데이터 분석 방법론의 유효성을 입증하였다. 지속적인 연구와 데이터 기반의 정책 개발을 통해 우리는 더 안전한 운전습관을 형성하며 안전한 도로 환경과 안전 전략을 수립하는 데 필수적인 지침을 제공할 것이다.

Funding

This research was supported by the Soonchunhyang University Research Fund and the Support Program for University Development.

This research was financially supported by the Ministry of Trade, Industry and Energy(MOTIE) and Korea Institute for Advancement of Technology(KIAT) through the International Cooperative R&D program. (P0025819)

References

1

Ahn S. H., Shin Y. E. (2018), Analysis of Tax Passenger Travel Patterns Based on Busan DTG Data, J. Korean Soc. Civil Eng., 38(6), Korean Society of Civil Engineers, 907-916.

2

Boutkhoum O., Hanine M. (2017), An Integrated Decision-Making Prototype Based on OLAP Systems and Multicriteria Analysis for Complex Decision-Making Problems, Appl. Informatics, 4, Springer Berlin Heidelberg, 1-24.

10.1186/s40535-017-0041-6
3

Chen H., Zhao Y., Ma X. (2020), Critical Factors Analysis of Severe Traffic Accidents Based on Bayesian Network in China, J. Adv. Transp., 2020, 1-14.

10.1155/2020/8878265
4

Chen S., Xue Q., Zhao X., Xing Y., Lu J. J. (2021), Risky Driving Behavior Recognition Based on Vehicle Trajectory, Int. J. Environ. Res. Public Health, 18(23), 12373.

10.3390/ijerph18231237334886099PMC8656887
5

Cho J. S., Lee H. S., Lee J. Y., Kim D. N. (2017), The Hazardous Expressway Sections for Drowsy Driving Using Digital Tachograph in Truck, J. Korean Soc. Transp., 35(2), Korean Society of Transportation, 160-168.

10.7470/jkst.2017.35.2.160
6

Eavis T., Dimitrov G., Dimitrov I., Cueva D., Lopez A., Taleb A. (2010), Parallel OLAP With the Sidera Server, Future Gener. Comput. Syst., 26(2), 259-266.

10.1016/j.future.2008.10.007
7

Eun S. J. (2020), Trends in Mortality From Road Traffic Injuries in South Korea, 1983-2017: Joinpoint Regression and Age-Period-Cohort Analyses, Accid. Anal. Prev., 134, 105325.

10.1016/j.aap.2019.10532531706185
8

Fellendorf M., Vortisch P. (2001), Validation of the Microscopic Traffic Flow Model VISSIM in Different Real-World Situations, Transp. Res. Board 80th Annu. Meet., 11.

9

Han J., Kamber M., Pei I. (2006), Data Mining: Concepts and Techniques, Morgan Kaufmann, 275.

10

Jang J. M., Lee Y. I., Lim J. K. (2017), Analysis of Risk Driver Discrimination Considering Driver's Behavior Based on Digital Tachograph (DTG), J. Transp. Res., 24(4), 63-77.

10.34143/jtr.2017.24.4.63
11

Kar P., Venthuruthiyil S. P., Chunchu M. (2024), Crash Risk Estimation of Heavy Commercial Vehicles on Horizontal Curves in Mountainous Terrain Using Proactive Safety Method, Accid. Anal. Prev., 199, 107521.

10.1016/j.aap.2024.10752138428243
12

Kim S. J., Joo J. H., Choo S. H., Lee H. S. (2018), Analysis of Dangerous Bus Driving Behavior Using Express Bus Digital Tachograph Data, J. Korean ITS Soc., 17(2), 87-97.

10.12815/kits.2018.17.2.87
13

Kim Y. W., Kang J. G. (2015), Implementation of Real-Time Dangerous Driving Behavior Analysis Utilizing the Digital Tachograph, J. Korea Soc. Comput. Inf., 20(2), 55-62.

10.9708/jksci.2015.20.2.055
14

Korea Transportation Safety Authority (2024), Commercial Vehicle Risk Driving Behaviors Analysis, https://etas. kotsa.or.kr/etas/frtl0401/pop/goList.do, 2024.02.08

15

Lee K. Y., Chung Y. D., Kim M. H. (2010), An Efficient Method for Maintaining Data Cubes Incrementally, Inf. Sci., 180(6), 928-948.

10.1016/j.ins.2009.11.037
16

Lee M. H., Kim Y. C. (2020), Queue Length Estimation Algorithm for Signalized Intersections Using Taxi DTG Data, J. East. Asia Soc. Transp. Stud., 38, 68-83.

10.7470/jkst.2020.38.1.068
17

Lee S. J., Lee C. (2012), Short-Term Impact Analysis of DTG Installation for Commercial Vehicles, J. Korea Inst. ITS, 11(6), 49-59.

10.12815/kits.2012.11.6.049
18

Mir M. U., Razzak J. A., Ahmad K. (2013), Commercial Vehicles and Road Safety in Pakistan: Exploring High-Risk Attributes Among Drivers and Vehicles, Int. J. Inj. Control Saf. Promot., 20(4), 331-338.

10.1080/17457300.2012.73371323092513
19

Moridpour S., Sarvi M., Rose G., Mazloumi E. (2012), Lane-Changing Decision Model for Heavy Vehicle Drivers, J. Intell. Transp. Syst., 16(1), 24-35.

10.1080/15472450.2012.639640
20

Noh B., Son J., Park H., Chang S. (2017), In-Depth Analysis of Energy Efficiency Related Factors in Commercial Buildings Using Data Cube and Association Rule Mining, Sustainability, 9(11).

10.3390/su9112119
21

Noh B., Yeo H. (2021), SafetyCube: Framework for Potential Pedestrian Risk Analysis Using Multi-Dimensional OLAP, Accid. Anal. Prev., 155, 106104.

10.1016/j.aap.2021.10610433819792
22

Noh B., Yeo H. (2022), A Novel Method of Predictive Collision Risk Area Estimation for Proactive Pedestrian Accident Prevention System in Urban Surveillance Infrastructure, Transp. Res. C Emerg. Technol., 137, 103570.

10.1016/j.trc.2022.103570
23

Pantangi S. S., Fountas G., Anastasopoulos P. C., Pierowicz J., Majka K., Blatt A. (2020), Do High Visibility Enforcement Programs Affect Aggressive Driving Behavior? An Empirical Analysis Using Naturalistic Driving Study Data, Accid. Anal. Prev., 138, 105361.

10.1016/j.aap.2019.10536132105837
24

Park D., Yu J., Park J. S., Kim M. S. (2013), NetCube: A Comprehensive Network Traffic Analysis Model Based on Multidimensional OLAP Data Cube, Int. J. Netw. Manag., 23(2), 101-118.

10.1002/nem.1818
25

Park E. M., Kang J. H., Bilal M., Lee S. H. (2020), Analysis of Dangerous Driving Behavior by Bus Type Using Digital Tachograph in Sejong City, J. Korean Soc. Transp., 38(6), Korean Society of Transportation, 462-472.

10.7470/jkst.2020.38.6.462
26

Seoul Research Institute (2014), Analyzing the Usage and Operation Behavior of Taxies through Integrated Digital Tachograph (IDTG), 1-95.

27

Singh H., Kathuria A. (2021), Analyzing Driver Behavior Under Naturalistic Driving Conditions: A Review, Accid. Anal. Prev., 150, 105908.

10.1016/j.aap.2020.10590833310431
28

Traffic Accident Analysis System, http://taas.koroad.or.kr, 2024.03.10.

29

Trirat P., Lee J. G. (2021), DF-TAR: A Deep Fusion Network for Citywide Traffic Accident Risk Prediction With Dangerous Driving Behavior, Proc. Web Conf. 2021, 1146-1156.

10.1145/3442381.3450003
30

World Health Organization (2015), Global Status Report on Road Safety 2015, World Health Organization.

31

Xu Z., Lee J., Park D., Chung Y. (2017), Multidimensional Analysis Model for Highly Pathogenic Avian Influenza Using Data Cube and Data Mining Techniques, Biosyst. Eng., 157, 109-121.

10.1016/j.biosystemseng.2017.03.004
32

Yan M., Chen W., Wang J., Zhang M., Zhao L. (2021), Characteristics and Causes of Particularly Major Road Traffic Accidents Involving Commercial Vehicles in China, Int. J. Environ. Res. Public Health, 18(8), 3878.

10.3390/ijerph1808387833917131PMC8067832
33

Zhang D., Zhai C., Han J. (2009), Topic Cube: Topic Modeling for OLAP on Multidimensional Text Databases, Soc. Ind. Appl. Math. Proc. Appl. Math., 3, Society for Industrial and Applied Mathematics, 1124-1135.

10.1137/1.9781611972795.96
페이지 상단으로 이동하기