서론
선행연구
1. 교통사고 분석 연구
2. 시나리오 도출 연구
3. 차별성
자율주행차 도심부 사고 시나리오 생성 방법론
1. 자율주행차 사고 데이터 수집 및 전처리
2. 연관규칙 분석
3. 자율주행차 사고 시나리오 생성을 위한 요소 선정
분석 결과
1. 자율주행차 사고 데이터 기초 통계
2. 연관규칙 분석 결과
자율주행차 도심부 사고 시나리오 생성
1. 사고 시나리오 도출
2. 자율주행차 사고 시나리오 비교 분석
결론 및 향후 연구
서론
최근 자율주행자동차(Autonomous Vehicle, 이하 자율주행차)를 위한 법적, 윤리적, 사회적 측면 등 제도적인 고려와 함께 기술의 진보를 통해 자율주행차 3단계 상용화가 가시화되고 있다. SAE(Society of Automotive Engineers)는 기술 수준에 따라 자율주행차 단계를 6단계(레벨 0-레벨 5)로 구분하였으며, 단계가 올라갈수록 인간의 개입이 최소화되고 차량에 탑재된 자율주행시스템(Autonomous Driving System, ADS)이 스스로 다양한 상황을 대처해야 한다. 구글, 현대 등 여러 기업에서 자율주행차가 직면하는 다양한 상황을 스스로 대처할 수 있는 고도화된 자율주행시스템을 개발하고 있으며, 국내에서도 상암, 판교 등 시범운행지역을 선정하여 4단계 자율주행차의 시범 운행을 수행하고 있다. 그러나 자율주행차 사고는 끊임없이 발생하고 있으며, 이상적인 상황에서도 사고가 발생할 수 있다는 의견이 제시됨에 따라(Goodall, 2014; Kang et al., 2020; Kang et al., 2022a) 자율주행차 안전성에 대한 이슈가 제기되고 있다. 이처럼 단순히 기술의 진보만으로 자율주행차의 상용화를 보장할 수 없으므로 안전성을 확보할 수 있는 체계가 요구되는 실정이다.
자동차의 안전성을 확보하는 방법으로 자동차 안전도 평가(New Car Assessment System, NCAP)가 존재하며, 이는 충격 실험을 통해 차량의 종합적인 안전성을 평가하여 소비자에게 자동차의 안전도에 관한 정보를 제공하는 제도이다. 도로 위를 주행하는 모든 차량은 안전성을 보장할 수 있는 평가제도가 요구되므로 자율주행차 또한 NCAP 내 포함되어 평가가 진행되고 있다. 자율주행차 안전성 평가시스템은 자율주행시스템에 대한 평가로 전방 충돌 방지 보조 시스템(Forward Collision-Avoidance Assist, FCA), 차로 유지 보조 시스템(Lane Following Assist, LFA) 등을 활용하고 있다. 그러나, 자율주행차는 일반 차량과 달리 복잡한 환경에서 특정 상황을 대응할 수 있어야 하므로 다양한 환경에서의 평가가 요구되어 시나리오 기반 접근법이 제시되고 있다(ISO 26262, 2018; PEGASUS Project Consortium, 2019; de Gelder et al., 2020; Riedmaier et al., 2020; Steimle et al., 2021). 시나리오 접근법은 실제 도로 운행 및 시뮬레이션 등을 통해 다양한 환경을 고려하여 조절할 수 있으며, 정교하게 설계된 모든 시나리오를 다룰 수 있기 때문에 다양한 환경에서의 종합적 평가를 가능하게 한다는 장점이 존재한다. 이러한 자율주행차 평가를 위한 시나리오 접근법은 지식 기반 접근법(Knowledge-based extraction)과 데이터 기반 접근법(Data-driven extraction)으로 구분된다(Riedmaier et al., 2020). 지식 기반 접근법의 경우, 온톨로지 방식을 활용하여 전문가 지식을 통해 차선변경, 우회전, 좌회전 등 다양한 상황 대한 목록을 사전에 분류하여 시나리오를 빠르게 생성할 수 있으나 시나리오 자체에 대한 대표성의 문제가 제기될 수 있다. 반면, 데이터 기반 접근법은 실제 데이터와 머신러닝 및 딥러닝 등을 활용하여 시나리오를 생성하는 방식으로 시나리오 대표성의 문제를 극복할 수 있으나, 데이터 정제 및 인공지능 등의 요건을 충족하지 못할 경우 시나리오를 생성할 수 없다는 전제조건이 존재한다. 이러한 조건이 충족될 경우 데이터 및 방법론에 따라 시나리오의 신뢰성 및 구체성을 확보할 수 있어 최근 데이터 기반 접근법 연구가 다양하게 수행되고 있다. 또한, 자율주행차는 고속도로 및 도심도로 환경에서 ODD(Operational Design Domain)가 상이하기 때문에 고속도로와 도심도로를 나누어 시나리오를 제시할 필요가 있다. 특히 도심 도로의 경우. 일반 차량 뿐만 아니라 복잡한 인프라 및 보행자가 혼재된 공간으로 여러 객체 간의 상호작용이 발생함에 따라 자율주행차 사고의 발생 빈도와 인명피해 확률이 높음에 따라 시나리오의 필요성이 제기되고 있다(Son et al., 2021).
이에 본 연구는 자율주행차와 일반 차량이 혼재하는 상황에서 발생하는 사고상황을 대상으로 자율주행차의 도심부 시나리오를 도출하는 방법론을 개발하고, 이를 기반으로 신뢰성과 구체성을 확보한 자율주행차의 사고 시나리오를 제시하고자 한다.
선행연구
1. 교통사고 분석 연구
교통사고는 매년 많은 사망자와 부상자를 낳으며, 이로 인해 사회적 비용도 상당한 규모로 발생하고 있다. 이에 교통사고 예방은 매우 중요한 과제임에 따라 교통사고의 원인을 분석하는 연구가 수행되고 있다. 이는 일반 차량의 사고와 자율주행차의 사고를 대상으로 수행되고 있으며, 다양한 사고데이터를 활용하여 수행되고 있다. 일반 차량을 대상으로 교통사고의 부상 및 사고 심각도를 예측하고, 심각도와 연관된 사고 요인을 파악하여 사고의 패턴을 도출하는 연구가 수행되고 있으며(Shanthi and Ramani., 2012; Taamneh et al., 2017; Bahiru et al., 2018), 충돌 방식, 연령대, 약물 및 음주 유무, 성별 등이 심각도에 유의미한 영향을 미치는 요소임을 확인하였다. 또한, 데이터마이닝 기법을 활용하여 교통사고의 원인을 파악하는 연구가 수행되고 있으며, 사고 데이터와 방법론에 따라 날씨, 조명 상태, 신호위반 유무 등이 교통사고의 원인으로 도출되었다(Park et al., 2006; Li et al., 2017; Muhammad et al., 2017; Bhin and Son, 2018; Bhin et al., 2020; Kim et al., 2020; DrissiTouzani et al., 2020). 특히, Kumar and Toshniwal(2016)은 사고 발생 위치의 공간적 분석을 통해 사고의 특징과 원인을 분석하였다. 저자는 k-means 알고리즘을 활용하였으며, 사고 빈도를 기준으로 사고의 군집화를 진행하고 군집을 기준으로 연관규칙 분석을 수행하였다. 분석 결과, 고속도로 교차로와 보행자 충돌사고가 연관성이 높은 것을 확인하였으며, 사고가 다수 발생하는 군집은 대부분 구릉지에서 발생한 이륜차 사고로 구성되어 있는 것을 확인하였다. 자율주행차의 경우, 일반 차량에 비해 사고가 다수 발생하지 않으며, 사고데이터는 제작사의 기밀사항으로 접근이 제한되어 있다. 이에 대부분의 연구는 캘리포니아의 DMV collision report(이하 DMV 사고 보고서)를 활용하여 자율주행차의 사고를 분석하는 연구를 수행하고 있다(Leilabadi et al., 2019; Das et al., 2020; Torres et al., 2021; Ashraf et al., 2021; Kang et al., 2022c). DMV 사고 보고서는 자율주행차의 사고를 기록한 보고서로 사고 당시의 날씨, 위치, 차량의 종류 및 움직임 등 다양한 데이터를 제공한다(https://www.dmv.ca.gov). DMV 사고 보고서를 활용한 교통사고 분석을 통해 대부분의 사고는 자율주행차가 정지하고 있는 상황에서 후방 추돌형태인 것을 확인하였으며(Ashraf et al., 2021; Torres et al., 2021), 좌회전, 우회전 상황에서 측면 충돌사고가 빈번하게 발생하는 것을 확인하였다(Das et al., 2020; Ashraf et al., 2021). 특히, Leilabadi et al.(2019)은 DMV 사고 보고서의 심층 분석을 통해 사고의 심각도와 도로 표면 상태의 상관관계가 있는 것을 확인하였으며, 다양한 사고 요인 중 도로 표면의 변화와 기상조건을 자율주행차의 사고와 밀접한 연관이 있는 사고 요인으로 선정하였다.
2. 시나리오 도출 연구
교통사고 예방을 위해 다양한 노력이 이루어지고 있으며, 보다 적극적으로 사고를 사전에 방지할 수 있는 시나리오 접근법이 제시됨에 따라 시나리오를 도출하는 연구가 수행되고 있다. 사고 시나리오는 일반 차량의 사고데이터를 기반으로 인공지능(Yuan et al., 2020; Yu et al., 2020; Kang et al., 2022b)과 데이터 마이닝 기법(Lenard et al., 2014; Nitsche et al., 2017; Sui et al., 2019)을 활용하여 작성되고 있다. Kang et al.(2022b)은 일반 차량의 사고데이터와 vision transformer를 활용하여 사고 취약상황을 분류하고 사고 취약상황 시나리오를 제시하였다. 위 연구는 TTC(Time-To-Collision)를 기준으로 사고 이전의 상황을 4가지(Normal, Pre-collision, Collision, Post-collision)로 분류하였으며, vision transformer의 학습을 통해 94%의 분류정확도를 도출하였다. 또한, Pegasus project에서 제시한 시나리오 템플릿을 기반으로 구체적인 사고 취약상황의 상황 시나리오를 제시하였다. 데이터 마이닝 기법을 활용하는 연구는 대부분 클러스터링과 연관규칙 분석을 진행하였으며, 이를 통해 보행자 사고(Lenard et al., 2014), 교차로 충돌 시나리오(Nitsche et al., 2017), 자동차-이륜차 시나리오(Sui et al., 2019) 등 다양한 상황의 시나리오가 도출되었다. 이처럼 일반 차량의 사고를 예방하기 위해 단순 사고 분석이 아닌 시나리오를 도출하는 연구가 수행되고 있다. 나아가 자율주행차 사고의 발생 가능성 또한 고려되고 있어 이를 사전에 예방하기 위해 자율주행차의 시나리오를 도출하는 연구가 수행되고 있다. 자율주행차 시나리오는 DMV 사고 보고서를 기반으로 통계 분석(Liu et al., 2021; Favarò et al., 2017), 데이터 마이닝(Song et al., 2021), 토픽 모델링(Alambeigi et al., 2020) 기법 등을 활용하여 도출되고 있다. 특히, Liu et al.(2021)은 통계 분석을 통해 일반 차량과 자율주행차의 시나리오가 상이한 것을 확인하였다. 이에 저자는 일반 차량 데이터를 활용한 시나리오를 자율주행차에 그대로 적용하는 것에 한계가 존재하는 것을 지적하였으며, 자율주행차의 시나리오는 자율주행차의 데이터를 활용해야 하는 것을 강조하였다. 또한, Favarò et al.(2017)은 DMV 사고 보고서와 DMV 제어권 전환 보고서의 통계 분석을 통해 자율주행차 사고의 특징을 추출하였으며, 빈번하게 발생하는 사고 시나리오를 도출하였다. 위 연구는 동적 객체의 움직임에 따라 26개의 사고 시나리오를 제시하였으며, 통계 분석을 통해 대부분 자율주행차 사고는 교차로 사고 및 자율주행차가 전방에 위치한 후방 추돌형태임을 확인하였다. 또한, 제어권 전환 보고서 분석을 통해 후방 추돌시, 제어권 전환을 위해 인지 및 대응하는 과정에서 인간과 유사한 결함이 존재한다는 것을 주장하였다.
3. 차별성
선행연구 고찰 결과, 일반 차량과 자율주행차의 교통사고를 예방하기 위해 사고의 원인을 분석하는 연구와 사고를 선제적으로 예방하기 위해 시나리오를 도출하는 연구가 수행되고 있다. 대부분 상관분석 등의 통계적 기법을 활용하였으며, 연관규칙 분석, 클러스터링 등 데이터 마이닝 기법을 통해 사고의 원인 분석 뿐만 아니라 다양한 상황의 시나리오를 생성하는 것을 확인하였다. 특히, 선행연구를 통해 일반 차량과 자율주행차 시나리오의 특성이 상이하였으며, 자율주행차 시나리오의 신뢰성을 확보하기 위해 자율주행차 데이터를 필수적으로 활용해야 하는 것을 확인하였다. 또한, 자율주행차 데이터는 제작사의 기밀 사항으로 접근이 제한되어 있어, 대다수의 연구는 캘리포니아의 DMV 사고 보고서를 활용하였다. 그러나, 선행연구는 보고서 분석을 통해 시나리오를 제시하였으나 실질적인 평가를 위해 사용할 수 있는 시나리오의 형태를 갖추지 못해 구체성이 부족한 한계를 지닌다. 이에 본 연구는 자율주행차 데이터인 DMV 사고 보고서를 활용한 연관규칙 분석을 통해 사고 요인 간의 연관성을 분석하고, 추출된 연관규칙을 기반으로 사고 시나리오의 요인을 선정하여 자율주행차의 도심부 사고 시나리오를 도출하고자 하며, 이를 통해 시나리오의 신뢰성과 구체성을 확보한 것에 차별성이 존재한다.
자율주행차 도심부 사고 시나리오 생성 방법론
자율주행차의 사고 시나리오 생성을 위한 전체적인 프레임워크는 다음과 같다(Figure 1).
1. 자율주행차 실사고 데이터를 수집하고 전처리한다(Step 1).
2. 연관규칙 분석을 통해 사고 요인의 관계를 파악하고, 시나리오 요소를 선정한다(Step 2 & Step 3).
3. 연관규칙을 조합하여 자율주행차의 사고 시나리오를 제시한다(Step 4 & Step 5).
1. 자율주행차 사고 데이터 수집 및 전처리
본 연구는 미국 캘리포니아 DMV에서 제공하는 사고 보고서를 활용하여 자율주행차의 사고 데이터베이스를 구축하였다. GM, Waymo, Zoox 등의 여러 제작사는 자율주행차 학습 데이터 구축, 자율주행 기술의 고도화 등을 위해 캘리포니아에서 실도로를 주행하고 있다. 이때 사고가 발생할 경우, 정보를 기록하여 캘리포니아 DMV에 보고서를 제출해야 한다. 해당 보고서는 제작사, 주행모드와 더불어 도로 조건, 사고 발생 시간 뿐만 아니라 사고와 연관된 차량(Vehicle 1(Autonomous Vehicle, 자율주행차, 이하 AV), Vehicle 2(Human-driven Vehicle, 일반 차량, 이하 HV))의 충돌 전 움직임, 상대적 위치, 충돌 형태 등의 정보를 개별적으로 제공하고 있다. 모든 DMV 보고서를 검토한 결과, 2018년 이후에 보고서의 형태가 개정되었으며 개정 이전과 대비하여 다양한 정보를 제공하는 것을 확인하였다. 또한, 보고서에서는 수동 운전 모드(Conventional mode)와 자율주행 모드(Autonomous mode)에 대한 정보를 제공하였다. 이에 따라 자율주행차 사고 시나리오를 작성하는 본 연구의 목적에 적합하다고 판단되는 자율주행 모드에서 발생한 개정 이후의 사고 보고서 165건을 활용하였다.
165건의 데이터를 검토한 결과, 보고서를 작성하는 가이드라인이 존재하지 않아 제조사별로 충돌 형태를 작성하는 방식이 상이한 것을 확인하였다. 충돌 형태는 AV와 HV가 개별적으로 작성되어 있었으며, 후방 추돌과 측면 충돌의 경우 제조사별로 작성방식이 상이하였다. 이처럼 동일한 충돌 형태임에도 작성방식이 상이할 경우, 분석으로 도출된 결과의 해석이 불가능하다. 이에 후방 추돌은 (N/A, Rear-end)로 작성하였으며, 측면 충돌은 (Sideswipe, Sideswipe)로 작성하는 데이터 통일화를 진행하였다(Table 1).
Table 1.
Result of data unification
이후, 사고 요인을 선별하였다. DMV 사고 보고서의 경우, Figure 2의 형태로 구성되어있으며, 부가적인 상세 사항의 경우 Figure 3과 같이 사고 경위가 서술되어있다. 이에 따라 본 연구에서는 고정적으로 제공되는 요소(Figure 2)를 우선적으로 활용하고 사고 경위에 표시된 요소(Figure 3)를 활용하여 총 24개의 사고 요인을 확인하였으며, 연구 목적에 맞도록 사고 요인을 선별하였다. 사고 요소 선별 과정에서 제조사 정보와 사고 후 정보(AV 파손 정도, HV 파손 정도, 인간 상해 정보 등)를 제거하였으며, 사고가 발생한 위치의 세부 주소 정보(Address/City/County/State)가 사고별로 상이하여 해당 위치의 도로 형태(Location)로 대체하였다. 또한, 사고 당시 차량의 속성을 파악할 수 있는 중요 요인인 차량 속도의 경우, 보고서에 따라 사고 경위 서술란(Figure 3)에 제공되고 있으나 80% 이상의 보고서에서 제공되고 있지 않아 이를 제거하였다.
이와 같은 선별 과정을 통해 연관규칙 분석에 활용할 14개의 사고 요인을 선별하였다(Table 2). 14개의 사고 요인은 사고 형태(Type of accident, TA), 날씨(Weather), 조명(Lighting), AV 충돌 전 움직임(AV movement preceding collision, AV_MPC), HV 충돌 전 움직임(HV movement preceding collision, HV_MPC), AV 상대적 위치(AV relative position, AV_RP), HV 상대적 위치(HV relative position, HV_RP), 사고 발생 위치(Location), 도로 표면 상태(Road surface, RS), 도로 상태(Road condition, RC), 사고 발생 시간(Time), 신호등 상태(Traffic light, TL), AV 충돌 형태(AV collision type, AV_TC), HV 충돌 형태(HV collision type, HV_TC)과 같다. 이는 맑음(Clear), 정지(Stopped), 차선 변경(Changing lane), 마름(Dry), 빨간불(Red light), 측면 충돌(Sideswipe) 등의 세부 속성으로 구성되어 있으며, 이를 통해 사고 당시의 상황을 세부적으로 파악할 수 있다.
Table 2.
Details of accident factors used in association rule mining
2. 연관규칙 분석
연관규칙 분석은 데이터 속성 간의 관계를 파악하기 위한 데이터마이닝 기법이다. 특히, Apriori 알고리즘(Agrawal and Srikant, 1994)은 대표적인 연관규칙 분석 방법론으로 범용성이 뛰어나며, 조건절(Antecedent)과 결과절(Consequent)을 설정하여 여러 속성 간의 연관성을 파악할 수 있다. 또한, 이는 자주 발생하는 빈발항목 집합을 활용하여 기존 방식 대비 연산 시간이 단축되는 장점이 있다.
Apriori 알고리즘은 다음과 같이 진행된다.
1. 전체 데이터를 대상으로 여러 속성의 조합을 통해 빈발항목 집합()을 추출하여 각 집합이 전체 데이터셋에서 포함되는 비율을 계산한다.
2. 빈발항목 집합의 최소 지지도(Support)를 설정하여 유의미한 후보 데이터군을 추출하며, 이를 활용하여 연관규칙을 도출한다. 이때, 연관규칙은 A(조건절, Antecedent)→B(결과절, Consequent)의 형태 표현되며, A가 발생할 때 B가 발생한다는 의미이다.
이처럼 Apriori 알고리즘을 통해 도출되는 연관규칙은 지지도(Support), 신뢰도(Confidence), 향상도(Lift)라는 3가지 지표를 활용하여 규칙의 적절성을 판단한다. 지지도(Equation 1)는 전체 집합에서 A와 B를 모두 포함하는 집합의 빈도를 확률로 표현한 것으로 규칙의 중요성을 확인하는 지표이며, 1과 가까울수록 규칙이 매우 중요하다는 것을 의미한다. 신뢰도(Equation 2)는 조건부확률의 개념으로 A를 포함하는 집합에서 A와 B가 모두 포함되는 집합의 확률을 의미하며 규칙의 신뢰성을 판단하는 지표이다. 이때 신뢰도는 0과 1 사이의 값으로 신뢰도가 높은 규칙일수록 1에 가까운 신뢰도가 도출된다. 향상도(Equation 3)는 A가 집합에 없을 때 B가 포함되는 확률과 A가 집합에 존재할 때 B가 포함되는 확률의 증가 비율을 계산하여 도출되며, 규칙의 유용성을 판단하는 지표이다. 향상도가 1이 도출되는 것은 A와 B의 연관성이 존재하지 않는 것을 뜻하며, 두 집합(A, B)의 연관성이 높을수록 향상도는 크게 도출된다.
3. 자율주행차 사고 시나리오 생성을 위한 요소 선정
자율주행차의 안전성 평가를 위한 시나리오를 생성하기 위해 PEGASUS(PEGASUS Project Consortium, 2019), CETRAN(de Gelder et al., 2020) 등 다양한 프로젝트가 수행되고 있다. PEGASUS 프로젝트는 독일에서 진행된 자율주행차 안전성 평가 시나리오 접근 방식으로, 고속도로에서 발생할 수 있는 다양한 시나리오를 제시하고 자율주행 기능의 안전성 확보 방법과 이에 관련한 요구사항을 체계화하였다. 또한, 시나리오의 추상 수준에 따라 functional scenario, logical scenario, concrete scenario를 제시하였다(Figure 4). Functional scenario는 도로의 형태, 고정 및 동적 요소에 관한 정보, 환경 조건 등을 자연어로 설명한 시나리오이며, logical scenario와 concrete scenario는 functional scenario에서 정의한 시나리오 요인들의 범위와 값을 제공하는 시나리오이다. CETRAN 프로젝트는 싱가폴에서 진행되었으며, NHTSA의 pre-crash scenario를 기반으로 자율주행차의 안전성 평가를 위한 시나리오를 제시하였다. 또한, CETRAN 프로젝트는 PEGASUS 프로젝트와 달리 도심부를 대상으로 시나리오를 도출하였으며, 동적 요소(dynamic environment), 정적 요소(static environment), 환경(condition)으로 구분하여 시나리오 요인을 정의하여(Figure 4) 64개의 시나리오를 제시하였다.
본 연구의 목적은 실제 데이터를 활용하여 구체적인 시나리오를 제시하는 것에 있어, 실제 데이터 요인을 PEGASUS 프로젝트와 CETRAN 프로젝트의 시나리오 요인과 비교하여 시나리오 요인을 선정하고자 한다. 이에 따라 PEGASUS와 CETRAN 프로젝트 요인을 추출하고, 실제 데이터 요인과 비교하였을 때 공통적으로 사용되는 요인을 활용한다. 또한, PEGASUS 프로젝트와 CETRAN 프로젝트가 집중하는 공간이 상이하므로 실제 데이터 및 시나리오 제시 공간에 따라 각 프로젝트에만 해당하는 요인을 추가 활용한다. 종합적으로 시나리오 제시를 위한 시나리오 요인을 추출하고 이에 기반하여 시나리오 템플릿을 작성할 수 있다.
위와 같은 과정을 통해 9개의 사고 시나리오 요인(Type of accident(TA), Weather, Lighting, AV movement preceding collision(AV_MPC), HV movement preceding collision(HV_MPC), AV relative position(AV_RP), HV relative position(HV_RP), Location, Traffic light(TL))을 선정하였다고 가정한다면, 이때의 시나리오는 Figure 5와 같은 형태로 제시할 수 있다. 이는 PEGASUS 프로젝트의 functional 시나리오를 기반으로 작성하였으며, 9개 요인이 모두 포함되어있다. 사고 당시의 날씨, 조명, 위치, 신호등 상태를 Figure 5(b)-(f)에서 제공하며, 두 차량(AV, HV)의 움직임, 상대적 위치 등 차량에 대한 정보는 Figure 5(i)를 통해 파악할 수 있다. 또한, Figure 5(j)를 통해 해당 시나리오가 도출된 데이터의 출처를 제공하며, Figure 5(g), (h)를 통해 사고의 전체적인 상황을 파악할 수 있다. 마지막으로 Figure 5(a)를 통해 자율주행차가 사고를 예방하기 위한 기능의 요구사항을 정의하였다.
분석 결과
1. 자율주행차 사고 데이터 기초 통계
연관규칙 분석에 앞서 165건 사고의 기초 통계 분석을 진행하였으며, 다음과 같은 특징을 확인하였다.
1. 153건(93%)의 차대차 사고가 발생함(Figure 6(a)).
2. 148건(90%)의 사고가 맑은 날씨에서 발생하였으며(Figure 6(b)), 114건(69%)의 사고가 밝은 조명 상태에서 발생함(Figure 6(c)).
3. 사고 발생 시 차량의 움직임 분포를 확인한 결과, AV 정지, HV 직진 상황은 30%(50건), AV 직진, HV 직진 상황은 10%(16건), AV 정지, HV 우회전 상황은 7%(11건)로 나타남(Figure 6(d)).
4. 사고 발생 시 차량 충돌 형태의 경우, HV가 AV 후방을 추돌한 사고((AV, HV)=(N/A, Rear-end))가 70%(115건)로 가장 많았으며 AV와 HV의 측면 충돌사고((AV, HV)=(Sideswipe, Sideswipe))가 13%(22건)로 확인됨(Figure 6(e)).
5. 두 차량이 동일 차선에 위치하였을 때((AV, HV)=(Same, Same)), 사고가 많이 발생함(83건, 50%)(Figure 6(f)).
6. 도로 표면이 마른 상태일 때와 특정 이벤트가 없는 일반적 상황(148건, 90%)일 때의 사고가 각각 151건(92%, Figure 6(g)), 148건(90%, Figure 6(h))이 발생함.
7. 오후 12시-18시에 65건(39%)의 사고 발생함(Figure 6(i)).
8. 약 77%(127건)의 사고가 교차로에서 발생하였으며(Figure 6(j)), 25건(15%)의 사고가 빨간불일 때 발생함(Figure 6(k)).
2. 연관규칙 분석 결과
연관규칙 분석을 수행하기 위해 Apriori 알고리즘의 조건을 설정하였다(Table 3). 우선, 사고 요인을 대상으로 조건절(Antecedent)과 결과절(Consequent)을 설정하였다. 통상적으로 교통사고의 결과는 사망자 수, 중상자 수, 경상자 수 등 인적 피해 또는 차량의 충돌 형태 등으로 표현된다. 또한, 결과절은 사건의 결과를 의미하므로 이에 부합하는 AV 충돌 유형(AV_TC)과 HV 충돌 유형(HV_TC)을 결과절로 설정하였다. 이후, AV 충돌 유형과 HV 충돌 유형을 제외한 12개의 사고 요인은 조건절로 설정하였다. 다음으로 빈발항목 집합을 대상으로 연관성이 높은 연관규칙을 추출하기 위해 최소 지지도(Minimum support), 최소 신뢰도(Minimum confidence), 최소 향상도(Minimum lift)를 설정하였다. 앞서 언급한 듯이 지지도, 신뢰도, 향상도는 각각 규칙의 중요성, 신뢰성, 유용성을 판단할 수 있는 지표로 이들의 최소값을 설정하여 유의미한 연관규칙을 도출하였다. 최소 지지도는 0.015로 설정하였으며, 최소 신뢰도는 0.7, 최소 향상도는 1.1로 설정하여 연관규칙 분석을 수행하였다.
Table 3.
Parameters set for Apriori algorithm
165개의 보고서를 대상으로 연관규칙 분석을 진행한 결과, AV 충돌 형태가 결과절에 포함된 경우 164,394개의 연관규칙이 도출되었으며, HV 충돌 형태가 결과절에 포함된 경우 163,108개의 연관규칙이 도출되어 총 327,502개의 연관규칙이 도출되었다. Table 4는 약 300,000개의 연관규칙의 예시이며, 결과절로 설정한 AV 충돌 유형, HV 충돌 유형과 연관성이 높은 사고 요인은 조건절에 서술되어있다. Rule #1의 경우 도로 표면이 마르고 신호등이 없는 교차로에서 AV가 직진하고 HV가 차선을 변경할 때 발생한 차대차 사고는 AV 충돌 형태가 측면 충돌인 것과 연관성이 높다는 의미이다. Rule #3의 경우 빨간불이 점등되어있는 날씨가 맑고 밝은 상황의 교차로에서 동일차선에 위치한 AV가 정자하고 HV가 직진할 때 발생한 차대차 사고는 AV 충돌 형태가 N/A인 것과 연관성이 높다는 의미이다. 또한, Rule #12의 경우 신호등이 없는 날씨가 맑고 밝은 상황의 교차로에서 동일차선에 위치한 AV가 정자하고 HV가 직진할 때 발생한 차대차 사고는 HV 충돌 형태가 후방 추돌인 것과 연관성이 높다는 의미이다. Rule #3, #4, #5는 결과절인 AV 충돌 형태가 N/A일 때 신호등 상태를 제외하고 나머지 사고 요인이 모두 동일하였으며, Rule #12, #13, #14는 HV 충돌 형태가 후방 추돌인 연관규칙에서 신호등 상태를 제외하고 나머지 사고 요인이 모두 동일한 연관규칙임을 알 수 있다.
이처럼 조건절과 결과절을 설정하고 최소 지지도, 신뢰도, 향상도를 활용하여 연관규칙 분석을 진행한 결과, 약 300,000개의 연관규칙이 도출되었으며, AV 충돌 유형과 HV 충돌 유형에 따라 연관성이 높은 다양한 사고 요인의 조합이 존재하는 것을 확인하였다.
Table 4.
Result of association rule mining (Apriori algorithm)
자율주행차 도심부 사고 시나리오 생성
1. 사고 시나리오 도출
PEGASUS와 CETRAN 프로젝트는 자율주행차의 안전성 평가를 위한 다양한 시나리오를 제시하였으며, 두 프로젝트를 기반으로 시나리오를 추출하기 위한 다양한 연구가 수행되고 있다. 이에 본 장에서는 DMV 사고 보고서와 PEGASUS 및 CETRAN 프로젝트를 비교하여 최종적으로 작성할 시나리오 요인을 추출하였다. 우선, 두 프로젝트에서 모두 활용하는 8개의 요소(날씨(Weather), 조명(Lighting), AV 충돌 전 움직임(AV_MPC), HV 충돌 전 움직임(HV_MPC), AV 상대적 위치(AV_RP), HV 상대적 위치(HV_RP), 위치(Location), 신호등 상태(Traffic Light))를 최종 시나리오로 활용 요인으로 선정하였다. 이후, 본 연구는 도심부 시나리오에 집중하고 있음에 따라 도심부 시나리오를 제시한 CETRAN 프로젝트에 포함되는 요소를 선정하였으며, 이는 사고 형태(TA)가 해당되었다. 또한, AV 충돌 형태(AV_TC), HV 충돌 형태(HV_TC), 시간(Time)의 경우 PEGASUS와 CETRAN 프로젝트에서 모두 활용되지 않음에 따라 시나리오 요인에서 제외하였다. 이러한 과정을 통해 9개의 요인을 사고 시나리오 요인으로 추출하였으며, 이를 기반으로 자율주행차의 도심부 사고 시나리오를 도출하였다(Table 5).
Table 5.
Accident scenario factor selection (Comparison with DMV collision report and PEGASUS, CETRAN project)
9개의 시나리오 요인을 포함한 자율주행차의 도심부 사고 시나리오를 도출하는 과정은 다음과 같다. 우선, Table 4와 같이 도출된 327,502개의 연관규칙을 대상으로 조건절에 9개의 시나리오 요인이 모두 포함된 연관규칙을 추출하였다. 다음으로, 조건절에 포함된 9개의 시나리오 요인이 모두 동일한 연관규칙을 조합하였다. 마지막으로 결과절에 포함되어있는 AV 충돌 유형과 HV 충돌 유형을 확인하여 두 개의 연관규칙을 결합하였다. 이때, 후방 추돌은 (AV_TC, HV_TC)=(N/A, Rear-end), 측면 충돌은 (AV_TC, HV_TC)=(Sideswipe, Sideswipe)로 통일화한 것을 고려하였다. 만약, 9개의 시나리오 요인이 모두 포함된 동일한 조건절이 있는 두 개의 연관규칙의 결과절이 (AV_TC, HV_TC)=(N/A, Sideswipe)라면, 이는 DMV 사고 보고서에 기술된 충돌 유형이 아니므로 제외하였다.
우선, Table 4의 #1, #2, #10, #11은 조건절에 9개의 시나리오 요인이 모두 서술되어있지 않기 때문에 제외하였다. 또한, #12의 경우 9개의 시나리오 요인을 모두 포함하지만, AV 충돌 유형이 N/A일 때 조합이 가능한 HV 충돌 유형에 부합하는 연관규칙을 찾지 못하였다. 이에 반해, (#3, #12), (#4, #13), (#5, #14), (#6, #15), (#7, #16), (#8, #17)의 경우 조건절에 9개의 시나리오 요인이 모두 포함되어있는 것을 확인하였다. 또한, 결과절이 후방 추돌로(N/A, Rear-end) 결합이 가능하였다. 이를 통해 6개의 자율주행차 도심부 사고 시나리오가 도출되었으며, 이는 Figure 7과 같다. 사고 시나리오는 전체적인 상황을 파악할 수 있는 개략도와 함께 9개의 시나리오 요인에 대한 세부 속성으로 구성되어있다. 모든 사고 시나리오는 교차로를 대상으로 하며, AV와 HV가 동일 차선에 위치한다. Scenario 2와 3의 경우 모든 세부 속성이 Scenario 1과 동일하지만 신호등의 상태가 빨간불 또는 정지 표지판인 것을 확인할 수 있다. 또한, Scenario 5는 유일하게 AV 충돌 전 움직임이 직진이었으며, 조명이 가로등이 있는 어두운 상태임을 확인하였다. Scenario 6의 경우 유일하게 날씨가 흐림이었으며, HV 충돌 전 움직임이 우회전인 것으로 나타났다. 앞서 제시한 템플릿(Figure 5)을 활용하여 Scenario 2를 functional scenario를 작성하였으며, 이는 Figure 8과 같다.
2. 자율주행차 사고 시나리오 비교 분석
본 장에서는 연관규칙 분석을 활용하여 도출한 6개의 도심부 사고 시나리오를 세부적으로 분석하고자 한다. 우선, 165건의 DMV 사고 보고서를 대상으로 6개 사고 시나리오의 세부 속성이 포함되어있는 사고 발생 건수를 파악하였으며, 시나리오별 실제 발생한 사고 건수 및 발생 확률은 Table 6과 같다. Scenario 1은 11건이 발생하여 6.67%의 확률로 가장 높았으며, Scenario 2의 발생 확률이 4.24%로 그 뒤를 이었다. Scenario 1과 Scenario 2의 경우 날씨, 조명, 위치, 차량의 상대적 위치 및 충돌 전 움직임 등이 통상적으로 많이 발생하는 사고의 조건과 동일함에 따라 사고 건수 및 확률이 높게 도출된 것으로 판단된다. 그러나, Scenario 3-6의 경우 사고가 5회 미만으로 발생하여 확률이 낮게 도출되었다. 만약, DMV 사고 보고서의 건수를 기준으로 시나리오를 도출한다면 4개의 시나리오는 도출되지 않을 것으로 판단된다. 이에 반해 본 연구는 연관규칙 분석을 기반으로 4개의 시나리오를 추가로 제시함에 따라 유의미한 결과를 도출하었으며, 해당 시나리오를 주목해야할 것으로 판단된다.
Table 6.
Real-world accident occurrence and probability of our AV scenarios based on DMV collision report
다음으로, 6개의 도심부 사고 시나리오와 NHTSA의 pre-crash scenario(Najm et al., 2007)를 비교분석하였다. 이는 일반 차량의 2004 GES(General Estimates System) crash database와 CDS(Crashworthiness Data System)를 기반으로 37개의 대표 시나리오를 제시하였다. 또한, 시나리오별 부상 확률, 사고 처리 비용과 함께 날씨, 조명, 차량의 충돌 전 움직임 등에 대한 세부 속성과 이에 따른 통계적 확률을 제시하였다(Figure 9). 이에 더해 pre-crash scenario는 본 연구에서 활용한 9개의 시나리오 요인 중 사고 형태, AV 상대적 위치, HV 상대적 위치를 제외한 6개 요인에 대한 확률을 제공하는 것을 확인하였다. 이에 따라, 6개 요인에 대한 통계적 확률을 통해 시나리오별 발생 확률을 계산하였으며, 이는 Table 7과 같다. Scenario 1과 Scenario 2의 경우 일반 차량 데이터 기반의 시나리오를 기준으로 발생 확률이 10%가 초과하는 것을 확인하였다. 그러나, Scenario 3-5의 경우 발생 확률이 매우 낮았으며, Scenario 6의 경우 0.0015%의 발생 확률이 도출되어 일반 차량을 대상으로 발생 확률이 매우 낮은 시나리오인 것을 알 수 있다. 이에 본 연구와 같이 자율주행차 시나리오는 일반 차량 데이터가 아닌 자율주행차 데이터를 기반으로 작성되어야 할 것으로 판단된다.
Table 7.
Probability of our AV scenarios based on NHTSA pre-crash scenario
결론 및 향후 연구
인적 요인에 의한 교통사고를 예방하기 위해 자율주행차가 개발되고 있으며, 자율주행차의 안전성과 신뢰성을 확보하기 위해 자율주행자동차의 안전성 평가에 활용 가능한 다양한 상황의 시나리오가 제시되고 있다. 이처럼 자율주행차의 안전성 평가를 위한 시나리오는 신뢰성과 구체성을 확보해야하며, 사고의 발생 빈도가 높은 도심부에 주목해야 한다. 이에 본 연구는 자율주행차의 사고데이터인 DMV 사고 보고서를 활용한 연관규칙 분석을 통해 자율주행차의 도심부 사고 시나리오를 제시하는 연구를 수행하였다. 연관규칙 분석을 위해 DMV 사고 보고서의 수집 및 전처리를 진행하였으며, 조건절과 결과절을 설정하는 등 연관규칙 분석의 조건을 설정하였다. Apriori 알고리즘을 활용한 연관규칙 분석 결과, 결과절로 설정한 일반 차량과 자율주행차의 충돌 형태와 연관성이 높은 사고 요인이 도출되었으며, 차선변경, 직진, 정지 등 차량의 충돌 전 움직임과 날씨, 조명, 위치 등 다양한 사고 요인의 조합이 차량의 충돌 형태와 연관성이 높은 것을 확인하였다. 이후, PEGASUS 및 CETRAN 프로젝트를 검토하여 9개의 시나리오 요인을 선정하였으며, 추출된 연관규칙을 기반으로 자율주행차의 안전성 평가를 위한 구체적인 시나리오를 제시하였다. 연관규칙을 조합한 결과, 신호등의 상태, 차량의 충돌 전 움직임 등이 다양한 6개의 사고 시나리오가 도출되었으며, 해당 시나리오는 9개의 시나리오 요인을 구체적으로 제시하였다. 또한, 6개의 시나리오를 대상으로 DMV 사고 보고서의 기초통계분석과 일반 차량 데이터 기반의 NHTSA pre-crash scenario를 활용하여 시나리오의 발생 확률을 도출한 결과, 확률이 낮은 시나리오가 도출됨에 따라 해당 시나리오를 주목해야 할 것으로 판단된다.
본 연구는 자율주행차 사고데이터의 절대적인 개수가 부족하여 교차로에서 발생한 후방 추돌 상황의 시나리오만 도출되었다는 한계가 존재하였다. 또한, DMV 사고 보고서가 제공하는 데이터 범위의 한계로 인해 평가를 위한 세부적인 실험값이 제공되지 않은 한계가 존재하였다. 이에 향후 지속적으로 축적되는 DMV 사고 보고서를 활용하여 데이터 기반의 신뢰성 있는 시나리오와 보다 다양한 상황의 시나리오를 도출하는 연구를 수행하고자 한다. 또한, DMV 사고 보고서 이외의 차량의 속도, 가속도 등이 기술된 사고 보고서 및 데이터를 활용하여 구체적인 실험값을 제공하는 logical scenario와 concrete scenario를 제시하는 연구를 수행하고자 한다. 본 연구는 자율주행차의 실사고 데이터를 활용하여 신뢰성과 구체성을 확보한 시나리오를 제시한 것에 의의가 있으며, 이는 자율주행차의 안전성 평가를 위한 기초적인 자료로 활용 가능할 것으로 판단된다.











