서론
선행연구
1. 개인위치정보 비식별화에 관한 연구
2. 개인 모빌리티 기반 대기오염 노출위험도 평가에 관한 연구
3. 기존 연구와의 차별성
사례연구: 개인 모빌리티 데이터 익명화
1. 참여기반의 센싱 데이터 수집
2. 개인위치정보 보호권리 평가
3. 정보활용을 위한 온라인 대시보드 작성
결론
서론
사물인터넷(Internet of Things, IoT) 기술기반 스마트 센서는 위치정보(Global Positioning System, GPS), 대기질 모니터링, 온도 및 습도 등 다양한 유형의 데이터 수집을 가능하게 하며, 수집된 데이터는 처리 및 융합과정을 거쳐 스마트시티에서 지향하는 지능형 서비스 개발에 활용될 수 있다(Ahmed et al., 2020). 특히 스마트센서를 활용한 IoT기기(smart-sensing devices)는 개인의 일상생활에 지장을 주지 않을 만큼 휴대가 간편하며, 개인 일상생활을 구성하는 통행과 활동과정에서 발생하는 다양한 데이터를 수집하고, 무선통신기술을 통한 실시간 데이터 수집 및 모니터링을 가능하게 한다(Wang et al., 2021). 이러한 IoT기반 스마트센서의 장점은 개인별 일상활동의 세부내용에 따라 상이한 공간에서 노출되는 다양한 환경오염인자의 위험도 평가에 활용할 수 있다(Steinle et al., 2013). 특히, 과밀도의 도시내부는 다양한 대기오염물질 배출원(예: 자동차 통행 및 산업단지 입지)으로 인하여 해당공간에서 다양한 일상생활을 수행하는 도시거주 및 생활인구는 상대적으로 높은 수준으로 대기오염에 노출되어 있으며(Ma et al., 2020), 단기간 혹은 장기간 대기오염 노출 및 누적은 잠재적으로 개인의 건강 및 삶의 질에 부정적인 영향을 끼치는 것으로 나타났다(Dons et al., 2012; van Zoest et al., 2020). 따라서 도시환경개선 및 취약인구의 보호, 나아가 대기오염관리를 위해 통행수단(예: 자전거, 도보통행), 통행목적(예: 야외활동) 및 활동공간(예: 도심내부) 등 개인 일상생활의 다양한 시공간 맥락적 특성을 고려한 개인별 모빌리티 기반 대기오염 노출위험도 평가에 관한 연구가 필요하다(Kwan, 2009, 2021).
최근 IoT기반 도시데이터 센서는 다양한 환경오염인자를 시공간 자료형태로 수집하는데 활용되고 있다. 특히 이용자들의 참여를 통해 수집 ‧ 제공된 자료의 분석결과를 정책 의사결정에 활용하고, 나아가 공공데이터 제공과 같은 개방형 공간정보서비스를 통해 데이터를 사용하는 최종 사용자(end-user)들의 접근성과 편의성 향상에 기여하고 있다(Rai et al., 2017). 따라서 공공의 이익을 위한 모빌리티 기반 빅데이터의 활용 및 새로운 서비스 제공은 향후 스마트 도시의 경쟁력과 삶의 질 향상에 기여할 수 있다(Choi et al., 2019; Kandt and Batty, 2020). 예컨대, 코로나19 팬데믹 상황에서 집계된 모바일 데이터의 분석을 통해 생산된 이동성지표는 전염병 대응에 따른 전역적인 일상생활 변화와 더불어 지역 내외간 통행패턴의 변화를 추적할 수 있는 중요한 도구로서, 전염병 대응을 위한 정부의 다양한 이동제한 및 봉쇄정책의 주요한 근거 및 통찰력을 제공하는데 기여하였다(Oliver et al., 2020).
하지만 참여기반의 센싱 데이터(이후 participatory sensing data) 수집 및 분석은 유용하고 시의성 높은 정보를 제공과 더불어 높은 활용도 및 서비스 가치에 반하여 개인정보의 노출 그리고 개인위치정보 보호권리(이후 Geoprivacy) 침해의 우려가 높아지고 있다(Kwan et al., 2004; Kamel Boulos et al., 2022). 또한, 구체적인 개인위치정보의 보호와 권한설정에 대한 익명화 및 비식별화 처리수준에 대한 연구의 부재는 향후 유용한 개인 모빌리티 데이터의 안전한 활용(예: 출판 및 연구데이터 공유)을 더 복잡하고 어렵게 만들 수 있다.
이에 본 연구에서는 공간정보 익명화(이후 geomasking) 기술을 적용하여, 특정 개인의 재식별 가능성을 일정 수준 이하로 낮추면서, 위치정보의 가치(예: 정보량)를 최대한 보존할 수 있도록 하는 최적의 균형점 탐색을 위한 Geoprivacy 평가방법에 관한 연구를 진행하였다. 구체적으로, 수집된 participatory sensing data를 활용하여 geomasking 수준에 따라 변화하는 위치정보의 정확도와 다양성을 고려하여 균형점을 제안하였다. 해당 균형점은 서비스 유용성과 이에 반하는 개인위치정보의 익명화 수준을 모두 고려한 결과물로서, 사례연구인 개인 모빌리티 기반 대기오염노출 평가 결과물의 시각화 제공에 활용될 수 있다. 본 연구에선 이를 시각화 및 연구데이터 공유를 위한 Geoprivacy가 보호되는 공개 대시보드 작성의 가이드라인으로 활용하였다.
본 연구는 다음과 같이 구성된다. 2장은 개인위치정보 보호를 위한 비식별화 및 스마트센서를 활용한 개인 모빌리티 기반 대기오염 노출위험도 평가에 대한 연구를 정리하였다. 3장은 수집된 개인 모빌리티 자료에 정사각형 격자구조 기반 geomasking을 적용하여, 감소하는 위치정보의 시공간 정밀성 수준에 따라 증가하는 개인위치정보의 익명화 수준과의 상충관계를 고려한 균형점을 제시하였다. 마지막으로 4장은 결과 및 활용방안을 제언하였다.
선행연구
1. 개인위치정보 비식별화에 관한 연구
대한민국의 위치정보의 보호 및 이용 등에 대한 법률(약칭: 위치정보법)은 2005년 1월 27일 법률 제7273호로 공포되어 2005년 7월 28일부터 시행되었으며, 최근(2021년 2월 5일)까지 개정되어 위치정보의 유출, 오용 및 남용으로부터 사생활의 비밀 등을 보호하고, 안전한 이용환경을 조성하여 위치정보의 이용을 활성화함으로써 국민생활의 향상과 공공복리의 증진에 이바지함을 목적으로 제정되었다(Kim et al., 2021a). 특히, 위치정보는 이동성이 있는 물건 또는 개인이 특정한 시간에 존재하거나 장소에 관한 모든 정보로서, 개인위치정보는 광범위하게 식별할 수 있는 모든 범위의 민감한 개인의 위치정보자료를 포괄하는 것으로 정의할 수 있다(Kwan et al., 2004). 특히 Kwan et al.(2004)은 Geoprivacy, 즉 개인의 일상에서 주요한 위치정보(예: 집, 일터) 및 개인 활동-통행정보의 노출(disclosure)을 방지하는 개인위치정보 보호권리에 대한 개념을 처음으로 제시하였다.
이후 개인위치정보의 익명화-비식별화 기법에는 공간단위의 집계 및 geographic masking기술이 주로 활용되었으며, 최근에는 머신러닝 기법을 활용한 전수화 데이터 생성기법(James et al., 2021)에 관한 연구도 진행되었다. 특히, Keßler and McKenzie(2018)는 광의적인 측면에서 Geoprivacy가 개인과 사회가 맞닿아 있는 기술 등 고려해야 하는 21개의 논지(theses)를 담은 연구결과(manifesto)를 발표하였다.
대한민국의 위치정보법 제15조 제1항(위치정보의 수집 등의 금지)에서도 이러한 Geoprivacy의 중요성을 인지하고 “누구든지 개인위치정보주체의 동의를 받지 않고 해당 개인위치정보를 수집, 이용 또는 제공해서는 안 된다”라는 조항을 통해 정보주체 동의권의 보장을 위해 힘쓰고 있다. 또한, 세부 시행령에선 위치정보사업자 혹은 공공부문의 빅데이터 공유 및 활용에 필요한 위치정보의 취급, 관리 지침을 제정하거나 접근권한자를 지정하는 등의 관리적 조치와 소프트웨어 활용 등의 기술적 조치가 포함되었으며, 구체적인 내용은 대통령령으로 정하는 것으로 제정되었다. 나아가 최근(2020년 1월) 개인정보 보호관련 3개 법률, 이른바 ‘데이터 3법’개정안이 통과됨으로써, 개인정보 보호법 제2조의8호에 따라 가명화-암호화된 개인정보는 공공적, 비영리적, 사회적 목적 하에 정보 주체의 동의 없이도 활용할 수 있게 되었다.
이에 데이터 3법 개정안 이후 가명처리된 개인정보는 이종 데이터와 결합 및 분석을 통해 다양한 데이터상품으로 거래될 수 있으며, 이를 위해 일반적으로 데이터 표준화, 비식별화, 전문기관 결합, 적정가격 산정, 거래 등의 순서를 거친다(Kim et al., 2021b). 이 중 비식별화 과정은 식별 가능한 개인정보(위치정보 포함)를 익명성이 보장되는 자료로 전환하는 것으로서, 행정안전부(Ministry of the Interior and Safety, 2016)는 관계부처 합동으로 개인정보 비식별 조치 가이드라인을 제시한 바 있다. 하지만 5G와 같은 첨단기술을 활용하여 획득 가능한 고정밀의 위치정보는 개인의 신원정보 및 민감한 위치정보(예: 집, 직장)의 추론이 용이함에 따라 기존의 비식별화 방식으로는 Geoprivacy를 보장하는 데 한계가 존재한다는 문제가 제기되었다(Lee and Park, 2020).
2. 개인 모빌리티 기반 대기오염 노출위험도 평가에 관한 연구
WHO(2014)에서는 전세계적으로 연간 약 420만 명에 달하는 대기오염으로 인한 사망자를 추정하고 있으며, 미세먼지(Particulate Matter, PM) 및 이산화질소(Nitrogen Dioxide, NO2)와 같은 대기오염물질은 호흡기 및 심혈관 질환을 유발하며, 나아가 삶의 질과 정신건강에 부정적인 영향을 미치는 것으로 확인되었다. 전통적인 대기오염노출 평가는 (고정된) 대기오염측정망을 통해 수집된 대기질 모니터링 자료를 바탕으로 개인 거주지 기반의 대기오염노출 위험도를 측정하였으나(Lee et al., 2011), 개인의 일상활동은 특정 공간에 한정되어 있지 않으며, 상이한 목적의 활동수행을 위해 시간의 흐름에 따라 다양한 장소의 공간이 선택되어 통행이 발생한다(Joh, 2007). 이에 최근 일상생활 수행에 필요한 이동 및 그에 따라 변화하는 대기오염의 시계열적 특성에 관한 연구는 “어디에 거주하는 가?”에서 “특정시간에 어떤 공간에서 얼마나 오랫동안 위치하고 있는가?”로의 관점의 전환이 이루어지고 있다(Poom et al., 2021). 이를 반영하듯, 공간적 맥락을 고려한 개인별 대기오염노출에 따른 건강 위해성 평가로의 확장(Lee et al., 2016)과 오픈소스 소프트웨어 개발을 통해 지역사회 대기오염수준을 진단하는 연구도 제안되었다(Feenstra et al., 2020).
하지만, 스마트 센서의 특성 및 성능에 따라 측정값이 상이할 수 있으므로, 과학적인 연구방법으로 자리매김하기 위해선 수집된 자료의 신뢰성과 이를 검증할 수 있는 추가적인 검증방법에 대한 연구가 필수적이다(Lewis and Edwards, 2016). 이에 최근 통제된 환경에서의 실험(Kelly et al., 2017; Curto et al., 2018) 및 성능시험을 통한 교정기술 개발(Miskell et al., 2017; Ripoll et al., 2019; Mahajan and Kumar, 2020)과 같이 스마트센서의 측정값에 대한 검증과 이상치 제거와 같은 데이터 처리기술을 활용하여 신뢰성 확보에 힘쓰고 있다.
3. 기존 연구와의 차별성
본 연구에서는 geomasking 기법 중 Geohash 함수를 통해 수집된 개인위치정보 기록(GPS tracks)을 익명화 하였다. 익명화된 개인위치정보는 스마트센서를 통해 수집된 이종데이터인 대기질 모니터링 자료와 결합하여 향후 온라인 대시보드 서비스를 통한 유용한 정보전달 및 연구데이터 공유를 가능하게 한다. 대시보드는 “현재 진행되고 있는 상황에 대한 유용한 정보를 (실시간으로) 제공하여 최종 사용자의 판단에 기여하는 시스템(Kim et al., 2019, p. 75)”으로 정의될 수 있으며, 비식별화 처리가 된 participatory sensing data의 시각화 결과물 제공과 더불어 부가적인 분석이 가능한 확장 모듈추가를 통해 활용성을 더 향상시킬 수 있다(Stehle and Kitchin, 2020; Daepp et al., 2022).
Geohash는 경위도 좌표 값을 일정한 문자열 해시(hash)값으로 치환하는 공개 지오코딩(geocoding) 시스템으로서, 연속적인 분해과정의 반복을 통해 고유의 위치를 Base 32 문자열의 계층적인 격자로 변환한다(Fox et al., 2013). 본 연구에서는 R 소프트웨어의 geohashTools 패키지를 사용하였으며, 이를 통해 1차원 점자료를 2차원 면자료 Geohash 격자로 익명화 할 수 있다. 일반적으로 Geohash 4자리(length-4) 값이면 대도시, 7자리(length-7) 값이면 도로를 표현할 수 있는 공간 정밀도로 나타난다. 예를 들어, 한국지방행정연구원 공간정보(점좌표)는 5자리 코드(length-5)에서 1.2km×609.4m의 격자 해상도를 지닌 면(wyeh26)으로, 7자리 코드에선 더 정밀한 152.9m×152.4m의 격자 해상도를 지닌 면(wyeh26z)으로 변환된다(Table 1 및 Figure 1 참조).
Table 1.
Cell sizes by various lengths of Geohash
본 연구의 목적은 개인 모빌리티 데이터의 Geoprivacy 보호와 이와 상충되는 위치정보의 유용성을 동시에 고려하여, 결합된 센싱 데이터의 분석결과 제공 및 공유에 적합한 geomasking 수준을 모색하는 것이다. 이를 위해 수집된 GPS 데이터가 Geohash 자리 값(해상도)에 따라 손실되는 정보 및 개인위치정보의 익명화 정도를 통해 Keßler and McKenzie(2018)가 제안한 Geoprivacy 평가를 수행하여, 사례연구에 적합한 균형점을 제안하였다. 특히 사례연구에서 수집된 participatory sensing data의 적절한 비식별화 처리수준을 손실된 공간정보 정확도 및 다양성 지수를 통해 판단하는 평가기준을 제시함으로써, 향후 Geoprivacy를 준수하는 공공 데이터 제공 및 서비스 개발에 필요한 기초연구로서 의미를 지닌다.
사례연구: 개인 모빌리티 데이터 익명화
1. 참여기반의 센싱 데이터 수집
Geoprivacy 평가를 위해 개인 모빌리티 데이터 기반 대기오염노출 연구과제에서 수집된 데이터를 활용하였다. 구체적으로, 해당연구는 영국 잉글랜드 옥스퍼드 지역 거주자 50명을 대상으로 실험적인 연구를 2021년 6월부터 7월까지, 2개월에 걸쳐 진행하였다. Geoprivacy를 고려한 participatory sensing data 수집을 위해 모든 참가자들은 연구시작 전 연구를 위해 수집되는 민감한 개인정보(위치정보 포함) 및 활용에 관한 안내문을 확인하고 동의서를 작성하였으며, 스마트기기 사용을 교육받았다(자세한 설명은 https://bit.ly/jffstudy 참조). 이후 참여기간(1주일) 동안 모든 참가자들은 휴대 가능한 대기질 모니터링 장비(portable air quality monitoring device)와 GPS 수신기를 항상 지니고 일상생활을 하면서 데이터를 수집하였다. 덧붙여, 모든 참가자들은 참여기간 중 매일 저녁시간에 사후 설문조사에 참여하였는데, (첫째 날에 작성한) 개인 거주지 및 사회인구학적 특성과 더불어 1주일간의 활동-통행 다이어리를 작성하였다. 이는 사후 설문조사를 참조자료로서 수집된 일련의 위치정보를 시간 순으로 나열된 활동-통행사슬로 변환하는 과정에서 불확실성을 줄이는 것뿐만 아니라(Moiseeva et al., 2014; Feng and Timmermans, 2019), 나아가 사회경제적 특성을 고려한 개인별(interpersonal) 대기오염노출 평가와 더불어 개인 내(intrapersonal) 통행수단 및 통행패턴에 따른 노출(위험도)의 변화를 살펴볼 수 있다. 이후 수집된 데이터는 일련의 처리과정을 통해 개인별 도로 네트워크에 투영된 시공간 경로와 대기질 모니터링 자료의 융합을 통해 새로운 데이터로 작성되어, 시공간 경로에 따라 변화하는 대기오염물질 농도변화에 따른 개인별 노출 프로필(personal exposure profiles)을 평가하는데 활용되었다(자세한 내용은 Lee et al., forthcoming 참조).
수집된 스마트기기를 통한 개인 모빌리티 기반 대기질 모니터링 자료는 처리과정 중에 발견한 입력오류 및 일정한 수준에 미치지 못한 자료를 제거한 후, 모든 참여자(50명) 중 29명의 자료를 선택하였다. 선택된 참가자들의 위치정보 및 대기질 모니터링 자료는 1분 단위의 이동평균 전처리 과정을 거쳐 각각 10,800개(1×60×24×7)의 열을 지닌 새로운 데이터가 작성되었다. 이를 통해 참가자들은 평균적으로 1주일간 총 101.4km(중위수: 30km), 11시간(중위수: 7시간)을 통행(이동)에 사용한 것을 확인하였다. 통행거리와 시간은 참가자들의 통행행태에 따라 차이를 보였으며, 이에 따라 수집된 대기오염물질(NO2, PM10, PM2.5) 측정값 또한 큰 변동폭이 나타났다(Figure 2 참조). 특히, NO2는 자동차 배기가스 등 연료연소 과정에서 주로 발생하므로, 차량통행이 많은 아침/저녁 첨두시간에 높게 나타난 것을 확인할 수 있다.
2. 개인위치정보 보호권리 평가
본 연구에선 참가자들의 시공간 경로에 대기질 모니터링 자료를 결합하여 생성된 융합데이터를 연구데이터로서 공유 및 활용을 위해 개인위치정보 비식별화 처리를 수행하였다. 참가자별로 처리된 1분 단위의 일주일 자료(10,080개 지점)에 Geohash 자리 값에 따라 변화하는 서비스의 유용성 및 개인위치청보 노출위험을 고려한 균형점을 정확도 및 다양성 지수를 통해 탐색하였다. 정확도는 geomasking 과정을 통해 축소되는 정보의 양을 개인위치정보가 속한 Geohash의 격자의 개수를 모든 지점의 수(10,080)로 나눈 값으로 산출하였으며, 다양성은 엔트로피(Entropy)지수를 통해 산정하였다. 엔트로피 지수는 다양한 분야에서 사용되고 있는 집단유형의 다양성을 0(다양성 없음)에서 1(최대 다양성)사이의 값을 통해 확인할 수 있는 지표(Shannon, 1948)로서, 과 같이 나타낼 수 있다. 여기서, 는 Geohash 격자에 속할 확률이다.
본 연구에서 제안하는 Geoprivacy 평가는 공간정보 집적수준에 따라 변화하는 정확도와 다양성 지수의 변화를 살펴보는 것이다. 참가자의 일주일치 개인 모빌리티 데이터에 Geohash 6자리 익명화를 적용하면, 총 10,800개의 경로지점이 총 27개의 격자로 변환되며(Figure 3 참조), 이는 약 0.3%(0.0026)의 정확도 및 28%(0.278) 다양성 지수로 산출된다. 다시 말해, geomasking을 통해 개인위치정보는 기존 최대 정보량 대비 약 99.7%(정확도) 혹은 72%(다양성) 위치정보 유용성이 감소하며, 반대로 개인정보노출위험도는 Geohash를 적용하지 않은 개인 모빌리티 데이터 대비 약 0.3%(정확도) 혹은 28%(다양성) 감소한다고 해석할 수 있다.
정보량 변화를 통한 Geoprivacy 평가와 더불어 Keßler and McKenzie(2018)는 서비스의 유용성 및 개인위치정보 노출위험의 균형점이 위치정보가 포괄하고 있는 공간적 범위를 고려해야 하며, 개념적으로 국가, 지역, 도시, 도로, 실내공간에 따라 상이한 익명화 수준이 적절하다고 제언하였다(Figure 4 참조). 다시 말해, 국가단위의 위치정보 서비스는 개인위치정보의 익명성 보장이 제일 우선시되지만, 건물 내부의 비접촉 쇼핑과 같은 서비스 제공을 위해선 고정밀의 위치정보 필요성에 따라 개인위치정보 노출위험이 불가피하다는 점을 고려해야 한다는 것이다.

Figure 4.
The conceptual idea of qualitative privacy profiles (source: Keßler and McKenzie (2018), p. 11.)
이에 본 연구에선 이러한 질적 수준의 개인정보보호 프로필(qualitative privacy profiles)개념을 적용하여 사례연구의 개인 모빌리티 데이터 활용을 위한 익명화 처리의 균형점을 탐색하였다(Figure 5 참조). 스마트 기기를 활용한 29명의 참가자들의 시공간 경로, 즉 개인 모빌리티 데이터는 수집기간이 짧고, 참가자 대부분이 연구지역(영국 잉글랜드 옥스퍼드주) 근방에서 일상활동을 영위하므로, 도시규모의 위치정보 서비스가 적절하다고 판단된다. 또한, 위치정보 서비스의 유용성(utility of services provided)과 개인위치정보 노출위험(level of privacy intrusion)을 고려한 Geoprivacy 평가에서도 5자리에서 7자리 코드에 해당되는 Geohash 격자가 도시규모의 대시보드 서비스를 위해 적절한 수준으로 나타났다(Figure 5 참조). 구체적으로, 위치정보의 정확도는 평균적으로 약 1%에서 20%(5L에서 7L)까지 상승하였으며, 다양성은 평균적으로 약 17.3%에서 61.9%%(5L에서 7L)까지 증가하였다. 이를 통해 사례연구의 출판 및 정보활용을 위한 위치정보 서비스는 Geohash 6-7자리를 통한 익명화 수준이 적절하며, 향후 정확도보다 다양성 지수가 균형점 탐색에 더 적합한 지수로 활용될 수 있음을 보여준다. 또한, 국가단위의 서비스를 위해선 더 낮은 수준의 해상도로 익명화가 요구되며, 도로 혹은 실내공간 단위의 고정밀 위치정보 활용에는 데이터 제공자(참가자)들의 추가적인 동의와 암호화 기술역량 강화가 필요함을 시사한다.
3. 정보활용을 위한 온라인 대시보드 작성
온라인기반 도시 대시보드는 현재 다양한 주제에 대한 정보가 여러 플랫폼으로 서비스되고 있으며, 이를 통해 도시내부의 주요시설 및 현황에 대한 모니터링이 가능하다. 또한 도시 전역에 설치되었거나 센서에서 (실시간으로) 수집되는 자료의 시각화 및 데이터 분석을 통해 더 많은 사람들이 도시와 관련된 방대한 정보를 쉽고 빠르게 제공받을 수 있으며(Batty, 2015; Kitchin et al., 2015), 나아가 사용자들의 의견수렴과 새로운 서비스 혁신을 위한 의사소통의 창구 역할도 수행하고 있다(O'Brien and Cheshire, 2016).
이에 본 연구에선 탐색된 균형점, 즉 Geohash 6자리(length-6)에 맞춰 geomasking된 개인 모빌리티 데이터를 활용하여 (공공 이용자를 대상으로 한) 온라인 대시보드를 작성하였다. 해당 온라인 대시보드는 Geohash 격자별로 분화된 참가자의 NO2 측정값을 반응형 타임라인(timeline slider)으로 탐색할 수 있는 지도 창을 제공함으로써, 근접지역의 활동이 예정되어 있거나 계획을 수립하려는 사용자가 대기오염노출위험 정보를 시간대와 요일을 고려하여 살펴볼 수 있는 정보를 제공한다(Figure 6 참조). 또한, 함께 제공되는 그래프 창을 통해 대기오염물질 측정값의 시계열적 변동과 더불어 추가적인 활용이 가능한 연구데이터 다운로드 기능이 추가될 예정이다.
결론
본 연구는 최근 부각되는 개인위치정보자료의 비식별화 처리 및 Geoprivacy를 고려한 연구데이터 공유 및 활용을 위한 방법론적 기초연구로서, geomasking 기법 중 하나인 Geohash를 활용하여 상충되는 (위치정보) 서비스의 유용성 및 개인위치정보 노출위험의 균형점을 공간익명 수준에 따라 변화하는 정확도와 다양성 지수를 통해 제시하였다. 나아가 익명화된 개인 모빌리티 패턴은 센싱 자료와 결합하여, 작성된 온라인 대시보드를 통해 참가자들의 Geoprivacy가 보장되면서 공공 및 잠재적인 연구자에게 대기오염노출의 시각화 및 유익한 정보 제공에 기여할 수 있다.
이를 반영하듯 현재 약 130개국 30,000개에 해당하는 실시간 (국가)대기오염측정망에서 수집되는 정보를 제공하는 World Air Quality project가 2007년부터 운영되고 있다. 하지만 대기오염을 포함한 다양한 환경유해인자의 노출의 위해성 최소화를 위한 위치정보서비스 제공을 위해선 센싱 데이터 수집 및 효율적인 공유 및 안전한 활용에 필수적인 Geoprivacy가 고려된 효과적인 개인위치정보 비식별화-익명화 처리수준과 영역에 대한 구체적인 규정 및 기술에 대한 연구가 필요하다.
마지막으로, 개인위치정보 비식별화-익명화 처리는 향후 데이터 기반 스마트도시 실현을 위해 도시민들이 직접 센서를 통해 자료를 수집하고, 수집된 자료의 처리를 통한 융합데이터 생성, 나아가 미시적인 공간단위의 분석을 통한 새로운 시사점을 도출하는 participatory sensing data 연구에서 개인정보 노출위험 방지를 위해 적절한 수준과 구체적인 방법의 검토가 반드시 고려되어야 할 것이다. 이를 위해선 온라인 대시보드의 각기 최종 사용자들의 목적을 검토하고, 이를 바탕으로 상이한 권한설정 및 비식별화 처리수준에 대한 가이드라인 작성이 요구된다.







