한국교통연구원은 비정상적 시계열 데이터 특성에 따른 비모수 기계학습 모형 성능 및 활용방안을 비교 · 분석한 보고서를 발표하였다.
- 끊임없이 변화하는 도시 인프라의 수요예측의 정확도에 따라 미래 도시의 경쟁력은 달라질 수 있으며, 도시 시계열 데이터 예측은 시간에 따른 변화양상이 큰 도시 인프라의 수요예측에서 핵심적인 역할을 함. 기존 시계열 수요예측은 통계적 모형(ARIMA, SARIMA)에 의존해 왔으나, 통계적 모형은 사전가정으로 비선형적 패턴을 포착하는 데 한계가 있어 사전 가정의 한계에서 자유로운 기계학습모형이 비선형적 데이터 처리에 활용되는 추세임. 다만, 다양한 기계학습 알고리즘 중 어떤 알고리즘이 도시 내 인프라 수요 예측에 적합한 지에 대한 논의는 계속해서 이뤄지고 있는 추세임. 본 연구에서는 COVID-19 이후 불확실성이 커진 도시내 철도수송수요를 대상으로 다변량 기계학습모형과 단변량 기계학습모형의 성능 및 활용방안을 비교 및 검증하였음.
- 분석 결과, Prophet은 비정상적 시계열적 자기상관성을 고려하며, COVID-19 및 올림픽을 고려한 예측에서 탁월한 성능을 보여주었음. 단, XGBoost는 외부요인에 대한 계량화를 통해 역별 수송수요의 특성을 파악할 수 있었음. 따라서, 기계학습 알고리즘의 선택은 분석의 목표·활용 방향성에 맞춰 활용한다면 보다 효율적인 전략수립에 도움이 될 것임.