머신러닝 기법을 이용한 공기업 재무건전성 예측모델 실증연구
- Abstract
- 본 연구는 4가지 머신러닝 기법(Random Forest, XGBoost, LightGBM, DNN)을 이용한 공기업 재무건전성 예측모델 실증연구를 통해 컨설팅 현장에서 머신러닝 기법을 적용할 수 있는 방안들을 모색해보고자 하였다.
불과 2-3년 사이 데이터의 디지털화를 통한 빅데이터 시장의 급성장과 컴퓨터 성능의 발달로 인해 머신러닝 기술의 발전과 함께 머신러닝 활용에 대한 대중적 관심이 급격하게 증가했다(한국IR협의회, 2019).
전통적 통계분석 기법이 표본에서 전체 집단의 의미를 탐색하는 수학적 모델을 중시한 형태라면, 머신러닝 기법은 데이터로부터 중요한 패턴과 규칙을 찾아내어 의사결정 지원 및 예측을 수행하는 모델을 구현하는 일에 초점이 맞추어져 있다. 이에 따라 인간의 직관이 아닌 데이터를 이용한 예측을 통한 의사 결정 시스템이 점점 중요해지고, 데이터를 이용한 경영 예측이 기업의 생존과 발전에 있어서 무엇보다 중요하게 여겨지고 있다(양진용, 2017).
현재 글로벌 선도기업인 구글, 아마존, MS는 모든 비즈니스 역량을 데이터 및 인공지능으로 전환하고 있다. 우리나라도 인공지능의 활용을 위해 정부 차원에서 공공·민간 분야별로 데이터를 수집 및 제공을 위한 빅데이터 플랫폼과 센터를 구축하고, 중소·벤처기업이 데이터를 활용한 새로운 서비스를 개발할 수 있도록 다양한 지원사업을 추진 중이다.
이처럼 다양한 분야에서 머신러닝에 대한 관심과 수요가 증가하고 있기에 컨설턴트들도 머신러닝이라는 새로운 방법론에 대한 이해 및 활용 가능성에 대해 살펴볼 필요가 있다. 그 동안 머신러닝 기법을 활용한 연구는 통계학, 의학, 공학, 자연과학 분야에서 주로 이루어져 왔으나, 최근 들어 사회과학 분야에서도 활용되기 시작했다(최필선, 민인식, 2018)
지난 해부터 올해까지 우리나라 주요 공공기간의 재무건전성이 악화되고 있다는 보도들이 계속 이어졌다. 한편 2012년 이후 공공기관 재무건전성 제고 방안에 대한 연구가 꾸준히 이어져 왔지만, 머신러닝을 이용한 공공기관 경영성과나 재무건전성 예측 연구는 찾아보지 못하였다. 이에 본 연구에서는 머신러닝 기법을 이용한 재무건전성 예측모델 설계해보기로 하였다.
본 연구에서는 공기업 재무건전성 예측모델 설계를 위해 K-IFRS 도입 시점인 2011년부터 2017년까지 7개년 연속 선정된 26개 공기업 재무 데이터를 활용하였다. 데이터를 각각 5개년 단위로 나누고 4가지 머신러닝 기법을 이용하여 2016년과 2017년 공기업 재무건전성 예측모델을 설계하여 도출된 요인들을 분석하였다.
본 연구의 실증분석 결과는 다음과 같다. 먼저 예측 모델 설계 결과, 4가지 머신러닝 기법 중 Random Forest와 XGboost를 이용한 공기업 재무건전성 예측모델을 만들 수 있었다. 모델별 예측에 있어서는 두 가지 모델 모두 거의 85% 이상의 예측 정확도를 보였고, XGBoost를 이용한 예측모델이 Random Forest 모델보다 예측 정확도가 더 높은 것으로 나타났다. 하지만 나머지 2가지 기법인 LightGBM과 DNN을 통해서는 예측모델을 만들지 못하였다. 이는 데이터의 수가 너무 적어 과한 학습으로 과적합 현상으로 실제 데이터에 대한 예측 시에는 오차가 커져 예측 정확도가 더 떨어지는 것으로 확인되었다.
연도별 예측에 있어서는 XGboost와 Random Forest를 이용한 공기업 재무건전성 예측모델 모두 2016년보다 2017년도의 예측 정확도가 더 낮게 나타났다. 이러한 결과는 2017년 정권 교체 영향으로 보인다. 2017년 5월 문재인 정부가 출범하면서 정책 등 사회 전반에 많은 변화가 있었다. 이러한 변화 요인은 기존 데이터를 통한 예측 정확도를 떨어뜨리는 요인이 될 수 있다.
머신러닝 기법은 변수 중요도를 제공하는데, 독립변수의 중요도 점수가 높을수록 목표변수 예측에 중요하다고 본다. 본 연구에서는 Random Forest와 XGboost 두 모델을 통해 총자산 경상이익률의 변화, 매출액 영업이익률, 매출액 영업이익률의 변화, 영업이익손실, 영업활동 현금흐름이 중요도가 높은 변수로 도출되었다. 주로 수익성과 관련된 지표들로 이는 공기업 재무건전성 예측에 주요변수가 됨을 확인하였다. 이러한 결과는 공기업의 특성상 공익성을 추구해야 하지만 공기업의 재무건전성을 높이기 위해서는 수익성을 간과할 수 없음을 시사한다. 또한 최근 우리나라 공기업 부채가 계속 늘어가고 있는 상황에서 공기업 경영실적 평가지표 내 재무관리 지표가 점수가 줄고, 주로 정성적 평가비중이 계속 늘어나고 있어 공기업 경영실적 평가지표에 대한 냉정한 재고가 필요한 시점이다.
본 연구 결과를 통해 컨설팅 현장에서 머신러닝 기법 적용 시 고려해야 할 부분들을 제시하면 다음과 같다. 먼저 머신러닝 기법에 필요한 데이터의 양은 문제의 복잡도과 머신러닝 기법에 따라 다르다. 실제 기업 현장에서 접하는 데이터들은 정제되지 않은 비선형 형태가 대부분이며, 이러한 데이터를 가지고 패턴과 규칙을 찾기 위해서는 훨씬 더 많은 데이터를 필요로 한다. 인터넷을 통해 막대한 양의 데이터가 확보되면서 빅데이터를 기반으로 한 머신러닝의 활용 가능성은 높아졌다. 하지만 현재 머신러닝은 원하는 수준의 모델에 필요한 데이터의 양이 표준화되어 있지 않다. 또한 컨설팅 현장에서도 기업의 규모나 기업이 원하는 문제의 형태에 따라 적용하는 방법론이 다르듯 기업이 가지고 있는 데이터의 규모나 형태에 따라 적절한 머신러닝 기법을 사용할 필요가 있다. 현재 머신러닝 기법은 계속 발전하고 있지만 전통적인 통계 분석 기법처럼 표준화된 형태의 방법론을 찾기 어렵다. 때문에 실제 머신러닝 기법의 적용에 있어서는 다양한 시행착오를 통한 노하우를 쌓아가야 할 것이다.
본 연구에서 공기업 재무건전성 예측모델 설계 시 정권의 변화 등 외부요인에 대해 고려하지 못하였는데, 이는 실제 데이터 예측에 영향을 주요 변인이 될 수 있다. 따라서 머신러닝 기법을 이용한 예측모델 설계 시 외부 예측 시간에 따라 예측 대상의 특성이 변하는 것을 모니터링하여 그 변화를 반영하거나 주기적으로 재학습하는 작업이 필요하다(Žliobaitė, 2010).
한편 본 연구를 통하여 머신러닝 기법의 유용함도 확인할 수 있었다. 먼저 머신러닝 이용하여 설계한 예측모델은 동일한 형태의 새로운 데이터가 주어졌을 때 이미 설계한 코드를 활용하여 쉽게 예측 결과를 확인할 수 있다. 즉, 2016년 공기업 재무건전성 예측모델을 설계한 코드에 해당 연도 코드명만 바꾸어 입력하여 손쉽게 2017년 예측모델 결과를 확인할 수 있었다. 또한 머신러닝 기법에서 제공하는 변수 중요도를 통해 목표변수 예측에 기여하는 주요 변수들을 쉽게 확인할 수 있다. 이러한 머신러닝 기법의 장점들은 컨설팅 현장에서도 유용하게 사용할 수 있는 부분이라고 여겨진다.
이제 인공지능은 4차 산업혁명을 촉발하는 핵심동력으로 산업구조의 변화는 물론 사회제도의 변화를 불러올 것이며, 인공지능 역량이 기업의 성장 요인이 될 것이라고 전망하고 있다(한국IR협의회, 2019). 컨설턴트는 기업의 문제해결을 위한 솔루선을 제공하는 전문가로 산업 및 경영환경의 변화에 민감하게 반응하고 민첩하게 대응해야 한다. 이에 컨설턴트라면 현재 빠른 속도로 발전하고 있는 인공지능에 대한 빠른 이해와 컨설팅 현장에서의 적용 방안을 준비해야 한다.
본 연구는 전통적인 통계분석 기법이 아닌 머신러닝 기법을 이용한 예측모델 실증연구를 통해 컨설팅 현장에서 머신러닝 기법을 적용할 수 있는 방안을 모색해보았다는 점에서 의의가 있가 있다. 본 연구가 컨설턴트들에게 머신러닝의 필요와 중요성에 대한 인식과 함께 컨설팅 현장에서의 머신러닝 기법의 적용을 위한 하나의 발판이 되기를 기대한다.
- Author(s)
- 윤혜란
- Issued Date
- 2020
- Awarded Date
- 2020-02
- Type
- Thesis
- Keyword
- 컨설팅; 공기업; 재무건전성; 재무건전성지수; KJY Score; K-IFRS; 머신러닝; 예측분석; 예측모델; RandomForest; XGBoost; LightGBM; DNN
- URI
- http://dspace.hansung.ac.kr/handle/2024.oak/7032
- Authorize & License
-
- Files in This Item:
-
Items in Repository are protected by copyright, with all rights reserved, unless otherwise indicated.