Ⅰ. 서 론
코로나-19 팬데믹 발발 이후 대한민국 전체 경제 상황은 2020년 2분기에 최저점을 거친 후 회복 중이나, 산업 부문별로 회복의 정도는 큰 차이를 보이고 있다. 일부 산업들은 2020년 2분기 최저점을 돌파한 이후 빠르게 회복 중이지만, 다른 산업부문들은 부진이 지속 중이다. 코로나-19 팬데믹 영향이 산업별로 미친 영향은 가히 양극화라 할 만큼 산업별 편차가 매우 컸는데, 예술, 스포츠, 식음료 등 대면형 서비스 업종은 마이너스 성장이라는 심각한 타격을 받았다. 하지만 바이오, 반도체 등 IT 산업, 온라인 유통 및 골프 산업 등은 코로나-19 특수로 오히려 역대 최대 규모 호황을 이어가고 있다(Kang et al., 2021).
특히 국내 골프산업은 코로나-19 팬데믹 특수를 누린 대표적인 산업으로 자리매김하였다. 골프장이 집중되어 있는 제주지역은 골프장 내장객이 ‘21년 기준 약 22% 급증하면서 역대 최고치를 기록했다. 코로나-19 팬데믹 이후 골프가 대표적인 비대면 스포츠로 대중화되었고, 각국이 국경을 봉쇄하면서 해외 아웃바운드 여행이 막히면서 기존 골프여행 수요가 제주도로 몰렸기 때문이다(조선비즈 보도자료, 2022.3.28.)1).
한국은행이 제시한 ‘2022년 3월 지역경제보고서’에 따르면 2021년 제주지역 골프장 내장객은 2020년 동기 대비 약 21.6% 증가한 290만 명으로 조사되었다. 2020년 제주지역 골프장 내장객 숫자가 약 238만 명을 기록하였고 2년 연속 역대 최고 기록을 경신한 것이다. 한국은행 보고서는 “제주지역內 내장객이 6.3% 감소했음에도 불구하고 다른 지역에서 제주도를 찾은 제주지역外 내장객이 46.1% 급증하였기 때문이다”라고 분석했다. 문화체육관광부에 따르면 우리나라 골프 인구는 2017년에 306만 명이었는데 2021년 474만 명으로 약 155% 증가했다. 뿐만 아니라 내국인의 아웃바운드 해외여행 제한이 장기화되면서 해외 골프여행 수요가 제주지역으로 이전된 효과까지 반영된 것으로 보인다.
제주연구원(2020)이 발간한 ‘코로나 이후 지속가능한 골프관광 활성화 방안' 연구 보고서에 따르면, 제주지역을 찾은 골프관광객의 지역경제 파급효과는 내륙지역보다 약 2배 이상 높은 것으로 조사되었다. 제주를 방문한 골프장 내장객의 소비지출에 따른 지역경제 파급효과를 분석한 결과, 생산유발 효과는 약 1조 1,640억 원으로 도외(내륙) 지역 5,651억 원의 약 2배 수준으로 나타났다. 부가가치 유발효과 역시 4,569억 원으로, 내륙 지역의 2,177억 원보다 약 2배 이상 높았다. 취업유발 효과는 1만 4,077명으로, 내륙지역의 유발 효과인 3,251명보다 무려 4배 이상 높았다.
코로나-19 팬데믹 이후 회복세를 이어오던 국내 경제는 최근 중국의 코로나-19 재확산 및 신규 변이 발생 등으로 다시금 복합적인 위기 상황을 맞이하고 있다(YTN 보도자료, 2023.01.22.)2). 이러한 대내외적인 경제적 및 외교적 상황들은 국내 인바운드 및 아웃바운드 항공여객 수요 예측에 돌발변수로 작용하고 있다. 하지만 제주지역 인바운드 항공여객은 국내외 충격에도 흔들림 없이 꾸준히 성장할 것으로 예측된다(제주연구원, 2020). 특히 제주지역을 방문한 골프장 내장객(도내 제외)이 제주지역에 미치는 지역경제 파급효과 및 생산유발효과가 매우 높기 때문에, 본 연구는 제주지역 골프장을 찾는 도외 및 외국인 내장객 증가세가 제주지역을 찾는 인바운드 항공여객 성장세에 가장 큰 영향을 미치는 변수들 중 하나로 작용할 것이라고 판단했다. 따라서 본 연구는 제주지역 골프장을 찾는 내장객 데이터를 토대로 단기적으로 2025년까지 수요를 분석하고 본 수요 분석 데이터를 토대로 향후 제주지역을 찾는 인바운드 항공여객 성장세를 예측하고자 하였다.
Ⅱ. 본 론
ARIMA는 자기회귀를 뜻하는 AR(Auto-Regressive) 과 이동평균을 의미하는 MA(Moving Average)의 약어가 합쳐진 단어이다. ARIMA는 지수평활법과 더불어 대표적인 수요 예측 방법론들 중 하나이다. ARIMA 시계열 모형은 과거의 데이터 관측값과 오차값을 토대로 현재의 시계열 값을 설명하는 ARMA 모형을 일반화 한 것으로 가운데 I는 개입변수(intervention)를 의미한다(김민수 외, 2012). ARIMA는 월별, 분기 또는 연 단위로 규칙적인 과거 데이터를 토대로 다음 지표를 예측하는 데 주로 사용된다. 따라서 ARIMA 시계열 모형으로 주/월간 단위로 지표를 예측하며 현재 및 미래시점에서 데이터의 주기(trend)에 이상이 없는지 확인하는데 주로 사용하는 분석 기법이다(Kwon, 2019).
자기회귀(AR) 모형은 시간이 경과하면서 데이터 x(t)에 대해 매 순간마다 데이터들 사이에 상관관계가 있다고 가정한다. 다만 여기에 백색잡음(white noise)이 첨가되는데 그 백색잡음에는 시간적인 상관관계가 존재하지 않는다. 현 시점에서 관측되는 데이터는 그 데이터의 과거 관측치들의 함수 형태로써 표현할 수 있다는 가정을 토대로 자기회귀 모형은 율-워커 방정식을 통해서 추정되었다(Libal and Johansson, 2019).
이동평균(MA) 모형은 현 시점에서 관측된 데이터는 백색잡음들의 선형결합 형태로 나타낼 수 있다는 가정 하에서 Slitzky(1937)에 의해 제안된 모형이다. 이후 Wold(1938)는 자신의 시계열 연구를 통해 자기회귀와 이동평균모형을 결합하여 자기회귀-이동평균(ARMA, Auto-Regressive & Moving Average) 모형을 제시하였다.
이러한 여러 모형들을 이용해서 현재의 확률적시계열 모형을 완성하는 방법론을 정립했는데, 바로 Box-Jenkins의 ARIMA모형이다(Box and Jenkins, 1976). 이는 다양한 분야에서 적용되어 시간영역에서 대표적인 시계열분석 방법론으로 자리를 잡았다(Yoon and Park, 2019; Kim et al., 2012; Box et al., 1994).
본 연구는 ARIMA 시계열 분석을 통한 수요 예측을 위해 총 3단계로 구성된 연구모형을 Fig. 1과 같이 제안하였다(Box and Jenkins, 1976; Abobazel and Abd-Elftah, 2019). 첫 번째 단계에서 연구자는 과거에 관측된 시계열 데이터를 바탕으로 예측하고자 하는 ARIMA 모형을 식별한다(Stage-1: Identification). 두 번째 단계에서 기식별된 ARIMA 시계열 모형의 계수를 추정(Stage-2: Estimation)한다. ARIMA 모형에는 p, d, q라고 하는 모수들이 있는데 해당 모수들을 추정한 후에 해당 모형과 계수들의 적합도를 통계 프로그램을 통해 검증하게 된다(윤한영과 박성식, 2019). 이 단계가 바로 검증(Stage-3: Diagnostic)이다. ARIMA 시계열 분석에 있어 최종적인 단계는 예측(Stage-4: Forecasting)이다. 예측과정에서 만족스러운 모형 및 결과값이 선택될 때 까지 진단과 예측과정을 반복하게 된다. 본 연구의 예측모형은 Box and Jenkins(1976)가 제안한 3단계 모형을 토대로 설정되었다.
본 연구는 2025년까지 단기적으로 제주지역 인바운드 항공여객 성장률을 예측하기 위하여 제주지역 골프장 내장객 현황 데이터를 활용하여 ARIMA 모형을 사용하였다. 본 연구에 사용된 데이터는 2017년 1월부터 2021년 12월까지 총 60개의 관찰 표본수로 이루어진 제주지역 골프장 내장객(도외 및 외국인) 월별자료이다. ARIMA 시계열 분석에 사용되는 관찰 표본수는 최소 50개 이상 확보된다면 신뢰성 있는 예측결과를 도출할 수 있다. 물론 본 연구에 사용된 데이터처럼 표본에 계절성(seasonality)이 있을 경우 보다 많은 관찰 표본을 필요로 하지만 약 60개 이상이면 안정적인 시계열 분석이 가능하다(Hanke and Wicherm, 2009). Fig. 1은 제주지역 골프장 내장객 월별 데이터를 시계열도표로 나타낸 것이다.
시계열 도표를 살펴보면 시간이 경과함에 따라 매년 수치가 증가하는 추세성(trend)이 분명히 존재하고, 매년 주기적이고 반복적인 추세까지 나타내는 비정상 시계열로 파악되었다. 따라서 계절성을 고려한 계절차분과 비계절적 차분을 각각 1회씩 실시하였으며 그 결과는 Fig. 2에 제시되어 있다. Fig. 2에는 본 연구의 시계열 데이터가 정상성(stationary)을 나타내고 있음을 보여준다.
다음으로 ARIMA 모형의 모수인 p, d, q 차수를 결정해야 한다. 차수의 결정은 자기상관함수(ACF, Auto Correlation Function)와 편자기상관함수(PACF, Partial Auto Correlation Function)에 나타난 Correlogram (코레오그램)을 분석함으로써 결정할 수 있다.
자기상관함수(ACF)의 코레로그램은 지수적으로 감소하는데 경향을 보이는 것에 반해 편자기상관함수(PACF) 코레로그램은 그렇지 못한 것으로 분석되었다. 아울러 편자기상관함수 코레로그램에서 제1주기의 단기시차 5에서 스파이크가 신뢰한계선 밖으로 돌출되어 있어 MA(1) 요소를 모형에 추가시켜야 함을 알 수 있었다. 비록 시차 12시점 이후에 자기상관함수와 편자기상관함수 코레로그램 모두 스파이크가 신뢰한계선 밖으로 돌출되어 있지는 않았지만, 앞서 순차도표에서 제주지역 골프 내장객 데이터에는 계절성 및 비정상성이 있음을 확인하였기 때문에 최종 예측모형은 ARIMA(0,1,0) (0,1,1)로 결정하였다(Fig. 3 참조).
제주지역 골프장 내장객 데이터를 토대로 추정된 예측 모형은 Table 1 및 Table 2와 같다. Table 1의 추정된 모형에서 p, d, q 모수들 중 앞서 결정한 모수(q) 차수 값인 MA(1)에 대한 분석 결과 t-값과 유의확률은 각각 2.151 및 .037로 분석되어 95% 신뢰수준에서 MA(1) 추정값은 유의한 것으로 분석되었다. 또한 자기상관함수 잔차에 대한 Box-Ljung 통계량 및 유의확률이 20.55(.247)로 나타나 95% 신뢰수준에서 통계적으로 유의하지 않았다(Table 1 참조). 다시 말해서 ‘잔차 사이에 자기상관이 없다’라는 귀무가설을 기각할 수 없는 것으로 나타났다.
ARIMA | Model fit statistics | Ljung-box Q | ||||||
---|---|---|---|---|---|---|---|---|
Stationary R-squared | R-squared | RMSE | MAPE | Normalized BIC | Statistics | Degree of freedom | p-value | |
Model_1 | .768 | .768 | 23,075.99 | 17.49 | 20.175 | 20.55 | 17 | .247 |
Model_1 | Est. | S.E. | t | p |
---|---|---|---|---|
Differentiation | 1 | - | - | - |
Seasonal differentiation | 1 | - | - | - |
MA(1) Numerator 1 | .436 | .203 | 2.151 | .037 |
추정된 ARIMA 모형의 예측치는 실제 관측치와 비교를 통해 예측 오차에 대한 검토과정을 거쳐 그 정확도를 측정할 수 있다. 본 연구에서는 MAPE(Mean Absolute Percentage Error)를 활용하였다. MAPE는 절대평균백분율오차라고 하며 실측치와 예측치 간 오차를 비교한 결과 그 값이 17.49로 나타나 수용할 만한 수준의 우수한 예측력을 보여주었다. Kim et al.(2012) 및 Lewis(1982) 연구에서 MAPE 값이 0% ≦ MAPE < 10% 범위에 있으면 매우 정확한 예측이며, 10% ≦ MAPE < 20%인 경우에는 수용할 만한 정확한 예측이라고 정의하였다. 하지만 MAPE 값이 20% ≦ MAPE < 50% 범위에 있으면 비교적 합리적인 예측이지만 재검토가 필요하며, 50% 이상일 경우에는 부정확한 예측으로 판단하였다.
따라서 본 연구는 MAPE, Ljung-Box 통계량 등을 근거로 예측모형 및 예측값을 신뢰하고 수용할 수 있다고 보았다(Chen et al., 2016; Ljung and Box, 1978).
또한 Fig. 4에 제시된 바와 같이 자기상관함수 및 편자기상관함수의 잔차가 신뢰수준 내에 분포해 있기 때문에 시계열 분석에서 백색잡음(white noise)의 조건을 만족하고 있다. 백색잡음 과정이란 서로 독립적으로 무차별하게 동일한 분포를 따르는 확률변수들의 계열로 구성된 확률과정이다. 잔차항들이 서로 독립적이고 평균 0, 분산 α2 분포를 갖는 확률변수라고 할 때 ε ∼ WN(0, α2) 라고 표기할 수 있다. WN(0, α2) 분포(WN: White Noise Distribution)에서 평균과 분산이 일정하며 어떠한 추세도 관측되지 않기 때문에 연구자는 대표적인 정상 시계열로 판단할 수 있다(Moffat and Akpan, 2019).
Fig. 5는 2017년 1월부터 2021년 12월까지 월별 데이터를 토대로 2025년 12월까지 예측한 제주지역 골프장 내장객(도외 및 외국인) 추정치를 보여주고 있다. 제주지역 골프장 내장객은 코로나-19 발발에도 불구하고 특이한 감소세를 보여주지 않았기 때문에 2025년 12월까지 단기적으로 백색잡음 조건을 만족하면서 안정적인 증가세를 보여주고 있다(Fig. 6 참조). 이러한 제주지역 골프장 내장객의 안정적인 증가세는 여러 대내외적 상황 및 변수에 영향을 쉽게 받는 항공여객 수요에 직접적인 영향을 줄 것이며 제주지역 인바운드 항공여객 증가세에 매우 유의한 영향을 줄 것으로 사료된다(Fig. 7 참조).
Ⅲ. 결 론
본 연구는 서론에서 언급한 바와 같이 제주지역 골프장 내장객 월별 데이터를 토대로 ARIMA 예측 분석을 실시하여 2025년까지 단기적으로 제주지역 골프장 내장객 성장률을 예측하고자 하였다. 이렇게 추정된 ARIMA 모형 모수 추정치 및 성장율을 토대로 제주지역 인바운드 항공여객수를 추정하고자 하였다.
제주지역 인바운드 항공여객에 대한 2025년 12월가지 수요예측 및 성장률은 추정치는 Fig. 5에 제시되어 있다. 제주지역 골프장 내장객 데이터를 토대로 도출되었던 모수(p, d, q) 추정치를 적용한 ARIMA(0,1,0) (0,1,1) 모델을 제주 인바운드 여객 데이터에 적용한 결과 Fig. 5와 달리 단기적으로 큰 변동성 없이 안정적인 인바운드 여객 성장세를 기록할 것으로 분석되었다. 왜냐하면 2017년 1월부터 2021년 12월까지 제주지역 골프장 내장객의 계절적 방문 특성은 큰 변동폭을 보였던 반면에 제주지역 인바운드 항공여객(도착여객 기준)의 계절적 입도 특성은 같은 기간 동안 소폭의 변동성을 보여주었기 때문이다(Table 3-5 참조).
ARIMA | Model fit statistics | Ljung-box Q | ||||||
---|---|---|---|---|---|---|---|---|
Stationary R-squared | R-squared | RMSE | MAPE | Normalized BIC | Statistics | Degree of freedom | p-value | |
Model_1 | .810 | .810 | 106,884.15 | 7.658 | 23.651 | 22.683 | 17 | .160 |
Model_1 | Est. | S.E. | t | p |
---|---|---|---|---|
Constant | 6,123.91 | 9,768.19 | .627 | .534 |
Differentiation | 1 | - | - | - |
Seasonal differentiation | 1 | - | - | - |
MA(1) Numerator 1 | .663 | .287 | 2.306 | .026 |
따라서 본 연구의 결과를 종합해 보면 제주지역 골프장 내장객은 코로나-19 발발기간에도 완만한 성장세를 보여주었으며 이러한 성장세를 꾸준히 2025년 12월까지 보여줄 것이다.
제주지역 인바운드 항공여객은 코로나-19 발발 기간 동안 여러 가지 대내외 경제적(고환율, 마이너스 경제성장 등) 사회적(방역강화, 사회적 거리두기 등) 및 글로벌 변수(국가별 출입국 제한, 코로나-19 변종 바이러스 발생 등)에 영향을 받아 골프장 내장객 추세와 다른 마이너스 성장을 보여주었다. 하지만 본 연구 결과 2023년 하반기 이후 2019년에 기록한 가장 높았던 월별 인바운드 여객(도착여객) 기록을 경신하여 높은 성장세를 보여줄 것으로 판단된다.