엑셀마이너(xlminer)는 생각보다 유용한 것 같아요.
다양한 classication 머신러닝 기법들 뿐만 아니라 시계열 분석도 가능하네요.
(그래서 프로그램의 무게가 꽤나 무거운 게 아닐까 싶네요 ㅎㅎ)
지도 학습과 비지도 학습
classification 툴 중에서는 classification tree, logistic regression을 주로 사용하는 것 같은데,
이외에도 Deep learning, Ensemble(bagging, boosting, random forest) 등 다양한
머신러닝 알고리즘을 구현하는 기능을 지원합니다.
다만 10,000 * 50 정도의 데이터를 Ensemble 기법으로 돌려보려고 했는데 컴퓨터가 멈췄습니다.
노트북 사양의 문제도 있겠지만, 만 건이면 데이터수가 많은 것도 아닌데
엑셀에서 ML을 돌리기에는 과부하가 걸리는 모양입니다.
(변수 개수를 최대 50개까지만 선택 가능한 것도 단점이네요)
이외에도 K-means algorithm 등 비지도 학습 기법들도 적용이 가능합니다.
비지도 학습은 target 변수를 별도로 지정하지 않고, 속성이 유사한 군끼리 clustering 하는 방식인데요.
대다수의 금융 데이터 분석에서는 target 변수를 예측하는 것이 목적이 되기 때문에
위의 지도 학습들에 비해서는 덜 사용하는 것 같습니다.
시계열 분석
생각보다 다양한 시계열 분석 기능을 지원합니다.
Smoothing 탭에서 Exponential, Holt--winters 등 기법을 통해 계절성, 추세성을 없애는 기능이 존재하며,
데이터의 정상성 가정 하에서 ARMA 모형도 적합이 가능합니다.
ACF, PACF의 형태도 선명하게 시각화가 가능해서 ARMA(p, q) 모형에서 적절한 p, q를 선택하는 작업도 해볼 수 있어요.
계절성을 제거하는 기증이 있는 것으로 보아 ARIMA(p, d, q) 형태로 적합도 가능한 것 같습니다.
정상성을 만족시키기 위해 데이터에 차분을 해서
비정상 데이터를 정상으로 만들어주는 방식이었던 것 같아요ㅎㅎ
prediction 기능도 있어서 프로그래밍 언어를 모르더라도 시계열 분석을 통해 예측을 해볼 수도 있습니다!
학부 시절에는 데이터의 변동성이 큰 금융데이터는 GARCH 모형으로 적합한다고 배웠던 것 같은데,
GARCH나 ARCH를 적합하는 기능은 따로 엑셀마이너에는 존재하지 않는 것 같습니다~
엑셀마이너의 기능을 일부 밖에 모르는 제가 보기에도
꽤나 장점이 많은 프로그램이라는 생각이 듭니다.
엑셀 기반이라 대용량 데이터나 수많은 변수를 다룰 순 없지만,
수천 건 정도의 데이터에 대하여 간단히 classification tree를 만들거나 variable selection을 진행하고 싶을 때,
ARIMA를 비롯한 시계열 모형을 적합하고 싶을 때 유용하게 사용할 수 있습니다.
시각화도 편하고, 무엇보다 코딩이 필요 없는 직관적인 구조라서 편하네요ㅎㅎ
'카이스트 DFMBA' 카테고리의 다른 글
[DFMBA] 디지털금융 MBA 1학년 겨울학기 재학 후기 (2) | 2023.12.31 |
---|---|
[DFMBA] 디지털금융 MBA 1학년 2학기 재학 후기 (0) | 2023.10.22 |
[DFMBA] 디지털금융 MBA 1학년 여름학기 재학 후기 (0) | 2023.10.22 |
[DFMBA] 디지털금융 MBA 1학년 1학기 재학 후기 (0) | 2023.07.15 |
[DFMBA] 카이스트 디지털금융 MBA 재학 후기를 시작하며 (0) | 2022.11.14 |
댓글