Finance, Markets and Valuation
DOI:
10.46503/HDDL8238
Corresponding author
Javier Oliver
Recibido: 30 Mar 2018
Revisado: 10 May 2018
Aceptado: 17 May 2018
Finance, Markets and
Valuation
ISSN 2530-3163.
Finance, Markets and Valuation Vol. 4, Num. 1 (Enero-Junio 2018), 59–66
Análisis y clasificación de indicadores técnicos
mediante Support Vector Machine
Analysis and classification of technical analysis indicators
by Support Vector Machines
Javier Oliver
ID
1
1
Facultad de Administración y Dirección de Empresas, Universitat Politècnica de Valéncia.
Valencia, España. Email: jaolmun@ade.upv.es
JEL: G110; G140; G170
Resumen
La búsqueda de modelos para la predicción de la tendencia de los índices bursátiles se ha desarrollado
en las últimas décadas. Los indicadores y osciladores técnicos son los inputs más utilizados en todos los
modelos. Éstos se basan fundamentalmente en los precios y dirección del propio índice. Esto puede pro-
vocar ciertos problemas en las estimaciones y procesos de aprendizajes de los diferentes modelos, como
multicolinealidad y autocorrelación para el caso de modelos lineales y problemas de sobreoptimización y
ruido en otros casos como en las redes neuronales.
Se plantea filtrar los diferentes indicadores y osciladores técnicos a utilizar en los diferentes modelos.
Para ellos, se va a analizar el impacto que tienen éstos en el proceso de predicción de la tendencia de un
índice bursátil. El modelo utilizado es la support vector machine que permite encontrar las características
tanto de los inputs (indicadores y osciladores) como del output (la tendencia del índice). Este mapeo de
la relación de los indicadores y la tendencia ofrece información relevante sobre si dicha contribución a
su predicción es estable en el tiempo. Por tanto, se seleccionarán aquellos inputs cuyas características
estabilicen las predicciones en los modelos. A pues, se deben descartar aquellos indicadores irregulares,
aunque puntualmente puedan alcanzar ratios de acierto algo más elevadas que los más estables. Este
proceso provocará obtener predicciones de la tendencia más consistentes.
Keywords: Support Vector Machines; Tendencia; Índice bursátil; Dow Jones Industrial;Indicadores técnicos.
Abstract
The searchformodelswhich canaccurately forecastthemarket trend has developed over the past decades.
Technical indicators and oscillators are the most usually employed inputs in the prediction models. These
inputs basically rely on prices and the evolution of the index itself, which may cause some problems like
multicolinearity and autocorrelation, in the case of linear models, or overoptimization and noise, in the
case of neural networks. This paper proposes filtering the inputs to be employed in the models. To this
end, their impact on the forecast will be analysed. A support vector machine will be used to this end,
in order to characterize both inputs (indicators and oscillators) and output (market trend). Doing this,
Cómo citar este artículo: Oliver, J. (2018) Análisis y clasificación de indicadores técnicos mediante
Support Vector Machine. Finance, Markets and Valuation 4(1), pp. 59–66.
59
Finance, Markets and Valuation Vol. 4, Num. 1 (Enero-Junio 2018), 59–66
it can be assessed whether the relationship between the dierent inputs and the market trend oers
relevant information regarding the contribution of the inputs in the prediction process and whether this
contribution remains constant over time. Those inputs will be selected, which obtain more stable forecasts
in order to obtain more consistent predictions.
Keywords: Support Vector Machines; Trend; Stock index; Dow Jones Industrial Average; Technical indica-
tors.
1 Introducción
El análisis y estudio de la tendencia de los índices bursátiles se ha realizado mediante el
uso de diferentes tipos de modelos. Por un lado, destacan modelos de regresión logística, que
se aplican cuando se supone una relación lineal entre los inputs y output.
Este modelo es muy utilizado para el caso que la variable respuesta sea dicotómica. El
modelo presenta una función qué describe la probabilidad del suceso 1 o 0, para el caso de
tener tendencia alcista o bajista. Puede verse un ejemplo de la utilización de este modelo en
Zaidi y Amirat (2016) que analiza la tendencia índice Ksa. También en el análisis de la tendencia
del índice bursátil de la India (Dutta, Bandopadhyay, y Sengupta, 2012).
La sup port vector machine es otro tipo de modelo de clasificación muy utilizado en la
predicción de la tendencia de los índices bursátiles. Este modelo separa el problema en un
hiperplano y mediante un problema de optimización minimiza las distancias generadas entre
las características de los inputs y las características de lo outputs. En W. Huang, Nakamori, y
Wang (2005) se analiza la tendencia semanal del índice Nikkei 225. Oztekin, Kizilaslan, Freund,
y Iseri (2016) utilizan la SVM en la tendencia diaria de los índices bursátiles emergentes, como
el índice de Estambul. El análisis de la tendencia diaria mediante indicadores técnicos es
muy frecuente. En jae Kim (2003) se analiza la tendencia del índice coreano mediante doce
indicadores y osciladores técnicos. Kara, Boyacioglu, y Ömer Kaan Baykan (2011) realiza una
comparación entre la SVM y las redes neuronales para la predicción de la tendencia del índice
de Estambul utilizando nueve indicadores y osciladores. Patel, Shah, Thakkar, y Kotecha (2015)
utiliza los mismos indicadores aplicándolo a los índices Cnx Niy y S&P de Bombay. En Ballings,
den Poel, Hespeels, y Gryp (2015) pude verse una recopilación de las técnicas de clasificación
más empleadas en la predicción de las tendencias bursátiles.
El otro tipo de modelos muy extendido para la predicción de la tendencia bursátil son
las redes neuronales y algoritmos genéticos. Por ejemplo, en Moghaddam, Moghaddam, y
Esfandyari (2016) se estudia la tendencia diaria del índice Nasdaq, si bien utilizando como
inputs los precios de cierre retardados. En Oliver (2016) utiliza la red neuronal backpropagation
con el índice Ibex-35.
A partir de estos modelos surgen otros como combinación de diferentes técnicas y modelos.
En Qiu y Song (2016) añaden un algoritmo genético a una red neuronal para la predicción del
índice Nikkei 225. Otros autores combinan la SVM con otras metodologías. Así, en C. Huang,
Yang, y Chuang (2008) realizan un análisis individual del impacto de las características de cada
input en los outputs del modelo. En Kumar, Meghwani, y Thakur (2016) plantean diferentes
modelos híbridos de la SVM como el Proximal Support Vector Macine o Ramdom Forest Support
Vector Machine, entre otros. En García, Guijarro, y Oliver (2017) se utiliza algoritmos genéticos y
heurísticos como el tabu search.
En estos estudios sobre la tendencia de los índices bursátiles se han empleado indicadores
y osciladores técnicos cuyo cálculo se basa en los precios del propio índice. El objetivo de este
Javier Oliver 60
Finance, Markets and Valuation Vol. 4, Num. 1 (Enero-Junio 2018), 59–66
Figura 1. Separación del problema en dos dimensiones (Zarogianni, Moorhead, y Lawrie, 2013)
trabajo es analizar la conveniencia del uso de algunos de estos indicadores como inputs de
los diferentes modelos. Mediante la Support Vector Machine, se observará el comportamiento
de cada uno de ellos frente a la variable respuesta, es decir, frente a la tendencia. Con esto se
pretende obtener qué indicadores presentan una estabilidad en su contribución a la predicción
de la tendencia. Aquellos indicadores más estables deberían formar parte de los diferentes
modelos a construir, eliminando aquellos más inestables que pueden provocar distorsiones en
el proceso de aprendizaje.
2 Descripción de la metodología
La Support Vector Machine fue desarrollada por Vapnik, Golowich, y Smola (1997) como una
alternativa de machine learning de las redes neuronales y el perceptron (Rumelhart, Hinton,
y Williams, 1986). El modelo se basa en incorporar el vector de inputs en un espacio de carac-
terísticas multidimensional Z mediante un mapeo no lineal. Por tanto, se trata de separar el
problema en diferentes espacios dimensionales. La support vector machine define el margen
de la máxima distancia entre las diferentes clases del hiperplano (Figura 1).
El problema fundamental reside en encontrar una separación del hiperplano que generalice
correctamente para dar una solución satisfactoria al problema. Dado que las dimensiones del
mapa de características son elevadas, los datos para el entrenamiento del algoritmo no siempre
generalizan correctamente en todos los hiperplanos. Por tanto, la support vector machine trata
de generar un modelo, basado en los datos de entrenamiento, que prediga los valores objetivo,
teniendo en cuenta sus características.
El modelo resuelve un problema de optimización, partiendo de los set de datos de apren-
dizaje compuesto por las diferentes pares de instancias y etiquetas (
x
i
, y
i
) con
i = 1, . . . , n
,
donde x
i
es un número real e y
i
{−1, 1}
n
(Hsu, Chang, y Lin, 2003).
m
ß
ın
w,b,ε
1
2
w
T
w + C
n
Õ
i =1
ε
i
(1)
Los vectores para el entrenamiento
x
i
, son mapeados en el espacio con
n
dimensiones
Javier Oliver 61
Finance, Markets and Valuation Vol. 4, Num. 1 (Enero-Junio 2018), 59–66
Indicador Descripción Ecuación
C C I (n)
t
Commodity channel index
(n = 20)
(M
t
S M (n)
t
)
(0,015×D (n)
t
)
P SY (n)
t
Ratio of rising days (
n =
2, 5, 10)
A(n)
t
n
LW %R (n)
t
William’s percentage range
(n = 14)
(100 ×
(H
n
C
t
)
(H
n
L
n
)
AT R Average True Range
(AT R
t 1
×13)+AT R
t
14
AD X Average Directional Index
(AD X
t 1
×13)+D X
t
14
Tabla 1. Indicadores técnicos analizados
mediante la función
. El modelo añade un parámetro de penalización,
C > 0
para el término
del error. Además añade una función interna (kernel)
K (x
i
, x
j
) = (x
i
)
T
(x
j
)
(Smola y Schöl-
kopf, 2004; Smola, Schölkopf, y Müller, 1998). Las principales funciones kernel utilizadas en la
support vector machine son (Jiang, Wang, y Wei, 2007):
Lineal K (x
i
, x
j
) = x
i
T
x
j
Polinomial K (x
i
, x
j
) =
γx
i
T
x
j
+ r
d
, γ > 0
Función radial base (RBF) K (x
i
, x
j
) = ex p (γkx
i
x
j
k
2
), γ > 0
Sigmoidal K (x
i
, x
j
) = t anh (γx
i
T
x
j
+ r )
donde γ, r y d son los parámetros kernel de la función.
3 Resultados
Para el análisis de la elección conveniente de indicadores técnicos para la predicción de
la tendencia de un índice bursátil, se ha seleccionado los datos diarios del índice Dow Jones
Industrial. El periodo analizado comprende del 2 enero de 1920 al 13 de febrero del 2018.
En la tabla 1 puede verse la descripción de los indicadores utilizados como inputs para su
estudio como son el CCI, Williams percentage range, ATR, ADX y PSY.
La muestra ha sido dividida en un 80 % para el entrenamiento y el resto para el testeo. Como
output del modelo se ha indicado la tendencia del índice bursátil comparando el cierre de la
sesión anterior con la sesión actual, siendo 1 cuando la tendencia es alcista y 0 cuando se trata
de tendencia bajista.
El modelo empleado para el estudio del comportamiento de los diferentes indicadores
técnicos en la predicción de la tendencia, ha sido la support vector machine con la función
radie base como función kernel.
En primer lugar, se analiza las correlaciones de los indicadores técnicos con la tendencia
del índice bursátil (Figura 2). Como puede observarse, existe una correlación muy baja entre
éstos y la dirección del índice. Esto se debe fundamentalmente a la definición de la tendencia
como variable dicotómica. Si se tomase la correlación con los precios de cierre diarios del
índice, las correlaciones aumentarían en la mayoría de casos. Este hecho no indica que los
indicadores no sean buenos predictores de la tendencia. Para determinar su conveniencia
debe analizarse mediante un modelo de clasificación como la support vector machine. Se
destaca la alta correlación existente entre el indicador CCI y Williams. Esta información puede
ser relevante para su incorporación como inputs en modelos lineales, dado los problemas que
Javier Oliver 62
Finance, Markets and Valuation Vol. 4, Num. 1 (Enero-Junio 2018), 59–66
Figura 2. Correlaciones cruzadas de los indicadores
pueden provocar como la multicolinealidad. Sin embargo, pueden ser necesarios en modelos
más complejos como las redes neuronales.
En la Figura 3 puede verse los principales resultados de la utilización de los indicadores
técnicos seleccionados en el modelo SVM. Dado que se trata de un modelo de clasificación,
permite comprender la conveniencia de unos indicadores frente a otros. Para cada uno de ellos,
se determina el ratio de errores y aciertos en la predicción de la tendencia del índice. Los indica-
dores ADX, ATR y CCI presentan irregularidades en el ratio de acierto de la tendencia mientras
que el indicador Williams y el indicador PSY para cada uno de los periodos seleccionados son
más estables en su relación a la tasa de aciertos.
A pesar que en algún caso los primeros indicadores puedan presentar en algún momento
tasas de acierto muy elevadas, dicha irregularidad los convierte en inputs inestables para el
modelo. Por tanto, serían recomendables aquellos que presenten una estabilidad en su tasa de
aciertos, incluso en el caso de tasas algo más reducidas. Los indicadores cuya tasa de acierto
de la predicción es irregular puede provocar problemas en las estimaciones y procesos de
aprendizaje de los diferentes modelos.
4 Conclusiones
El modelo de clasificación Support Vector Machine se ha utilizado, en este caso, para el
estudio de diferentes indicadores técnicos para la predicción de la tendencia de un índice
bursátil. El objetivo del modelo es determinar qué indicadores son los más adecuados para su
uso como inputs en un modelo posterior, bien en un modelo SVM u otro como una red neuronal.
Por tanto, sirve como clasificación de los mismos. La conveniencia de la elección de indicadores
que presenten tasas de acierto estables evidencia la utilización de este tipo de modelos.
En estudiosfuturos puede analizarse cómola preselecciónde indicadorestécnicosmediante
la utilización de modelos de clasificación puede mejorar la predicción de la tendencia de los
indicadores técnicos. Para ello, pueden incorporarse estos indicadores estables como inputs
para otros modelos.
Referencias
Ballings, M., den Poel, D. V., Hespeels, N., y Gryp, R. (2015). Evaluating multiple classifiers for
stock price direction prediction. Expert Systems with Applications, 42(20), 7046–7056. doi:
https://doi.org/10.1016/j.eswa.2015.05.013
Javier Oliver 63
Finance, Markets and Valuation Vol. 4, Num. 1 (Enero-Junio 2018), 59–66
Figura 3. Análisis de los indicadores en el modelo SVM
Javier Oliver 64
Finance, Markets and Valuation Vol. 4, Num. 1 (Enero-Junio 2018), 59–66
Dutta, A., Bandopadhyay, G., y Sengupta, S. (2012). Prediction of stock performance in indian
stock market using logistic regression. International Journal of Business and Information,
7(1), 105–136.
García, F., Guijarro, F., y Oliver, J. (2017). Index tracking optimization with cardinality constraint:
a performance comparison of genetic algorithms and tabu search heuristics. Neural
Computing and Applications, 30(8), 2625–2641. doi: https://doi.org/10.1007/s00521-017-
2882-2
Hsu, C.-W., Chang, C.-C., y Lin, C.-J. (2003). A practical guide to support vector classification (Inf.
Téc.). National Taiwan University.
Huang, C., Yang, D., y Chuang, Y. (2008). Application of wrapper approach and composite
classifier to the stock trend prediction. Expert Systems with Applications, 34(4), 2870–2878.
doi: https://doi.org/10.1016/j.eswa.2007.05.035
Huang, W., Nakamori, Y., y Wang, S.-Y. (2005). Forecasting stock market movement direction
with support vector machine. Computers & Operations Research, 32(10), 2513–2522. doi:
https://doi.org/10.1016/j.cor.2004.03.016
jae Kim, K. (2003). Financial time series forecasting using support vector machines. Neurocom-
puting, 55(1-2), 307–319. doi: https://doi.org/10.1016/s0925-2312(03)00372-2
Jiang, T., Wang, S., y Wei, R. (2007). Support vector machine with composite kernels for time
series prediction. En Advances in neural networks ISNN 2007 (pp. 350–356). Springer
Berlin Heidelberg. doi: https://doi.org/10.1007/978-3-540-72395-0_45
Kara, Y., Boyacioglu, M. A., y Ömer Kaan Baykan. (2011). Predicting direction of stock price index
movement using artificial neural networks and support vector machines: The sample
of the istanbul stock exchange. Expert Systems with Applications, 38(5), 5311–5319. doi:
https://doi.org/10.1016/j.eswa.2010.10.027
Kumar, D., Meghwani, S. S., y Thakur, M. (2016). Proximal support vector machine based hybrid
prediction models for trend forecasting in financial markets. Journal of Computational
Science, 17, 1–13. doi: https://doi.org/10.1016/j.jocs.2016.07.006
Moghaddam, A. H., Moghaddam, M. H., y Esfandyari, M. (2016). Stock market index prediction
using artificial neural network. Journal of Economics, Finance and Administrative Science,
21(41), 89–93. doi: https://doi.org/10.1016/j.jefas.2016.07.002
Oliver, J. (2016). Modelling conditional volatility in the spanish ibex-35 stock index using
high frequency data. a comparison of the egarch model and the backpropagation neural
network. Finance, Markets and Valuation, 2(2), 21–37.
Oztekin, A., Kizilaslan, R., Freund, S., y Iseri, A. (2016). A data analytic approach to forecasting
daily stock returns in an emerging market. European Journal of Operational Research,
253(3), 697–710. doi: https://doi.org/10.1016/j.ejor.2016.02.056
Patel, J., Shah, S., Thakkar, P., y Kotecha, K. (2015). Predicting stock market index using fusion
of machine learning techniques. Expert Systems with Applications, 42(4), 2162–2172. doi:
https://doi.org/10.1016/j.eswa.2014.10.031
Qiu, M., y Song, Y. (2016). Predicting the direction of stock market index movement
using an optimized artificial neural network model. PLOS ONE, 11(5), e0155133. doi:
https://doi.org/10.1371/journal.pone.0155133
Rumelhart, D. E., Hinton, G. E., y Williams, R. J. (1986). Learning representations by back-
propagating errors. Nature, 323(6088), 533–536. doi: https://doi.org/10.1038/323533a0
Smola, A. J., y Schölkopf, B. (2004). A tutorial on support vector regression. Statistics and
Computing, 14(3), 199–222. doi: https://doi.org/10.1023/b:stco.0000035301.49549.88
Javier Oliver 65
Finance, Markets and Valuation Vol. 4, Num. 1 (Enero-Junio 2018), 59–66
Smola, A. J., Schölkopf, B., y Müller, K.-R. (1998). The connection between regulariza-
tion operators and support vector kernels. Neural Networks, 11(4), 637–649. doi:
https://doi.org/10.1016/s0893-6080(98)00032-x
Vapnik, V., Golowich, S. E., y Smola, A. J. (1997). Support vector method for function approxi-
mation, regression estimation and signal processing. En Advances in neural information
processing systems (pp. 281–287).
Zaidi, M., y Amirat, A. (2016). Forecasting stock market trends by logistic regression and neural
networks: Evidence from ksa stock market. International Journal of Economics, Commerce
and Management, 4, 4–7.
Zarogianni, E., Moorhead, T. W., y Lawrie, S. M. (2013). Towards the identification of imaging
biomarkers in schizophrenia, using multivariate pattern classification at a single-subject
level. NeuroImage: Clinical, 3, 279–289. doi: https://doi.org/10.1016/j.nicl.2013.09.003
Javier Oliver 66