Las técnicas analíticas de regresión jugarán
un papel fundamental en la resolución de nuestro problema. Recordemos la primera cuestión que queríamos resolver:
¿Es posible realizar un producto de ámbito general para la toma de
decisiones predictiva y automática partiendo de una topología de red, una
caracterización de los elementos, una algorítmica adecuada y existente y unas
series históricas de datos?
Cuando lanzábamos esta pregunta, irremediablemente,
estamos hablando en un porcentaje muy alto de sistemas dinámicos de naturaleza
continua pero, ¿qué es un sistema
dinámico?
“Un sistema
dinámico es aquel cuyo estado evoluciona con el tiempo. El comportamiento
en dicho estado se puede caracterizar determinando los límites del sistema, los
elementos y sus relaciones; de esta forma se pueden construir instrumentos que
buscan representar el comportamiento del sistema”.
Hay miles de ejemplos de sistemas
dinámicos a nuestro alrededor; el curso del agua en un río, la trayectoria y
evolución de una nube, una cadena de producción de una fábrica, el comportamiento
de un individuo en un entorno, etc. en los que si pudiésemos medir todas las
variables que afectan al sistema y tuviésemos la suficiente capacidad de
cálculo, en teoría, podríamos saber cómo se comportaría en el siguiente
instante de tiempo. A este enfoque en el que se reproducen los comportamientos físicos
de un objeto en un entorno se le denomina “Simulación”.
Este enfoque es muy exacto y preciso
pero presenta un problema; ¿somos capaces de obtener y calcular todos los datos
y variables que, en cada momento, afectan a cada individuo del sistema
modelado? En algunos casos sí pero, para sistemas físicos complejos, se tiene
que trabajar con un conjunto reducido de datos para predecir qué va a ocurrir.
Existe un segundo enfoque denominado “Modelado”. Este enfoque no trata de
imitar el comportamiento físico de un sistema sino de generar modelos matemáticos
(conocimiento) que permitan descubrir el estado final (inferencia)
independientemente de cuales sean las leyes físicas que producen que el sistema
pase de un estado et a un estado et+1.
Para sistemas complejos con un conjunto
limitado de datos este último enfoque suele dar mejores resultados.
Adicionalmente incluiremos un par de
conceptos más que nos ayudarán a comprender los algoritmos y técnicas de regresión que necesitaremos para dar respuesta a la cuestión planteada.
Sistemas dinámicos de naturaleza discreta en el tiempo: son aquellos en los que la variación del estado se produce a intervalos concretos
del tiempo, esto es, a pequeños lapsos de tiempo no variando su estado entre
paso y paso. Los sistemas.
Sistemas dinámicos de naturaleza continúa en el tiempo: son aquellos en los que la variación del estado se produce continuamente.
Sistemas dinámicos de naturaleza continúa en el tiempo: son aquellos en los que la variación del estado se produce continuamente.
Aquí se nos presenta el primer problema
a resolver. La mayoría de los sistemas productivos industriales son sistemas
continuos (energía, agua, cadenas de producción de alta velocidad, etc.) pero
la capacidad de medir los datos mediante sensores (IoT) es discreta en la mayoría de
las instalaciones (adquisición de datos minutal, cinco-minutal, quince-minutal,
horaria, diaria, etc.).
¿Trabajaremos entonces sobre sistemas
dinámicos discretos o continuos?
En nuestro caso trataremos normalmente sistemas
continuos pero, en función del objetivo del análisis y de los datos disponibles
abordaremos una técnica denominada discretizar,
que se basa en transformar una distribución continua de datos en discreta
con la mínima pérdida de información.
Otro concepto importante es si el sistema dinámico es lineal o no.
Un sistema dinámico es de naturaleza
lineal si se puede resolver
(predecir) mediante ecuaciones diferenciales lineales según la siguiente
formula:
xt = ak(xt)yk
Donde x cambia con el tiempo. Tanto a como x pueden ser elementos de en un espacio vectorial Rk para permitir análisis multi-dimensionales (múltiples
variables).
Los sistemas no lineales son
mucho más difíciles de analizar y a menudo exhiben un fenómeno conocido como Caos (exhiben
un comportamiento muy complicado en intervalos grandes de tiempo), con comportamientos totalmente impredecibles por lo que tiene que ser
modelados por medio de otro tipo de técnicas basadas en el aprendizaje (por
ejemplo, Redes Neuronales).