Cócteles de aprendizaje automático (machine learning) y optimización matemática
Es cada vez más evidente que todos los sectores económicos se han lanzado en tromba a mejorar su operativa enarbolando las nuevas tecnologías de Inteligencia Artificial (IA). Hoy día no hay escenario de negocio que quede al margen de la aplicación de técnicas matemáticas a los datos que tienen disponibles, muchos de ellos fruto de nuevas iniciativas para captar más y más traza digital de la actividad de las empresas.
Cada vez más datos, todos los sectores
Nuevas tecnologías de IA
El resultado de esta tendencia es una explosión de proyectos de distinta complejidad pero que emiten un aroma común que no debe confundirnos: no hay un único tipo de proyectos porque no hay solo una tecnología disponible. Ya hemos analizado en otra ocasión la frontera entre los proyectos enfocados a mejorar nuestras capacidades de predicción y los que buscaban una decisión óptima concreta para un problema de negocio (ver https://www.numensai.com/es/la-soledad-del-decisor/); y alertamos también de la inercia, muchas veces errónea, que nos lleva a enfocar todos los proyectos exclusivamente desde la óptica predictiva.
Cómo combinar las técnicas de optimización matemática con los algoritmos de machine learning.
Vamos a completar ahora lo que allí expusimos discutiendo las posibilidades de que ambos paradigmas tecnológicos colaboren en la búsqueda de una solución. Más específicamente, vamos a discutir cómo combinar las técnicas de optimización matemática con los algoritmos de machine learning.
Independientemente de matices de rango menor, las posibilidades se resumen en tres grandes categorías:
Por ejemplo, ¿qué ocurre si tenemos que planificar las rutas óptimas para la flota de vehículos de una empresa de paquetería cuando no conocemos la demanda que habrá que atender en el periodo que queremos planificar? El escenario puede parecer particular, pero es perfectamente aplicable a cualquier compañía en la que una infraestructura común de recursos -red de telecomunicaciones, personal de mantenimiento, espacio en un almacén…- deba dar servicio a una demanda variable. Sin esa demanda bien caracterizada perdemos pie para tomar decisiones adecuadas.
En la misma línea, ¿cómo vamos a disponer los productos que ofrecemos -sea en los lineales de una tienda física, o en la parrilla virtual de un ecommerce- para maximizar las ventas, si no disponemos de modelos predictivos del comportamiento de los usuarios? ¿Cómo definir carteras de inversiones, o targets de campañas de marketing, sin modelos predictivos de la evolución futura de esas inversiones o del churn que prevemos para nuestros clientes?
En mayor o menor medida el puzzle es siempre el mismo: lanzamos proyectos predictivos cuyo resultado acaba caracterizando los modelos de optimización. Los resultados de esas predicciones se convierten en restricciones del modelo matemático, o ingredientes de su función objetivo. En otras palabras, los modelos machine learning reducen el espacio de decisiones porque anticipan elementos clave de nuestro modelo de optimización, dando así sentido a las decisiones que este toma.

Si aun así la incertidumbre resulta excesivamente elevada, el resultado de los modelos predictivos lo podemos incorporar a un gemelo digital. Las caracterizaciones estadísticas de los elementos de ese gemelo digital están informadas por las conclusiones de los modelos predictivos. Las simulaciones realizadas sobre estos gemelos digitales permiten tomar decisiones porque generan estadísticos relevantes sobre los aspectos que más nos interesa vigilar.
El foco en este caso es a la inversa. Existen modelos de optimización desplegados en nuestra operativa, pero que forman parte de un ecosistema más grande con otros aspectos no incluidos en esos modelos. En ese entorno global ponen el foco los modelos machine learning, que trabajan con una perspectiva más amplia. Es decir, las decisiones del modelo de optimización se convierten en features predictivas del modelo machine learning.

Es importante recalcar que, de vuelta, los resultados de esos modelos machine learning pueden generar aprendizajes que conduzcan a ajustes finos respecto de las restricciones o la función objetivo de los modelos de optimización que operan a un nivel inferior. En el fondo, los modelos predictivos están ayudando así a definir cuál es realmente el óptimo que tienen que buscar los modelos de optimización.
Por ejemplo, démosle la vuelta al ejemplo logístico del punto anterior. Sobre las rutas definidas por el modelo de optimización, y como parte de una operativa más completa que incorpore, por ejemplo, los centros logísticos implicados, podríamos aplicar modelos predictivos que anticipen el personal que hará falta en esos centros para atender la demanda, o los cuellos de botella a los que tendremos que enfrentarnos, o los tiempos de entrega que podemos prever. Esas predicciones, además de generar un valor en sí mismas, pueden ayudar a los desarrolladores de los modelos de optimización a afinar sus modelos, y que sus decisiones óptimas se alineen mejor con los objetivos generales de la compañía.
En último extremo, no olvidemos que la propia optimización matemática está en el corazón de los procesos de aprendizaje automático. Un modelo de aprendizaje empieza definiendo una función de error que tenemos que minimizar. Los procesos de entrenamiento no son más que procesos de optimización por los que ajustamos los parámetros del modelo para minimizar ese error. Es decir, definir mejores técnicas de optimización es esencial para los procesos de aprendizaje automático.
Pero más allá de esa conexión básica, la combinación de ambos enfoques puede adoptar formas más curiosas. ¿Será posible aplicar aprendizaje automático a los resultados repetitivos de la ejecución de un modelo de optimización matemática? ¿Sería capaz así el modelo predictivo de inferir por inducción las restricciones que no incorpora de manera directa? Algunos artículos de investigación apuntan en esta dirección: https://arxiv.org/pdf/2105.06618.pdf
Una segunda propuesta sería buscar mejoras operativas de los algoritmos predictivos por aplicación de técnicas de optimización. De nuevo, hay artículos que apuntan a avances significativos en ese sentido https://arxiv.org/abs/1507.03133
Una tercera sugerencia nos lleva a analizar los modelos de aprendizaje conocidos como reinforcement learning. Se trata de modelos machine learning que trabajan generando decisiones (la frontera predicción-decisión óptima se difumina casi completamente), pero que aprenden de sus decisiones anteriores a partir de una fórmula de recompensa en un ciclo constante de prueba y error. Un enfoque habitual para entrenar esos modelos es construir modelos matemáticos que permitan arrancar el proceso de aprendizaje sin dejarles operar en su entorno real (el coste de dejarles fallar para aprender puede ser muy alto). ¿No es esta una nueva vía para que los modelos de optimización se integren eficazmente en algoritmos predictivos?
Notas finales
Para finalizar, y a modo de conclusión, queremos expresar rotundamente que solo el manejo de todos los enfoques tecnológicos habilita para explorar esos caminos intermedios que pueden resultar más que prometedores. Si necesitas soluciones IA para problemas complejos, evaluar la capacidad técnica de tu compañero de viaje es una de las recetas del éxito. Esa evaluación debe mirar la capacidad de ejecución de proyectos predictivos, pero también de optimización matemática; y la experiencia previa de cada proveedor combinando ambos enfoques para construir soluciones más allá de lo estándar.
¿Quieres conocer nuestro Curso de Inteligencia Artificial para Directivos?
Podemos personalizarlo poniendo el foco en la industria energética
